Apache Druid

Druid는 이벤트 데이터에 대한 비즈니스 인텔리전스(OLAP)용으로 제작된 오픈소스 분석 데이터 저장소입니다. Druid는 짧은 지연 시간(실시간) 데이터 수집, 유연한 데이터 탐색, 빠른 데이터 집계 기능을 제공합니다.

Druid 작동 원리

Druid는 데이터를 일반적인 OLAP 쿼리 패턴에 이상적인 고도로 인덱싱된 열 형식으로 변환하기 때문에 속도가 빠릅니다. Druid는 HDP에 포함된 Druid-Hive 커넥터를 사용하는 Hive SQL을 통해서나 네이티브 REST API를 통해 쿼리됩니다.

Druid가 수행하는 작업

 

Feature Description
Sub-Second Queries Druid delivers sub-second queries, even when you have terabytes of data and dozens of dimensions.
Real-Time Data Ingestion Druid makes real-time a reality. Query data seconds after it arrives. Native integration with Apache Kafka makes it simple to enable real-time analytics.
Integrated with Apache Hive Build OLAP cubes and run sub-second SQL queries using any Hive-compatible tool.
Apache Ambari Integration Apache Ambari makes deploying, configuring and monitoring Druid a breeze..

Druid의 초점

Cloudera는 과거 데이터와 실시간 데이터를 원활하게 결합하는 빠르고 확장 가능한 분석을 지원하는 데 초점을 두고 있습니다.

  • 실시간 분석: Druid/Hive 커넥터를 통해 SQL을 사용하여 OLAP 큐브를 구축하거나 기존 Druid 큐브를 이용할 수 있습니다. 또는 Hive의 강력한 SQL 지원을 활용하여 Druid 데이터에 대한 심층 분석을 수행할 수도 있습니다.
  • 관리: Apache Ambari를 사용하면 Druid 클러스터를 손쉽게 배포, 구성, 모니터링 및 관리할 수 있습니다.
  • 보안: 이제 Druid는 Kerberos와 안전한 Hadoop을 완벽하게 지원하며, Apache Ambari가 Druid 클러스터 보호에 따르는 부담 모두를 관리해 드립니다.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.