Apache Druid
Druid è un archivio dati analitico open source progettato per le query di business intelligence (OLAP) sui dati degli eventi. Druid fornisce acquisizione di dati a bassa latenza (in tempo reale), esplorazione flessibile dei dati e aggregazione rapida dei dati.
Come funziona Druid
Druid è veloce perché i dati vengono convertiti in un formato a colonne fortemente indicizzato, ideale per i modelli di query OLAP tipici. Druid viene interrogato tramite Hive SQL, utilizzando il connettore Druid to Hive incluso in HDP o tramite un'API REST nativa.
Cosa fa Druid
Feature | Description |
---|---|
Sub-Second Queries | Druid delivers sub-second queries, even when you have terabytes of data and dozens of dimensions. |
Real-Time Data Ingestion | Druid makes real-time a reality. Query data seconds after it arrives. Native integration with Apache Kafka makes it simple to enable real-time analytics. |
Integrated with Apache Hive | Build OLAP cubes and run sub-second SQL queries using any Hive-compatible tool. |
Apache Ambari Integration | Apache Ambari makes deploying, configuring and monitoring Druid a breeze.. |
Focus per Druid
Cloudera è impegnata a rendere possibili analisi rapide e scalabili in grado di combinare in modo fluido i dati storici e quelli in tempo reale.
- Analisi in tempo reale: il connettore Druid/Hive consente di creare cubi OLAP utilizzando SQL oppure di accedere a cubi Druid esistenti. È possibile inoltre sfruttare il potente supporto SQL di Hive per eseguire analisi in profondità sui dati Druid.
- Gestione: Apache Ambari semplifica la distribuzione, la configurazione, il monitoraggio e la gestione dei cluster Druid.
- Sicurezza: Druid ora supporta completamente Kerberos e protegge Hadoop, e Apache Ambari gestisce l'intero compito di proteggere il cluster Druid.