Caratteristiche principali
Analisi agili dei fast data
Kudu può fornire sia inserimenti che aggiornamenti, oltre a efficienti scansioni colonnari, consentendo all'ecosistema Apache Hadoop™ di affrontare nuovi carichi di lavoro analitici.
Architettura semplificata
Kudu colma il divario tra HDFS e Apache HBase precedentemente risolto con architetture ibride complesse, alleggerendo il lavoro sia di IT architect che di sviluppatori.
Integrazione dell’ecosistema
Kudu è stato costruito specificamente per l'ecosistema Hadoop, consentendo ad Apache Spark™, Apache Impala e MapReduce di elaborare e analizzare i dati in modo nativo. Inoltre, le tabelle Kudu possono essere unite ai dati in HDFS o HBase.
Casi d’uso comuni
Kudu è pensato per ottenere il massimo in casi d'uso che richiedono la combinazione di letture/scritture casuali e la capacità di eseguire velocemente scansioni analitiche, che in precedenza richiedevano la creazione di complesse architetture lambda. Se combinato con il più ampio ecosistema Hadoop, Kudu consente una varietà di casi d'uso, tra cui:
- Dati di serie temporali e IoT
- Analisi dei dati generati da dispositivi (stato e sicurezza di rete, ecc.)
- Creazione di report online
Integrato in tutto l'ecosistema
Designed to work alongside the Apache Hadoop ecosystem, Kudu integrates tightly with Impala, Spark, and MapReduce. Data can be streamed from live, real-time sources and processed immediately upon arrival by any of those engines. The integration with Impala for BI and SQL analytics provides the ability to create an updateable, open-source data warehouse. Integration with Spark provides an easy blueprint for real-time applications.
Innovazione open source continua di Cloudera
Cloudera continua ad innovare l'ecosistema Apache Hadoop, grazie soprattutto alle opinioni dei moltissimi utenti. E Kudu ne è un perfetto esempio: gli utenti ci chiedono architetture lambda per avere a disposizione le funzionalità necessarie per il loro caso d’uso e noi li ascoltiamo. Con Kudu, Cloudera ha affrontato il tradizionale divario tra HDFS e HBase: la necessità di analisi agili di fast data.