Panoramica
Distribuisci sul cloud pubblico un'ampia gamma di analisi in modo rapido e semplice.
CDP Data Hub è un potente servizio di analisi su Cloudera Data Platform (CDP) Public Cloud che rende più semplice e veloce ottenere analisi di valore elevato Edge to AI in un modello cluster familiare sul cloud. Grazie alla sua ampia gamma di carichi di lavoro, comprensiva di streaming, ETL, data mart, database e machine learning, CDP Data Hub ti permette di spostare agevolmente carichi di lavoro esistenti da on premise a cloud o di costruirli direttamente su cloud.
La soluzione, completa e basata su cloud, è basata su Cloudera Runtime, una suite di tecnologie integrate, open source e costruita su SDX. Offre un'ampia scelta di forme di cluster, tipi di carico di lavoro, modelli preconfezionati e opzioni di configurazione per offrire un'esperienza intuitiva e personalizzabile, pensata per gli utenti che si trovano bene con le architetture tradizionali.
Casi d'uso di Data Hub
Semplifica il tuo passaggio al cloud
Esegui il lift-and-shift di carichi di lavoro Cloudera on premise sul cloud pubblico grazie a una piattaforma che si estende sui cloud sia pubblici che privati e che fornisce:
- Prestazioni migliorate, governance solida e disponibilità del cloud pubblico
- Flessibilità di ottimizzare i carichi di lavoro in entrambi i modelli di distribuzione
- I vantaggi di un fattore di forma familiare con un modello di cluster tradizionale che facilita il tuo passaggio al cloud
- Un percorso di migrazione ininterrotto alle esperienze containerizzate di CDP
Implementa rapidamente carichi di lavoro multianalitici
Velocizza l'implementazione di carichi di lavoro complessi su cloud pubblico per tutto il ciclo di vita dei dati, con:
- Un'architettura cloud-based che permette di implementare diversi carchi di lavoro di analisi flessibili e personalizzati
- Un'esperienza intuitiva impiegata usando cluster familiari basati sui nodi, sia per approcci preconfigurati che per carichi di lavoro personalizzati
- Un livello elevato di personalizzazione che permette di distribuire carichi di lavoro su misura per le tue esigenze aziendali specifiche
Seleziona i carichi di lavoro
Data mart in tempo reale
Data engineering per pipeline complesse
Streaming su cloud ibrido
Database operativo
Data mart in tempo reale
Abilita l'analisi su grandi volumi di dati in rapido arrivo
Il modello Real Time Data Mart su Data Hub ti permette di inserire milioni di dati al secondo, con aggiornamenti sul posto, ove necessario. I dati sono immediatamente disponibili in un formato ottimale per le query. Questo modello è perfetto per applicazioni in serie temporali, analisi di eventi, verifiche di concordanza CDC e pipeline di elaborazione dei dati in tempo reale. Il modello include il motore di storage analitico Apache Kudu, Apache Impala per l'esecuzione rapida di SQL, HUE per lo sviluppo e l'analisi di SQL e Apache Spark Streaming per elaborazione e analisi dei flussi.
Data engineering per pipeline complesse
Arricchisci, trasforma e carica i tuoi dati.
Data Hub permette di arricchire, trasformare e ripulire i dati per creare, eseguire e gestire le pipeline di dati end-to-end con flessibilità e personalizzazione elevate. Il modello di Data Engineering permette di eseguire un'ampia gamma di carichi di lavoro di elaborazione dei dati, fra cui l'elaborazione in batch e in tempo reale, utilizzando Apache Spark e Hive.
Streaming su cloud ibrido
Raccogli, elabora e costruisci analisi in tempo reale
DataFlow per CDP Data Hub è una piattaforma completa di streaming dei dati edge-to-cloud pensata per affrontare alcune delle sfide relative allo streaming dei dati su ambienti ibridi con Apache NiFi e Kafka. Consente agli utenti di estendere le stesse esperienze di streaming on premise di Cloudera DataFlow su cloud, senza richiedere grandi risorse per svilupparle, configurarle e mantenerle.
Database operativo
Costruisci applicazioni altamente affidabili di livello enterprise.
Data Hub permette di eseguire database NoSQL a prestazioni elevate con supporto per ANSI SQL, fornendo scalabilità e prestazioni senza precedenti per le applicazioni operative mission-critical con Apache Hbase. Il database operativo fornisce un supporto evolutivo della struttura, che consente agli sviluppatori di sfruttare il potere dei dati mantenendo la flessibilità nella progettazione delle applicazioni. Offre anche scalabilità automatica basata sull'utilizzo dei carichi di lavoro del cluster per ottimizzare l'uso e i costi dell'infrastruttura.