Panoramica
Distribuisci sul cloud pubblico un'ampia gamma di analisi in modo rapido e semplice.
CDP Data Hub è un potente servizio di analisi su Cloudera Data Platform (CDP) Public Cloud che rende più semplice e veloce ottenere analisi di valore elevato Edge to AI in un modello cluster familiare sul cloud. Grazie alla sua ampia gamma di carichi di lavoro, comprensiva di streaming, ETL, data mart, database e machine learning, CDP Data Hub ti permette di spostare agevolmente carichi di lavoro esistenti da on premise a cloud o di costruirli direttamente su cloud.
La soluzione, completa e basata su cloud, è basata su Cloudera Runtime, una suite di tecnologie integrate, open source e costruita su SDX. Offre un'ampia scelta di forme di cluster, tipi di carico di lavoro, modelli preconfezionati e opzioni di configurazione per offrire un'esperienza intuitiva e personalizzabile, pensata per gli utenti che si trovano bene con le architetture tradizionali.
Casi d'uso di Data Hub
Semplifica il tuo passaggio al cloud
Esegui il lift-and-shift di carichi di lavoro Cloudera on premise sul cloud pubblico grazie a una piattaforma che si estende sui cloud sia pubblici che privati e che fornisce:
- Prestazioni migliorate, governance solida e disponibilità del cloud pubblico
- Flessibilità di ottimizzare i carichi di lavoro in entrambi i modelli di distribuzione
- I vantaggi di un fattore di forma familiare con un modello di cluster tradizionale che facilita il tuo passaggio al cloud
- Un percorso di migrazione ininterrotto alle esperienze containerizzate di CDP
Implementa rapidamente carichi di lavoro multianalitici
Velocizza l'implementazione di carichi di lavoro complessi su cloud pubblico per tutto il ciclo di vita dei dati, con:
- Un'architettura cloud-based che permette di implementare diversi carchi di lavoro di analisi flessibili e personalizzati
- Un'esperienza intuitiva impiegata usando cluster familiari basati sui nodi, sia per approcci preconfigurati che per carichi di lavoro personalizzati
- Un livello elevato di personalizzazione che permette di distribuire carichi di lavoro su misura per le tue esigenze aziendali specifiche
Seleziona i carichi di lavoro
Data mart in tempo reale
Data engineering per pipeline complesse
Streaming su cloud ibrido
Database operativo
Data mart in tempo reale
Abilita l'analisi su grandi volumi di dati in rapido arrivo
Il modello Real Time Data Mart su Data Hub ti permette di inserire milioni di dati al secondo, con aggiornamenti sul posto, ove necessario. I dati sono immediatamente disponibili in un formato ottimale per le query. Questo modello è perfetto per applicazioni in serie temporali, analisi di eventi, verifiche di concordanza CDC e pipeline di elaborazione dei dati in tempo reale. Il modello include il motore di archiviazione per analisi Apache Kudu, Apache Impala per l'esecuzione rapida di SQL, HUE per lo sviluppo e l'analisi di SQL e Apache Spark Streaming per l'elaborazione/l'analisi dei flussi.
Data engineering per pipeline complesse
Arricchisci, trasforma e carica i tuoi dati.
Data Hub permette di arricchire, trasformare e ripulire i dati per creare, eseguire e gestire le pipeline di dati end-to-end con flessibilità e personalizzazione elevate. Il modello di Data Engineering ti permette di eseguire un'ampia gamma di carichi di lavoro di elaborazione dei dati, fra cui l'elaborazione in batch e in tempo reale, utilizzando Apache Spark e Hive.
Streaming su cloud ibrido
Raccogli, elabora e costruisci analisi in tempo reale
DataFlow per CDP Data Hub è una piattaforma completa di streaming dei dati edge-to-cloud pensata per affrontare alcune delle sfide relative allo streaming dei dati su ambienti ibridi con Apache NiFi e Kafka. Consente agli utenti di estendere le stesse esperienze di streaming on premise di Cloudera DataFlow su cloud, senza richiedere grandi risorse per svilupparle, configurarle e mantenerle.
Database operativo
Costruisci applicazioni altamente affidabili di livello enterprise.
Data Hub permette di eseguire database NoSQL a prestazioni elevate con supporto per ANSI SQL, fornendo scalabilità e prestazioni senza precedenti per le applicazioni operative mission-critical con Apache Hbase. Il database operativo fornisce un supporto evolutivo della struttura, che consente agli sviluppatori di sfruttare il potere dei dati mantenendo la flessibilità nella progettazione delle applicazioni. Offre anche scalabilità automatica basata sull'utilizzo dei carichi di lavoro del cluster per ottimizzare l'uso e i costi dell'infrastruttura.
Data Hub è pensato per gli utenti che desiderano flessibilità, scalabilità e facilità d'uso. Consente di riorganizzare i ruoli dei lavoratori, configurare il supporto GPU, modificare le impostazioni di gestione delle risorse e ottimizzare i cluster per rendere possibili su vasta scala analisi complesse e multifunzionali.
I cluster di Data Hub possono essere forniti e gestiti rapidamente con opzioni di configurazione precostituite per l'infrastruttura. Le definizioni preconfigurate dei cluster con le impostazioni specifiche dei cloud provider e i modelli di cluster con le configurazioni di servizio di Cloudera Runtime consentono di fornire velocemente i cluster di carichi di lavoro per casi d'uso prescrittivi. È inoltre possibile salvare le proprie definizioni e i propri modelli cluster per utilizzo futuro.
Data Hub consente di spostare agevolmente i carichi di lavoro legacy in un fattore di forma familiare su un modello cloud. L'architettura basata su cloud scinde i dati dall'infrastruttura di calcolo e il livello di erogazione dei dati viene astratto dai dati grezzi. Questa architettura non accoppiata migliora significativamente la flessibilità, l'agilità, la protezione dei dati e la scala.
Fornire più cluster su dati condivisi è semplice e i clienti potranno lanciare nuove applicazioni completamente isolate, con la sicurezza e la governance adeguate, senza interrompere le applicazioni di produzione esistenti.
Data Hub è basato su Cloudera SDX, che consente di proteggere e governare i dati della piattaforma e i metadati e le funzionalità di controllo con interfacce dedicate e integrate per gestirli. Le politiche di sicurezza, governance e controllo dei dati vengono stabilite una sola volta e applicate coerentemente ovunque, consentendo di ridurre i costi di esercizio e i rischi aziendali e, allo stesso tempo, di disporre di una scelta completa in termini di infrastruttura e flessibilità.
Data Hub è costruito su Cloudera Runtime, la distribuzione di software open source di base all'interno di CDP che comprende circa 50 progetti open source. Sfruttare Runtime permette di utilizzare gli strumenti open source più adatti per costruire i propri carichi di lavoro e le proprie applicazioni.
Per iniziare
Demo CDP
Scopri come CDP permette alle aziende di costruire pipeline di dati end-to-end per cloud ibridi, con sicurezza e governance integrate.
Scopri il video tour di CDP
Scopri i segreti di Cloudera Data Platform con un video tour che mostra come il ciclo di vita dei dati viene gestito e protetto.
Tutorial
Inizia con un tutorial step by step che spiega come creare, ridimensionare e interrompere le istanze Data Hub su Cloudera Data Platform.
Formazione gratuita
Scopri Cloudera Essentials per CDP e in che modo aumenta la produttività dei team aziendali e dello staff IT, trasformando i dati in informazioni fruibili.
Prezzi
Valuta i prezzi, i termini di fatturazione, i dettagli delle licenze e il prezzo orario e ottieni un preventivo dei costi con pratici calcolatori.
Documentazione sui prodotti
Parti con il piede giusto con la pianificazione delle risorse, la configurazione del prodotto e le migliori pratiche di gestione del prodotto.