Panoramica
Controlla la distribuzione dei dati e abilita la flessibilità di fornire i dati ovunque.
CDF-PC offre un paradigma di sviluppo low-code basato sul flusso che si allinea meglio alla modalità degli sviluppatori per la progettazione, sviluppo e test delle pipeline di distribuzione dei dati. Con oltre 450 connettori e processori in tutto l'ecosistema di servizi cloud ibridi, tra cui data lake, lakehouse, cloud warehouse e fonti on-premise, CDF-PC fornisce una distribuzione indiscriminata dei dati. Questi flussi di distribuzione dei dati vengono quindi controllati in base alle loro versioni in un catalogo in cui gli operatori possono eseguire autonomamente le distribuzioni di dati a diversi runtime.
CLOUDERA DATAFLOW FOR PUBLIC CLOUD
Distribuzione universale dei dati con tecnologia Apache NiFi

Connettiti a qualsiasi fonte di dati ovunque, elaborala e consegnala a qualsiasi destinazione
Casi d'uso
Microservizi no-code serverless
Elaborazione quasi in tempo reale
Acquisizione di Data lakehouse
Sicurezza informatica e ottimizzazione dei registri
IoT e raccolta di dati in streaming
Microservizi no-code serverless
DataFlow Functions è la prima soluzione visiva no-code per creare microservizi con scalabilità infinita.
Eseguendo i flussi NiFi all'interno di AWS Lambda, Azure Functions e Google Cloud Functions, DataFlow Functions è la prima soluzione in grado di fornire un'interfaccia utente intuitiva e no-code per la creazione di microservizi attivati dalle richieste HTTPS. Inoltre, permette di creare in pochissimo tempo un endpoint API con scalabilità infinita in ambiente serverless.
Elaborazione quasi in tempo reale
DataFlow Functions abilita facilmente l'elaborazione quasi in tempo reale dei file in un'architettura serverless.
Eseguendo flussi NiFi all'interno di AWS Lambda, Azure Functions e Google Cloud Functions, DataFlow Functions rappresenta il modo più conveniente per elaborare i file ogni volta che vengono resi disponibili nello storage di oggetti. Le risorse vengono eseguite solo quando i dati sono in fase di elaborazione e NiFi non deve più essere in esecuzione 24 ore su 24, 7 giorni su 7. Questo permette anche di fornire un'architettura completamente serverless senza alcun requisito di costi operativi dell'infrastruttura.
Acquisizione di Data lakehouse
Modernizza le pipeline di dati con uno strumento unico che funziona con qualsiasi data lakehouse o warehouse.
Grazie al supporto di oltre 450 processori, Cloudera DataFlow semplifica la raccolta e la trasformazione dei dati nel formato richiesto dal tuo lakehouse.
Cloudera DataFlow offre la flessibilità necessaria per trattare i dati non strutturati come tali e ottenere un throughput elevato senza dover applicare uno schema o per fornire una struttura ai dati non strutturati, applicando uno schema e utilizzando il linguaggio di espressione NiFi o le query SQL per trasformarli facilmente.
Sicurezza informatica e ottimizzazione dei registri
Consenti ai data analyst di rilevare e analizzare gli eventi in modo più rapido e preciso curando i dati SIEM.
Riduci i costi della tua soluzione di sicurezza informatica modernizzando le pipeline di raccolta dei dati per raccogliere e filtrare in tempo reale i dati provenienti da migliaia di fonti in tutto il mondo.
L'ingestione di tutti i log di dispositivi e applicazioni all'interno della tua soluzione SIEM non è un approccio scalabile né per i costi né per le prestazioni. Cloudera DataFlow consente di raccogliere i dati di log da qualsiasi punto e eliminare ciò che non è necessario, mantenendo la gestione dei dati memorizzati nel sistema SIEM.
IoT e raccolta dati in streaming
Invia i dati dai dispositivi IoT all'edge a un flusso di dati centralizzato nel cloud in grado di scalare in base alle esigenze.
Cloudera DataFlow è progettato per gestire i dati in streaming su larga scala, consentendo alle organizzazioni di avviare i progetti IoT in piccolo, con la certezza che i flussi di dati sono in grado gestire l'esplosione di dati causata dall'aggiunta di più dispositivi sorgente e i problemi di connettività intermittente.
Il runtime di DataFlow Functions offre un modo efficiente, ottimizzato in termini di costi e scalabile per eseguire flussi NiFi in modo completamente serverless per casi d'uso basati sugli eventi.
Le distribuzioni di Dataflow scalano automaticamente in base ai flussi NiFi. I costi dell'infrastruttura possono essere controllati impostando limiti minimi e massimi per la scalabilità automatica.
Connettiti a qualsiasi fonte o destinazione di dati utilizzando la ricca libreria di processori di NiFi, tra cui fonti di dati on premise, archiviazione di dati cloud, data warehouse cloud, fonti di dati di log, servizi di analisi dei dati cloud o servizi di processi aziendali cloud. Gli sviluppatori possono anche implementare rapidamente un set predefinito di flussi di dati con ReadyFlows, una configurazione minima che implementa i casi d'uso più comuni di flusso di dati.
Monitora tutte le distribuzioni di flusso NiFI in un'unica dashboard, indipendentemente dal cloud in cui vengono eseguite. Monitora le metriche importanti sulle prestazioni del flusso definendo avvisi KPI per le distribuzioni del flusso.
Fornisci facilmente endpoint sicuri, stabili e scalabili, semplificando l'invio di dati per le distribuzioni di flusso da parte di qualsiasi applicazione.
Cloudera DataFlow è stato creato pensando all'automazione. Qualsiasi azione eseguita all'interno dell'interfaccia utente può essere trasformata in un'istruzione CLI per l'automazione. Distribuire un nuovo flusso NiFi è facile come eseguire un singolo comando CLI.
SVILUPPA FLUSSI NIFI OVUNQUE E DISTRIBUISCILI SU QUALSIASI CLOUD
come cluster Kubernetes con scalabilità automatica o come flussi serverless NiFi

Opzioni di Runtime nel cloud pubblico
Caratteristiche | Implementazioni di DataFlow | Funzioni di DataFlow |
Runtime Cloud |
Cluster NiFi che utilizzano Kubernetes/Container |
Flussi NiFi in esecuzione sui servizi di elaborazione serverless dei provider di cloud (AWS Lambda, Azure Functions e Google Cloud Functions) |
---|---|---|
Casi d'uso |
Casi d'uso che richiedono una bassa latenza, per carichi di lavoro a volumi elevati che richiedono flussi NiFi sempre in esecuzione | Casi d'uso event-driven e con possibilità di micro esplosioni di dati, senza requisiti di latenza inferiori al secondo, in cui i flussi NiFi non devono essere eseguiti in modo continuo |
Vantaggi |
Ridimensionamento automatico dei cluster Kubernetes per flussi di lavoro di lunga durata con monitoraggio centralizzato | Modalità efficiente, economicamente ottimizzata e scalabile di eseguire flussi NiFi serverless, per consentire agli sviluppatori di concentrarsi sulla logica aziendale |
Unità di misurazione |
Cloudera Compute Unit (CCU) | Conteggio delle invocazioni di metodo |
Raccogli dati dall'edge
Gestisci, controlla e monitora l'edge per iniziative di streaming e IoT e fornisci dati in streaming in tempo reale con l'acquisizione e la gestione no-code con Cloudera Edge Management.
Per iniziare
DOCUMENTAZIONE DI PRODOTTO
Scopri specifiche tecniche, architettura e tutorial su Cloudera DataFlow for the Public Cloud.
PREZZI DI CDF PER IL PUBLIC CLOUD
Valuta i prezzi di Cloudera DataFlow for the Public Cloud rispetto ai diversi tipi di istanze cloud.
PRESENTAZIONE DI DATAFLOW
Guarda con i tuoi occhi Cloudera DataFlow per il Public Cloud.
COMMUNITY CLOUDERA CON NIFI
Connettiti con i tuoi colleghi, poni domande, risolvi problemi e scopri di più su Apache NiFi.
FORMAZIONE NIFI
Prenota un corso di formazione pratico di tre giorni sulle basi di Apache NiFi e molto altro.
DEMO DEL PRODOTTO
Guarda la presentazione e la dimostrazione di Cloudera DataFlow per il Public Cloud.