DataFlow Functions disponibile per casi d'uso event-driven di breve durata
Panoramica
 

Controlla la distribuzione dei dati e abilita la flessibilità di fornire i dati ovunque.

CDF-PC offre un paradigma di sviluppo low-code basato sul flusso che si allinea meglio alla modalità degli sviluppatori per la progettazione, sviluppo e test delle pipeline di distribuzione dei dati. Con oltre 450 connettori e processori in tutto l'ecosistema di servizi cloud ibridi, tra cui data lake, lakehouse, cloud warehouse e fonti on-premise, CDF-PC fornisce una distribuzione indiscriminata dei dati. Questi flussi di distribuzione dei dati vengono quindi controllati in base alle loro versioni in un catalogo in cui gli operatori possono eseguire autonomamente le distribuzioni di dati a diversi runtime.

CLOUDERA DATAFLOW FOR PUBLIC CLOUD

Distribuzione universale dei dati con tecnologia Apache NiFi

Diagramma CDF per il Public Cloud

Connettiti a qualsiasi fonte di dati ovunque, elaborala e consegnala a qualsiasi destinazione

Casi d'uso

  • Microservizi no-code serverless
  • Elaborazione quasi in tempo reale
  • Acquisizione di Data lakehouse
  • Sicurezza informatica e ottimizzazione dei registri
  • IoT e raccolta di dati in streaming

Microservizi no-code serverless


DataFlow Functions è la prima soluzione visiva no-code per creare microservizi con scalabilità infinita.

Eseguendo i flussi NiFi all'interno di AWS Lambda, Azure Functions e Google Cloud Functions, DataFlow Functions è la prima soluzione in grado di fornire un'interfaccia utente intuitiva e no-code per la creazione di microservizi attivati dalle richieste HTTPS. Inoltre, permette di creare in pochissimo tempo un endpoint API con scalabilità infinita in ambiente serverless.

 

Elaborazione quasi in tempo reale


DataFlow Functions abilita facilmente l'elaborazione quasi in tempo reale dei file in un'architettura serverless.

Eseguendo flussi NiFi all'interno di AWS Lambda, Azure Functions e Google Cloud Functions, DataFlow Functions rappresenta il modo più conveniente per elaborare i file ogni volta che vengono resi disponibili nello storage di oggetti. Le risorse vengono eseguite solo quando i dati sono in fase di elaborazione e NiFi non deve più essere in esecuzione 24 ore su 24, 7 giorni su 7. Questo permette anche di fornire un'architettura completamente serverless senza alcun requisito di costi operativi dell'infrastruttura.

Acquisizione di Data lakehouse


Modernizza le pipeline di dati con uno strumento unico che funziona con qualsiasi data lakehouse o warehouse.

Grazie al supporto di oltre 450 processori, Cloudera DataFlow semplifica la raccolta e la trasformazione dei dati nel formato richiesto dal tuo lakehouse.

Cloudera DataFlow offre la flessibilità necessaria per trattare i dati non strutturati come tali e ottenere un throughput elevato senza dover applicare uno schema o per fornire una struttura ai dati non strutturati, applicando uno schema e utilizzando il linguaggio di espressione NiFi o le query SQL per trasformarli facilmente.

 

Sicurezza informatica e ottimizzazione dei registri


Consenti ai data analyst di rilevare e analizzare gli eventi in modo più rapido e preciso curando  i dati SIEM.

Riduci i costi della tua soluzione di sicurezza informatica modernizzando le pipeline di raccolta dei dati per raccogliere e filtrare in tempo reale i dati provenienti da migliaia di fonti in tutto il mondo.

L'ingestione di tutti i log di dispositivi e applicazioni all'interno della tua soluzione SIEM non è un approccio scalabile né per i costi né per le prestazioni. Cloudera DataFlow consente di raccogliere i dati di log da qualsiasi punto e eliminare ciò che non è necessario, mantenendo la gestione dei dati memorizzati nel sistema SIEM.

IoT e raccolta dati in streaming


Invia i dati dai dispositivi IoT all'edge a un flusso di dati centralizzato nel cloud in grado di scalare in base alle esigenze.

Cloudera DataFlow è progettato per gestire i dati in streaming su larga scala, consentendo alle organizzazioni di avviare i progetti IoT in piccolo, con la certezza che i flussi di dati sono in grado gestire l'esplosione di dati causata dall'aggiunta di più dispositivi sorgente e i problemi di connettività intermittente.

Caratteristiche principali

Il runtime di DataFlow Functions offre un modo efficiente, ottimizzato in termini di costi e scalabile per eseguire flussi NiFi in modo completamente serverless per casi d'uso basati sugli eventi.

Le distribuzioni di Dataflow scalano automaticamente in base ai flussi NiFi. I costi dell'infrastruttura possono essere controllati impostando limiti minimi e massimi per la scalabilità automatica.

Connettiti a qualsiasi fonte o destinazione di dati utilizzando la ricca libreria di processori di NiFi, tra cui fonti di dati on premise, archiviazione di dati cloud, data warehouse cloud, fonti di dati di log, servizi di analisi dei dati cloud o servizi di processi aziendali cloud. Gli sviluppatori possono anche implementare rapidamente un set predefinito di flussi di dati con ReadyFlows, una configurazione minima che implementa i casi d'uso più comuni di flusso di dati.

Monitora tutte le distribuzioni di flusso NiFI in un'unica dashboard, indipendentemente dal cloud in cui vengono eseguite. Monitora le metriche importanti sulle prestazioni del flusso definendo avvisi KPI per le distribuzioni del flusso.

Fornisci facilmente endpoint sicuri, stabili e scalabili, semplificando l'invio di dati per le distribuzioni di flusso da parte di qualsiasi applicazione.

Cloudera DataFlow è stato creato pensando all'automazione. Qualsiasi azione eseguita all'interno dell'interfaccia utente può essere trasformata in un'istruzione CLI per l'automazione. Distribuire un nuovo flusso NiFi è facile come eseguire un singolo comando CLI.

SVILUPPA FLUSSI NIFI OVUNQUE E DISTRIBUISCILI SU QUALSIASI CLOUD
come cluster Kubernetes con scalabilità automatica o come flussi serverless NiFi

Diagramma di flusso DataFlow for Public Cloud

Opzioni di Runtime nel cloud pubblico

Caratteristiche Implementazioni di DataFlow Funzioni di DataFlow

Runtime Cloud

Cluster NiFi che utilizzano 
Kubernetes/Container
Flussi NiFi in esecuzione sui servizi di elaborazione serverless dei provider di cloud (AWS Lambda, Azure Functions e Google Cloud Functions)

Casi d'uso

Casi d'uso che richiedono una bassa latenza, per carichi di lavoro a volumi elevati che richiedono flussi NiFi sempre in esecuzione Casi d'uso event-driven e con possibilità di micro esplosioni di dati, senza requisiti di latenza inferiori al secondo, in cui i flussi NiFi non devono essere eseguiti in modo continuo

Vantaggi

Ridimensionamento automatico dei cluster Kubernetes per flussi di lavoro di lunga durata con monitoraggio centralizzato Modalità efficiente, economicamente ottimizzata e scalabile di eseguire flussi NiFi serverless, per consentire agli sviluppatori di concentrarsi sulla logica aziendale

Unità di misurazione

Cloudera Compute Unit (CCU) Conteggio delle invocazioni di metodo 


Scopri DataFlow per il Public Cloud

Raccogli dati dall'edge 


Gestisci, controlla e monitora l'edge per iniziative di streaming e IoT e fornisci dati in streaming in tempo reale con l'acquisizione e la gestione no-code con Cloudera Edge Management.

Per iniziare

DOCUMENTAZIONE DI PRODOTTO

Scopri specifiche tecniche, architettura e tutorial su Cloudera DataFlow for the Public Cloud.

Scopri di più

PREZZI DI CDF PER IL PUBLIC CLOUD


Valuta i prezzi di Cloudera DataFlow for the Public Cloud rispetto ai diversi tipi di istanze cloud.

Consulta i dettagli

PRESENTAZIONE DI DATAFLOW

Guarda con i tuoi occhi Cloudera DataFlow per il Public Cloud.

Accedi ora

COMMUNITY CLOUDERA CON NIFI

Connettiti con i tuoi colleghi, poni domande, risolvi problemi e scopri di più su Apache NiFi.

Guarda ora

FORMAZIONE NIFI

Prenota un corso di formazione pratico di tre giorni sulle basi di Apache NiFi e molto altro.

Scopri di più

DEMO DEL PRODOTTO

Guarda la presentazione e la dimostrazione di Cloudera DataFlow per il Public Cloud.

Guarda

Demo

Funzionalità DataFlow su Cloudera Data Platform for Public Cloud

Webinar

Spostare i dati aziendali da qualsiasi luogo a qualsiasi sistema è più facile che mai

News

Blog: Annuncio della disponibilità generale delle funzionalità DataFlow

Webinar

Controlla tutte le pipeline di dati in streaming

Formazione, assistenza e servizi di punta

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.