La sfida più grande quando si tratta di ottenere informazioni dai dati in streaming risiede senz'altro nell'acquisizione dei dati, che deve avvenire in modo rapido, sicuro e con priorità all'analisi, garantendo una chiara tracciabilità.
Hortonworks DataFlow (HDF) si è ora trasformato in Cloudera DataFlow (CDF), una piattaforma di analisi in streaming scalabile e in tempo reale che acquisisce, gestisce e analizza i dati per ottenere informazioni chiave e un'intelligence prontamente utilizzabile.
DataFlow è un valido aiuto nell'affrontare le principali sfide a cui le grandi organizzazioni devono far fronte quando si parla di dati in transito:
- Elaborazione dello streaming di dati in tempo reale con grandi volumi e su larga scala
- Tracciabilità della provenienza dei dati e del percorso dei dati in streaming
- Gestione e monitoraggio di applicazioni edge e delle fonti di streaming
La piattaforma Cloudera DataFlow
Cloudera Edge Management, Cloudera Flow Management e Cloudera Stream Processing sono finalmente disponibili nella piattaforma data-in-motion open-source di Cloudera per lo streaming dei dati in tempo reale.

Principali vantaggi
Riduzione dei tempi di sviluppo dell'integrazione dei dati
Immagina un approccio no-code alla costruzione di pipeline di dati complesse con il minimo sforzo. CDF sfrutta semplici UI grafiche per la costruzione di flussi di dati sofisticati che favoriscono l'acquisizione e la trasformazione di notevoli quantità di dati e un arricchimento alimentato da molte fonti di streaming diverse. Gestito da Apache NiFi, CDF acquisisce dati da dispositivi, applicazioni aziendali, sistemi di partner e applicazioni edge che generano dati in streaming in tempo reale.
Gestione e protezione dei dati edge-to-enterprise
CDF consente la raccolta di grandi volumi di dati dal edge, anche da dispositivi edge che utilizzano Minifi. Ora è possibile impostare con facilità i modelli di distribuzione IoT per raccolte di dati regionali utilizzando NiFi con Minifi per far fluire i dati dal edge. La perfetta integrazione con Apache Ranger assicura a CDF l'esclusivo vantaggio di una protezione senza falle per tutti i dati in transito e i dati a riposo.
Informazioni in tempo reale più velocemente che mai
Avendo a disposizione informazioni in tempo reale e un'intelligence prontamente utilizzabile, si può agire più in fretta. Grazie alla potente piattaforma in streaming Apache Kafka, CDF è in grado di elaborare diversi milioni di transazioni al secondo, individuare pattern chiave, eseguire confronti con modelli di machine learning e offrire analisi predittive o prescrittive per aiutare i dirigenti a prendere decisioni strategiche e cogliere preziose opportunità.
Conformità pronta all'uso
CDF è l'unico prodotto del settore che offre immediatamente elementi quali provenienza dei dati e governance dei dati edge-to-enterprise. Nell'era del GDPR e delle altre norme sulla conformità, è fondamentale conoscere la derivazione dei dati, anche se si tratta di dati in streaming. Grazie a NiFi, CDF mette subito a disposizione questo tipo di informazioni, senza bisogno di ulteriori operazioni di configurazione o impostazione. La perfetta integrazione con Apache Atlas assicura una governance dei dati completa, dai margini della rete al cuore dell'organizzazione.
Costruisci un'architettura di dati che si adatta all'IoT
Capitalizza la ricchezza delle informazioni ottenute dai dati IoT
CDF è una tecnologia 100% open source, per progettare un'architettura adeguata alle esigenze future senza legarsi a fornitori specifici. Consente di implementare soluzioni IoT per casi d'uso critici in settori come automotive, produzione, trasporti, utenze, commercio al dettaglio e settore pubblico. Per i dati è possibile adottare una strategia che consente l'elaborazione di grandi volumi di dati diversificati a grande velocità.