small image Ebook: Apache NiFi per principianti
Panoramica

Semplifica e rendi operative le pipeline di dati, in modo sicuro e su qualsiasi scala.

CDP Data Engineering è l'unico servizio cloud-native creato appositamente per i team aziendali di data engineering. Costruito su Apache Spark, Data Engineering è un kit di strumenti completo che consente automazione dell'orchestrazione con Apache Airflow, monitoraggio avanzato delle pipeline, risoluzione visiva dei problemi e strumenti di gestione completi per agevolare i processi ETL per tutti i team di analisi aziendali.

Data Engineering è completamente integrato con Cloudera Data Platform, consentendo visibilità e sicurezza end-to-end con SDX e integrazioni continue con i servizi CDP come CDP Data Warehouse e CDP Machine Learning. Data Engineering su CDP potenzia flussi di lavoro di data engineering coerenti, ripetibili e automatizzati su una piattaforma di cloud ibrido, ovunque.

Casi d'uso di CDP Data Engineering

  • Automatizza le pipeline di dati ovunque
  • Ottieni visibilità e controllo ETL
  • Mantieni l'integrità dei dati

Automatizza le pipeline di dati ovunque


Trasmetti in sicurezza set di dati di qualità a CDP Data Warehouse, CDP Machine Learning o ad altri strumenti di analisi.

Data Engineering semplifica il passaggio delle pipeline di dati ai team di analisi, dal machine learning al data warehousing e oltre. Aumenta il time-to-value organizzando e automatizzando le pipeline per trasmettere set di dati curati e di qualità ovunque, in modo sicuro e trasparente.

Esempi concreti

Ottieni visibilità e controllo ETL


Gestisci i tuoi dati in modo olistico e trasparente.

Gestire il ciclo di vita dei dati e controllare i costi diventa sempre più difficile quando si cerca di rendere operative le pipeline di dati in tutta l'azienda su larga scala.

Data Engineering offre una suite di funzionalità operative e di visibilità per pianificare la capacità, l'automazione delle pipeline, l'acquisizione automatica delle derivazioni e la risoluzione dei problemi sui casi d'uso aziendali.

Leggi il post del blog

Screenshot di CDP Data Engineering | Cloudera

Mantieni l'integrità dei dati


Visibilità completa delle pipeline di dati per proteggere la tua attività.

Con l'aumentare della quantità e della complessità dei dati, non è facile garantire un'accuratezza e un'affidabilità costante per scalare i carichi di lavoro di analisi in tutta l'azienda.

Data Engineering offre monitoraggio e avvisi nativi per le pipeline di dati per identificare tempestivamente le criticità e un visual troubleshooting per risolverle rapidamente prima che incidano sulla tua attività.

 

Screenshot di CDP Data Engineering - Risoluzione dei problemi relativi alla pipeline di dati | Cloudera

Caratteristiche principali di CDP Data Engineering

Organizza flussi di lavoro complessi di trasformazione dei dati con il supporto di Apache Flow e centinaia di operatori per soddisfare i principali requisiti di analisi.

Data Engineering è containerizzato, scalabile e portatile, con barriere di protezione e ambienti di carichi di lavoro isolati che consentono una gestione sicura delle pipeline, con elaborazione on-demand elastica per soddisfare gli SLA aziendali in modo conveniente.

Visualizza le metriche delle performance come CPU, memoria e I/O in tutte le fasi dei tuoi lavori Spark per individuare le problematiche nelle prestazioni e trovare i punti critici durante la risoluzione dei problemi.

Sfrutta una ricca interfaccia di gestione dei lavori con CLI e API Rest da automatizzare e integrare facilmente nei flussi di lavoro esistenti come le pipeline CI/CD e gli strumenti di terze parti.

Data Engineering offre un servizio Spark su Kubernetes completamente integrato, che automatizza e semplifica la gestione degli artefatti, la sicurezza e la pianificazione delle risorse, sfruttando Apache Yunikorn per fornire pianificazione FIFO e GANG.

Tramite un'interfaccia centralizzata, gli amministratori della piattaforma possono gestire accessi e sicurezza per poi effettuare il provisioning di nuovi carichi di lavoro, monitorando la capacità e visualizzando l'utilizzo delle risorse nel tempo con semplicità. SDX consente anche il monitoraggio completo della derivazione del ciclo di vita per scoprire da dove provengono i dati e dove sono diretti.

Pronto per dare un'occhiata più da vicino?


Prova tu stesso Data Engineering su Cloudera Data Platform

Ebook

CDP Data Engineering: porta il tuo data lifecycle ad un livello superiore

Webinar

Webinar Cognilytica: come ottimizzare le pipeline di Data Engineering

Whitepaper

AI Data Engineering Lifecycle Checklist

Webinar

Data Engineering per le aziende: come accelerare e scalare le tue pipeline di dati

Formazione, assistenza e servizi di punta

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.