Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

CCP dati ingegnere esame (DE575)

  • Numero di domande:  5–10 attività pratiche sul cluster preconfigurato di Cloudera Enterprise, dove si valutano i risultati finali. 
  • Tempo a disposizione:  240 minuti
  • Punteggio necessario per superare l’esame: 70%
  • Lingua: inglese
  • Prezzo:  USD $400

Bundle di sviluppatore: Acquistate un  esame di CCP Data Engineer (DE575)  e aggiungere un scintilla Developer esame (CCA175)  per $95. Vedi la nostra pagina  di promozioni per i dettagli.

Formato delle domande di esame

Vi verranno assegnati da cinque a dieci problemi dei clienti, ciascuno con un unico e ampio set di dati, un cluster CDH e quattro ore. Per ogni problema, è necessario implementare una soluzione tecnica con un alto grado di precisione che soddisfi tutti i requisiti. È possibile utilizzare qualsiasi strumento o combinazione di strumenti sul cluster (vedi elenco sotto) - potrai scegliere lo strumento o gli strumenti che siano adatti al lavoro. Deve possedere sufficiente conoscenza del settore per analizzare il problema e arrivare a un approccio ottimale dato il tempo consentito. È necessario che tu possieda una conoscenza del settore sufficiente per analizzare il problema e arrivare ad un approccio ottimale nel tempo concesso.

Valutazione, resoconto con il punteggio e certificato

L'esame viene valutato immediatamente dopo la conclusione e riceverai un resoconto con il punteggio lo stesso giorno dell'esame. Lì si mostrerà il numero di problemi per ciascuna sezione e il relativo voto. Se non superi una sezione, il resoconto con il punteggio include i criteri non superati (ad esempio, “I record contengono dati errati” o “Formato del file errato"). Non forniamo informazioni più dettagliate al fine di proteggere il contenuto dell'esame. Leggi ulteriori informazioni sulla revisione del contenuto dell'esame tra le domande frequenti.

Se superi l'esame, riceverai una seconda e-mail pochi giorni dopo l'esame con il tuo certificato digitale in PDF, il numero di licenza, un aggiornamento del profilo LinkedIn e un link per scaricare i loghi CCA da utilizzare nel tuo profilo professionale e nei social network.

Profili e prerequisiti

I candidati a data engineer CCP dovrebbero vantare una profonda esperienza nello sviluppo di soluzioni di data engineering e un’alta padronanza delle competenze di cui sopra. Non ci sono altri prerequisiti.

L'esame di CCP Data Engineer è stato creato per identificare i professionisti di talento dati cercando di distinguersi e di essere riconosciuto dai datori di lavoro alla ricerca per le loro abilità. Di fuori con esperienza pratica nel settore, è consigliabile che dall'aspetto professionale per ottenere questo certificazione inizio prendendo di  Cloudera scintilla e corso di formazione  per sviluppatori Hadoop.

 

Competenze richieste

Raccolta dati

Trasferimento dati tra sistemi esterni e il tuo cluster, tra cui:

  • Importare ed esportare i dati tra un RDBMS esterno e il tuo cluster, includendo l’importazione di sottoinsiemi specifici, la modifica del delimitatore e del formato file dei dati importati durante la raccolta e la variazione del modello o dei privilegi di accesso ai dati.
  • Raccogliere i dati in streaming e quasi in tempo reale in HDFS, includendo la distribuzione verso più fonti di dati e la conversione dei dati in fase di acquisizione da un formato all'altro.
  • Caricare i dati su e da HDFS usando i comandi di Hadoop File System (FS).

Trasforma, prepara e archivia

Converti una serie valori di dati con un determinato formato archiviato in HDFS in nuovi valori di dati o in un nuovo formato di dati e scrivili in HDFS o Hive/HCatalog. Ciò include le seguenti competenze:

  • Convertire i dati da un formato di file all’altro
  • Scrivere e comprimere i tuoi dati
  • Convertire i dati da un set di valori a un altro (ad esempio, Lat/Long a indirizzo postale utilizzando una libreria esterna)
  • Cambiare il formato dei dati dei valori in un set di dati
  • Eliminare i record non validi da un set di dati, ad esempio valori nulli
  • Deduplicare e unire i dati
  • Denormalizzare i dati da più set di dati eterogenei
  • Sviluppare uno schema Avro o Parquet
  • Effettuare una partizione di un set di dati esistente in base a una o più chiavi delle partizioni
  • Ottimizzare i dati per prestazioni ottimali della query

Analisi dei dati

Filtra, ordina, unisci, aggiungi o trasforma uno o più set di dati in un determinato formato archiviato in HDFS per ottenere un risultato specifico. Tutte queste attività possono includere la lettura da Parquet, Avro, JSON, testo delimitato e testo in linguaggio naturale. Le query includeranno tipi di dati complessi (ad es. matrici, mappe, strutture), l'implementazione di librerie esterne, partizioni di dati, dati compressi e richiedono l'uso di metadati da Hive o HCatalog.

  • Scrivi una query per aggiungere più righe di dati
  • Scrivi una query per calcolare statistiche aggregate (ad es. media o somma)
  • Scrivi una query per filtrare i dati
  • Scrivi una query per calcolare le statistiche aggregate (ad esempio, media o somma)
  • Scrivi una query che unisce più set di dati
  • Leggi e/o crea una tabella HCatalog o Hive con i dati esistenti in HDFS

Flusso di lavoro

La capacità di creare ed eseguire vari processi e azioni che permettono di ottenere dai dati maggior valore e uso in un sistema. Questo include quanto segue:

  • Crea ed esegui un flusso di lavoro lineare con azioni che includono processi Hadoop, Hive, Pig, azioni personalizzate, ecc.
  • Crea ed esegui un flusso di lavoro con diramazione e con azioni che includono processi Hadoop, Hive, Pig, azioni personalizzate, ecc.
  • Organizza un flusso di lavoro da avviare regolarmente a orari predefiniti, incluso con dipendenze dai dati

Hai altre domande? Consulta le nostre domande frequenti sulla certificazione

Consegna dell’esame e informazioni sui cluster

L’esame per data engineer CCP (DE575) è un esame controllato a distanza disponibile ovunque e in qualsiasi momento. 

L’esame per data engineer CCP (DE575) è un esame pratico che utilizza le tecnologie Cloudera. Ogni utente ha il proprio cluster CDH (al momento, versione 5.10.1) che già dispone di Spark, Impala, Crunch, Hive, Pig, Sqoop, Kafka, Flume, Kite, Hue, Oozie, DataFu e molti altri (vedi l’elenco completo). Inoltre, il cluster include Python 2.7 e 3.4, Perl 5.16, Elephant Bird, Cascading 2.6, Brickhouse, Hive Swarm, Scala 2.11, Scalding, IDEA, Sublime, Eclipse e NetBeans.

Documentazione disponibile online durante l'esame

Documentazione sui prodotti Cloudera
Apache Hadoop
Apache Hive
Apache Impala
Apache Sqoop
Spark
Apache Crunch
Apache Pig
Kite SDK
Apache Avro
Apache Parquet
Cloudera HUE
Apache Oozie
Apache Flume
DataFu
JDK 7 API Docs
Python 2.7 Documentation
Python 3.4 Documentation
Scala Documentation

Only the documentation, links, and resources listed above are accessible during the exam. All other websites, including Google/search functionality is disabled. You may not use notes or other exam aids.

 

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.