Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

Esame CCA dati analista (CCA159)

  • Numero di domande:  8–12 attività pratiche sul cluster di Cloudera Enterprise, dove si valutano i risultati finali. Vedi sotto maggiori informazioni per la configurazione completa del cluster.
  • Tempo a disposizione: 120 minuti
  • Punteggio necessario per superare l’esame: 70%
  • Lingua: inglese
  • Prezzo: 295 USD

Formato delle domande di esame

Ti verranno proposti tra otto e 12 problemi di clienti con un unico e grande set di dati, un cluster CDH e due ore per risolverli. Per ogni problema, devi trovare una soluzione tecnica con un alto grado di precisione che soddisfi tutti i requisiti. Potrai usare qualsiasi strumento o combinazione di strumenti sul cluster (vedi l'elenco sotto); sta a te scegliere quale o quali strumenti usare per farlo. Devi avere conoscenze sufficienti per analizzare il problema e arrivare ad un approccio ottimale considerando il tempo concesso. Devi sapere cosa dovresti fare e poi farlo su un cluster reale, tenendo conto del limite di tempo e del fatto che ci sarà un controllore.

Valutazione, resoconto con il punteggio e certificato

L'esame viene valutato immediatamente dopo la conclusione e riceverai un resoconto con il punteggio lo stesso giorno dell'esame. Lì si mostrerà il numero di problemi per ciascuna sezione e il relativo voto. Se non superi una sezione, il resoconto con il punteggio include i criteri non superati (ad esempio, “I record contengono dati errati” o “Formato del file errato"). Non forniamo informazioni più dettagliate al fine di proteggere il contenuto dell'esame. Leggi ulteriori informazioni sulla revisione del contenuto dell'esame tra le domande frequenti.

Se superi l'esame, riceverai una seconda e-mail pochi giorni dopo l'esame con il tuo certificato digitale in PDF, il numero di licenza, un aggiornamento del profilo LinkedIn e un link per scaricare i loghi CCA da utilizzare nel tuo profilo professionale e nei social network.

Profili e prerequisiti

Candidati per CCA analista di dati possono essere sviluppatori, analisti di dati, specialisti di intelligenza di affari, gli sviluppatori, architetti di sistema e gli amministratori di database SQL. Non esistono prerequisiti.

L'esame per analisti di dati CCA è stato creato per identificare sviluppatori SQL di talento che desiderano distinguersi agli occhi dei datori di lavoro che cercano queste competenze. Si raccomanda che gli interessati frequentino prima il corso di  formazione Cloudera per analisti di dati, che ha gli stessi obiettivi dell'esame.

 

Competenze richieste

Prepara i dati

Usa i processi di estrazione, trasferimento e caricamento (ETL) per preparare i dati per le query.

  • Importa i dati da un database MySQL in HDFS usando Sqoop

  • Esporta i dati a un database MySQL da HDFS usando Sqoop

  • Sposta i dati tra le tabelle nel metastore

  • Trasforma valori, colonne o formati di file dei dati in arrivo prima dell'analisi

Fornisci una struttura ai dati

Utilizza le istruzioni di linguaggio di definizione dati (DDL, Data Definition Language) per creare o modificare strutture nel metastore da usare in Hive e Impala.

  • Crea tabelle utilizzando una varietà di tipi di dati, delimitatori e formati di file

  • Crea nuove tabelle utilizzandone di esistenti per definire lo schema

  • Migliora le prestazioni delle query creando tabelle partizionate nel metastore

  • Modifica le tabelle per modificare lo schema esistente

  • Crea viste per semplificare le query

Analisi dei dati

Utilizzare le istruzioni del linguaggio query (QL, Query Language) su Hive e Impala per analizzare i dati sul cluster.

  • Prepara report usando i comandi SELECT, tra cui union e sottoquery

  • Calcola statistiche aggregate, come somme e medie, durante una query

  • Crea query su più fonti di dati utilizzando i comandi “join”

  • Trasforma il formato di output delle query utilizzando le funzioni incorporate

  • Esegui query su un gruppo di righe utilizzando le funzioni finestra

 

Consegna dell’esame e informazioni sui cluster

CCA159 è un esame pratico che utilizza le tecnologie Cloudera. Ogni utente ha il proprio cluster CDH5 (al momento, 5.10.1) che già dispone di Spark, Impala, Crunch, Hive, Pig, Sqoop, Kafka, Flume, Kite, Hue, Oozie, DataFu e molti altri (vedi l’elenco completo). Inoltre, il cluster include Python 2.7 e 3.4, Perl 5.16, Elephant Bird, Cascading 2.6, Brickhouse, Hive Swarm, Scala 2.11, Scalding, IDEA, Sublime, Eclipse e NetBeans.

Documentazione disponibile online durante l'esame

Documentazione sui prodotti Cloudera
Apache Hadoop
Apache Hive
Apache Impala
Apache Sqoop
Spark
Apache Crunch
Apache Pig
Kite SDK
Apache Avro
Apache Parquet
Cloudera Hue
Apache Oozie
Apache Flume
DataFu
Documenti sull’API JDK 7
Documentazione su Python 2.7
Documentazione su Python 3.4
Documentazione su Scala

Durante l’esame si potranno consultare solo la documentazione, i link e le risorse sopra elencati. Tutti gli altri siti web, inclusa la funzionalità di ricerca di Google verranno disabilitati. Non è possibile utilizzare appunti o altri aiuti per gli esami.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.