Prerequisiti del corso

Amministratore: Questo corso si rivolge in particolare a sistemisti e ai responsabili informatici che hanno esperienza di base su Linux. Non è tuttavia imprescindibile avere conoscenze precedenti di Apache Hadoop.

Analista di dati: Questo corso è pensato per analisti di dati, specialisti di business intelligence, sviluppatori, sistemisti e amministratori di database. Si presuppone la conoscenza di SQL, così come familiarità di base con riga di comando Linux. Conoscere almeno un linguaggio di scripting (ad esempio, Bash, Perl, Python o Ruby) è un plus, ma non è essenziale. Non è inoltre imprescindibile avere conoscenze precedenti di Apache Hadoop.

Sviluppatore per Spark e ​​Hadoop: Questo corso è pensato per sviluppatori e ingegneri che hanno esperienza di programmazione. Gli esempi di Apache Spark e gli esercizi pratici sono proposti in Scala e Python, quindi è necessario saper programmare in uno di questi linguaggi. Possedere conoscenze di base di SQL è un plus, mentre non è imprescindibile avere conoscenze precedenti di Apache Hadoop.

Search: Questo corso è rivolto a sviluppatori e ingegneri di dati con almeno una familiarità minima con Hadoop ed esperienza nella programmazione con un linguaggio generico come Java, C, C ++, Perl o Python. Gli studenti dovrebbero essere a proprio agio lavorando con riga di comando Linux e dovrebbero poter eseguire semplici compiti come creare e rimuovere directory, visualizzare e modificare autorizzazioni per i file, eseguire script ed esaminare l’output dei file. Non è richiesta alcuna esperienza precedente con Apache Solr o Cloudera Search, né HBase o SQL.

HBase: Questo corso si rivolge in particolare a sviluppatori e amministratori, preferibilmente con esperienza con database e modellazione dati, anche se non è indispensabile. Non è inoltre imprescindibile avere conoscenze precedenti di Apache Hadoop.

Formazione di scienziato di dati: Questo corso è  progettato per i dati distribuiti gli scienziati che attualmente utilizza Python o R per lavorare con set di dati più piccolo su una singola macchina e che hanno bisogno di scalare la loro analisi e machine learning modelli di DataSet di grandi dimensioni su cluster. Dati tecnici e sviluppatori con una certa conoscenza della scienza di dati e apprendimento automatico possono anche trovare questo workshop utile. I partecipanti al workshop dovrebbe avere una conoscenza di base di Python o R e alcuni esperienza esplorazione e analisi dei dati e sviluppo statistico o modelli di apprendimento della macchina. Non è richiesta la conoscenza di Hadoop o scintilla.

Per visualizzare i requisiti di configurazione del corso, clicca qui.

Per qualsiasi domanda, ti preghiamo di contattarci all’indirizzo training-admin@cloudera.com.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.