Cercare di gestire la governance senza una soluzione completa di data lineage può farti sentire come se i tuoi dati ti sfuggissero. Non è facile tenere il passo con i dati e i metadati in movimento. I responsabili della governance e gli amministratori dei dati di successo sfruttano uno strumento di data lineage per migliorare la governance cento volte in quattro modi chiave che analizzeremo di seguito.
Il mantenimento della qualità è un obiettivo chiave della governance dei dati. È tua responsabilità assicurarsi che il management e gli utenti aziendali prendano decisioni importanti sulla base di informazioni accurate.
Se trovi dati errati, rimuovili e sostituiscili il prima possibile. Ma se correggi costantemente in modo retroattivo invece di correggere l'origine dell'errore, sarà come strappare continuamente le erbacce dal campo dei dati. A lungo termine, è molto più efficace identificare dove nel sistema è stato introdotto l'errore e correggerlo alla fonte.
Uno strumento di data lineage completo consente di tracciare il viaggio di qualsiasi punto di dati a monte verso l'origine e a valle verso l'obiettivo, ispezionando ogni processo che ha trasformato i dati lungo il percorso.
Nel caso di dati difettosi, puoi usare la linea di dati per condurre rapidamente un'analisi delle cause radice, lavorando a ritroso dal punto in cui l'errore è apparso e identificando la fase e/o il processo in cui i dati sono passati da accurati a difettosi. È quindi possibile correggere il problema alla radice, eliminando la proliferazione di dati sporchi e la necessità di correggere tali dati ovunque si trovino nel proprio ambiente.
Se vuoi lavorare in un settore in cui il cambiamento sembra lento, prova la paleontologia. Quando lavori nella governance dei dati, il cambiamento è costante e rapido. Le tecnologie si evolvono, i sistemi sorgente si sviluppano, la struttura del set di dati viene modificata per riflettere le nuove esigenze aziendali derivanti dai dati, i metodi di calcolo cambiano e così via.
Tutte le piccole modifiche costanti devono essere riflesse nella tua piattaforma di governance dei dati, altrimenti ti ritroverai rapidamente con pile di dati non governati. Se l'aggiornamento della piattaforma di governance dei dati è affidato a uno sforzo umano e manuale, è molto facile che un cambiamento cada nel dimenticatoio.
Gli strumenti di data lineage automatizzati per la governance dei dati, invece, eseguiranno periodicamente e automaticamente tutti i suoi metadati e prenderanno nota di ogni nuova aggiunta, eliminazione o modifica. Aggiorneranno quindi la tua piattaforma di governance dei dati con i nuovi campi, calcoli o altri metadati.
Con una soluzione automatizzata di tracciabilità dei dati a supporto, puoi concentrarti sulla gestione e sul governo dei dati invece che sulla loro ricerca.
Fusioni, migrazioni e transizioni: oh, cielo! La maggior parte dei professionisti dei dati probabilmente vivrà, se non presiederà, almeno uno di questi importanti eventi nel corso della propria carriera.
Di solito la transizione è inevitabile. E altrettanto inevitabilmente causerà danni al lavoro di chiunque nella tua azienda si occupi di dati e dei loro risultati, dalla governance alla BI fino al business, a meno che tu non preveda dove le modifiche apportate per adattarsi al nuovo sistema influenzeranno i tuoi flussi di lavoro attuali.
A parte una sfera di cristallo, questa previsione può essere ottenuta solo creando una visualizzazione completa del sistema attuale e del flusso di dati, confrontandola con il layout e i processi previsti del nuovo sistema e pianificando come passare agevolmente dall'uno all'altro.
Di solito comporta anche molta comunicazione tra i membri dei diversi dipartimenti per informarli dei cambiamenti previsti e chiedere in che modo questi cambiamenti influenzeranno loro, i loro dati e i loro processi (e poi sperare che rispondano effettivamente in modo tempestivo). Questo processo, se eseguito manualmente, richiede tipicamente mesi a un intero dipartimento dati.
Inoltre, una prossima grande transizione può rappresentare un'opportunità: un'opportunità per rendere la governance dei dati più efficiente eliminando i campi dormienti, consolidando definizioni sovrapposte e verificando la coerenza dei risultati del processo. Ma sfruttare questa opportunità può richiedere mesi di mappatura manuale solo per preparare il vero lavoro di semplificazione della gestione dei dati.
Uno strumento automatizzato per la il data lineage può trasformare quei mesi di analisi manuale dell'impatto in giorni, o addirittura in un solo giorno. Parliamo di efficienza. Un piccolo passo per uno strumento automatizzato di lineage dei dati; un grande balzo in avanti per la governance dei dati.
Facciamo un viaggio indietro nel tempo fino al giorno in cui la tua azienda ha ottenuto una nuova piattaforma di governance dei dati aziendali: congratulazioni! Questa piattaforma farà miracoli per voi non appena la installerete. Ma è più facile a dirsi che a farsi.
Le piattaforme di governance dei dati solitamente dispongono di un catalogo dati incorporato e la configurazione implica il popolamento di tale catalogo con tutti i metadati che si intende gestire. Questo processo di solito richiede mesi e mesi di lavoro. Tuttavia, con uno strumento di lignaggio dati automatizzato, è possibile creare un intero catalogo dati durante la pausa pranzo.
Come già detto, una soluzione completa di data lineage non si adagia sul lavoro dopo la pulizia iniziale. Si aggiorna periodicamente, aggiornando la tua piattaforma di governance dei dati con eventuali cambiamenti o aggiunte ai metadati, così non devi mettere a rischio il tuo rapporto di lavoro con altri dipartimenti ricordando costantemente di aggiornare te o la piattaforma ogni volta che apportano una modifica a un campo, un processo o un report.
Non tutte le soluzioni che si definiscono "di data lineage" possono effettivamente svolgere tutte le funzioni sopra descritte. Alcuni strumenti sono dotati di funzioni di lineage automatizzate integrate, ma richiedono comunque un lavoro manuale significativo (e un mal di testa). Pertanto, è importante valutare le soluzioni per assicurarsi che offrano la gamma completa di funzionalità e la gestione dei metadati di cui si ha bisogno.
A tal fine, richiedi una demo per iniziare con Cloudera Octopai Data Lineage, una soluzione automatizzata di lineage che può svolgere queste funzioni e migliorare la governance dei suoi dati oggi stesso.
This may have been caused by one of the following: