INAIL logo
400% riduzione del tempo di elaborazione

Caratteristiche chiave

Categoria

Settore pubblico

Sede

Italia

Impatto

  •  Una profonda revisione dell’infrastruttura di gestione dei dati
  • Abbattimento dei silos pre-esistenti con la creazione di un unico repository per tutti i dati presenti in azienda, organizzati e grezzi

  • Semplificazione delle operazioni, con una forte ottimizzazione dei job di trasformazione

  • Tempi di elaborazione dei dati fortemente ridotti, con il caricamento mensile dei data mart passato da 6 giorni a 1 giorno e mezzo

  • Migliore organizzazione delle informazioni, indipendentemente dalla loro origine e tipologia

  • Possibilità per gli utenti di accedere ai dati in modo semplice e naturale, senza necessità di affrontare tecnicismi eccessivi

  • Forte spinta alla diffusione della conoscenza in azienda, anche fuori dal dominio IT

INAIL, Istituto Nazionale per l'Assicurazione contro gli Infortuni sul Lavoro, è un ente pubblico non economico italiano che gestisce l'assicurazione obbligatoria contro gli infortuni sul lavoro e le malattie professionali.

Fondato nel 1933, sostiene la cultura della prevenzione per ridurre sempre più il fenomeno infortunistico e le malattie professionali. Oltre ad assicurare i lavoratori che svolgono attività rischiosa, eroga prestazioni economiche e sanitarie e promuove il reinserimento lavorativo e sociale. 

Ogni anno vengono denunciati circa 650.000 infortuni sul lavoro. Con circa 10.000 dipendenti distribuiti su tutto il territorio nazionale, INAIL gestisce un portfolio di circa 3,2 milioni di aziende, proteggendo le attività lavorative e realizzando attività di ricerca scientifica tese a migliorare sempre di più la sicurezza dei lavoratori.

Gestire i dati in modo efficiente e utile al business

“Il momento storico attuale vede il prevalere di due forze che impattano fortemente sul mondo della gestione dei dati e delle informazioni. Da un lato, si verifica una crescita esponenziale e continua della quantità di informazioni prodotte ogni giorno, che porta significative difficoltà nella sua gestione. Dall’altro, si fa più pressante da parte dell’utente business la richiesta di analisi sempre più ricche e sofisticate sui dati: se prima era sufficiente un’analisi di tipo descrittivo, ora si richiedono analisi predittive, con tempi di attesa che si fanno sempre più ridotti, portando a un time-to-market via via più stringente”, spiega Patrizio Galasso, Responsabile Ufficio Soluzioni per la gestione dei dati e del patrimonio informativo, INAIL.

Per velocizzare i processi e guadagnare in flessibilità, INAIL ha avviato un progetto di revisione completa del sottosistema IT dedicato alla business intelligence. Il punto di partenza era un’infrastruttura di gestione dei dati di tipo tradizionale, basata su un data warehouse classico, dotato di data mart. Nel tempo sono stati aggiunti cruscotti specifici per rispondere a domande puntuali da parte del business, arrivando a un’infrastruttura abbastanza tipica per un’organizzazione di queste dimensioni.

Tuttavia, INAIL si è trovato così con un’architettura poco flessibile, che richiedeva profonde revisioni ogni volta che veniva richiesta una variazione, con tutti i costi collegati. La presenza di tanti cruscotti differenti portava inoltre a una duplicazione dei dati, con conseguente occupazione di storage ma anche e soprattutto di incongruenze a livello di informazioni derivanti dalla lettura dei dati dai diversi settori aziendali. Tutto questo, abbinato alle numerose licenze software necessarie e alla complessità operativa legata alla gestione di un’infrastruttura così articolata faceva lievitare ulteriormente i costi.

Una profonda revisione infrastrutturale in ottica Big Data

Per risolvere queste criticità, INAIL ha deciso di affidarsi a Cloudera per l’adozione di una piattaforma Big Data. I sistemi alimentanti non sono stati toccati, ma è stato completamente ridisegnato il cuore del sistema, rappresentato da tre componenti principali: il data lake che contiene i dati provenienti dai sistemi alimentanti con una struttura identica a quella originale; un data hub che contiene i dati organizzati in base all'utilizzo che se ne intende fare, quindi con un’organizzazione a tabelle di fatti e dimensioni; infine un data lab che contiene sia i dati che gli strumenti di analisi. Questa parte centrale implementata su un cluster Cloudera è stata chiamata Ianua, perché rappresenta la porta verso la conoscenza di INAIL. Sopra questo sistema è stato creato un data portal unificato per la fruizione dei dati, dotato di strumenti per eseguire analisi avanzate.

“Punto di forza di questo tipo di piattaforma è indubbiamente il fatto di aver creato un punto unico per la memorizzazione dei dati; quindi abbiamo un'infrastruttura omogenea che contiene sia i dati organizzati nell'ambito del data hub, ma anche i dati grezzi del data lake, ed è quindi molto semplice integrarli, anche in maniera dinamica”, spiega Patrizio Galasso. “Oggi, abbiamo una struttura al servizio dei data scientist, il data lab, che permette di utilizzare nuove tecnologie che prima non erano compatibili con l’organizzazione che avevamo. Ovviamente abbiamo guadagnato molto anche in termini di velocità di preparazione dei dati.”

Risultati concreti e misurabili, sia per l’IT che per il business

Grazie all’adozione di questa architettura dati, i risultati positivi ottenuti hanno riguardato aspetti differenti. Dal punto di vista dell’IT sono stati ottimizzati i job di trasformazione, che sono passati da 2000 a 800: questo è stato possibile perché sul nuovo ambiente è possibile creare big query e andare a integrare in un unico step elaborativo attività prima suddivise su più job. I tempi di elaborazione si sono ridotti: il caricamento mensile dei data mart si è ridotto del 400%, passando da 6 giorni a un giorno e mezzo. Ma soprattutto c’è stato un miglioramento nell'organizzazione dell'informazione, con la creazione di un unico ambiente dove sono memorizzati i dati, assicurando ulteriori benefici in termini di riduzione dei tempi di manutenzione e dello spazio disco occupato.

Dal punto di vista del business, l’eliminazione dei silos ci ha permesso di aumentare sia la qualità che la congruenza dei dati, nonché gli ambiti di analisi disponibili, tanto che adesso è possibile fare analisi su dati provenienti da sistemi diversi in maniera molto più semplice, mettendo a disposizione degli utenti più evoluti nuovi strumenti. Il passaggio alla piattaforma unica di Cloudera ha reso infatti possibile l’analisi incrociata di dati prima ospitati su sistemi differenti, come ad esempio quello delle richieste di riduzione del tasso medio di tariffa per prevenzione da parte delle aziende e quello storico degli infortuni, consentendo così agli utenti INAIL una visione unificata e immediata dei dati a disposizione, a supporto delle decisioni aziendali.

INAIL si sta ora muovendo sul livello più elevato, quello di fruibilità del dato. Le direttrici del progetto in questo ambito sono tre: arricchimento del patrimonio informativo, potenziamento dell'infrastruttura e miglioramento dell’accesso e gestione della conoscenza.

Un progetto che guarda al futuro

La piattaforma Ianua viene via via arricchita con domini prima non gestiti dal vecchio data warehouse, mentre prosegue il processo di abbattimento dei silos riducendo il numero di cruscotti, e si avviano nuovi progetti basati su machine learning e intelligenza artificiale. Dal punto di vista delle infrastrutture, INAIL sta migrando sui Cloudera Data Platform Private Cloud Base, che offre funzionalità multi-tenant per rispondere a esigenze specifiche e guadagnare sempre in flessibilità. La terza dimensione riguarda il miglioramento dell’accesso e la gestione della conoscenza, con l’obiettivo di semplificare sempre più la vita agli utenti business che vogliono interfacciarsi con il sistema informativo senza doversi scontrare con troppi tecnicismi. 

L’utente avrà a disposizione una schermata Google-like per esprimere, in linguaggio naturale, la propria esigenza. Utilizzando tecnologie ormai consolidate sul mercato tipo NLP(natural language processing), motori semantici e ontologie si andrà a estrapolare l'informazione che viene richiesta: se quell’informazione è presente su un cruscotto esistente, l'utente verrà indirizzato su questa componente applicativa. In caso contrario, si guiderà l'utente nell'interrogazione che deve fare accedendo in maniera autonoma direttamente a Ianua utilizzando un grafo ontologico, avvalendosi di terminologie e relazioni a lui note. 

La condivisione delle conoscenze

“Dal punto di vista dell’organizzazione aziendale, stiamo raggiungendo una serie di vantaggi particolarmente significativi, come documentare e mantenere aggiornata la conoscenza all’interno dell’organizzazione, utilizzando formalismi standard come l’ontologia. Stiamo diffondendo e uniformando la cultura e la semantica del dato e del significato dei termini che vengono utilizzati; e ovviamente stiamo semplificando l'accesso alla conoscenza in modo che possa effettivamente diventare patrimonio dell'intera organizzazione, e non solo dell’IT”, conclude Patrizio Galasso.

Punto di forza di una piattaforma di questo tipo è indubbiamente il fatto di aver creato un punto unico per la memorizzazione dei dati. Abbiamo creato un'infrastruttura omogenea che contiene sia i dati organizzati nell'ambito del data hub, ma anche i dati grezzi del data lake, motivo per cui diventa molto semplice integrarli, anche in maniera dinamica. Oggi, abbiamo una struttura al servizio dei data scientist, che permette di utilizzare nuove tecnologie che non erano compatibili con l’organizzazione che avevamo in precedenza. Abbiamo guadagnato molto anche in termini di velocità di preparazione dei dati.

-Patrizio Galasso, Responsabile Ufficio Soluzioni per la gestione dei dati e del patrimonio informativo, INAIL