L'Indice di prontezza dei dati 2026: comprendere le basi per un'AI di successo

Scopri i risultati
  • Cloudera Cloudera
  • | Azienda

    Dalla piattaforma di analisi a un sistema operativo di intelligenza artificiale: Data Lakehouse nell'era dell'AI agentica

    Navita Sood Headshot
    Due donne con computer desktop

    L'architettura lakehouse è stata sviluppata con la missione di combinare la scala non strutturata del data lake con le prestazioni strutturate del data warehouse. Questo cambiamento ha unificato i dati aziendali e ha dato vita alla prima vera "unica fonte di informazione". Ma nel 2026 la missione si è ampliata. Con l'avvento dell'AI agentica, il lakehouse si sta evolvendo da un repository per la reportistica retrospettiva a supporto decisionale a uno strato contestuale ad alte prestazioni che alimenta gli agenti aziendali autonomi per supportare azioni autonome e immediate. La sua base aperta, flessibile e affidabile è arricchita da interoperabilità, gestione dei dati in tempo reale, sicurezza, governance, portabilità cross-cloud e on premise, e automazioni AI integrate per tutte le funzioni amministrative e operative. 

    In Cloudera, stiamo assistendo a una trasformazione fondamentale nel modo in cui i leader delle Fortune 2000 vedono i loro asset di dati. La pressione deriva dalla necessità di alimentare in modo efficiente gli agenti AI autonomi. Stanno utilizzando Cloudera lakehouse per unificare dati strutturati, semi-strutturati e non strutturati, al fine di abilitare "zero-copy", "zero-ETL", la messa a punto quasi in tempo reale del modello e l’inferenza in tempo reale. Il lakehouse abilita le pipeline RAG, i feature store AI e le pipeline di streaming in tempo reale, offrendo framework di governance, livelli di contesto semantico e intelligenza operativa per gli agenti aziendali. 

    Evoluzione del data lakehouse 

    Interoperabilità: rompere la trappola del "consolidation-first"

    Nell'era dell'AI, i tuoi dati sono il tuo principale vantaggio competitivo. Quindi è giusto che la tua strategia dati definisca quale strumento usare o dove addestrare ed eseguire la tua AI, non il contrario. Tuttavia, molti fornitori continuano a promuovere un modello "consolidation-first", richiedendo di spostare o copiare i dati nel loro ambiente proprietario di governance o cloud prima di poterli utilizzare. Questo non solo aggiunge costi, complessità e rischi alla tua strategia sui dati, ma spesso ti obbliga anche a rinunciare alla proprietà e al controllo dei tuoi dati.

    Il tuo data lakehouse deve essere aperto, flessibile, portabile, interoperabile e adattabile in modo che se la tua strategia di dati cambia, il tuo lakehouse si adatti ad essa. Quindi, i formati di tabella aperti (Apache Iceberg), i cataloghi aperti (Apache Polaris), i motori di query aperti, le REST-API e l'accesso federato stanno diventando il nuovo punto di riferimento e formano i blocchi fondamentali del lakehouse di Cloudera. 

    Lakehouse ibrido sensibile al contesto

    Gli LLM vengono addestrati su internet. Non conoscono la tua attività. Il successo dell'AI non è più determinato dalla qualità del modello. Dipende dai flussi di lavoro che sta automatizzando e dall'accuratezza del contesto aziendale che fornisce ai modelli: record ERP, transazioni finanziarie, log della supply chain, ecc.

    Cloudera Data Lakehouse fornisce un livello sicuro, ben protetto e consapevole del contesto per i tuoi agenti: 

    • Contesto a 360°: unifica e rendi disponibili i dati dall'edge, dai data center e dai cloud con un unico livello di governance che fornisce un contesto completo a 360°.

    • Dati multimodali: trasforma, pulisci e unifica i dati non strutturati come i log, i video e le immagini, aumentando l'analisi e il ragionamento insieme alle tabelle strutturate.

    • Semantica condivisa: combina metadati tecnici, aziendali e operativi per facilitare agli agenti la scoperta, la comprensione e l'utilizzo dei suoi dati nel corretto contesto aziendale.

    • Lineage a tutto campo: quando un agente AI prende una decisione di acquisto da un milione di dollari, è necessaria una traccia cartacea, o spiegabilità. Cloudera fornisce questa spiegabilità attraverso la tracciabilità end-to-end e il lineage automatizzato dal sensore edge all'output del modello finale. 

    Il lakehouse di Cloudera fornisce contesto in tempo reale attraverso ambienti distribuiti ed eterogenei, permettendo alle aziende di mantenere sotto controllo i propri dati, modelli e regole di business fornendo al contempo un contesto completo ai sistemi di AI.

    AI portatile

    Cloudera ti permette di applicare analisi e intelligence artificiale ai dati, ovunque essi si trovino. Sia che i tuoi dati risiedano in un object store on premise, in un cloud privato o in più cloud pubblici, il nostro lakehouse offre un'AI portatile con un'architettura unificata e zero-copy. Puoi sviluppare nel cloud ed eseguire inferenze on premise, senza alcun costo di rifattorizzazione, per mantenere il controllo sui tuoi dati e prevenire la fuga di IP. Per istituzioni finanziarie globali, come OCBC Bank, questa apertura di architettura consente loro di ampliare le capacità di AI/ML all'intero gruppo, rispettando rigorosi requisiti regionali di residenza e sovranità dei dati.

    Lakehouse autonomo e auto-ottimizzante

    I sistemi di AI sono altamente sensibili alla qualità, freschezza e coerenza dei dati. Con la crescita esponenziale dei volumi di dati e dei flussi di lavoro AI, l'ottimizzazione manuale diventa insostenibile. Cloudera integra le automazioni guidate dall'AI direttamente all'interno della piattaforma lakehouse per: 

    • Accesso ai dati 

    • Ottimizzazione dei dati

    • Compattazione

    • Evoluzione dello schema

    • Etichettatura e classificazione

    • Ottimizzazione del carico di lavoro

    • Monitoraggio della qualità

    • Applicazione della governance

    • Lineage

    • Gestione del ciclo di vita 

    Si auto-ottimizza continuamente riducendo la complessità operativa per i team di dati e AI. Utilizzando Cloudera Agent Studio, i nostri clienti distribuiscono agenti che monitorano, trasformano e spostano i dati in modo autonomo in base all'intento di business.

    Da batch a continuo: lo streaming lakehouse

    La distinzione tra "streaming" e "batch" sta svanendo. Per supportare i flussi di lavoro agentici, i dati non possono essere vecchi di minuti o ore: devono essere continui. 

    Cloudera Open Data Lakehouse funge da lakehouse in streaming per trattare ogni dato come un evento, consentendo agli agenti di AI di rispondere alle interruzioni della catena di approvvigionamento o alle anomalie finanziarie nel millisecondo in cui si verificano. Elabora questi eventi direttamente nel punto in cui si originano ed esegue analisi complesse sui dati in streaming prima di importarli nel lakehouse per un processo decisionale quasi in tempo reale. Fornisce inoltre agli agenti i dati di streaming pre-elaborati in fase di inferenza per consentire azioni in tempo reale. Il lakehouse include anche funzionalità di condivisione e federazione dei dati, assicurando che i dati provenienti da altre fonti possano essere utilizzati con una latenza minima, senza spostamenti o trasformazioni inutili dei dati. 

    Il continuum edge-to-AI: l'inferenza edge estende il lakehouse oltre il data center

    Un lakehouse non è un monolite centralizzato. Con la proliferazione di IoT, fabbriche intelligenti e applicazioni mobili, l'inferenza edge è diventata fondamentale. Cloudera estende il lakehouse verso l’esterno, permettendo analisi e azioni dove i dati vengono generati (all’edge) sincronizzando nuovamente gli approfondimenti con l’hub centrale. Da Navistar: elaborando i dati dei sensori provenienti da migliaia di camion connessi in tempo reale, hanno ridotto i costi di manutenzione del 30% attivando automaticamente azioni proattive di manutenzione.

    Convergenza tra Data Fabric e Lakehouse

    Da Cloudera, stiamo assistendo a una convergenza delle architetture Lakehouse e Fabric. Mentre il lakehouse unifica i dati, il fabric attiva i metadati (acquisizione automatizzata all'ingestione: tracciabilità, tag di sensibilità e altro). Insieme, tutto questo aiuta ad automatizzare la scoperta, l'integrazione e la governance dei dati. Questo semplifica l'accesso ai dati ovunque con zero-copy, zero-ETL e sicurezza zero-redundancy.

    Dall'AI che parla all'AI che prevede e agisce

    La prima ondata di AI riguardava la conversazione. La prossima ondata riguarda gli agenti. I vincitori in questa era non saranno coloro che si limiteranno a “memorizzare” il maggior numero di dati; saranno quelli in grado di fornire un contesto affidabile, continuo e multimodale ai sistemi autonomi, fornendo raccomandazioni e decisioni chiare. Fornendo agli agenti AI un accesso governato e federato a qualsiasi dato, Cloudera sta aiutando le più grandi imprese del mondo a passare dalla "chiacchierata" all'"azione".

    Che i dati siano nel data center, nel cloud o all'edge, Cloudera Open Data Lakehouse funge da lakehouse ibrido per assicurare che siano pronti per il futuro agentico. 

     

    Guarda il video per scoprire come funziona Cloudera Open Data Lakehouse.

    Visita Cloudera Open Data Lakehouse per saperne di più.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.