Se la rivoluzione dell'AI ha dato spazio a una verità universale sulla gestione dei dati, è la necessità di apertura e interoperabilità in tutto il patrimonio di dati. Dopotutto, l'AI è valida solo quanto i dati a cui può effettivamente accedere.
Le imprese non sono più disposte a investire in tecnologie legacy disconnesse. Il costo dei silos, una volta misurato nella sola infrastruttura, è ora esponenzialmente più alto se misurato in termini di perdita di valore e incapacità di eseguire l'IA su larga scala. Considerando questo scenario, le aziende non possono permettersi di non ripensare le proprie architetture dati.
In Cloudera definiamo l'apertura come un'architettura di gestione dei dati a tre livelli (vedi Figura 1):
Calcolo aperto: la capacità di utilizzare qualsiasi motore indipendentemente da dove sono archiviati i dati
Apri catalogo: la capacità di scambiare e interagire tra diversi livelli di accesso ai dati, garantendo che lo schema e la governance siano coerenti indipendentemente dal motore di visualizzazione
Dati aperti: la capacità di spostare e accedere alle risorse di dati ovunque si trovino
Più in generale, l'apertura è al centro di ciò che siamo in Cloudera:
Uno dei primi sostenitori di Apache Iceberg: Cloudera ha iniziato a supportare Iceberg nel nostro Lakehouse nel cloud pubblico nel 2021. Altri fornitori hanno rapidamente seguito l'esempio, riconoscendo implicitamente Iceberg come vincitore della guerra dei formati di tabella aperta. Nel 2024, Databricks ha acquisito Tabular, in parte grazie alla sua governance aperta e alle sue funzionalità sofisticate. Nel 2025, sia Snowflake che Amazon Web Services (AWS) hanno investito nell'espansione del supporto e delle funzionalità di Iceberg.
Fondazione ed ecosistema open-source: profondamente inserita nella comunità open-source sin dalla sua fondazione nel 2008, Cloudera è stata la prima azienda a commercializzare la tecnologia open-source dei data lake e continua a contribuire e supportare oltre 50 progetti open-source. La nostra base open source offre libertà di scelta consentendo ai nostri clienti di aderire o meno alle distribuzioni Cloudera molto più facilmente rispetto ai fornitori i cui overlay proprietari li vincolano. I clienti Cloudera non sono obbligati a restare, ma scelgono di restare.
Interoperabilità attraverso lo stack di gestione dei dati: fornire calcolo aperto, catalogo e dati garantisce interoperabilità a ogni livello dello stack di gestione dati, così che i nostri clienti possano davvero vincere nell'era dell'IA senza dover costruire da zero. Inoltre, Cloudera offre la flessibilità di utilizzare qualsiasi motore di calcolo o dati terrestri in qualsiasi provider di servizi cloud (CSP), e fornisce pieno accesso alle funzionalità indipendentemente da dove risiedono i dati o dal motore di calcolo utilizzato. Al contrario, alcuni fornitori limitano l'accesso alle funzionalità in base al fatto che tutti i livelli dello stack siano in esecuzione sulla stessa piattaforma. Possiedi i tuoi dati. Controlla i tuoi dati. Usa i tuoi dati. Questa è la promessa di Cloudera.
Per approfondire l'importanza dell'apertura nell'era dell'AI, leggi il nostro blog: IIl futuro distribuito oggi: il data lakehouse basato sull'AI.
This may have been caused by one of the following: