Tre anni fa, i clienti di Cloudera hanno iniziato a esplorare l'AI generativa per trasformare le interazioni con i dati costruendo assistenti intelligenti, riassumendo documenti complessi e generando insight su richiesta. Oggi, i nostri clienti gestiscono più di 25 exabyte (ovvero 25 miliardi di gigabyte!) di dati aziendali in ambienti on-premise e cloud.
Il modo in cui le organizzazioni gestiscono i loro dati è fondamentale. Nell'era dell'AI, il contesto non è solo utile, ma fa la differenza tra decisioni accurate e allucinazioni. I modelli AI hanno bisogno di un accesso continuo ai dati proprietari per generare insight, rispondere alle domande o automatizzare i flussi di lavoro. Tuttavia, nella maggior parte delle organizzazioni, questi dati rimangono frammentati tra archivi di oggetti isolati, tabelle Iceberg, stream Kafka e database operativi. Gli sviluppatori perdono tempo prezioso per scrivere connettori personalizzati e mantenere pipeline fragili, un macigno sull'innovazione che rallenta il time-to-value.
Ed è qui che entrano in gioco i server Model Context Protocol (MCP) di Cloudera. I nostri server sono costruiti su MCP e offrono un gateway universale per gestire i dati aziendali. MCP è uno standard aperto che mira a uniformare l'integrazione dell'AI nello stesso modo in cui Microsoft Open Database Connectivity (ODBC) ha standardizzato i database relazionali (puoi trovare maggiori dettagli su MCP nella prossima sezione).
Per supportare questa missione, stiamo lanciando Cloudera MCP Server per Apache Iceberg tramite Impala. Apache Iceberg è la spina dorsale dei lakehouse moderni e offre gestione su scala di petabyte, conformità ACID, indagini cronologiche e governance granulare. È il punto di partenza perfetto per colmare il divario tra dati e AI.
Iniziando da Apache Iceberg, affrontiamo una sfida fondamentale: le applicazioni di AI richiedono un accesso governato e in tempo reale ai dati analitici senza codice personalizzato aggiuntivo. Il nostro server MCP consente agli sviluppatori di interrogare le tabelle Iceberg in linguaggio naturale, di integrarsi perfettamente con framework come CrewAI, Microsoft AutoGen, LangChain o LangGraph, LlamaIndex e toolkit di agentic AI, come NVIDIA Agent Intelligence (AIQ), che funzionano con questi framework mantenendo sempre una solida sicurezza con le politiche di Cloudera SDX. E questo è solo l'inizio: i futuri server MCP di Cloudera estenderanno il supporto allo streaming di dati, ai database operativi e agli archivi di file/oggetti.
Figura 1: Due scenari di agenti di SI che accedono ai dati per ottenere il contesto:
Mentre le organizzazioni si affrettano ad adottare architetture basate su agenti, creare un livello di integrazione coerente è più importante che mai.
"La frenesia legata all'adozione di architetture basate su agenti sta spingendo le organizzazioni a lanciare più iniziative in parallelo." Sebbene questo slancio sia un segnale positivo, rischia anche di creare l'equivalente moderno dello spaghetti code, una cosa che abbiamo già visto agli albori dell'ingegneria del software. Ciò di cui le aziende hanno veramente bisogno è un'architettura semplificata e basata su standard che garantisca l'interoperabilità tra i diversi sistemi che partecipano all'ecosistema basato su agenti. L'MCP di Anthropic sta emergendo come standard promettente in questo settore, ed è già ampiamente adottato dai fornitori di intelligenza artificiale."
- Sanjeev Mohan, Principal di SanjMo ed ex analista di Gartner
MCP non è uno strumento proprietario di Cloudera: è uno standard ampiamente adottato che evita il vendor lock-in attingendo a un ecosistema di strumenti in espansione. L'approccio di Cloudera ai server MCP è in linea con la filosofia di apertura, semplicità e controllo di MCP. I server MCP di Cloudera vengono eseguiti in modo nativo all'interno della piattaforma unificata di Cloudera, eliminando spostamenti rischiosi dei dati e consentendo un'implementazione ininterrotta in ambienti multi-cloud e on-premise.
Il potere trasformativo dell'AI dipende dalla qualità dei dati che la alimentano. Quando i dati e i sistemi AI operano in modo isolato, le informazioni disconnesse ritardano gli insight, creano pipeline fragili e lasciano i modelli senza il contesto necessario per prendere decisioni accurate.
Cloudera riunisce dati e AI in un ciclo di vita coeso. I dati fluiscono senza problemi nei flussi di lavoro dell'AI, regolati da metadati condivisi, politiche di sicurezza e risorse di calcolo ottimizzate. Questo approccio elimina i costi elevati di duplicazione e spostamento dei dati, rendendo ogni previsione tracciabile alla sua origine e garantendo trasparenza, fiducia e conformità.
Sei pronto a eliminare l'attrito di integrazione? Esplora il server Cloudera MCP per Apache Iceberg qui—attualmente disponibile in anteprima—e scopri come potenziare le tue applicazioni AI con il contesto di cui hanno bisogno, proprio dove risiedono i tuoi dati. Per vederlo in azione oggi stesso, approfitta della nostra prova gratuita di 5 giorni.
This may have been caused by one of the following: