Cloudera nominata leader nel The Forrester Wave™: Data Fabric Platforms, Q4 2025

Leggi il report
  • Cloudera Cloudera
  • | Partner

    Cloudera Agent Studio e NVIDIA portano gli agenti di nuova generazione nell'AI aziendale

    Charu Anchlia headshot
    Suryakant Bhardwaj headshot
    Pamela Pan headshot
    uomini con telefono in mano e testo AI fluttuante

    Gli agenti autonomi agiscono verso obiettivi complessi senza richiedere istruzioni dagli utenti umani a ogni passo. Negli ambienti aziendali, l'implementazione di questi agenti introduce una serie di sfide più impegnative: devono navigare sistemi dati eterogenei, soddisfare i requisiti di conformità, audit e sovranità dei dati e mantenere tutti i dati entro i confini operativi dell'organizzazione.

    Gli agenti a lungo termine rappresentano una nuova classe di AI autonoma che va oltre i singoli compiti per perseguire obiettivi attraverso decine di decisioni sequenziali, eseguendo flussi di lavoro per ore o giorni e mantenendo il contesto. Su scala aziendale, ognuna di queste sfide viene amplificata.

    Un'architettura creata per gli agenti AI aziendali

    In collaborazione con NVIDIA, Cloudera ha progettato Cloudera Agent Studio (parte di Cloudera AI Studios) proprio per affrontare queste sfide. 

    • NVIDIA Nemotron fornisce la base del modello: è progettato appositamente per l'agentic AI e per le esigenze di inferenza a throughput elevato per i flussi di lavoro a lungo termine. 

    • Cloudera Agent Studio fornisce il livello di orchestrazione che si basa su questa base attraverso quattro pilastri architettonici: pianificazione dinamica a più fasi di lavoro, collaborazione trasparente multi-agente, ingegneria del contesto per accuratezza ed esecuzione in ambiente protetto. Ogni pilastro risponde a un requisito specifico che emerge quando gli agenti autonomi operano su scala aziendale. 

    Figura 1: Cloudera Agent Studio orchestra flussi di lavoro autonomi attraverso pianificazione iterativa multi-step, collaborazione multi-agente con strumenti e competenze, context engineering basata su artefatti ed esecuzione in sandbox, il tutto costruito sulla base del serving dei modelli con Cloudera AI Inference, alimentato da NVIDIA NIM e modelli Nemotron per l'agentic AI.

    La base: implementazione di modelli privati con NVIDIA Nemotron

    L'AI aziendale inizia con la data governance. I prompt, i dati proprietari e i risultati dei modelli devono rimanere entro i limiti operativi dell'organizzazione, rispettando i requisiti di conformità senza compromessi architettonici. Questo è il requisito fondamentale dell'intelligenza artificiale privata: lo stack di inferenza completo in esecuzione all'interno dell'azienda, non all'esterno.

    Il servizio Cloudera AI Inference, basato sui microservizi NVIDIA NIM, consente la distribuzione di modelli scalabili ad alte prestazioni direttamente all'interno dell'ambiente aziendale, mantenendo prompt, dati e output all'interno del perimetro di sicurezza. Accelerato dallo stack NVIDIA AI, tra cui GPU Blackwell e Dynamo-Triton, il servizio supporta una vasta gamma di modelli, tra cui la famiglia di modelli Nemotron di NVIDIA per agentic AI con ragionamento avanzato, uso di strumenti e flussi di lavoro a lungo termine. Questa base consente alle organizzazioni di creare ed eseguire agenti AI aziendali direttamente sui propri dati, in modo sicuro e su larga scala.

    I quattro pilastri di Cloudera Agent Studio

    1. Pianificazione dinamica, iterativa e multifase

    Gli ambienti di dati aziendali non sono puliti. Le implementazioni reali coinvolgono decine di database con schemi incoerenti, documentazione scarsa e nessun percorso deterministico da una domanda aziendale alla fonte di dati corretta. L'agente deve costruire quel percorso in fase di esecuzione.

    L'orchestratore di Agent Studio tratta l'esplorazione come parte dell'esecuzione. Scompone le richieste complesse in piani a più fasi, li esegue in modo iterativo e si auto-valuta dopo ogni fase prima di intraprendere un percorso definitivo. Questo ciclo di pianificazione autocorrettivo rende gli agenti affidabili anche in ambienti che non hanno mai incontrato e sostiene flussi di lavoro a lungo termine attraverso più fasi sequenziali.

    2. Collaborazione multi-agente: riutilizzabilità e trasparenza

    I flussi di lavoro aziendali complessi si estendono su più domini, ciascuno dei quali richiede strategie di ragionamento distinte e strumenti specializzati. Un singolo agente che tenti di coprirli tutti non può essere ottimizzato adeguatamente per nessuno di essi e, quanto più ampio è il loro ambito, tanto più diventa difficile comprendere e governare il comportamento degli agenti. 

    Agent Studio è costruito attorno ad agenti specializzati, ciascuno orientato a un dominio specifico e dotato degli strumenti appropriati, coordinati da un orchestratore che sa come delegare. Ciò che rende questa collaborazione trasparente e riutilizzabile è il modo in cui gli agenti comunicano: ogni agente scrive output strutturati nel contesto condiviso del progetto, e gli agenti successivi consumano tali output come input espliciti e ispezionabili. L'intera catena di ragionamento è tracciabile in ogni sua fase, fornendo la verificabilità richiesta dalle aziende e la possibilità di riutilizzare il lavoro precedente in tutte le fasi.

    3. Ingegneria del contesto: accuratezza, velocità e costi

    Considerate le quantità in cui solitamente si presentano i dati aziendali, passare i dati grezzi direttamente al modello non funziona. Le finestre di contesto sono finite e, man mano che il contesto non strutturato cresce, l'accuratezza diminuisce ben prima di raggiungere il limite della finestra.

    Agent Studio considera la finestra di contesto come uno strumento di precisione: in ogni fase, solo le informazioni pertinenti all'attività specifica di quell'agente raggiungono il modello. Questo design basato sugli artefatti riduce il consumo di token, diminuendo i costi di inferenza e la latenza, migliorando al contempo la precisione. Questa combinazione rende i flussi di lavoro a lungo termine trattabili su scala aziendale.

    4. Esecuzione in modalità sandbox

    Ciò che rende gli agenti autonomi davvero potenti è la loro capacità di generare dinamicamente strumenti, competenze e codice eseguibile secondo i workflow, capacità che Agent Studio supporta in modo nativo. Tuttavia, senza isolamento, il codice generato dagli agenti e gli strumenti eseguiti direttamente sui sistemi aziendali presentano un rischio inaccettabile. 

    Abbiamo progettato il livello di esecuzione di Agent Studio attorno all'isolation-by-default. Tutto il codice generato dagli agenti e l'esecuzione degli strumenti viene eseguita in un runtime sandbox che non ha accesso a sistemi al di fuori del loro ambito definito. Gli agenti iniziano senza autorizzazioni, e ogni azione è applicata tramite politiche al livello infrastrutturale, non all'interno del processo dell'agente stesso. Questo offre ai settori regolamentati la verificabilità di cui hanno bisogno, senza limitare ciò che gli agenti possono fare. 

    Storia del cliente: un'agentic AI che trasforma l'analisi dei dati su scala di petabyte

    Cloudera gestisce oltre 30 exabyte di dati strutturati nella sua base clienti, rendendo le analisi dei dati strutturati un ambito in cui questa architettura ha un impatto immediato. Una grande azienda di media e intrattenimento l'ha implementata per fornire agli utenti aziendali e agli analisti un'interfaccia in linguaggio naturale per i loro dati operativi. Il loro patrimonio di dati si estendeva per petabyte su decine di database, spesso caratterizzati da metadati contrastanti e documentazione scarsa.

    Cloudera Agent Studio ha orchestrato agenti specializzati supportati da NVIDIA Nemotron che funzionavano all'interno della rete privata del cliente. La domanda analitica di un utente aziendale ha attivato un ciclo di pianificazione iterativo: l'orchestratore esplorava il patrimonio dei dati, navigava nell'ambiguità dello schema e identificava autonomamente le fonti di dati giuste. Quando l'analisi richiedeva calcoli statistici oltre ciò che SQL poteva esprimere, l'orchestratore ha delegato all'agente di esecuzione del codice appropriato. Gli output intermedi sono stati scritti come artefatti e trasmessi attraverso il flusso di lavoro a lungo termine. Tutto il codice generato è stato eseguito in un ambiente sandbox, mantenendo un audit trail completo.

    I flussi di lavoro che un tempo richiedevano un ingegnere dei dati, uno sviluppatore e un analista che lavorassero in sequenza, sono diventati accessibili a qualsiasi utente aziendale. I risultati degli agenti, compresi i comandi SQL, il codice generato e le visualizzazioni, sono stati scritti in un contesto di progetto condiviso, tutti ispezionabili e verificabili. Quegli artefatti erano anche esportabili come pipeline di produzione. Poiché il codice generato dagli agenti è deterministico anche quando i modelli sottostanti non lo sono, tali pipeline sono affidabili e riproducibili senza ingegneria aggiuntiva.

    Architettura come Vantaggio Competitivo

    Ogni pilastro di questa architettura si basa su quello precedente. Un livello di inferenza privato fornisce la base, supportando i volumi di chiamate e l'affidabilità richiesti dai flussi di lavoro a lungo termine. La pianificazione iterativa consente agli agenti di muoversi in ambienti che non hanno mai visto prima. La collaborazione multi-agente apporta precisione di dominio al ragionamento a più fasi. La gestione del contesto basata su artefatti migliora l'accuratezza riducendo i costi di inferenza e la latenza. L'esecuzione in sandbox garantisce che gli agenti operino in sicurezza entro limiti definiti, con ogni azione regolata e verificabile.

    Cloudera e NVIDIA hanno dato vita a questa architettura attraverso Cloudera Agent Studio, Cloudera AI Inference basato su NVIDIA NIM e la famiglia di modelli NVIDIA Nemotron. Insieme, forniscono le basi per l'orchestrazione della costruzione e il ragionamento basato su agenti necessari per eseguire gli agenti AI aziendali direttamente sui dati in modo sicuro, privato e su larga scala.

    Per saperne di più, vedi Cloudera Agent Studio in azione.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.