L'Indice di prontezza dei dati 2026: comprendere le basi per un'AI di successo

Scopri i risultati
  • Cloudera Cloudera
  • | Tecnico

    Quando i secondi contano: costruire un'AI su cui puoi fare affidamento

    Ian Brooks
    Sarah Habermand headshot
    Pamela Pan headshot
    ragazza che guarda l'orizzonte

    Negli ultimi anni, la conversazione sull'IA è stata incentrata sull'accesso: mettere i modelli a disposizione dei team, sperimentare rapidamente, dimostrare casi d'uso. Quel capitolo si sta chiudendo. Le domande che le organizzazioni si pongono ora sono diverse: chi controlla il modello? Dove vanno a finire i dati? Cosa succede quando fallisce?

    Immagina un ospedale che utilizza l'AI per aiutare a diagnosticare la polmonite dalle radiografie toraciche. Un paziente arriva con difficoltà respiratorie. Il medico carica la scansione e aspetta, ma il sistema non risponde: il modello su cui si basa l'applicazione di diagnosi è ospitato nel cloud pubblico, ed è temporaneamente non disponibile. 

    Nel settore sanitario, questo tipo di ritardo è importante. È uno scenario su cui vale la pena riflettere attentamente, perché tocca un aspetto che non emerge abbastanza nelle conversazioni sull'AI: il luogo in cui il tuo modello viene eseguito è tanto importante quanto il modello che esegui.

    Progettare per l'affidabilità

    Il cloud pubblico ha reso l'AI accessibile a una vasta gamma di organizzazioni, e questo è davvero prezioso. Allo stesso tempo, per le applicazioni in cui l'operatività non è negoziabile, l'introduzione di dipendenze esterne diventa un'importante considerazione architettonica.

    Un modo per pensare a questo è attraverso le aspettative di tempo di attività. Un contratto sul livello di servizio (SLA) con tempo di attività del 99,9% lascia ancora quasi nove ore di inattività all'anno. Per un'applicazione per utenti, questo è un inconveniente. Per un sistema radiologico ospedaliero, una piattaforma di trading che esegue milioni di transazioni o uno strumento di gestione del traffico aereo, anche interruzioni brevi potrebbero richiedere una pianificazione aggiuntiva.

    Quando i servizi esterni fanno parte dello stack, alcuni aspetti dell'affidabilità vengono condivisi tra i fornitori. Man mano che l'AI viene utilizzata in parti più critiche dell'azienda, i team spesso la integrano con considerazioni progettuali aggiuntive, come le strategie di ripiego e la flessibilità di implementazione, per allinearsi ai loro requisiti specifici.

    La soluzione: eseguire l'AI dove vivono i tuoi dati

    Al contrario, se esegui l'AI dove i tuoi dati risiedono già, puoi scegliere l'ambiente che si adatta alle tue esigenze e, cosa importante, mantenere il controllo sull'affidabilità del sistema.

    Con Cloudera AI Inference service, i modelli possono essere distribuiti on premise, in un cloud privato o in una configurazione ibrida. Questa flessibilità permette ai team di allineare l'inferenza con i propri dati, carichi di lavoro e profilo di rischio, senza imporre tutto attraverso un'unica architettura.

    In pratica, si presenta così:

    • Continuità operativa: le tue applicazioni continuano a funzionare indipendentemente da ciò che accade fuori dalle tue mura

    • Costi prevedibili: abbandonare i prezzi variabili (ad esempio, per chiamata) per passare al calcolo controllato e pianificabile.

    • Prestazioni in tempo reale: come mostrato nella nostra demo di radiologia, l'analisi delle immagini viene completata in meno di un secondo, fornendo ai medici risultati immediati.

    Oltre a questa base, i team ottengono la flessibilità del modello per impostazione predefinita. Un registro curato dei modelli di AI, che include fornitori come NVIDIA, Cohere e Mistral AI, rende facile scegliere il modello giusto per ogni caso d'uso. E senza blocco, non dipenderai dalla roadmap di un singolo fornitore e potrai cambiare i modelli di AI quando emergono opzioni migliori.

    Tutto è progettato per la produzione fin dal primo giorno. La scalabilità automatica assorbe picchi di domanda, l'elevata disponibilità elimina i singoli punti di guasto e le ottimizzazioni delle prestazioni per i tempi di risposta inferiori al secondo sono integrate direttamente nell'implementazione, non sovrapposte successivamente.

    La governance è integrata in ogni aspetto. Un gateway AI applica il controllo degli accessi e le policy prima che le richieste raggiungano un modello, mentre un livello di monitoraggio fornisce visibilità continua su latenza, velocità di trasmissione e utilizzo delle risorse.

    Il risultato è un sistema in cui l'intera pipeline di inferenza rimane sotto il tuo controllo, dalla selezione del modello all'esecuzione in produzione, pur offrendo la flessibilità di eseguire l'AI dove funziona meglio.

    Perché mantenere il controllo sui dati è particolarmente importante per i settori regolamentati

    Per il settore sanitario, i servizi finanziari o la sicurezza nazionale, la privacy dei dati è un obbligo legale. Quando gli input, gli output e i suggerimenti del modello vengono inviati a un fornitore esterno per l'inferenza, non si tratta più di una questione di latenza, ma di una preoccupazione per il mantenimento della conformità e della sovranità.

    Pensa a cosa viene effettivamente inviato durante una chiamata di inferenza. In radiologia, potrebbe trattarsi di una scansione di un paziente collegata alla sua cartella clinica. Nel settore dei servizi finanziari, potrebbe trattarsi di una cronologia delle transazioni utilizzata per segnalare frodi. Nei contesti legali o di difesa, potrebbe trattarsi di documenti sensibili per loro natura. Ciascuna di queste chiamate rappresenta un trasferimento di dati e, con le API esterne, tale trasferimento attraversa un confine che non si controlla completamente.

    Mantenere l'inferenza on-premise o in un cloud privato significa che i dati rimangono dove devono essere, i modelli proprietari restano completamente di proprietà dell'organizzazione e le tracce di controllo rimangono interne. L'osservabilità integrata offre ai team una visibilità in tempo reale sulla latenza e sull'uso delle risorse senza che questa attività tocchi un fornitore esterno, il che è importante sia per la reportistica di conformità sia per capire come si comportano effettivamente i tuoi modelli in produzione.

    Smetti di discutere di "Cloud o on premise" e costruisci architetture ibride consapevoli

    L'AI deve essere una risorsa che rende i tuoi sistemi più affidabili, non un singolo punto di errore. La sanità rende la posta in gioco viscerale, ma la stessa logica si applica ovunque l'impatto del tempo di inattività sia elevato: linee di produzione, sistemi finanziari in tempo reale e reti logistiche. Per mitigare i tempi di inattività e sfruttare i vantaggi dell'AI, le organizzazioni devono progettare consapevolmente architetture ibride, affinché i loro carichi di lavoro più critici funzionino su infrastrutture che controllano.

    Curioso di vedere come funziona nella pratica? 
    Guarda la demo completa di Cloudera AI Inference.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.