Connect with us

Leader di pensiero

Perché il Recupero Generativo-Potenziato è la Prossima Frontiera dell’Analisi dei Dati

mm

Tre persone su quattro dicono che le loro organizzazioni utilizzano l’AI. Eppure, la maggior parte di tale attività si concentra ancora su contenuti non strutturati: riassumere riunioni, redigere email o automatizzare il supporto clienti.

Ma ironia della sorte, gran parte dei dati che guidano effettivamente le decisioni aziendali – rapporti finanziari, tabelle di magazzino e KPI – rimane in gran parte inutilizzata dall’AI.

Il motivo non è la mancanza di ambizione, ma la mancanza di fiducia. Quando un modello “sogna” una frase, ciò può spesso essere corretto; quando “sogna” un numero, è catastrofico. Un CFO non può approvare una risposta che non può verificare.

Oggi, i dati strutturati vivono in dozzine di sistemi, ognuno con le proprie regole e relazioni. Ottenere che l’AI ragioni correttamente attraverso tale complessità è una sfida più difficile di qualsiasi chatbot.

Le aziende e i loro team – compresi gli utenti non tecnici – devono essere in grado di interagire con i loro dati in modo semplice per ridurre gli intasamenti e recuperare informazioni rapide e accurate. Senza dover imparare SQL.

Stanno emergendo alcune soluzioni – analizziamo alcuni esempi prominenti, con i loro vantaggi e svantaggi.

AI e dati strutturati – un ponte troppo lontano

Negli ultimi due anni, sono emerse diverse iniziative per collegare le informazioni dell’AI e i dati strutturati.

Molte provengono da giganti tecnologici con risorse e dati significativi. Snowflake, ad esempio, ha introdotto un Cortex Analyst, che tenta di consentire agli utenti di porre domande in linguaggio naturale contro il data warehouse di Snowflake.

Per migliorare l’accuratezza, Cortex ha un modo per fornire metadati semantici – ma il modello è fortemente limitato. In primo luogo, deve essere costruito manualmente e, anche così, può operare solo su un massimo di 10 tabelle, insufficienti anche per un’azienda di medie dimensioni. Ogni numero superiore e la fiducia si rompe, poiché l’accuratezza diminuisce.

La storia si ripete con i tentativi di Databricks, che ha adottato un approccio testo-SQL con AI/BI Genie. Questa soluzione può essere distribuita in modo efficace solo su domini di piccole dimensioni, perdendo accuratezza con set di dati aumentati.

Microsoft Power BI Copilot adotta un approccio generativo di superficie, incorporando l’AI direttamente all’interno dei dashboard per descrivere visualizzazioni, suggerire misure e redigere rapporti. Migliora l’esplorazione, ma non cambia il modo in cui le analisi sono ragionate o verificate. Ogni risposta dipende ancora dal giudizio del modello e, quando quel giudizio fallisce, non c’è traccia di audit o logica deterministica a cui fare riferimento.

Collettivamente, questi sistemi puntano nella direzione giusta: distribuire l’AI sui dati aziendali strutturati. Ma condividono anche un difetto critico. Dipendono dal modello AI per generare SQL dal linguaggio naturale e, quando quel SQL è errato, il che accade spesso, l’utente aziendale è bloccato. Un dirigente che non può leggere SQL non ha modo di diagnosticare o correggere il risultato. La conversazione si ferma bruscamente.

Un altro modo per affrontare il problema è pre-indicizzare le coppie di domande e risposte probabili. Ada’s GARAGe, tra gli altri, segue questo metodo. Funziona bene in domini ristretti in cui le domande sono prevedibili, ma le prestazioni calano quando la complessità dei dati cresce. Una volta che le tabelle e gli schemi si moltiplicano, la pre-indicizzazione diventa rapidamente ingestibile.

Un Percorso Diverso: Recupero Generativo-Potenziato

Il Recupero Generativo-Potenziato (GAR) capovolge l’approccio RAG attuale (Retrieval-Augmented Generation fonti di informazioni rilevanti e le incorpora in un LLM per aumentare l’accuratezza).

Invece di chiedere a un LLM di scrivere SQL, GAR utilizza l’AI generativa per comprendere l’intento della query dell’utente e quindi crea i passaggi di ragionamento per generare la risposta.

In GAR, le query interagiscono direttamente con la base di conoscenza. Sono compilate e non generate, la stessa domanda produce sempre la stessa risposta. Una catena di ragionamento in GAR è un artefatto permanente e verificabile, non un chat transitorio, quindi l’intera catena di ragionamento può essere riprodotta.

Ciò significa che i risultati sono esponenzialmente più accurati rispetto ai motori genAI generalizzati.

In sostanza, GAR fa tre cose:

  1. Costruisce automaticamente uno strato semantico. GAR utilizza l’AI per scoprire relazioni e definizioni aziendali attraverso i sistemi, unificando i dati in un unico modello
  2. Traduce l’intento aziendale in linguaggio analitico di alto livello. Questo linguaggio cattura la query a livello di concetto aziendale (“ricavi per visita per fornitore per il Q2”) e si compila direttamente in SQL.
  3. Registra ogni passaggio di ragionamento per l’auditabilità. L’origine di ogni risposta è tracciabile.

Perché Ciò È Importante

Limitando la ragionamento al modello di conoscenza interno dell’azienda, GAR può eliminare le “allucinazioni” e fornire risposte che sono corrette in modo dimostrabile.

Le definizioni, le metriche e i modelli di query si accumulano nel tempo, rendendo le risposte future ulteriormente personalizzate per l’utente specifico.

L’elemento di fiducia è cruciale per gli utenti aziendali che dipendono dai loro dati strutturati per prendere decisioni aziendali informate. Man mano che sempre più organizzazioni implementano soluzioni AI avanzate, esigeranno framework che riducano il rischio di allucinazione e di errore quasi a zero.

Ciò accade quando la query si collega direttamente ai propri dati, quando l’AI può lavorare su grandi set di dati senza rompersi e quando le risposte sono fornite con coerenza e dimostrabilità.

Rob Giardina è Co-Fondatore e CEO di Claritype, un'azienda che sviluppa sistemi di intelligenza artificiale che portano spiegabilità e controllabilità all'analisi dei dati aziendali. In precedenza, ha ricoperto il ruolo di Ingegnere schierato in avanti presso Palantir Technologies.