Intelligenza artificiale

Che cos’è la Generazione Migliorata con Recupero?

Published January 3, 2024

Updated April 4, 2026

Haziqa Sajid

I Large Language Models (LLM) hanno contribuito a far avanzare il dominio dell’elaborazione del linguaggio naturale (NLP), ma esiste ancora una lacuna nella comprensione del contesto. Gli LLM possono sometimes produrre risposte inaccurate o inaffidabili, un fenomeno noto come “allucinazioni.”

Ad esempio, con ChatGPT, la frequenza di allucinazioni è stimata intorno al 15% al 20% intorno all’80% delle volte.

La Generazione Migliorata con Recupero (RAG) è un potente framework di Intelligenza Artificiale (AI) progettato per affrontare la lacuna di contesto ottimizzando l’output degli LLM. RAG sfrutta la vasta conoscenza esterna attraverso il recupero, migliorando la capacità degli LLM di generare risposte precise, accurate e ricche di contesto.

Esploriamo l’importanza di RAG all’interno dei sistemi AI, svelando il suo potenziale per rivoluzionare la comprensione e la generazione del linguaggio.

Che cos’è la Generazione Migliorata con Recupero (RAG)?

Come framework ibrido, RAG combina i punti di forza dei modelli generativi e di recupero. Questa combinazione attinge a fonti di conoscenza di terze parti per supportare le rappresentazioni interne e generare risposte più precise e affidabili.

L’architettura di RAG è distintiva, fondendo modelli sequenza-per-sequenza (seq2seq) con componenti di Recupero di Passaggi Densi (DPR). Questa fusione consente al modello di generare risposte rilevanti per il contesto fondate su informazioni accurate.

RAG stabilisce la trasparenza con un meccanismo robusto per la verifica dei fatti e la convalida per garantire l’affidabilità e l’accuratezza.

Come funziona la Generazione Migliorata con Recupero?

Nel 2020, Meta ha introdotto il framework RAG per estendere gli LLM oltre i loro dati di training. Come un esame a libro aperto, RAG consente agli LLM di sfruttare conoscenze specializzate per risposte più precise accedendo a informazioni del mondo reale in risposta a domande, anziché affidarsi solo a fatti memorizzati.

Diagramma del modello RAG originale di Meta

Modello RAG originale di Meta (Fonte dell’immagine)

Questa tecnica innovativa si discosta da un approccio basato sui dati, incorporando componenti basati sulla conoscenza, migliorando l’accuratezza, la precisione e la comprensione del contesto dei modelli linguistici.

Inoltre, RAG funziona in tre fasi, potenziando le capacità dei modelli linguistici.

Tassonomia dei componenti RAG

Componenti principali di RAG (Fonte dell’immagine)

Recupero: I modelli di recupero trovano informazioni collegate al prompt dell’utente per migliorare la risposta del modello linguistico. Ciò comporta l’abbinamento dell’input dell’utente con documenti rilevanti, garantendo l’accesso a informazioni accurate e aggiornate. Tecniche come Recupero di Passaggi Densi (DPR) e similarità del coseno contribuiscono al recupero efficace in RAG e raffinano ulteriormente i risultati restringendoli.
Miglioramento: Dopo il recupero, il modello RAG integra la query dell’utente con i dati recuperati rilevanti, utilizzando tecniche di ingegneria del prompt come l’estrazione di frasi chiave, ecc. Questo passaggio comunica efficacemente le informazioni e il contesto con l’LLM, garantendo una comprensione completa per la generazione di output accurati.
Generazione: In questa fase, le informazioni migliorate vengono decodificate utilizzando un modello adatto, come un modello sequenza-per-sequenza, per produrre la risposta finale. La fase di generazione garantisce che l’output del modello sia coerente, accurato e personalizzato in base al prompt dell’utente.

Quali sono i vantaggi della Generazione Migliorata con Recupero?

RAG affronta sfide critiche nel NLP, come mitigare le inesattezze, ridurre la dipendenza da set di dati statici e migliorare la comprensione del contesto per una generazione del linguaggio più raffinata e accurata.

Il framework innovativo di RAG migliora la precisione e l’affidabilità del contenuto generato, aumentando l’efficienza e l’adattabilità dei sistemi AI.

1. Riduzione delle allucinazioni degli LLM

Integrando fonti di conoscenza esterne durante la generazione del prompt, RAG garantisce che le risposte siano saldamente fondate su informazioni accurate e rilevanti per il contesto. Le risposte possono anche presentare citazioni o riferimenti, consentendo agli utenti di verificare autonomamente le informazioni. Questo approccio migliora notevolmente l’affidabilità del contenuto generato dall’AI e riduce le allucinazioni.

2. Risposte aggiornate e accurate

RAG mitiga il taglio temporale dei dati di training o il contenuto errato recuperando continuamente informazioni in tempo reale. Gli sviluppatori possono integrare senza sforzo le ultime ricerche, statistiche o notizie direttamente nei modelli generativi. Inoltre, collega gli LLM ai feed di social media, ai siti di notizie e alle fonti di informazione dinamiche. Questa funzione rende RAG uno strumento inestimabile per le applicazioni che richiedono informazioni precise e in tempo reale.

3. Efficienza dei costi

Lo sviluppo di chatbot spesso coinvolge l’utilizzo di modelli fondamentali che sono LLM accessibili tramite API con un’ampia formazione. Tuttavia, ritracciare questi FM per dati specifici del dominio comporta costi computazionali e finanziari elevati. RAG ottimizza l’utilizzo delle risorse e recupera selettivamente le informazioni come necessario, riducendo i calcoli non necessari e migliorando l’efficienza complessiva. Ciò migliora la fattibilità economica dell’implementazione di RAG e contribuisce alla sostenibilità dei sistemi AI.

4. Informazioni sintetizzate

RAG crea risposte complete e rilevanti fondendo senza sforzo la conoscenza recuperata con le capacità generative. Questa sintesi di diverse fonti di informazione migliora la profondità della comprensione del modello, offrendo output più precisi.

5. Facilità di addestramento

La natura user-friendly di RAG si manifesta nella sua facilità di addestramento. Gli sviluppatori possono addestrare il modello senza sforzo, adattandolo a domini o applicazioni specifici. Questa semplicità nell’addestramento facilita l’integrazione senza problemi di RAG in vari sistemi AI, rendendolo una soluzione versatile e accessibile per far avanzare la comprensione e la generazione del linguaggio.

La capacità di RAG di risolvere le allucinazioni degli LLM e i problemi di freschezza dei dati la rende uno strumento cruciale per le aziende che desiderano migliorare l’accuratezza e l’affidabilità dei loro sistemi AI.

Casi d’uso di RAG

RAG‘s adattabilità offre soluzioni trasformative con un impatto reale, dalle motori di conoscenza al miglioramento delle capacità di ricerca.

1. Motore di conoscenza

RAG può trasformare i modelli linguistici tradizionali in motori di conoscenza completi per la creazione di contenuti aggiornati e autentici. È particolarmente prezioso in scenari in cui è richiesta l’ultima informazione, come in piattaforme educative, ambienti di ricerca o settori intensivi di informazione.

2. Miglioramento della ricerca

Integrando gli LLM con i motori di ricerca, arricchendo i risultati della ricerca con risposte generate dagli LLM, migliora l’accuratezza delle risposte alle query informative. Ciò migliora l’esperienza dell’utente e semplifica i flussi di lavoro, rendendo più facile accedere alle informazioni necessarie per i loro compiti..

3. Sommario del testo

RAG può generare sommari concisi e informativi di grandi volumi di testo. Inoltre, RAG risparmia tempo e sforzo agli utenti consentendo lo sviluppo di sommari di testo precisi e completi ottenendo dati rilevanti da fonti di terze parti.

4. Chatbot per domande e risposte

Integrare gli LLM nei chatbot trasforma i processi di follow-up abilitando l’estrazione automatica di informazioni precise da documenti aziendali e basi di conoscenza. Ciò eleva l’efficienza dei chatbot nel risolvere le query dei clienti in modo accurato e tempestivo.

Prospettive future e innovazioni in RAG

Con un focus crescente su risposte personalizzate, sintesi di informazioni in tempo reale e ridotta dipendenza dalla ritrattazione costante, RAG promette sviluppi rivoluzionari nei modelli linguistici per facilitare interazioni AI dinamiche e consapevoli del contesto.

Man mano che RAG matura, la sua integrazione senza problemi in diverse applicazioni con un’accuratezza aumentata offre agli utenti un’esperienza di interazione raffinata e affidabile.

Visita Unite.ai per approfondire le innovazioni AI e la tecnologia.