Artificial Intelligence

Wat is Retrieval Augmented Generation?

Bijgewerkt on 3 januari 2024

Grote Taalmodellen (LLM's) hebben bijgedragen aan de vooruitgang van het domein van natuurlijke taalverwerking (NLP), maar er blijft een bestaande kloof bestaan in contextueel begrip. LLM's kunnen soms produceren onnauwkeurige of onbetrouwbare antwoorden, een fenomeen dat bekend staat als "hallucinaties.”

Met ChatGPT wordt bijvoorbeeld geschat dat het optreden van hallucinaties aanwezig is 15% tot 20% ongeveer 80% van de tijd.

Retrieval Augmented Generation (RAG) is een krachtig raamwerk voor kunstmatige intelligentie (AI) dat is ontworpen om de contextkloof te dichten door de output van LLM te optimaliseren. RAG maakt gebruik van de enorme externe kennis door middel van retrievals, waardoor het vermogen van LLM's om nauwkeurige, nauwkeurige en contextueel rijke antwoorden te genereren wordt vergroot.

Laten we de betekenis van RAG binnen AI-systemen onderzoeken en het potentieel ervan ontrafelen om het begrip en de taalgeneratie radicaal te veranderen.

Wat is Retrieval Augmented Generation (RAG)?

Als hybride raamwerk VOD combineert de sterke punten van generatieve en retrievalmodellen. Deze combinatie maakt gebruik van kennisbronnen van derden om interne representaties te ondersteunen en om nauwkeurigere en betrouwbaardere antwoorden te genereren.

De architectuur van RAG is onderscheidend en combineert sequentie-tot-sequentie (seq2seq) modellen met Dense Passage Retrieval (DPR)-componenten. Deze fusie stelt het model in staat contextueel relevante antwoorden te genereren op basis van nauwkeurige informatie.

RAG zorgt voor transparantie met een robuust mechanisme voor factchecking en validatie om betrouwbaarheid en nauwkeurigheid te garanderen.

Hoe Retrieval Augmented Generation werkt?

In 2020 introduceerde Meta de RAG-framework om LLM's uit te breiden buiten hun trainingsgegevens. Net als bij een openboekexamen stelt RAG LLM's in staat gespecialiseerde kennis in te zetten voor nauwkeurigere antwoorden door toegang te krijgen tot informatie uit de echte wereld als antwoord op vragen, in plaats van uitsluitend te vertrouwen op uit het hoofd geleerde feiten.

Meta's originele RAG-modeldiagram

Origineel RAG-model van Meta (Image Source)

Deze innovatieve techniek vertrekt van een datagestuurde aanpak, waarbij kennisgestuurde componenten worden geïntegreerd, waardoor de nauwkeurigheid, precisie en contextueel begrip van taalmodellen wordt verbeterd.

Bovendien functioneert RAG in drie stappen, waardoor de mogelijkheden van taalmodellen worden vergroot.

Taxonomie van RAG-componenten

Kerncomponenten van RAG (Image Source)

ophalen: Ophaalmodellen vinden informatie die verband houdt met de prompt van de gebruiker om de reactie van het taalmodel te verbeteren. Daarbij gaat het om het matchen van de input van de gebruiker met relevante documenten, waardoor de toegang tot accurate en actuele informatie wordt gewaarborgd. Technieken zoals Dichte doorgang ophalen (DPR) en cosinus gelijkenis bijdragen aan het effectief terugvinden in RAG en de bevindingen verder verfijnen door deze te beperken.
Vergroting: Na het ophalen integreert het RAG-model gebruikersquery's met relevante opgehaalde gegevens, waarbij gebruik wordt gemaakt van snelle engineeringtechnieken zoals extractie van sleutelzinnen, enz. Deze stap communiceert de informatie en context effectief met de LLM, waardoor een uitgebreid begrip wordt gegarandeerd voor het genereren van nauwkeurige output.
Generatie: In deze fase wordt de toegevoegde informatie gedecodeerd met behulp van een geschikt model, zoals een reeks-tot-reeks, om het ultieme antwoord te produceren. De generatiestap garandeert dat de uitvoer van het model coherent en nauwkeurig is en is afgestemd op de vraag van de gebruiker.

Wat zijn de voordelen van RAG?

RAG pakt kritische uitdagingen in NLP aan, zoals het verminderen van onnauwkeurigheden, het verminderen van de afhankelijkheid van statische datasets en het verbeteren van contextueel begrip voor een verfijndere en nauwkeurigere taalgeneratie.

Het innovatieve raamwerk van RAG verbetert de precisie en betrouwbaarheid van de gegenereerde inhoud, waardoor de efficiëntie en het aanpassingsvermogen van AI-systemen worden verbeterd.

1. Verminderde LLM-hallucinaties

Door externe kennisbronnen te integreren tijdens prompt generatie zorgt RAG ervoor dat de antwoorden stevig zijn gebaseerd op nauwkeurige en contextueel relevante informatie. Reacties kunnen ook citaten of verwijzingen bevatten, waardoor gebruikers informatie onafhankelijk kunnen verifiëren. Deze aanpak verbetert de betrouwbaarheid van de door AI gegenereerde inhoud aanzienlijk en vermindert hallucinaties.

2. Actuele en nauwkeurige antwoorden

RAG vermindert de tijdslimiet van trainingsgegevens of foutieve inhoud door voortdurend realtime informatie op te halen. Ontwikkelaars kunnen de nieuwste onderzoeken, statistieken of nieuws naadloos rechtstreeks in generatieve modellen integreren. Bovendien verbindt het LLM's met live feeds van sociale media, nieuwssites en dynamische informatiebronnen. Deze functie maakt RAG tot een hulpmiddel van onschatbare waarde voor toepassingen die realtime en nauwkeurige informatie vereisen.

3. Kostenefficiëntie

Bij de ontwikkeling van chatbots wordt vaak gebruik gemaakt van basismodellen die API-toegankelijke LLM's zijn met een brede training. Toch brengt het herscholen van deze FM’s voor domeinspecifieke gegevens hoge reken- en financiële kosten met zich mee. RAG optimaliseert het gebruik van hulpbronnen en haalt selectief informatie op als dat nodig is, waardoor onnodige berekeningen worden verminderd en de algehele efficiëntie wordt verbeterd. Dit verbetert de economische levensvatbaarheid van de implementatie van RAG en draagt bij aan de duurzaamheid van AI-systemen.

4. Gesynthetiseerde informatie

RAG creëert alomvattende en relevante antwoorden door opgedane kennis naadloos te combineren met generatieve capaciteiten. Deze synthese van diverse informatiebronnen vergroot de diepgang van het begrip van het model en biedt nauwkeurigere resultaten.

5. Gemakkelijk te trainen

Het gebruiksvriendelijke karakter van RAG komt tot uiting in het trainingsgemak. Ontwikkelaars kunnen het model moeiteloos verfijnen en aanpassen aan specifieke domeinen of applicaties. Deze eenvoud in training vergemakkelijkt de naadloze integratie van RAG in verschillende AI-systemen, waardoor het een veelzijdige en toegankelijke oplossing wordt voor het bevorderen van het begrip en de taalgeneratie.

Het vermogen van RAG om op te lossen LLM hallucinaties en problemen met de versheid van gegevens maken het tot een cruciaal hulpmiddel voor bedrijven die de nauwkeurigheid en betrouwbaarheid van hun AI-systemen willen verbeteren.

Gebruiksscenario's van RAG

VOD‘s aanpassingsvermogen biedt transformatieve oplossingen met impact in de echte wereld, van kennismotoren tot het verbeteren van zoekmogelijkheden.

1. Kennismotor

RAG kan traditionele taalmodellen transformeren in uitgebreide kennismotoren voor actuele en authentieke contentcreatie. Het is vooral waardevol in scenario's waarin de nieuwste informatie vereist is, zoals in onderwijsplatforms, onderzoeksomgevingen of informatie-intensieve industrieën.

2. Zoekvergroting

Door LLM's te integreren met zoekmachines, verbetert het verrijken van zoekresultaten met door LLM gegenereerde antwoorden de nauwkeurigheid van antwoorden op informatieve vragen. Dit verbetert de gebruikerservaring en stroomlijnt workflows, waardoor het gemakkelijker wordt om toegang te krijgen tot de benodigde informatie voor hun taken.

3. Samenvatting van de tekst

RAG kan beknopte en informatieve samenvattingen van grote hoeveelheden tekst genereren. Bovendien bespaart RAG gebruikers tijd en moeite door nauwkeurige en grondige ontwikkeling mogelijk te maken tekst samenvattingen door relevante gegevens uit externe bronnen te verkrijgen.

4. Vraag- en antwoord-chatbots

Het integreren van LLM's in chatbots transformeert vervolgprocessen door de automatische extractie van nauwkeurige informatie uit bedrijfsdocumenten en kennisbanken mogelijk te maken. Dit verhoogt de efficiëntie van chatbots bij het nauwkeurig en snel oplossen van klantvragen.

Toekomstperspectieven en innovaties in RAG

Met een toenemende focus op gepersonaliseerde antwoorden, realtime informatiesynthese en verminderde afhankelijkheid van voortdurende bijscholing, belooft RAG revolutionaire ontwikkelingen in taalmodellen om dynamische en contextueel bewuste AI-interacties te faciliteren.

Naarmate RAG volwassener wordt, biedt de naadloze integratie in diverse toepassingen met verhoogde nauwkeurigheid gebruikers een verfijnde en betrouwbare interactie-ervaring.

Bezoek Verenig.ai voor betere inzichten in AI-innovaties en technologie.