Mākslīgais intelekts

Kas ir izguves paplašinātā paaudze?

Atjaunināts on Janvāris 3, 2024

Lielie valodu modeļi (LLM) ir veicinājuši dabiskās valodas apstrādes (NLP) jomas attīstību, tomēr kontekstuālajā izpratnē joprojām pastāv atšķirības. LLM dažreiz var ražot neprecīzas vai neuzticamas atbildesparādība, kas pazīstama kā "halucinācijas."

Piemēram, ar ChatGPT halucināciju rašanās ir aptuveni 15% līdz 20% apmēram 80% laika.

Retrieval Augmented Generation (RAG) ir spēcīgs mākslīgā intelekta (AI) ietvars, kas izstrādāts, lai novērstu konteksta trūkumu, optimizējot LLM izvadi. RAG izmanto plašās ārējās zināšanas, izmantojot izguves, uzlabojot LLM spēju radīt precīzas, precīzas un kontekstuāli bagātīgas atbildes.

Izpētīsim RAG nozīmi AI sistēmās, atklājot tās potenciālu mainīt valodas izpratni un ģenerēšanu.

Kas ir Retrieval Augmented Generation (RAG)?

Kā hibrīds ietvars, RAG apvieno ģeneratīvo un izguves modeļu stiprās puses. Šī kombinācija izmanto trešo pušu zināšanu avotus, lai atbalstītu iekšējos attēlojumus un radītu precīzākas un uzticamākas atbildes.

RAG arhitektūra ir atšķirīga, apvienojot secības uz secību (seq2seq) modeļus ar blīvās caurbraukšanas izguves (DPR) komponentiem. Šī saplūšana dod modelim iespēju radīt kontekstuāli atbilstošas atbildes, kuru pamatā ir precīza informācija.

RAG nodrošina caurspīdīgumu ar spēcīgu faktu pārbaudes un apstiprināšanas mehānismu, lai nodrošinātu uzticamību un precizitāti.

Kā darbojas paplašinātās paaudzes izguve?

2020. gadā Meta iepazīstināja ar RAG ietvars paplašināt LLM ārpus viņu apmācības datiem. Tāpat kā atklātās grāmatas eksāmens, RAG ļauj LLM izmantot specializētās zināšanas, lai sniegtu precīzākas atbildes, piekļūstot reālās pasaules informācijai, atbildot uz jautājumiem, nevis paļaujoties tikai uz iegaumētiem faktiem.

Meta oriģinālā RAG modeļa diagramma

Oriģinālais Meta RAG modelis (Image Source)

Šī novatoriskā tehnika atšķiras no uz datiem balstītas pieejas, iekļaujot uz zināšanām balstītus komponentus, uzlabojot valodas modeļu precizitāti, precizitāti un kontekstuālo izpratni.

Turklāt RAG darbojas trīs posmos, uzlabojot valodu modeļu iespējas.

RAG komponentu taksonomija

RAG galvenās sastāvdaļas (Image Source)

Izguve: Izguves modeļi atrod informāciju, kas saistīta ar lietotāja uzvedni, lai uzlabotu valodas modeļa reakciju. Tas ietver lietotāja ievades saskaņošanu ar attiecīgajiem dokumentiem, nodrošinot piekļuvi precīzai un aktuālai informācijai. Tādas metodes kā Blīvu eju atgūšana (DPR) un kosinusa līdzība veicināt efektīvu izguvi RAG un turpināt precizēt konstatējumus, sašaurinot to.
Papildinājums: Pēc izguves RAG modelis integrē lietotāja vaicājumu ar atbilstošiem izgūtajiem datiem, izmantojot tūlītējus inženierijas paņēmienus, piemēram, atslēgas frāzes izvilkšanu utt. Šī darbība efektīvi sazinās informāciju un kontekstu ar LLM, nodrošinot visaptverošu izpratni par precīzu izvades ģenerēšanu.
Paaudze: šajā fāzē papildinātā informācija tiek dekodēta, izmantojot piemērotu modeli, piemēram, secību no secības, lai iegūtu galīgo atbildi. Ģenerēšanas solis garantē, ka modeļa izvade ir saskaņota, precīza un pielāgota atbilstoši lietotāja norādījumiem.

Kādas ir RAG priekšrocības?

RAG risina kritiskas NLP problēmas, piemēram, neprecizitātes mazināšanu, paļaušanās uz statiskām datu kopām samazināšanu un kontekstuālās izpratnes uzlabošanu, lai pilnveidotu un precīzāk ģenerētu valodu.

RAG novatoriskā sistēma uzlabo ģenerētā satura precizitāti un uzticamību, uzlabojot AI sistēmu efektivitāti un pielāgošanās spēju.

1. Samazinātas LLM halucinācijas

Integrējot ārējos zināšanu avotus laikā tūlītēja paaudzes, RAG nodrošina, ka atbildes ir stingri pamatotas ar precīzu un kontekstuāli atbilstošu informāciju. Atbildēs var būt arī citāti vai atsauces, kas ļauj lietotājiem neatkarīgi pārbaudīt informāciju. Šī pieeja ievērojami uzlabo mākslīgā intelekta radītā satura uzticamību un samazina halucinācijas.

2. Jaunākās un precīzas atbildes

RAG samazina apmācības datu vai kļūdaina satura laika ierobežojumu, nepārtraukti izgūstot reāllaika informāciju. Izstrādātāji var nemanāmi integrēt jaunākos pētījumus, statistiku vai ziņas tieši ģeneratīvajos modeļos. Turklāt tas savieno LLM ar tiešsaistes sociālo mediju plūsmām, ziņu vietnēm un dinamiskiem informācijas avotiem. Šī funkcija padara RAG par nenovērtējamu rīku lietojumprogrammām, kurām nepieciešama reāllaika un precīza informācija.

3. Izmaksu efektivitāte

Chatbot izstrāde bieži ietver pamata modeļu izmantošanu, kas ir API pieejami LLM ar plašu apmācību. Tomēr šo FM pārkvalificēšana domēna specifiskiem datiem rada lielas skaitļošanas un finanšu izmaksas. RAG optimizē resursu izmantošanu un pēc vajadzības selektīvi ienes informāciju, samazinot nevajadzīgos aprēķinus un uzlabojot kopējo efektivitāti. Tas uzlabo RAG ieviešanas ekonomisko dzīvotspēju un veicina AI sistēmu ilgtspējību.

4. Sintezētā informācija

RAG rada visaptverošas un atbilstošas atbildes, nemanāmi apvienojot iegūtās zināšanas ar ģenerēšanas iespējām. Šī dažādu informācijas avotu sintēze uzlabo modeļa izpratnes dziļumu, piedāvājot precīzākus rezultātus.

5. Apmācības vieglums

RAG lietotājam draudzīgais raksturs izpaužas kā apmācības vieglums. Izstrādātāji var bez pūlēm pielāgot modeli, pielāgojot to noteiktiem domēniem vai lietojumprogrammām. Šī apmācības vienkāršība atvieglo RAG nevainojamu integrāciju dažādās AI sistēmās, padarot to par daudzpusīgu un pieejamu risinājumu valodas izpratnes un ģenerēšanas uzlabošanai.

RAG spēja atrisināt LLM halucinācijas un datu svaiguma problēmas padara to par būtisku rīku uzņēmumiem, kas vēlas uzlabot savu AI sistēmu precizitāti un uzticamību.

RAG lietošanas gadījumi

RAGPielāgošanās spēja piedāvā transformējošus risinājumus ar reālu ietekmi, sākot no zināšanu dzinējiem un beidzot ar meklēšanas iespēju uzlabošanu.

1. Zināšanu dzinējs

RAG var pārveidot tradicionālos valodu modeļus visaptverošos zināšanu dzinējos, lai radītu mūsdienīgu un autentisku saturu. Tas ir īpaši vērtīgs gadījumos, kad nepieciešama jaunākā informācija, piemēram, izglītības platformās, pētniecības vidēs vai informācijas ietilpīgās nozarēs.

2. Meklēšanas palielināšana

Integrējot LLM ar meklētājprogrammām, meklēšanas rezultātu bagātināšana ar LLM ģenerētajām atbildēm uzlabo atbilžu precizitāti uz informatīvajiem vaicājumiem. Tas uzlabo lietotāja pieredzi un racionalizē darbplūsmas, atvieglojot piekļuvi viņu uzdevumu veikšanai nepieciešamajai informācijai.

3. Teksta apkopojums

RAG var izveidot kodolīgus un informatīvus kopsavilkumus liela apjoma tekstam. Turklāt RAG ietaupa lietotāju laiku un pūles, ļaujot izstrādāt precīzu un rūpīgu teksta kopsavilkumi iegūstot attiecīgos datus no trešo pušu avotiem.

4. Jautājumu un atbilžu tērzēšanas roboti

LLM integrēšana tērzēšanas robotos pārveido turpmākos procesus, ļaujot automātiski iegūt precīzu informāciju no uzņēmuma dokumentiem un zināšanu bāzēm. Tas paaugstina tērzēšanas robotu efektivitāti, precīzi un ātri risinot klientu jautājumus.

Nākotnes perspektīvas un inovācijas RAG

Pievēršot arvien lielāku uzmanību personalizētām atbildēm, reāllaika informācijas sintēzei un samazinātai atkarībai no pastāvīgas pārkvalificēšanās, RAG sola revolucionārus valodu modeļu attīstību, lai veicinātu dinamisku un kontekstuāli apzinātu AI mijiedarbību.

Kad RAG attīstās, tā nemanāma integrācija dažādās lietojumprogrammās ar paaugstinātu precizitāti piedāvā lietotājiem izsmalcinātu un uzticamu mijiedarbības pieredzi.

Apmeklējums Unite.ai lai iegūtu labāku ieskatu AI inovācijās un tehnoloģija.