Connect with kami

Kacerdasan buatan

Naon Retrieval Augmented Generation?

mm
diropéa on
Naon Retrieval Augmented Generation?

Modél Basa Gedé (LLMs) parantos nyumbang kana kamajuan domain ngolah basa alami (NLP), tapi jurang anu aya tetep aya dina pamahaman kontekstual. LLMs kadang bisa ngahasilkeun réspon anu teu akurat atanapi henteu dipercaya, fenomena anu katelah "halusinasi.” 

Contona, kalawan ChatGPT, lumangsungna halusinasi diperkirakeun jadi sabudeureun 15% ka 20% sakitar 80% waktos.

Retrieval Augmented Generation (RAG) mangrupikeun kerangka Artificial Intelligence (AI) anu kuat anu dirancang pikeun ngatasi jurang kontéks ku cara ngaoptimalkeun kaluaran LLM. RAG ngungkit pangaweruh éksternal anu lega ngaliwatan panéangan, ningkatkeun kamampuan LLM pikeun ngahasilkeun réspon anu tepat, akurat, sareng kontékstual.  

Hayu urang ngajalajah pentingna RAG dina sistem AI, ngabongkar poténsina pikeun ngarévolusi pamahaman sareng generasi basa.

Naon ari Retrieval Augmented Generation (RAG)?

Salaku kerangka hibrid, RAG ngagabungkeun kaunggulan model generative jeung dimeunangkeun. Kombinasi ieu ngetok sumber pangaweruh pihak katilu pikeun ngadukung perwakilan internal sareng ngahasilkeun jawaban anu langkung tepat sareng dipercaya. 

Arsitéktur RAG nyaéta has, ngagabungkeun model sequence-to-sequence (seq2seq) sareng komponén Dense Passage Retrieval (DPR). Fusi ieu nguatkeun modél pikeun ngahasilkeun réspon anu relevan sacara kontekstual dumasar kana inpormasi anu akurat. 

RAG netepkeun transparansi sareng mékanisme anu kuat pikeun pamariksaan fakta sareng validasi pikeun mastikeun réliabilitas sareng akurasi. 

Kumaha Retrieval Augmented Generation Gawé? 

Dina 2020, Meta ngenalkeun kerangka RAG manjangkeun LLMs saluareun data latihan maranéhna. Kawas ujian buka-buku, RAG ngamungkinkeun LLMs pikeun ngungkit pangaweruh husus pikeun réspon leuwih tepat ku ngakses informasi dunya nyata dina respon kana patarosan, tinimbang ngandelkeun solely on fakta apal.

Diagram modél RAG Asli Meta

Modél RAG Asli ku Meta (Sumber Gambar)

Téhnik inovatif ieu miang tina pendekatan data-driven, incorporating komponén pangaweruh-driven, ngaronjatkeun akurasi model basa ', precision, jeung pamahaman kontekstual.

Salaku tambahan, RAG berpungsi dina tilu léngkah, ningkatkeun kamampuan modél basa.

Taksonomi komponén RAG

Komponén Inti RAG (Sumber Gambar)

  • Pamulihan: Modél pamulihan mendakan inpormasi anu nyambung ka pituduh pangguna pikeun ningkatkeun réspon modél basa. Ieu ngawengku nyocogkeun input pamaké jeung dokumén relevan, mastikeun aksés ka informasi akurat tur ayeuna. Téhnik kawas Padet Passage Retrieval (DPR) jeung kasaruaan kosinus nyumbang kana dimeunangkeun éféktif dina RAG sarta salajengna nyaring papanggihan ku narrowing eta handap. 
  • Augmentasi: Saatos dimeunangkeun, modél RAG ngahijikeun pamundut pangguna sareng data anu dicandak relevan, ngagunakeun téknik rékayasa gancang sapertos ékstraksi frasa konci, jsb. Léngkah ieu sacara efektif komunikasi inpormasi sareng kontéks sareng LLM, mastikeun pamahaman komprehensif pikeun generasi kaluaran akurat.
  • turunan: Dina fase ieu, informasi augmented ieu decoded ngagunakeun model merenah, kayaning runtuyan-to-urutan, pikeun ngahasilkeun respon pamungkas. Lengkah generasi ngajamin kaluaran modél anu koheren, akurat, sareng disaluyukeun dumasar kana pituduh pangguna.

Naon Mangpaat RAG?

RAG alamat tantangan kritis dina NLP, kayaning mitigating akurat, ngurangan reliance on datasets statik, sarta enhancing pamahaman kontekstual pikeun generasi basa leuwih refined tur akurat.

Kerangka inovatif RAG ningkatkeun katepatan sareng reliabilitas eusi anu dihasilkeun, ningkatkeun efisiensi sareng adaptasi sistem AI.

1. Ngurangan LLM halusinasi

Ku ngahijikeun sumber pangaweruh éksternal salila gancang generasi, RAG ensures yén réspon anu pageuh grounded dina informasi akurat tur contextually relevan. Tanggapan ogé tiasa nampilkeun kutipan atanapi rujukan, anu ngamungkinkeun para pangguna pikeun pariksa inpormasi sacara mandiri. Pendekatan ieu sacara signifikan ningkatkeun reliabilitas eusi anu dihasilkeun ku AI sareng ngirangan halusinasi.

2. Up-to-date & Tanggapan Akurat 

RAG ngirangan waktos cutoff data latihan atanapi eusi anu salah ku terus-terusan nyandak inpormasi sacara real-time. Pamekar tiasa sacara mulus ngahijikeun panalungtikan panganyarna, statistik, atanapi warta langsung kana modél generatif. Sumawona, éta ngahubungkeun LLM pikeun hirup feed média sosial, situs warta, sareng sumber inpormasi dinamis. Fitur ieu ngajadikeun RAG alat anu teu berharga pikeun aplikasi anu nungtut inpormasi sacara real-time sareng tepat.

3. Éféktivitas ongkos 

Pangembangan Chatbot sering ngalibatkeun ngagunakeun modél yayasan anu LLM anu tiasa diaksés API kalayan pelatihan anu lega. Tapi, ngalatih deui FM ieu pikeun data khusus domain nyababkeun biaya komputasi sareng kauangan anu luhur. RAG ngaoptimalkeun pamakean sumber daya sareng sacara selektif nyandak inpormasi upami diperyogikeun, ngirangan komputasi anu teu perlu sareng ningkatkeun efisiensi sacara umum. Ieu ningkatkeun daya tahan ékonomi pikeun ngalaksanakeun RAG sareng nyumbang kana kelestarian sistem AI.

4. Émbaran disintésis

RAG nyiptakeun réspon anu komprehensif sareng relevan ku cara nyampur sacara mulus pangaweruh anu dicandak sareng kamampuan generatif. Sintésis sumber inpormasi anu rupa-rupa ieu ningkatkeun jero pamahaman modél, nawiskeun kaluaran anu langkung akurat.

5. Gampang Latihan 

Sifat ramah-pamaké RAG dibuktikeun dina betah latihanna. Pamekar tiasa nyaluyukeun modél kalayan gampang, nyaluyukeun kana domain atanapi aplikasi khusus. Kesederhanaan ieu dina latihan ngagampangkeun integrasi RAG anu mulus kana sababaraha sistem AI, ngajantenkeun solusi anu serbaguna sareng tiasa diaksés pikeun ngamajukeun pamahaman sareng generasi basa.

kamampuan RAG pikeun ngajawab LLM halusinasi sareng masalah kasegaran data ngajadikeun éta alat anu penting pikeun usaha anu hoyong ningkatkeun akurasi sareng reliabilitas sistem AI na.

Paké Kasus RAG

RAG's adaptability nawarkeun solusi transformative kalawan dampak real-dunya, ti mesin pangaweruh pikeun enhancing kamampuhan pilarian. 

1. Engine pangaweruh

RAG tiasa ngarobih modél basa tradisional janten mesin pangaweruh anu komprehensif pikeun nyiptakeun kontén anu up-to-date sareng otentik. Utamana berharga dina skenario dimana inpormasi panganyarna diperyogikeun, sapertos dina platform pendidikan, lingkungan panalungtikan, atanapi industri anu intensif inpormasi.

2. Pilarian Augmentation

Ku ngahijikeun LLM sareng mesin pencari, ngabeungharan hasil pamilarian sareng balesan anu dihasilkeun LLM ningkatkeun katepatan réspon kana patarosan inpormasi. Ieu ngaronjatkeun pangalaman pamaké sarta streamlines workflows, sahingga leuwih gampang pikeun ngakses informasi diperlukeun pikeun tugas maranéhanana. 

3. Ringkesan Téks

RAG tiasa ngahasilkeun ringkesan singket sareng informatif tina volume téks anu ageung. Sumawona, RAG ngahemat waktos sareng usaha pangguna ku ngamungkinkeun pamekaran anu akurat sareng lengkep kasimpulan téks ku cara meunangkeun data nu sasuai ti sumber pihak katilu. 

4. Tanya & Jawab Chatbots

Ngahijikeun LLMs kana chatbots transforms prosés nurutan-up ku sangkan ékstraksi otomatis informasi tepat tina dokumén parusahaan jeung basis pangaweruh. Ieu elevates efisiensi chatbots dina resolving queries customer akurat tur promptly. 

Prospek hareup jeung Inovasi di RAG

Kalayan paningkatan fokus kana réspon pribadi, sintésis inpormasi sacara real-time, sareng ngirangan katergantungan kana palatihan ulang konstan, RAG ngajangjikeun pamekaran revolusioner dina modél basa pikeun ngagampangkeun interaksi AI anu dinamis sareng sadar kontekstual.

Salaku RAG matures, integrasi mulus na kana rupa-rupa aplikasi kalawan akurasi heightened nawarkeun pamaké pangalaman interaksi refined tur dipercaya.

nganjang Ngahiji.ai pikeun wawasan hadé kana inovasi AI na téhnologi.