Biz bilan ulang

Sun'iy intellekt

LLMda Qidiruv-kengaytirilgan avlodga chuqur sho'ng'ish

mm

Published

 on

Midjourney yordamida kengaytirilgan avlod tasvirini olish

Tasavvur qiling-a, siz tahlilchisiz va sizda katta til modeliga kirish imkoningiz bor. Bu ish oqimingizga olib keladigan istiqbollardan hayajondasiz. Ammo keyin siz undan so'nggi aktsiya baholari yoki joriy inflyatsiya darajasi haqida so'raysiz va u sizga quyidagilar bilan ta'sir qiladi:

“Kechirasiz, lekin men real vaqt rejimida yoki uzilishdan keyingi maʼlumotlarni taqdim eta olmayman. Mening so'nggi mashg'ulotlarim haqidagi ma'lumotlarim faqat 2022 yil yanvargacha yetadi.

Katta til modeli, ularning barcha lingvistik kuchiga qaramay, ''ni tushunish qobiliyatiga ega emas.hozir'. Va tez rivojlanayotgan dunyoda,hozir"hammasi.

Tadqiqotlar shuni ko'rsatdiki, oldindan o'rgatilgan katta til modellari (LLM) ham faktik bilimlarning ombori hisoblanadi.

Ular shunchalik ko'p ma'lumotlarga o'rgatilganki, ular juda ko'p fakt va raqamlarni o'zlashtirdilar. Nozik sozlanganda, ular turli NLP vazifalarida ajoyib natijalarga erishishlari mumkin.

Ammo bu erda bir narsa bor: ularning ushbu saqlangan bilimlarga kirish va boshqarish qobiliyati, ba'zida mukammal emas. Ayniqsa, vazifa bilim talab qiladigan bo'lsa, bu modellar ko'proq ixtisoslashgan arxitekturalardan orqada qolishi mumkin. Bu xuddi dunyodagi barcha kitoblar jamlangan kutubxonaga ega, lekin kerakli narsalarni topish uchun katalog yo‘qligiga o‘xshaydi.

OpenAI-ning ChatGPT brauzeri yangilanishini oladi

OpenAI-ning ChatGPT-ni ko'rish qobiliyati haqidagi so'nggi e'loni Qidiruv-kengaytirilgan avlod (RAG) yo'nalishidagi sezilarli sakrashdir. ChatGPT endi joriy va ishonchli ma'lumot uchun internetni o'rgana oladi, u boyitilgan javoblarni taqdim etish uchun tashqi manbalardan ma'lumotlarni dinamik ravishda olishning RAG yondashuvini aks ettiradi.

Hozirda Plus va Enterprise foydalanuvchilari uchun mavjud bo‘lgan OpenAI bu funksiyani tez orada barcha foydalanuvchilarga taqdim etishni rejalashtirmoqda. Foydalanuvchilar buni GPT-4 opsiyasi ostidagi "Bing bilan ko'rish" ni tanlash orqali faollashtirishlari mumkin.

Chatgpt yangi ko'rish xususiyati

Chatgpt yangi "Bing" ko'rish xususiyati

 Tez muhandislik samarali, ammo etarli emas

Ko'rsatmalar LLM bilimlariga kirish eshigi bo'lib xizmat qiladi. Ular javob uchun yo'nalishni ta'minlab, modelni boshqaradi. Biroq, samarali taklifni yaratish LLMdan kerakli narsani olishning to'liq echimi emas. Shunday bo'lsa-da, keling, taklif yozishda e'tiborga olish kerak bo'lgan yaxshi amaliyotni ko'rib chiqaylik:

  1. aniqlik: Yaxshi belgilangan taklif noaniqlikni yo'q qiladi. Model foydalanuvchining niyatini tushunishini ta'minlab, sodda bo'lishi kerak. Bu aniqlik ko'pincha yanada izchil va tegishli javoblarga aylanadi.
  2. Kontekst: Ayniqsa, keng ko'lamli kirishlar uchun ko'rsatmani joylashtirish chiqishga ta'sir qilishi mumkin. Masalan, ko'rsatmani uzoq so'rovning oxiriga o'tkazish ko'pincha yaxshi natijalar berishi mumkin.
  3. Yo'riqnomada aniqlik: Ko'pincha "kim, nima, qayerda, qachon, nima uchun, qanday" doirasi orqali berilgan savolning kuchi modelni ko'proq yo'naltirilgan javobga yo'naltirishi mumkin. Bundan tashqari, kerakli chiqish formati yoki hajmini belgilash modelning chiqishini yanada yaxshilashi mumkin.
  4. Noaniqlikni boshqarish: Ishonchsiz bo'lsa, modelga qanday javob berish kerakligini ko'rsatish juda muhimdir. Misol uchun, noaniq bo'lsa, modelga "bilmayman" deb javob berishni ko'rsatsangiz, uni noto'g'ri yoki "bilmayman" deb aytish mumkin.gallyutsinatsiyalangan” javoblari.
  5. Bosqichma-bosqich fikrlash: Murakkab ko'rsatmalar uchun modelni tizimli fikrlashga yo'naltirish yoki vazifani kichik vazifalarga bo'lish yanada kengroq va aniq natijalarga olib kelishi mumkin.

ChatGPT-ni boshqarishda ko'rsatmalarning ahamiyati bilan bog'liq holda, keng qamrovli maqolani quyidagi maqolada topish mumkin. Unite.ai.

Generativ AI modellaridagi qiyinchiliklar

Tezkor muhandislik, uning ishlashini yaxshilash uchun modelingizga berilgan ko'rsatmalarni aniq sozlashni o'z ichiga oladi. Bu Generativ AI ilovangizning aniqligini oshirishning juda tejamli usuli boʻlib, faqat kichik kod tuzatishlarini talab qiladi. Tezkor muhandislik natijalarni sezilarli darajada oshirishi mumkin bo'lsa-da, katta til modellarining (LLM) o'ziga xos cheklovlarini tushunish juda muhimdir. Ikkita asosiy muammo gallyutsinatsiyalar va bilim chegaralari.

  • Halüsinasyonlar: Bu model noto'g'ri yoki uydirma javobni ishonchli tarzda qaytaradigan holatlarga ishora qiladi. Ilg'or LLM bunday natijalarni tanib olish va oldini olish uchun o'rnatilgan mexanizmlarga ega.
LLMlarda gallyutsinatsiyalar

LLMda gallyutsinatsiyalar

  • Bilimlarni kesish: Har bir LLM modelida mashg'ulotning tugash sanasi bor, u voqea yoki o'zgarishlardan bexabar. Bu cheklash modelning bilimi oxirgi o'qitish sanasida muzlatilganligini anglatadi. Misol uchun, 2022 yilgacha o'qitilgan model 2023 yil voqealarini bilmaydi.
LLMSda bilimlarni cheklash

LLMda bilimlarni cheklash

Qidiruv kengaytirilgan avlod (RAG) ushbu muammolarga yechim taklif qiladi. Bu modellarga tashqi ma'lumotlarga kirish imkonini beradi, xususiy yoki domenga xos ma'lumotlarga kirishni ta'minlash orqali gallyutsinatsiyalar bilan bog'liq muammolarni yumshatadi. Ma'lumotni cheklash uchun RAG joriy ma'lumotlarga modelni o'qitish sanasidan tashqari kirishi mumkin, bu esa chiqishning dolzarbligini ta'minlaydi.

Shuningdek, u LLMga real vaqtda turli xil tashqi manbalardan ma'lumotlarni olish imkonini beradi. Bu bilim bazalari, ma'lumotlar bazalari yoki hatto Internetning keng doirasi bo'lishi mumkin.

Qidiruv-kengaytirilgan avlodga kirish

Qidiruv-kengaytirilgan avlod (RAG) ma'lum bir texnologiya emas, balki katta til modellariga o'rganilmagan ma'lumotlardan foydalanish imkonini beruvchi ramka hisoblanadi. RAGni amalga oshirishning bir necha yo'li mavjud va eng yaxshi moslik sizning aniq vazifangizga va ma'lumotlaringizning tabiatiga bog'liq.

RAG ramkasi tuzilgan tarzda ishlaydi:

Tezkor kiritish

Jarayon foydalanuvchi kiritishi yoki so'rovi bilan boshlanadi. Bu aniq ma'lumotni talab qiladigan savol yoki bayonot bo'lishi mumkin.

Tashqi manbalardan olish

O'qitish asosida to'g'ridan-to'g'ri javob yaratish o'rniga, model retriver komponenti yordamida tashqi ma'lumotlar manbalari orqali qidiradi. Ushbu manbalar ma'lumotlar bazalari, ma'lumotlar bazalari va hujjatlar do'konlaridan tortib, Internetga kirish mumkin bo'lgan ma'lumotlargacha bo'lishi mumkin.

Qidiruvni tushunish

O'z mohiyatiga ko'ra, qidiruv qidiruv operatsiyasini aks ettiradi. Bu foydalanuvchi kiritishiga javoban eng kerakli ma'lumotlarni olish haqida. Ushbu jarayonni ikki bosqichga bo'lish mumkin:

  1. Kataloglashtirish: Aytish mumkinki, butun RAG sayohatining eng qiyin qismi bu sizning bilim bazangizni indekslashdir. Indekslash jarayonini ikki bosqichga bo'lish mumkin: Yuklash va Bo'lish. LangChain kabi asboblarda bu jarayonlar "deb ataladi.yuklovchilar"Va"bo'linuvchilar“. Yuklagichlar veb-sahifalar yoki PDF-lar bo'lsin, turli manbalardan tarkibni oladilar. Olinganidan so'ng, splitterlar ushbu tarkibni o'lchamdagi bo'laklarga bo'lib, ularni joylashtirish va qidirish uchun optimallashtiradi.
  2. So'rov: Bu qidiruv atamasi asosida eng mos bilim qismlarini olish harakati.

Qidiruvga yondashishning ko'plab usullari mavjud bo'lsa-da, oddiy matnni moslashtirishdan Google kabi qidiruv tizimlaridan foydalanishgacha, zamonaviy Qidiruv-kengaytirilgan avlod (RAG) tizimlari semantik qidiruvga tayanadi. Semantik qidiruvning markazida o'rnatish tushunchasi yotadi.

O'rnatishlar Katta til modellari (LLM) tilni qanday tushunishida muhim ahamiyatga ega. Odamlar so'zlardan qanday ma'no olishlarini ifodalashga harakat qilganda, tushuntirish ko'pincha o'ziga xos tushunchaga qaytadi. Kognitiv tuzilmalarimizning chuqurligida biz "bola" va "bola" sinonim ekanligini yoki "qizil" va "yashil" ikkalasi ham ranglarni anglatishini tushunamiz.

Taklifni kuchaytirish

Keyin olingan ma'lumot asl so'rov bilan birlashtirilib, kengaytirilgan yoki kengaytirilgan so'rovni yaratadi. Ushbu kengaytirilgan taklif modelni qo'shimcha kontekst bilan ta'minlaydi, agar ma'lumotlar domenga xos bo'lsa yoki modelning asl o'quv korpusining bir qismi bo'lmasa, ayniqsa qimmatlidir.

To'ldirishni yaratish

Qo'lda kengaytirilgan so'rov bilan model yakunlash yoki javobni yaratadi. Bu javob nafaqat modelni o'qitishga asoslangan, balki real vaqt rejimida olingan ma'lumotlar orqali ham ma'lum qilinadi.

Qidiruv-kengaytirilgan avlod

Qidiruv-kengaytirilgan avlod

Birinchi RAG LLM arxitekturasi

Meta tomonidan 2020 yilda chop etilgan tadqiqot maqolasi "Intensiv bilim talab qiladigan NLP vazifalari uchun qidirish-kengaytirilgan avlod” ushbu texnikani chuqur o'rganish imkonini beradi. Qidiruv-kengaytirilgan avlod modeli tashqi qidirish yoki qidirish mexanizmi bilan an'anaviy avlod jarayonini kengaytiradi. Bu modelga katta hajmdagi ma'lumotlardan tegishli ma'lumotlarni olish imkonini beradi va kontekstli aniq javoblarni yaratish qobiliyatini oshiradi.

Bu quyidagicha ishlaydi:

  1. Parametrik xotira: Bu seq2seq modeli kabi an'anaviy til modelingiz. U katta hajmdagi ma'lumotlar bo'yicha o'qitilgan va ko'p narsani biladi.
  2. Parametrik bo'lmagan xotira: Buni qidiruv tizimi sifatida tasavvur qiling. Bu, masalan, Vikipediyaning zich vektor indeksidir, unga neyron retriever yordamida kirish mumkin.

Birlashganda, bu ikkisi aniq modelni yaratadi. RAG modeli avvalo parametrik bo'lmagan xotiradan tegishli ma'lumotlarni oladi va keyin izchil javob berish uchun parametrik bilimlaridan foydalanadi.

RAG ORIGNAL MODEL BY META

Meta tomonidan original RAG modeli

1. Ikki bosqichli jarayon:

RAG LLM ikki bosqichli jarayonda ishlaydi:

  • Qabul qilish: Model avval tegishli hujjatlarni yoki katta maʼlumotlar toʻplamidan parchalarni qidiradi. Bu so'rovni ham, hujjatlarni ham ko'rsatish uchun joylashtirishdan foydalanadigan zich qidirish mexanizmi yordamida amalga oshiriladi. Keyinchalik o'rnatishlar o'xshashlik ballarini hisoblash uchun ishlatiladi va eng yuqori o'rindagi hujjatlar olinadi.
  • Generatsiya: Qo'lda eng yuqori darajadagi tegishli hujjatlar bilan ular dastlabki so'rov bilan birga ketma-ketlik generatoriga yo'naltiriladi. Keyinchalik, ushbu generator so'rov va olingan hujjatlardan kontekstni chizib, yakuniy natijani ishlab chiqaradi.

2. Zich olish:

An'anaviy qidiruv tizimlari ko'pincha TF-IDF kabi siyrak vakillarga tayanadi. Biroq, RAG LLM zich tasvirlardan foydalanadi, bunda so'rovlar ham, hujjatlar ham uzluksiz vektor bo'shliqlariga joylashtirilgan. Bu shunchaki kalit so'zlarni moslashtirishdan tashqari semantik munosabatlarni qamrab oladigan o'xshashlikni yanada nozik taqqoslash imkonini beradi.

3. Ketma-ketlikni yaratish:

Qabul qilingan hujjatlar avlod modeli uchun kengaytirilgan kontekst vazifasini bajaradi. Ko'pincha Transformers kabi arxitekturalarga asoslangan ushbu model, so'ngra yakuniy natijani ishlab chiqaradi va uning izchil va kontekstga mos kelishini ta'minlaydi.

Hujjatlarni qidirish

Hujjatlarni indekslash va qidirish

Samarali ma'lumot olish uchun, ayniqsa katta hajmdagi hujjatlardan ma'lumotlar ko'pincha vektor ma'lumotlar bazasida saqlanadi. Har bir ma'lumot yoki hujjat tarkibning semantik mohiyatini qamrab oluvchi o'rnatish vektori asosida indekslanadi. Samarali indeksatsiya kiritish so'rovi asosida tegishli ma'lumotlarni tezda olish imkonini beradi.

Vektor ma'lumotlar bazalari

Vektor ma'lumotlar bazasi

Manba: Redis

Vektor ma'lumotlar bazalari, ba'zan vektor saqlash deb ataladi, vektor ma'lumotlarini saqlash va olish uchun mo'ljallangan moslashtirilgan ma'lumotlar bazalari. AI va kompyuter fanlari sohasida vektorlar asosan ko'p o'lchovli makonda nuqtalarni ifodalovchi raqamlar ro'yxatidir. Jadvalli ma'lumotlarga ko'proq moslashtirilgan an'anaviy ma'lumotlar bazalaridan farqli o'laroq, vektor ma'lumotlar bazasi tabiiy ravishda vektor formatiga mos keladigan ma'lumotlarni boshqarishda porlaydi, masalan, sun'iy intellekt modellarini o'rnatish.

Ba'zi taniqli vektor ma'lumotlar bazalariga Annoy, Faiss Meta tomonidan Milvusva Qarag'ay daraxti. Ushbu ma'lumotlar bazalari AI ilovalarida muhim ahamiyatga ega bo'lib, tavsiya tizimlaridan tortib tasvirlarni qidirishgacha bo'lgan vazifalarni bajarishda yordam beradi. AWS kabi platformalar, shuningdek, Amazon OpenSearch Service va PostgreSQL uchun Amazon RDS kabi vektor ma'lumotlar bazasi ehtiyojlariga moslashtirilgan xizmatlarni taklif qiladi. Ushbu xizmatlar aniq foydalanish holatlari uchun optimallashtirilgan bo'lib, samarali indeksatsiya va so'rovlarni ta'minlaydi.

Muvofiqlik uchun bo'linish

Ko'pgina hujjatlar keng qamrovli bo'lishi mumkinligini hisobga olsak, ko'pincha "chunking" deb nomlanuvchi usul qo'llaniladi. Bu katta hujjatlarni kichikroq, semantik jihatdan izchil bo'laklarga ajratishni o'z ichiga oladi. Keyinchalik bu bo'laklar indekslanadi va kerak bo'lganda olinadi, bu esa hujjatning eng tegishli qismlarini tez ko'paytirish uchun ishlatilishini ta'minlaydi.

Kontekst oynasini ko'rib chiqish

Har bir LLM kontekst oynasida ishlaydi, bu bir vaqtning o'zida ko'rib chiqilishi mumkin bo'lgan maksimal ma'lumot miqdoridir. Agar tashqi ma'lumotlar manbalari ushbu oynadan oshib ketadigan ma'lumotni taqdim etsa, uni modelning kontekst oynasiga mos keladigan kichikroq bo'laklarga bo'lish kerak.

Qidiruv-kengaytirilgan avloddan foydalanishning afzalliklari

  1. Kengaytirilgan aniqlik: Tashqi ma'lumotlar manbalaridan foydalangan holda, RAG LLM nafaqat o'quv ma'lumotlariga asoslangan, balki qidiruv korpusida mavjud bo'lgan eng dolzarb va eng dolzarb ma'lumotlardan ham xabardor qilinadigan javoblarni ishlab chiqishi mumkin.
  2. Bilimlardagi kamchiliklarni bartaraf etish: RAG LLMga xos bo'lgan bilim cheklovlarini samarali tarzda hal qiladi, bu modelning o'qitishning uzilishi yoki o'quv korpusida domenga xos ma'lumotlarning yo'qligi bilan bog'liqmi.
  3. Ko'pchilik: RAG turli tashqi ma'lumotlar manbalari bilan birlashtirilishi mumkin, tashkilot ichidagi xususiy ma'lumotlar bazalaridan tortib, hamma uchun ochiq bo'lgan internet ma'lumotlarigacha. Bu uni keng ko'lamli ilovalar va sohalarga moslashishga imkon beradi.
  4. Gallyutsinatsiyalarni kamaytirish: LLM bilan bog'liq muammolardan biri bu "gallyutsinatsiyalar" yoki haqiqatan ham noto'g'ri yoki uydirma ma'lumotni yaratish potentsialidir. Haqiqiy vaqtda ma'lumotlar kontekstini ta'minlash orqali RAG bunday chiqish imkoniyatlarini sezilarli darajada kamaytirishi mumkin.
  5. Ölçeklenebilirlik: RAG LLM ning asosiy afzalliklaridan biri uning miqyoslash qobiliyatidir. Qidirish va yaratish jarayonlarini ajratib, model keng ma'lumotlar to'plamlarini samarali boshqarishi mumkin, bu esa uni ma'lumotlar ko'p bo'lgan haqiqiy dunyo ilovalari uchun mos qiladi.

Qiyinchiliklar va mulohazalar

  • Hisoblash bo'yicha qo'shimcha xarajatlar: Ikki bosqichli jarayon, ayniqsa, katta ma'lumotlar to'plamlari bilan ishlashda hisoblash intensiv bo'lishi mumkin.
  • Ma'lumotlarga bog'liqlik: Qabul qilingan hujjatlarning sifati ishlab chiqarish sifatiga bevosita ta'sir qiladi. Shunday qilib, keng qamrovli va yaxshi tuzilgan qidiruv korpusiga ega bo'lish juda muhimdir.

Xulosa

Qidiruv va yaratish jarayonlarini birlashtirgan holda, Retrieval-Augmented Generation bilim talab qiladigan vazifalarga ishonchli yechim taklif etadi, natijada ham axborotga ega, ham kontekstga mos keladi.

RAGning haqiqiy va'dasi uning potentsial real dunyo ilovalarida yotadi. O'z vaqtida va aniq ma'lumot muhim bo'lishi mumkin bo'lgan sog'liqni saqlash kabi sohalar uchun RAG keng tibbiy adabiyotlardan muammosiz tushunchalarni olish va yaratish qobiliyatini taklif qiladi. Bozorlar daqiqa sayin rivojlanib borayotgan moliya sohasida RAG real vaqt rejimida ma'lumotlarga asoslangan tushunchalarni taqdim etishi mumkin, bu esa ongli qarorlar qabul qilishda yordam beradi. Bundan tashqari, akademiya va tadqiqotlarda olimlar RAG-dan keng ma'lumotlar omborlarini skanerlash uchun foydalanishlari mumkin, bu esa adabiyotlarni ko'rib chiqish va ma'lumotlarni tahlil qilishni yanada samarali qiladi.

Men so'nggi besh yilni Mashinani o'rganish va chuqur o'rganishning maftunkor dunyosiga sho'ng'ish uchun o'tkazdim. Mening ishtiyoqim va tajribam meni AI/MLga alohida e'tibor qaratgan holda 50 dan ortiq turli xil dasturiy injiniring loyihalariga hissa qo'shishimga olib keldi. Doimiy qiziquvchanligim meni tabiiy tilni qayta ishlashga ham tortdi, bu sohani men ko'proq o'rganishni xohlayman.