Sun'iy intellekt

ChatGPT-ning birinchi yubileyi: AI o'zaro ta'sirining kelajagini qayta shakllantirish

Published

6 oy oldin

Dekabr 6, 2023

ChatGPT-ning birinchi yili haqida fikr yuritadigan bo'lsak, ushbu vosita AI sahnasini sezilarli darajada o'zgartirganligi aniq. 2022-yil oxirida ishga tushirilgan ChatGPT o‘zining qulay, suhbat uslubi bilan ajralib turdi, bu esa sun’iy intellekt bilan o‘zaro ishlashni mashinadan ko‘ra odam bilan suhbatlashishga o‘xshatadi. Ushbu yangi yondashuv tezda jamoatchilik e'tiborini tortdi. Chiqarilganidan keyin besh kun ichida ChatGPT allaqachon million foydalanuvchini jalb qildi. 2023 yil boshiga kelib, bu raqam oylik foydalanuvchilar soni 100 millionga yetdi va oktyabr oyiga kelib, platforma butun dunyo bo'ylab 1.7 milliardga yaqin tashrif buyurdi. Bu raqamlar uning mashhurligi va foydaliligi haqida gapiradi.

O'tgan yil davomida foydalanuvchilar elektron pochta yozish va rezyumelarni yangilash kabi oddiy vazifalardan muvaffaqiyatli biznes boshlashgacha bo'lgan ChatGPT-dan foydalanishning barcha ijodiy usullarini topdilar. Lekin bu nafaqat odamlar undan qanday foydalanayotgani; texnologiyaning o'zi o'sdi va yaxshilandi. Dastlab, ChatGPT batafsil matnli javoblarni taklif qiluvchi bepul xizmat edi. Endi ChatGPT-4ni o'z ichiga olgan ChatGPT Plus mavjud. Ushbu yangilangan versiya ko'proq ma'lumotlarga o'rgatilgan, kamroq noto'g'ri javoblar beradi va murakkab ko'rsatmalarni yaxshiroq tushunadi.

Eng katta yangilanishlardan biri shundaki, ChatGPT endi bir necha usulda o'zaro ta'sir qilishi mumkin - u tinglashi, gapirishi va hatto tasvirlarni qayta ishlashi mumkin. Bu siz u bilan uning mobil ilovasi orqali gaplashishingiz va javob olish uchun rasmlarni ko'rsatishingiz mumkin degan ma'noni anglatadi. Ushbu o'zgarishlar sun'iy intellekt uchun yangi imkoniyatlarni ochib berdi va odamlarning sun'iy intellektning hayotimizdagi o'rni haqidagi qarashlari va qarashlarini o'zgartirdi.

Texnologik demo sifatida boshlanganidan tortib texnologiya olamidagi asosiy o'yinchi sifatidagi hozirgi maqomiga qadar, ChatGPT sayohati juda ta'sirli. Dastlab, bu jamoatchilikdan fikr-mulohazalarni olish orqali texnologiyani sinab ko'rish va takomillashtirish usuli sifatida ko'rilgan. Ammo u tezda AI landshaftining muhim qismiga aylandi. Bu muvaffaqiyat katta til modellarini (LLM) nazorat ostida o‘rganish va odamlarning fikr-mulohazalarini hisobga olgan holda nozik sozlash qanchalik samarali ekanligini ko‘rsatadi. Natijada, ChatGPT turli xil savollar va vazifalarni hal qila oladi.

Eng qobiliyatli va ko'p qirrali AI tizimlarini ishlab chiqish poygasi ChatGPT kabi ochiq manba va xususiy modellarning ko'payishiga olib keldi. Ularning umumiy imkoniyatlarini tushunish keng ko'lamli vazifalar bo'yicha keng qamrovli mezonlarni talab qiladi. Ushbu bo'lim turli modellar, shu jumladan ChatGPT, bir-biriga qanday qarama-qarshi bo'lganiga oydinlik kiritib, ushbu mezonlarni o'rganadi.

LLMlarni baholash: ko'rsatkichlar

MT-skameyka: Ushbu mezon sakkizta sohada ko'p bosqichli suhbat va ko'rsatmalarga rioya qilish qobiliyatlarini sinovdan o'tkazadi: yozish, rol o'ynash, ma'lumot olish, fikrlash, matematika, kodlash, STEM bilimlari va gumanitar/ijtimoiy fanlar. GPT-4 kabi kuchliroq LLMlar baholovchi sifatida ishlatiladi.
AlpacaEval: AlpacaFarm baholash to'plamiga asoslanib, ushbu LLM-ga asoslangan avtomatik baholovchi modellarni GPT-4 va Klod kabi ilg'or LLMlarning javoblari bilan taqqoslaydi va nomzod modellarning g'alaba qozonish darajasini hisoblaydi.
LLM yetakchilar panelini oching: Til modelini baholash vositasidan foydalangan holda, ushbu peshqadamlar paneli LLMlarni yettita asosiy mezon bo'yicha baholaydi, jumladan, fikrlash muammolari va umumiy bilim testlari, ham nol, ham bir nechta tortishish sozlamalarida.
KATTA skameyka: Bu hamkorlikdagi mezon turli mavzular va tillarni qamrab oluvchi 200 dan ortiq yangi til vazifalarini qamrab oladi. Bu LLMlarni tekshirish va ularning kelajakdagi imkoniyatlarini bashorat qilishga qaratilgan.
ChatEval: Jamoalarga ochiq savollar va an'anaviy tabiiy tillarni yaratish vazifalari bo'yicha turli modellardan olingan javoblar sifatini avtonom tarzda muhokama qilish va baholash imkonini beruvchi ko'p agentli bahs tizimi.

Qiyosiy ishlash

Umumiy ko'rsatkichlar nuqtai nazaridan, ochiq manbali LLMlar sezilarli yutuqlarga erishdi. Llama-2-70B, masalan, ta'sirchan natijalarga erishdi, ayniqsa ko'rsatmalar ma'lumotlari bilan yaxshi sozlangandan keyin. Uning Llama-2-chat-70B varianti AlpacaEvalda 92.66% yutuq ko‘rsatkichi bilan GPT-3.5-turbo-dan oshib ketdi. Biroq, GPT-4 95.28% g'alaba qozonish darajasi bilan oldingi o'rinni egallab turibdi.

Zefir-7B, kichikroq model, ayniqsa AlpacaEval va MT-Bench-da katta 70B LLM bilan taqqoslanadigan qobiliyatlarni namoyish etdi. Shu bilan birga, WizardLM-70B, turli xil ko'rsatmalar ma'lumotlari bilan yaxshi sozlangan, MT-Bench-dagi ochiq manbali LLMlar orasida eng yuqori ballga ega bo'ldi. Biroq, u hali ham GPT-3.5-turbo va GPT-4 dan ortda qoldi.

Qiziqarli yozuv GodziLLa2-70B, turli xil ma'lumotlar to'plamlarini birlashtirgan eksperimental modellarning imkoniyatlarini namoyish qilib, Open LLM Peshqadamlik reytingida raqobatbardosh ballga erishdi. Xuddi shunday, noldan ishlab chiqilgan Yi-34B GPT-3.5-turbo bilan taqqoslanadigan ball bilan ajralib turdi va GPT-4dan biroz orqada qoldi.

UltraLlama turli xil va yuqori sifatli ma'lumotlarning nozik sozlanishi bilan GPT-3.5-turbo-ga taklif qilingan mezonlarga mos keldi va hatto jahon va professional bilimlar bo'yicha undan oshib ketdi.

Kengaytirish: Gigant LLMlarning ko'tarilishi

2020 yildan beri eng yaxshi LLM modellari

LLM rivojlanishining muhim tendentsiyasi model parametrlarining kengayishi bo'ldi. Gopher, GLaM, LaMDA, MT-NLG va PaLM kabi modellar chegaralarni oshirib, 540 milliardgacha parametrlarga ega modellar bilan yakunlandi. Ushbu modellar o'ziga xos qobiliyatlarni namoyish etdi, ammo ularning yopiq manbali tabiati kengroq qo'llanilishini cheklab qo'ydi. Ushbu cheklash ochiq manbali LLMlarni ishlab chiqishga qiziqish uyg'otdi, bu tendentsiya tobora kuchayib bormoqda.

Model o'lchamlarini kengaytirish bilan bir qatorda, tadqiqotchilar muqobil strategiyalarni o'rganishdi. Modellarni kattalashtirish o‘rniga, ular kichikroq modellarni oldindan tayyorlashni yaxshilashga e’tibor qaratdilar. Masalan, Chinchilla va UL2, ular ko'proq har doim ham yaxshi emasligini ko'rsatdi; oqilona strategiyalar ham samarali natijalar berishi mumkin. Bundan tashqari, FLAN, T0 va Flan-T5 kabi loyihalar ushbu sohaga katta hissa qo'shayotgan til modellarini ko'rsatmalarni sozlashga katta e'tibor qaratildi.

ChatGPT katalizatori

OpenAI ning kiritilishi GPT chat NLP tadqiqotlarida burilish nuqtasi bo'ldi. OpenAI bilan raqobat qilish uchun Google va Anthropic kabi kompaniyalar mos ravishda Bard va Claude modellarini ishga tushirdilar. Ushbu modellar ko'p vazifalarda ChatGPT bilan taqqoslanadigan ko'rsatkichlarni ko'rsatsa-da, ular hali ham OpenAI-ning so'nggi modeli GPT-4 dan ortda qolmoqda. Ushbu modellarning muvaffaqiyati, birinchi navbatda, insonning fikr-mulohazalaridan (RLHF) o'rganishni kuchaytirish bilan bog'liq bo'lib, bu usul yanada takomillashtirish uchun ko'proq tadqiqot e'tiborini oladi.

OpenAI Q* (Q-Star) atrofidagi mish-mishlar va taxminlar

So'nggi hisobotlar OpenAI tadqiqotchilari Q* (Q yulduzi deb ataladi) deb nomlangan yangi modelni ishlab chiqish bilan sun'iy intellektda sezilarli yutuqlarga erishgan bo'lishi mumkinligini taxmin qilmoqda. Taxminlarga ko'ra, Q* maktab darajasidagi matematikani bajarish qobiliyatiga ega, bu uning sun'iy umumiy intellekt (AGI) yo'nalishidagi potentsiali haqida mutaxassislar o'rtasida munozaralarga sabab bo'lgan. OpenAI ushbu hisobotlarga izoh bermagan bo'lsa-da, Q * ning mish-mishlar qobiliyatlari ijtimoiy tarmoqlarda va sun'iy intellekt ishqibozlari orasida katta hayajon va mish-mishlarni keltirib chiqardi.

Q* ning rivojlanishi diqqatga sazovordir, chunki ChatGPT va GPT-4 kabi mavjud til modellari ba'zi matematik vazifalarni bajarishga qodir bo'lsa-da, ularni ishonchli tarzda boshqarishda ayniqsa mohir emas. Qiyinchilik AI modellari nafaqat chuqur o'rganish va transformatorlar orqali amalga oshirilganidek, naqshlarni tanibgina qolmay, balki mavhum tushunchalarni mulohaza yuritish va tushunish zaruratidadir. Mulohaza yuritish uchun mezon bo'lgan matematika AIdan mavhum tushunchalarni chuqur o'zlashtirganini ko'rsatib, bir nechta bosqichlarni rejalashtirish va bajarishni talab qiladi. Bu qobiliyat AI qobiliyatlarida sezilarli pog'onani ko'rsatadi va potentsial ravishda matematikadan tashqari boshqa murakkab vazifalarni ham qamrab oladi.

Biroq, mutaxassislar bu rivojlanishni haddan tashqari oshirib yuborishdan ehtiyot bo'lishadi. Matematik muammolarni ishonchli hal qiladigan sun'iy intellekt tizimi ta'sirchan yutuq bo'lsa-da, bu superintellektual AI yoki AGI paydo bo'lishidan dalolat bermaydi. Hozirgi sun'iy intellekt bo'yicha tadqiqotlar, shu jumladan OpenAIning sa'y-harakatlari murakkabroq vazifalarda turli darajadagi muvaffaqiyatlarga ega elementar muammolarga qaratilgan.

Q* kabi potentsial ilovalarni rivojlantirish imkoniyatlari juda katta bo'lib, shaxsiylashtirilgan repetitorlikdan ilmiy tadqiqot va muhandislik sohasida yordam berishgacha. Biroq, umidlarni boshqarish va bunday yutuqlar bilan bog'liq cheklovlar va xavfsizlik muammolarini tan olish ham muhimdir. OpenAI-ning asosiy tashvishi bo'lgan ekzistensial xavflarni keltirib chiqaradigan AI haqidagi xavotirlar dolzarb bo'lib qolmoqda, ayniqsa AI tizimlari real dunyo bilan ko'proq aloqa o'rnatishni boshlaganda.

Ochiq manbali LLM harakati

Ochiq manbali LLM tadqiqotlarini kuchaytirish uchun Meta Llama seriyali modellarini chiqardi va bu Llama asosidagi yangi ishlanmalar to'lqinini keltirib chiqardi. Bunga Alpaca, Vicuna, Lima va WizardLM kabi ko'rsatmalar ma'lumotlari bilan yaxshi sozlangan modellar kiradi. Tadqiqot, shuningdek, Llama asosidagi doirada agentning imkoniyatlarini, mantiqiy fikrlashni va uzoq kontekstli modellashtirishni kuchaytirishga qaratilgan.

Bundan tashqari, MPT, Falcon, XGen, Phi, Baichuan, Mistral, grok, va Yi. Ushbu sa'y-harakatlar yopiq manbali LLMlarning imkoniyatlarini demokratlashtirish, ilg'or AI vositalarini yanada qulayroq va samaraliroq qilish majburiyatini aks ettiradi.

Sog'liqni saqlashda ChatGPT va ochiq kodli modellarning ta'siri

Biz LLMlar klinik eslatmalarni olishda, tovon toʻlash uchun blankalarni toʻldirishda hamda shifokorlarni tashxis va davolashni rejalashtirishda qoʻllab-quvvatlashda yordam beradigan kelajakni qidirmoqdamiz. Bu texnologiya gigantlari va sog'liqni saqlash muassasalarining e'tiborini tortdi.

Microsoft Epic bilan munozaralar, elektron sog'liqni saqlash yozuvlari dasturiy ta'minotining etakchi provayderi, LLMlarning sog'liqni saqlashga integratsiyalashuvidan dalolat beradi. UC San-Diego Health va Stenford universiteti tibbiyot markazida tashabbuslar allaqachon mavjud. Xuddi shunday, Google Mayo Clinic va Amazon Web Services bilan hamkorlik"HealthScribe" AI klinik hujjatlashtirish xizmatining ishga tushirilishi bu yo'nalishda sezilarli yutuqlarni ko'rsatmoqda.

Biroq, ushbu tezkor joylashtirishlar tibbiyot ustidan nazoratni korporativ manfaatlarga o'tkazish haqida tashvish uyg'otadi. Ushbu LLMlarning mulkiy tabiati ularni baholashni qiyinlashtiradi. Ularning mumkin bo'lgan o'zgarishi yoki rentabellik sabablari bo'yicha to'xtatilishi bemorning parvarishi, maxfiyligi va xavfsizligini buzishi mumkin.

Sog'liqni saqlash sohasida LLMni rivojlantirishga ochiq va inklyuziv yondashuv zarur. Sog'liqni saqlash muassasalari, tadqiqotchilar, klinisyenler va bemorlar sog'liqni saqlash uchun ochiq manbali LLM yaratish uchun global miqyosda hamkorlik qilishlari kerak. Trillion Parameter Consortiumga o'xshash ushbu yondashuv hisoblash, moliyaviy resurslar va tajribalarni birlashtirishga imkon beradi.

Aloqador mavzular:GPT lama 2 LLM

Keyingi

UltraFastBERT: Eksponensial tezroq tilni modellashtirish

Yo'qotmang

Ilon Maskning xAI kompaniyasi milliard dollarlik moliyalashtirishni ko'paytirishga intilmoqda

Aayush Mittal

Men so'nggi besh yilni Mashinani o'rganish va chuqur o'rganishning maftunkor dunyosiga sho'ng'ish uchun o'tkazdim. Mening ishtiyoqim va tajribam meni AI/MLga alohida e'tibor qaratgan holda 50 dan ortiq turli xil dasturiy injiniring loyihalariga hissa qo'shishimga olib keldi. Doimiy qiziquvchanligim meni tabiiy tilni qayta ishlashga ham tortdi, bu sohani men ko'proq o'rganishni xohlayman.