stub L-Ewwel Anniversarju ta' ChatGPT: Tibdil mill-ġdid tal-Futur tal-Interazzjoni tal-AI - Unite.AI
Kuntatt magħna

Intelliġenza Artifiċjali

L-Ewwel Anniversarju ta' ChatGPT: Tfassil mill-ġdid tal-Futur tal-Interazzjoni tal-AI

mm

ippubblikat

 on

ChatGPT vs Mudelli Open-Source

Meta nirrifletti fuq l-ewwel sena ta' ChatGPT, huwa ċar li din l-għodda biddlet b'mod sinifikanti x-xena tal-AI. Imnedija fl-aħħar tal-2022, ChatGPT spikkat minħabba l-istil ta’ konversazzjoni faċli għall-utent li għamel l-interazzjoni mal-AI tħossha aktar qisha titkellem ma’ persuna milli ma’ magna. Dan l-approċċ il-ġdid malajr ġibed l-għajn tal-pubbliku. Fi żmien ħamest ijiem biss wara l-ħruġ tiegħu, ChatGPT kien diġà ġibed miljun utent. Sal-bidu tal-2023, dan in-numru żdied għal madwar 100 miljun utent fix-xahar, u sa Ottubru, il-pjattaforma kienet qed tiġbed madwar 1.7 biljun żjara madwar id-dinja. Dawn in-numri jitkellmu ħafna dwar il-popolarità u l-utilità tiegħu.

Matul is-sena li għaddiet, l-utenti sabu kull xorta ta’ modi kreattivi biex jużaw ChatGPT, minn ħidmiet sempliċi bħall-kitba ta’ emails u l-aġġornament tal-kompji għall-bidu ta’ negozji ta’ suċċess. Imma mhux biss dwar kif in-nies qed jużawha; it-teknoloġija nnifisha kibret u tjiebet. Inizjalment, ChatGPT kien servizz b'xejn li joffri tweġibiet dettaljati tat-test. Issa, hemm ChatGPT Plus, li jinkludi ChatGPT-4. Din il-verżjoni aġġornata hija mħarrġa fuq aktar dejta, tagħti inqas tweġibiet ħżiena, u tifhem aħjar struzzjonijiet kumplessi.

Wieħed mill-akbar aġġornamenti huwa li ChatGPT issa jista’ jinteraġixxi b’diversi modi – jista’ jisma’, jitkellem, u anke jipproċessa immaġini. Dan ifisser li tista 'tkellem magħha permezz tal-app mobbli tagħha u turiha stampi biex tikseb tweġibiet. Dawn il-bidliet fetħu possibbiltajiet ġodda għall-AI u bidlu kif in-nies jaraw u jaħsbu dwar ir-rwol tal-AI f'ħajjitna.

Mill-bidu tiegħu bħala demo teknoloġiku sal-istatus attwali tiegħu bħala attur ewlieni fid-dinja tat-teknoloġija, il-vjaġġ ta 'ChatGPT huwa pjuttost impressjonanti. Inizjalment, kien meqjus bħala mod biex tittestja u tittejjeb it-teknoloġija billi tikseb feedback mill-pubbliku. Iżda malajr sar parti essenzjali mill-pajsaġġ tal-IA. Dan is-suċċess juri kemm hu effettiv li jiġu rfinati mudelli ta’ lingwi kbar (LLMs) kemm b’tagħlim sorveljat kif ukoll b’feedback mill-bnedmin. Bħala riżultat, ChatGPT jista 'jimmaniġġja firxa wiesgħa ta' mistoqsijiet u kompiti.

It-tellieqa biex jiġu żviluppati l-aktar sistemi AI kapaċi u versatili wasslet għal proliferazzjoni ta’ mudelli kemm open source kif ukoll proprjetarji bħal ChatGPT. Il-fehim tal-kapaċitajiet ġenerali tagħhom jeħtieġ punti ta' riferiment komprensivi fuq firxa wiesgħa ta' kompiti. Din it-taqsima tesplora dawn il-punti ta’ riferiment, u titfa’ dawl fuq kif mudelli differenti, inkluż ChatGPT, jingħaqdu ma’ xulxin.

Evalwazzjoni tal-LLMs: Il-Punti ta' Referenza

  1. MT-Bank: Dan il-punt ta' referenza jittestja l-abbiltajiet ta' konverżazzjoni b'ħafna dawriet u li jsegwu l-istruzzjoni fi tmien oqsma: kitba, rwoli, estrazzjoni ta' informazzjoni, raġunament, matematika, kodifikazzjoni, għarfien STEM, u umanistiċi/xjenzi soċjali. LLMs aktar b'saħħithom bħal GPT-4 jintużaw bħala evalwaturi.
  2. AlpacaEval: Ibbażat fuq is-sett ta' evalwazzjoni ta' AlpacaFarm, dan l-evalwatur awtomatiku bbażat fuq LLM jagħmel benchmarks ta' mudelli kontra tweġibiet minn LLMs avvanzati bħal GPT-4 u Claude, u jikkalkula r-rata ta' rebħ ta' mudelli kandidati.
  3. Open LLM Leaderboard: Bl-użu tal-Arness tal-Evalwazzjoni tal-Mudell Lingwistiku, dan il-leaderboard jevalwa l-LLMs fuq seba’ punti ta’ referenza ewlenin, inklużi sfidi ta’ raġunament u testijiet tal-għarfien ġenerali, kemm f’settings ta’ zero-shot kif ukoll ta’ ftit shots.
  4. BIG-bank: Dan il-punt ta' referenza kollaborattiv ikopri aktar minn 200 biċċa xogħol lingwistika ġdida, li jkopru firxa diversa ta' suġġetti u lingwi. Għandha l-għan li tinvestiga l-LLMs u tbassar il-kapaċitajiet futuri tagħhom.
  5. ChatEval: Qafas ta’ dibattitu multi-aġenti li jippermetti lit-timijiet jiddiskutu u jevalwaw b’mod awtonomu l-kwalità tat-tweġibiet minn mudelli differenti dwar mistoqsijiet miftuħa u kompiti tradizzjonali ta’ ġenerazzjoni tal-lingwa naturali.

Prestazzjoni Komparattiva

F'termini ta 'benchmarks ġenerali, LLMs open-source wrew progress notevoli. Llama-2-70B, pereżempju, kisbet riżultati impressjonanti, partikolarment wara li ġew irfinati b'dejta tal-istruzzjoni. Il-varjant tiegħu, Llama-2-chat-70B, eċċella f'AlpacaEval b'rata ta 'rebħ ta' 92.66%, li qabeż lil GPT-3.5-turbo. Madankollu, GPT-4 jibqa 'l-quddiem b'rata ta' rebħ ta '95.28%.

Zephyr-7B, mudell iżgħar, wera kapaċitajiet komparabbli ma 'LLMs 70B akbar, speċjalment f'AlpacaEval u MT-Bench. Sadanittant, WizardLM-70B, irfinat b'firxa diversa ta 'dejta ta' istruzzjoni, kiseb l-ogħla fost LLMs open-source fuq MT-Bench. Madankollu, xorta baqa 'wara GPT-3.5-turbo u GPT-4.

Daħla interessanti, GodziLLa2-70B, kisbet punteġġ kompetittiv fuq il-Leaderboard Open LLM, li turi l-potenzjal ta 'mudelli sperimentali li jgħaqqdu settijiet ta' dejta differenti. Bl-istess mod, Yi-34B, żviluppat mill-bidu, spikka b'punteġġi komparabbli ma' GPT-3.5-turbo u ftit biss wara GPT-4.

UltraLlama, bl-irfinar tagħha fuq data diversa u ta 'kwalità għolja, qabbel GPT-3.5-turbo fil-benchmarks proposti tagħha u saħansitra qabeżha f'oqsma ta' għarfien dinji u professjonali.

Scaling Up: Iż-Żieda ta' Giant LLMs

Mudelli LLM

L-aqwa mudelli LLM mill-2020

Xejra notevoli fl-iżvilupp tal-LLM kienet it-tkabbir tal-parametri tal-mudell. Mudelli bħal Gopher, GLaM, LaMDA, MT-NLG, u PaLM imbuttaw il-konfini, u laħqu l-qofol tagħhom f'mudelli b'sa 540 biljun parametru. Dawn il-mudelli wrew kapaċitajiet eċċezzjonali, iżda n-natura ta 'sors magħluq tagħhom illimitat l-applikazzjoni usa' tagħhom. Din il-limitazzjoni qanqlet interess fl-iżvilupp ta' LLMs open-source, tendenza li qed tieħu l-momentum.

B'mod parallel mat-tkabbir tad-daqsijiet tal-mudelli, ir-riċerkaturi esploraw strateġiji alternattivi. Minflok biss jagħmlu mudelli akbar, ħadthom ffukaw fuq it-titjib tat-taħriġ minn qabel ta 'mudelli iżgħar. Eżempji jinkludu Chinchilla u UL2, li wrew li aktar mhux dejjem aħjar; strateġiji aktar intelliġenti jistgħu jagħtu riżultati effiċjenti wkoll. Barra minn hekk, kien hemm attenzjoni konsiderevoli fuq l-irfinar tal-istruzzjoni tal-mudelli tal-lingwa, bi proġetti bħal FLAN, T0, u Flan-T5 jagħmlu kontribuzzjonijiet sinifikanti f'dan il-qasam.

Il-Katalizzatur ChatGPT

L-introduzzjoni ta' OpenAI's Chat GPT immarka punt ta’ bidla fir-riċerka tal-NLP. Biex jikkompetu ma 'OpenAI, kumpaniji bħal Google u Anthropic nedew il-mudelli tagħhom stess, Bard u Claude, rispettivament. Filwaqt li dawn il-mudelli juru prestazzjoni komparabbli ma' ChatGPT f'ħafna ħidmiet, għadhom lura mal-aħħar mudell minn OpenAI, GPT-4. Is-suċċess ta 'dawn il-mudelli huwa attribwit primarjament għat-tagħlim ta' rinfurzar mir-rispons uman (RLHF), teknika li qed tirċievi fokus akbar fir-riċerka għal aktar titjib.

Xnigħat u Spekulazzjonijiet Madwar Q* (Q-Star) ta' OpenAI

Rapporti reċenti jissuġġerixxu li r-riċerkaturi fl-OpenAI setgħu kisbu avvanz sinifikanti fl-AI bl-iżvilupp ta 'mudell ġdid imsejjaħ Q* (pronunzjat Q star). Allegatament, Q* għandu l-kapaċità li jwettaq matematika fil-livell tal-iskola tal-grad, proeza li qanqlet diskussjonijiet fost l-esperti dwar il-potenzjal tagħha bħala pass importanti lejn l-intelliġenza ġenerali artifiċjali (AGI). Filwaqt li OpenAI ma kkummentax dwar dawn ir-rapporti, l-abbiltajiet rumored ta 'Q* iġġeneraw eċċitament u spekulazzjoni konsiderevoli fuq il-midja soċjali u fost id-dilettanti tal-AI.

L-iżvilupp ta' Q* huwa notevoli għaliex mudelli lingwistiċi eżistenti bħal ChatGPT u GPT-4, filwaqt li kapaċi jagħmlu xi ħidmiet matematiċi, mhumiex partikolarment kapaċi li jimmaniġġjawhom b'mod affidabbli. L-isfida tinsab fil-ħtieġa li l-mudelli tal-IA mhux biss jirrikonoxxu l-mudelli, kif jagħmlu bħalissa permezz ta’ tagħlim profond u transformers, iżda wkoll biex jirraġunaw u jifhmu kunċetti astratti. Il-matematika, li hija punt ta' referenza għar-raġunament, teħtieġ li l-AI tippjana u tesegwixxi passi multipli, li turi ħakma profonda ta 'kunċetti astratti. Din il-kapaċità timmarka qabża sinifikanti fil-kapaċitajiet tal-IA, potenzjalment testendi lil hinn mill-matematika għal kompiti kumplessi oħra.

Madankollu, l-esperti iwissu kontra dan l-iżvilupp iżżejjed. Filwaqt li sistema AI li ssolvi b'mod affidabbli l-problemi tal-matematika tkun kisba impressjonanti, mhux bilfors tindika l-miġja ta 'AI jew AGI superintelliġenti. Ir-riċerka attwali tal-AI, inklużi l-isforzi ta' OpenAI, iffokat fuq problemi elementari, bi gradi differenti ta' suċċess f'ħidmiet aktar kumplessi.

L-avvanzi potenzjali tal-applikazzjonijiet bħal Q* huma vasti, li jvarjaw minn tutoring personalizzat għal għajnuna fir-riċerka xjentifika u l-inġinerija. Madankollu, huwa importanti wkoll li timmaniġġja l-aspettattivi u tirrikonoxxi l-limitazzjonijiet u t-tħassib dwar is-sikurezza assoċjati ma 'dawn l-avvanzi. It-tħassib dwar l-AI li toħloq riskji eżistenzjali, inkwiet fundamentali tal-OpenAI, jibqa' pertinenti, speċjalment hekk kif is-sistemi tal-AI jibdew jgħaqqdu aktar mad-dinja reali.

Il-Moviment LLM Open-Source

Biex tingħata spinta lir-riċerka LLM open-source, Meta ħarġet il-mudelli tas-serje Llama, u wasslu għal mewġa ta 'żviluppi ġodda bbażati fuq Llama. Dan jinkludi mudelli rfinati b'dejta tal-istruzzjoni, bħal Alpaca, Vicuna, Lima, u WizardLM. Ir-riċerka qed tinfirex ukoll fit-titjib tal-kapaċitajiet tal-aġenti, ir-raġunament loġiku, u l-immudellar ta 'kuntest twil fi ħdan il-qafas ibbażat fuq il-Llama.

Barra minn hekk, hemm xejra dejjem tikber ta' żvilupp ta' LLMs b'saħħithom mill-bidu, bi proġetti bħal MPT, Falcon, XGen, Phi, Baichuan, Mistral, Grok, u Yi. Dawn l-isforzi jirriflettu impenn biex jiġu demokratizzati l-kapaċitajiet tal-LLMs ta’ sors magħluq, li jagħmlu l-għodod avvanzati tal-IA aktar aċċessibbli u effiċjenti.

L-Impatt ta' ChatGPT u Mudelli Open Source fil-Kura tas-Saħħa

Qegħdin inħarsu lejn futur fejn l-LLMs jassistu fit-teħid ta' noti kliniċi, il-mili tal-formoli għar-rimborżi, u l-appoġġ tat-tobba fid-dijanjosi u l-ippjanar tat-trattament. Dan ġibed l-attenzjoni kemm tal-ġganti tat-teknoloġija kif ukoll tal-istituzzjonijiet tal-kura tas-saħħa.

Microsoft's diskussjonijiet ma’ Epic, fornitur ewlieni tas-softwer tar-rekords tas-saħħa elettroniċi, jindika l-integrazzjoni tal-LLMs fil-kura tas-saħħa. Inizjattivi huma diġà fis-seħħ fl-UC San Diego Health u Stanford University Medical Center. Bl-istess mod, Google's sħubijiet ma’ Mayo Clinic u Amazon Web Servicesit-tnedija ta' HealthScribe, servizz ta' dokumentazzjoni klinika AI, jimmarka passi sinifikanti f'din id-direzzjoni.

Madankollu, dawn l-iskjeramenti rapidi jqajmu tħassib dwar iċ-ċediment tal-kontroll tal-mediċina lill-interessi korporattivi. In-natura proprjetarja ta' dawn l-LLMs tagħmilhom diffiċli biex jiġu evalwati. Il-modifika jew it-twaqqif possibbli tagħhom għal raġunijiet ta' profittabilità jistgħu jikkompromettu l-kura tal-pazjent, il-privatezza u s-sigurtà.

Il-ħtieġa urġenti hija għal approċċ miftuħ u inklużiv għall-iżvilupp tal-LLM fil-kura tas-saħħa. L-istituzzjonijiet tal-kura tas-saħħa, ir-riċerkaturi, il-kliniċisti u l-pazjenti għandhom jikkollaboraw globalment biex jibnu LLMs open-source għall-kura tas-saħħa. Dan l-approċċ, simili għall-Konsorzju tal-Parametru Triljun, jippermetti l-ġbir flimkien ta 'riżorsi komputazzjonali, finanzjarji, u kompetenza.

Għamilt l-aħħar ħames snin ngħaddas ruħi fid-dinja affaxxinanti tal-Machine Learning u t-Tagħlim Profond. Il-passjoni u l-kompetenza tiegħi wassluni biex nikkontribwixxi għal aktar minn 50 proġett ta' inġinerija tas-softwer differenti, b'fokus partikolari fuq AI/ML. Il-kurżità kontinwa tiegħi ġibditni wkoll lejn Natural Language Processing, qasam li jien ħerqan li nesplora aktar.