Tekoäly

ChatGPT:n ensimmäisen vuosipäivän merkitys: Muuttaen tulevaisuuden AI-viestintää

Julkaistu 6. joulukuuta 2023

Päivitetty 22. toukokuuta 2026

Tekijä

Aayush Mittal Mittal

ChatGPT:n ensimmäisen vuoden aikana on selvää, että tämä työkalu on muuttanut merkittävästi AI-maailmaa. Laitteisto julkaistiin vuoden 2022 lopulla, ja se erottui käyttäjäystävällisellä, keskustelumaisella tyylillään, joka teki AI: n kanssa vuorovaikutuksen tuntumisen enemmän kuin koneen kanssa. Tämä uusi lähestymistapa sai nopeasti julkisuuden huomion. Vain viiden päivän kuluttua julkaisun jälkeen ChatGPT: llä oli jo miljoona käyttäjää. Vuoden 2023 alussa tämä luku kasvoi noin 100 miljoonaan kuukausittaiseen käyttäjään, ja lokakuussa alusta keräsi noin 1,7 miljardia vierailua maailmanlaajuisesti. Nämä luvut puhuvat paljon sen suosiosta ja hyödyllisyydestä.

Viime vuoden aikana käyttäjät ovat löytäneet kaikenlaisia luovia tapoja käyttää ChatGPT: tä, yksinkertaisista tehtävistä kuten sähköpostien kirjoittamisesta ja ansioluettelojen päivittämisestä menestyksekkäiden yritysten perustamiseen. Mutta se ei ole vain siinä, miten ihmiset käyttävät sitä; itse tekniikka on kasvanut ja parantunut. Alun perin ChatGPT oli ilmainen palvelu, joka tarjosi yksityiskohtaisia tekstivastauksia. Nyt on ChatGPT Plus, joka sisältää ChatGPT-4: n. Tämä päivitetty versio on koulutettu enemmän dataa, antaa vähemmän väärä vastauksia ja ymmärtää monimutkaisia ohjeita paremmin.

Yksi suurimmista päivityksistä on, että ChatGPT voi nyt vuorovaikuttaa monin tavoin – se voi kuunnella, puhua ja jopa prosessoida kuvia. Tämä tarkoittaa, että voit puhua sille sen mobiilisovelluksella ja näyttää sille kuvia vastauksia varten. Nämä muutokset ovat avanneet uusia mahdollisuuksia AI: lle ja muuttaneet, miten ihmiset kokevat ja ajattelevat AI: n roolia elämässään.

Sen alkuajoista teknisen demonstraationa sen nykyiseen asemaan teknologian johtavana toimijana ChatGPT: n matka on melko vaikuttava. Alun perin se nähtiin tavan testata ja parantaa teknologiaa saamalla palautetta julkisuudesta. Mutta se nopeasti muuttui tärkeäksi osaksi AI-maailmaa. Tämä menestys osoittaa, kuinka tehokasta on hienosäätää suuria kielen malleja (LLM) sekä valvotulla oppimisella että ihmisten palautteella. Tämän seurauksena ChatGPT voi käsitellä laajan valikoiman kysymyksiä ja tehtäviä.

Kilpailu kehittää kyvykkäimpiä ja monipuolisempia AI-järjestelmiä on johtanut sekä avoimen lähdekoodin että omistamien mallien kuten ChatGPT: n lisääntymiseen. Ymmärtääkseen niiden yleiset kyvyt vaaditaan kattavia mittareita laajalla tehtävien kirjolla. Tämä osio tutkii näitä mittareita ja valottaa, miten eri mallit, mukaan lukien ChatGPT, ovat toisiinsa nähden.

Arvioiden LLM: t: Mittarit

MT-Bench: Tämä mittari testaa monivaiheisen keskustelun ja ohjeiden seuraamisen kykyä kahdeksalla alueella: kirjoittaminen, roolipeli, tietojen poistaminen, päättely, matematiikka, koodaus, STEM-tietämys ja humanistiset/tieteelliset tieteet. Vahvemmat LLM: t kuten GPT-4 toimivat arvioijina.
AlpacaEval: AlpacaFarm-arviointijoukon perusteella tämä LLM-pohjainen automaattinen arvioija mittaa malleja vastauksia vastaan edistyneistä LLM: istä kuten GPT-4 ja Claude, laskien ehdokasmallien voittoprosentin.
Avoin LLM-johtaja: Käyttäen Language Model Evaluation Harness -ohjainta tämä johtaja arvioi LLM: iä seitsemällä avainmittarilla, mukaan lukien päättelyhaasteet ja yleistietokokeet, sekä nollaus- että vähäiskussa asetelmissa.
BIG-bench: Tämä yhteistyössä tehty mittari kattaa yli 200 uutta kielenkäytön tehtävää, jotka ulottuvat monipuolisiin aiheisiin ja kieliryhmiin. Sen tavoitteena on tutkia LLM: iä ja ennustaa niiden tulevia kykyjä.
ChatEval: Monien agenttien välinen keskustelukehys, joka sallii tiimien kesken autonomisen keskustelun ja eri mallien vastausten laadun arvioinnin avoimissa kysymyksissä ja perinteisissä luonnollisen kielen generoimistehtävissä.

<h3 Vertaileva suorituskyky

Yleisten mittareiden osalta avoimet LLM: t ovat edistyneet merkittävästi. Esimerkiksi Llama-2-70B saavutti vaikuttavia tuloksia, erityisesti ohjattua koulutusta käytettäessä. Sen variantti, Llama-2-chat-70B, menestyi erinomaisesti AlpacaEvalissa 92,66 prosentin voittoprosentilla, jolla se ohitti GPT-3.5-turbon. GPT-4 on kuitenkin edelleen johtava 95,28 prosentin voittoprosentilla.

Zephyr-7B, pienempi malli, osoitti kykyjä, jotka ovat vertailukelpoisia suurempien 70B LLM:ien kanssa, erityisesti AlpacaEvalissa ja MT-Benchissä. Samalla WizardLM-70B, joka on koulutettu monipuolisen ohjausaineiston avulla, saavutti korkeimman tuloksen avoimien LLM:ien joukossa MT-Benchissä. Se kuitenkin jäi edelleen GPT-3.5-turbon ja GPT-4: n jälkeen.

GodziLLa2-70B, mielenkiintoinen tulokas, saavutti kilpailukykyisen tuloksen avoimessa LLM-johtajassa, osoittaen kokeellisten mallien yhdistämisen moninaisten tietojoukkojen potentiaalia. Samoin Yi-34B, joka on kehitetty alusta alkaen, erottui tuloksilla, jotka olivat vertailukelpoisia GPT-3.5-turbon kanssa ja vain hieman GPT-4: n jäljessä.

UltraLlama, joka on hienosäätelty monipuolisilla ja korkealaatuisilla tiedoilla, vastasi GPT-3.5-turboa ehdotetuissa mittareissa ja jopa ohitti sen joissakin maailman ja ammattitaidon osa-alueilla.

Skalata: Jättiläisten LLM:ien nousu

Huipputason LLM-mallit vuodesta 2020 lähtien

Merkittävä kehityssuunta LLM:ien kehityksessä on ollut malliparametrien skaalautuminen. Malleja kuten Gopher, GLaM, LaMDA, MT-NLG ja PaLM on viety rajojen äärelle, ja ne ovat saavuttaneet jopa 540 miljardin parametrin kokoisia malleja. Nämä mallit ovat osoittaneet poikkeuksellisia kykyjä, mutta niiden suljettu lähdekoodi on rajoittanut niiden laajempaa soveltamista. Tämä rajoitus on herättänyt mielenkiinnon avoimien LLM:ien kehittämiseen, ja tämä suuntaus on voimistumassa.

Samalla tutkijat ovat tutkineet vaihtoehtoisia strategioita. Sen sijaan, että vain tekevät malleja suuremmiksi, he ovat keskittyneet pienempien mallien esikoulutukseen. Esimerkkejä ovat Chinchilla ja UL2, jotka ovat osoittaneet, että enemmän ei aina ole parempaa; älykkäät strategiat voivat tuottaa tehokkaita tuloksia myös. Lisäksi on ollut merkittävää kiinnostusta kielen mallien ohjausmallien koulutukseen, ja hankkeet kuten FLAN, T0 ja Flan-T5 ovat tehneet merkittäviä panoksia tähän alueeseen.

ChatGPT-katalysaattori

OpenAI: n ChatGPT: n julkaisu merkitsi käännekohtaa NLP-tutkimuksessa. Kilpailemaan OpenAI: n kanssa yritykset kuten Google ja Anthropic julkaisivat omat mallinsa, Bard ja Claude. Vaikka nämä mallit osoittavat vertailukelpoista suorituskykyä useissa tehtävissä, ne ovat edelleen jäljessä OpenAI: n viimeisimmästä mallista, GPT-4: stä. Näiden mallien menestys voidaan pääasiassa liittää vahvistavaan oppimiseen ihmisten palautteen avulla (RLHF), jota tutkitaan yhä enemmän parantamiseksi.

OpenAI: n Q* (Q-tähti) -mallin spekulaatiot

Viimeaikaiset raportit viittaavat siihen, että OpenAI: n tutkijat saattavat saavuttaneet merkittävän edistysaskeleen AI: ssä kehittämällä uuden mallin, joka on nimeltään Q* (lausutaan Q-tähti). Ilmoitetaan, että Q*: lla on kyky suorittaa peruslukion matematiikkaa, saavutus, joka on herättänyt keskustelua asiantuntijoiden keskuudessa siitä, onko se merkittävä askel kohti tekoälyä (AGI). Vaikka OpenAI ei ole kommentoinut näitä raportteja, Q*: n ilmoitetut kyvyt ovat herättäneet suurta mielenkiintoa ja spekulaatioita sosiaalisessa mediassa ja AI-entusiastien keskuudessa.

Q*: n kehitys on merkittävää, koska olemassa olevat kielen mallit kuten ChatGPT ja GPT-4 eivät ole erityisen taitavia matemaattisissa tehtävissä. Haasteena on, että AI-malleja on pyrittävä ymmärtämään abstrakteja käsitteitä, ei pelkästään tunnistamaan malleja, kuten nykyisin tehdään syvällä oppimisella ja muunnoksilla. Matematiikka, ollessaan päättelyn mittari, edellyttää AI: lta suunnittelua ja useiden askelten suorittamista, osoittaen syvää ymmärrystä abstrakteista käsitteistä. Tämä kyky merkitsisi merkittävää loikkaa AI: n kyvyssä, mahdollisesti laajentuen matematiikan ulkopuolelle monimutkaisiin tehtäviin.

Asiantuntijat varoittavat kuitenkin liiallisesta innostumisesta tämän kehityksen suhteen. Vaikka AI-järjestelmä, joka luotettavasti ratkaisee matemaattisia ongelmia, olisi vaikuttava saavutus, se ei välttämättä merkitse ylivoimaisen älymystön tai AGI: n tuloa. Nykyinen AI-tutkimus, mukaan lukien OpenAI: n pyrkimykset, on keskittynyt perusongelmiin, ja vaihtelevalla menestyksellä monimutkaisemmissa tehtävissä.

Tällaisten edistysten mahdolliset sovellukset ovat laajat, aina henkilökohtaisesta opettamisesta tieteelliseen tutkimukseen ja insinööritöihin. On kuitenkin tärkeää hallita odotuksia ja tunnustaa rajoitukset ja turvallisuusuhkat, jotka liittyvät tällaisiin edistyksiin. AI: n aiheuttamat olemassaoloUhkat, jotka ovat OpenAI: n perimmäinen huolenaihe, ovat edelleen relevantteja, erityisesti kun AI-järjestelmät alkavat vuorovaikuttaa enemmän todellisen maailman kanssa.

Avoimen lähdekoodin LLM-liike

Avoimen lähdekoodin LLM-tutkimuksen edistämiseksi Meta julkaisi Llama-sarjan malleja, laukaisi aallon uusia kehityksiä, jotka perustuvat Llamaan. Tähän kuuluu malleja, jotka on hienosäätelty ohjausaineistolla, kuten Alpaca, Vicuna, Lima ja WizardLM. Tutkimus on myös laajentunut parantamaan agenttien kykyjä, loogista päättelyä ja pitkän kontekstin mallinnusta Llama-pohjaisessa kehyksessä.

Lisäksi on kasvava suuntaus kehittää voimakkaita LLM: iä alusta alkaen, kuten MPT, Falcon, XGen, Phi, Baichuan, Mistral, Grok ja Yi. Nämä pyrkimykset heijastavat sitoutumista demokratisoimaan suljettujen LLM:ien kykyjä, tehdäkseen edistyneitä AI-työkaluja helpommin saataville ja tehokkaampia.

ChatGPT: n ja avoimien mallien vaikutus terveydenhuoltoon

Olemme näkemässä tulevaisuutta, jossa LLM: t auttavat kliinisen kirjaamisen, korvauslomakkeiden täyttämisen ja tukevat lääkäreitä diagnosoimisessa ja hoitosuunnitelman laatimisessa. Tämä on saanut sekä teknologiajätit että terveydenhuollon laitokset kiinnostumaan.

Microsoftin keskustelut Epicin kanssa, johtavan sähköisen terveydenhuollon rekisteröintiohjelmiston tarjoajan, osoittavat LLM:ien integroimista terveydenhuoltoon. Aloite on jo käynnissä UC San Diego Healthissa ja Stanfordin yliopiston lääketieteellisessä keskuksessa. Samoin Google yhteistyö Mayo-klinikan kanssa ja Amazon Web Servicesin HealthScribe, AI-pohjainen kliininen asiakirjauspalvelu, merkitsevät merkittäviä askelia tässä suunnassa.

Nämä nopeat käyttöönotot herättävät kuitenkin huolia lääketieteen hallinnasta yritysten etuihin. Nämä LLM:ien omistajuus tekee niiden arvioinnin haasteelliseksi. Niiden mahdollinen muuttaminen tai lopettaminen voittojen vuoksi voisi vaarantaa potilaiden hoitoa, yksityisyyttä ja turvallisuutta.

Kiireellinen tarve on avoimelle ja osallistavalle lähestymistavalle LLM:ien kehittämiseen terveydenhuollossa. Terveydenhuollon laitokset, tutkijat, klinisyät ja potilaat tulee yhdessä luoda avoimia LLM: iä terveydenhuoltoon. Tämä lähestymistapa, samanlainen kuin Trillion Parameter Consortium, mahdollistaisi laskentaresurssien, taloudellisten resurssien ja asiantuntijoiden yhdistämisen.

Aayush Mittal, Mittal

Olen viettänyt viimeiset viisi vuotta uppoutumalla kiinnostavaan koneoppimisen ja syvän oppimisen maailmaan. Minun intohimoni ja asiantuntemukseni ovat johtaneet minun osallistumiseen yli 50:een monipuoliseen ohjelmistosuunnitteluhankkeeseen, joissa on erityisesti painottunut AI/ML. Minun jatkuva uteliaisuuteni on myös ohjannut minun luontaisen kielen prosessoinnin pariin, jota haluan tutkia tarkemmin.