stub Punktide ühendamine: OpenAI väidetava Q-Star mudeli lahtiharutamine – Unite.AI
Ühenda meile

Üldine tehisintellekt

Punktide ühendamine: OpenAI väidetava Q-Star mudeli lahtiharutamine

mm

avaldatud

 on

Hiljuti on tehisintellekti kogukonnas OpenAI väidetava projekti Q-star ümber palju spekuleeritud. Hoolimata sellest, et selle salapärase algatuse kohta on vähe teavet, tähistab see väidetavalt olulist sammu üldise tehisintellekti saavutamise suunas - intelligentsuse tasemeni, mis vastab või ületab inimese võimeid. Kuigi suur osa arutelust on keskendunud selle arengu võimalikele negatiivsetele tagajärgedele inimkonnale, on Q-tähe olemuse ja võimalike tehnoloogiliste eeliste avastamiseks tehtud suhteliselt vähe jõupingutusi. Selles artiklis kasutan uurivat lähenemisviisi, püüdes seda projekti lahti harutada peamiselt selle nime järgi, mis minu arvates annab piisavalt teavet selle kohta arusaamade kogumiseks.

Müsteeriumi taust

Kõik sai alguse sellest, et OpenAI juhatajate nõukogu ootamatult tagandati Sam Altman, tegevjuht ja kaasasutaja. Kuigi Altman ennistati hiljem, on sündmuste kohta endiselt küsimusi. Mõned näevad seda võimuvõitlusena, samas kui teised omistavad selle Altmani keskendumisele teistele ettevõtmistele nagu Worldcoin. Süžee aga tiheneb, kuna Reuters teatab, et salajane projekt nimega Q-star võib olla draama peamine põhjus. Reutersi sõnul on Q-Star märkimisväärne samm OpenAI AGI eesmärgi suunas, mille OpenAI töötajad juhtnõukogule edastasid. Selle uudise ilmumine on tekitanud spekulatsioonide ja murede tulva.

Pusle ehitusplokid

Selles jaotises olen tutvustanud mõningaid ehitusplokke, mis aitavad meil seda mõistatust lahti harutada.

  • Q õpe: Tugevdusõpe on masinõppe tüüp, kus arvutid õpivad oma keskkonnaga suheldes, saades tagasisidet preemiate või karistuste kujul. Q-õpe on tugevdusõppes spetsiifiline meetod, mis aitab arvutitel teha otsuseid, õppides erinevate toimingute kvaliteeti (Q-väärtust) erinevates olukordades. Seda kasutatakse laialdaselt sellistes stsenaariumides nagu mängimine ja robootika, võimaldades arvutitel õppida optimaalseid otsuseid tegema katse-eksituse meetodil.
  • A-tärni otsing: A-star on otsingualgoritm, mis aitab arvutitel uurida võimalusi ja leida probleemi lahendamiseks parima lahenduse. Algoritm on eriti tähelepanuväärne selle tõhususe poolest, et leida graafikus või ruudustikus lühima tee alguspunktist eesmärgini. Selle peamine tugevus seisneb sõlme jõudmise kulude nutikas kaalumises üldise eesmärgi saavutamise hinnangulise maksumusega. Selle tulemusena kasutatakse A-tähte laialdaselt tee leidmise ja optimeerimisega seotud väljakutsete lahendamisel.
  • AlphaZero: AlfaZero, täiustatud AI-süsteem alates Deepmind, ühendab Q-õppe ja otsingu (st Monte Carlo puuotsingu) strateegiliseks planeerimiseks lauamängudes nagu male ja Go. See õpib optimaalseid strateegiaid ise mängides, juhindudes liigutuste ja positsiooni hindamise närvivõrgust. Monte Carlo puuotsingu (MCTS) algoritm tasakaalustab mänguvõimaluste uurimisel uurimise ja kasutamise. AlphaZero iteratiivne isemängimine, õppimine ja otsinguprotsess viib pideva täiustamiseni, võimaldades üliinimlikku jõudlust ja võitu inimtšempionide üle, näidates oma tõhusust strateegilises planeerimises ja probleemide lahendamises.
  • Keelemudelid: Suured keelemudelid (LLM-id), nagu GPT-3, on AI vorm, mis on loodud inimsarnase teksti mõistmiseks ja genereerimiseks. Nad läbivad koolituse ulatuslike ja mitmekesiste Interneti-andmete alal, hõlmates laia valikut teemasid ja kirjutamisstiile. LLM-ide silmapaistev omadus on nende võime ennustada jada järgmist sõna, mida nimetatakse keele modelleerimiseks. Eesmärk on anda arusaamine sõnade ja fraaside omavahelistest seostest, võimaldades mudelil luua sidusat ja kontekstuaalselt asjakohast teksti. Ulatuslik koolitus muudab LLM-id valdavaks grammatika, semantika ja isegi keelekasutuse nüansside mõistmises. Pärast koolitamist saab neid keelemudeleid konkreetsete ülesannete või rakenduste jaoks täpselt häälestada, muutes need mitmekülgseteks tööriistadeks loomuliku keele töötlemine, vestlusrobotid, sisu genereerimine ja palju muud.
  • Üldine tehisintellekt: Üldine tehisintellekt (AGI) on tehisintellekti tüüp, mis suudab mõista, õppida ja täita erinevaid valdkondi hõlmavaid ülesandeid tasemel, mis vastab või ületab inimese kognitiivseid võimeid. Vastupidiselt kitsale või spetsialiseeritud tehisintellektile on AGI-l võime iseseisvalt kohaneda, arutleda ja õppida, ilma et see piirduks konkreetsete ülesannetega. AGI annab AI-süsteemidele võimaluse näidata iseseisvat otsustusvõimet, probleemide lahendamist ja loovat mõtlemist, peegeldades inimese intelligentsust. Põhimõtteliselt kehastab AGI ideed masinast, mis on võimeline täitma mis tahes inimeste teostatavat intellektuaalset ülesannet, tuues esile mitmekülgsuse ja kohanemisvõime erinevates valdkondades.

LLM-ide peamised piirangud AGI saavutamisel

Suurtel keelemudelitel (LLM) on tehisintellekti (AGI) saavutamisel piirangud. Kuigi nad oskavad tohututest andmetest õpitud mustritel põhinevat teksti töödelda ja genereerida, on neil raske mõista reaalset maailma, mis takistab tõhusat teadmiste kasutamist. AGI nõuab igapäevaste olukordade lahendamiseks tervet mõistust ja planeerimisoskust, mida LLM-id peavad väljakutseks. Vaatamata näiliselt õigetele vastustele puudub neil võime süstemaatiliselt lahendada keerulisi probleeme, näiteks matemaatilisi probleeme.

Uued uuringud näitavad, et LLM-id võivad jäljendada mis tahes arvutusi nagu universaalne arvuti, kuid neid piirab vajadus ulatusliku välismälu järele. Andmete arvu suurendamine on elukestva tööjõu parandamiseks ülioluline, kuid erinevalt energiatõhusast inimajust nõuab see märkimisväärseid arvutusressursse ja energiat. See seab väljakutsed LLM-ide muutmisel AGI jaoks laialdaselt kättesaadavaks ja skaleeritavaks. Hiljutised uuringud näitavad, et lihtsalt rohkemate andmete lisamine ei paranda alati jõudlust, mistõttu tekib küsimus, millele veel keskenduda teekonnal AGI poole.

Ühendab punkte

Paljud tehisintellekti eksperdid usuvad, et suurte keelemudelite (LLM) väljakutsed tulenevad nende peamisest keskendumisest järgmise sõna ennustamisele. See piirab nende arusaamist keelenüanssidest, arutluskäikudest ja planeerimisest. Sellega tegelemiseks meeldib teadlastele Yann LeCun soovitage proovida erinevaid treeningmeetodeid. Nad teevad ettepaneku, et LLM-id peaksid aktiivselt kavandama sõnade, mitte ainult järgmise märgi ennustamist.

AlphaZero strateegiaga sarnane Q-tähe idee võib hõlmata LLM-ide juhendamist, et nad kavandaksid aktiivselt märgi ennustamist, mitte ei ennustaks ainult järgmist sõna. See toob keelemudelisse struktureeritud arutluskäigu ja planeerimise, ületades tavapärase keskendumise järgmise märgi ennustamisele. Kasutades AlphaZerost inspireeritud planeerimisstrateegiaid, saavad LLM-id paremini mõista keelenüansse, parandada arutluskäiku ja tõhustada planeerimist, käsitledes tavaliste LLM-i koolitusmeetodite piiranguid.

Selline integratsioon loob paindliku raamistiku teadmiste esitamiseks ja manipuleerimiseks, aidates süsteemil kohaneda uue teabe ja ülesannetega. See kohanemisvõime võib olla ülioluline tehisintellekti (AGI) jaoks, mis peab hakkama saama erinevate ülesannete ja erinevate nõuetega domeenidega.

AGI vajab tervet mõistust ja LLM-ide mõistmise koolitamine võib anda neile tervikliku arusaamise maailmast. Lisaks võib selliste LLM-ide nagu AlphaZero koolitamine aidata neil omandada abstraktseid teadmisi, parandades õppimist ja üldistamist erinevates olukordades, aidates kaasa AGI tugevale jõudlusele.

Lisaks projekti nimele toetab seda ideed Reutersi raport, mis tõstab esile Q-tähe võimet konkreetseid matemaatilisi ja arutlusprobleeme edukalt lahendada.

Loosung

OpenAI salajane projekt Q-Star lööb tehisintellektis laineid, püüdes saavutada inimestest kaugemale ulatuvat intelligentsust. Selle võimalike riskide jutu keskel uurib see artikkel mõistatust, ühendades punktid Q-õppest AlphaZero ja suurte keelemudelitega (LLM).

Arvame, et "Q-star" tähendab õppimise ja otsingu nutikat sulandumist, mis annab LLM-idele tõuke planeerimisel ja arutlemisel. Kuna Reuters väidab, et see suudab lahendada keerulisi matemaatilisi ja arutlusprobleeme, viitab see suurele edasiminekule. See nõuab põhjalikumat vaatlust, kuhu AI-õpe võib tulevikus suunduda.

Dr Tehseen Zia on Islamabadi COMSATSi ülikooli dotsent, kellel on doktorikraad tehisintellektis Viini Tehnikaülikoolis Austrias. Spetsialiseerudes tehisintellektile, masinõppele, andmeteadusele ja arvutinägemisele, on ta andnud märkimisväärse panuse mainekates teadusajakirjades avaldatud publikatsioonidega. Dr Tehseen on juhtinud ka erinevaid tööstusprojekte juhtivteadlasena ja töötanud tehisintellekti konsultandina.