Keinotekoinen yleinen älykkyys

Onko GPT-4 harppaus kohti AGI:n saavuttamista?

Päivitetty on Huhtikuu 23, 2024

Microsoft julkaisi äskettäin tutkimuspaperin nimeltä: Keinotekoisen yleisen älykkyyden kipinät: GPT-4:n varhaiset kokeilut. Microsoftin kuvauksen mukaan:

Tämä paperi kertoo tutkimuksestamme GPT-4:n varhaisesta versiosta, kun se oli vielä OpenAI:n aktiivisessa kehittämisessä. Väitämme, että (tämä varhainen versio) GPT-4 on osa uutta LLM-ryhmää (esimerkiksi ChatGPT:n ja Googlen PaLM:n kanssa), jotka osoittavat yleisempää älykkyyttä kuin aiemmat tekoälymallit.

Tässä artikkelissa on vakuuttavia todisteita, jotka osoittavat, että GPT-4 menee paljon ulkoa muistamista pidemmälle ja että sillä on syvä ja joustava käsitteiden, taitojen ja alueiden ymmärtäminen. Itse asiassa sen yleistyskyky ylittää paljon nykyisen ihmisen kykyä.

Vaikka olemme aiemmin keskustelleet AGI:n edut, meidän pitäisi tehdä nopeasti yhteenveto yleinen konsensus siitä, mitä AGI-järjestelmä on. Pohjimmiltaan AGI on eräänlainen edistynyt tekoäly, joka voi yleistyä useille alueille ja joka ei ole kapea. Esimerkkejä kapeasta tekoälystä ovat autonominen ajoneuvo, chatbot, shakkibot tai mikä tahansa muu tekoäly, joka on suunniteltu yhteen tarkoitukseen.

Vertailun vuoksi AGI voisi joustavasti vuorotella minkä tahansa edellä mainitun tai minkä tahansa muun asiantuntemuksen välillä. Se on tekoäly, joka hyödyntäisi syntyviä algoritmeja, kuten siirrä oppimistaja evoluutiooppimista hyödyntäen samalla myös vanhoja algoritmeja, kuten syvävahvistusoppiminen.

Yllä oleva AGI:n kuvaus vastaa henkilökohtaista kokemustani GPT-4:n käytöstä sekä Microsoftin julkaisemassa tutkimusasiakirjassa esitettyjä todisteita.

Yksi paperissa esitetyistä kehotuksista on, että GPT-4 kirjoittaa runon muodossa todiste alkulukujen äärettömyydestä.

Jos analysoimme vaatimuksia tällaisen runon luomiselle, ymmärrämme, että se vaatii matemaattista päättelyä, runollista ilmaisua ja luonnollisen kielen luomista. Tämä on haaste, joka ylittäisi useimpien ihmisten keskimääräisen kyvyn.

Paperi halusi ymmärtää, tuottaako GPT-4 yksinkertaisesti sisältöä, joka perustuu yleiseen ulkoamiseen verrattuna kontekstin ymmärtämiseen ja järkeilyyn. Kun häntä pyydettiin luomaan Shakespearen tyylinen runo, se pystyi tekemään niin. Tämä vaatii monitahoista ymmärrystä, joka ylittää paljon yleisen väestön kyvyt ja sisältää mielen teorian ja matemaattisen nerouden.

Kuinka laskea GPT-4-äly?

Kysymys tulee sitten siitä, kuinka voimme mitata LLM:n älykkyyttä? Ja näyttääkö GPT-4 aidon oppimisen vai pelkkää ulkoa oppimista?

Nykyinen tapa testata tekoälyjärjestelmää on arvioida järjestelmä standardien vertailutietojoukon perusteella ja varmistaa, että ne ovat riippumattomia koulutustiedoista ja että ne kattavat joukon tehtäviä ja alueita. Tämäntyyppinen testaus on lähes mahdotonta, koska GPT-4:lle opetettiin lähes rajoittamaton määrä dataa.

Paperi käsittelee uusien ja vaikeiden tehtävien/kysymysten luomista, jotka osoittavat vakuuttavasti, että GPT-4 menee paljon ulkoa muistamista pidemmälle ja että sillä on syvä ja joustava käsitteiden, taitojen ja alueiden ymmärtäminen.

Mitä tulee älykkyyteen, GPT-4 voi luoda novelleja, käsikirjoituksia ja laskea monimutkaisimmat kaavat.

GPT-4 pystyy myös koodaamaan erittäin korkealla tasolla sekä ohjeista koodin kirjoittamisen että olemassa olevan koodin ymmärtämisen kannalta. GPT-4 pystyy käsittelemään monenlaisia koodaustehtäviä, alkaen
koodaushaasteita tosielämän sovelluksille matalan tason kokoonpanosta korkean tason kehyksiin, yksinkertaisista tietorakenteista monimutkaisiin ohjelmiin, kuten peleihin. GPT-4 voi myös perustella koodin suorittamista, simuloida käskyjen vaikutuksia ja selittää tuloksia luonnollisella kielellä. GPT-4 voi jopa suorittaa pseudokoodin,

GPT-4 voi tarjota rationaalisia vastauksia melkein mihin tahansa annettuun kehotteeseen. Itse asiassa sen älykkyys on lähes voittamaton monimutkaisuudessaan.

GPT-4:n rajoitukset

Paperi jatkaa sitten kuvaamista, kuinka he tutkivat GPT-4:n vastauksia ja käyttäytymistä, varmistaakseen sen johdonmukaisuuden, johdonmukaisuuden ja oikeellisuuden sekä paljastaakseen sen rajoitukset ja harhaluulot.

Ilmeisin rajoitus on sen taipumus hallusinaatioihin. Tässä on esimerkki hallusinaatiosta, joka on annettu paperissa, jossa GPT-4 oli varma vastauksestaan, joka oli täysin väärä.

Näyttää siltä, että jopa GPT-4 ymmärtää tämän nykyisen hallusinaatiorajoituksen, koska tämä oli vastaus, kun kysyin siltä, mikä on GPT-hallusinaatio:

GPT-hallusinaatiolla tarkoitetaan ilmiötä, jossa generatiivinen esikoulutettu muuntaja (GPT) -malli, kuten se, jonka kanssa olet tällä hetkellä vuorovaikutuksessa, tuottaa vastauksen, joka ei perustu tosiasiatietoihin tai ei ole johdonmukainen tarjotun kontekstin kanssa. Näitä hallusinaatioita esiintyy, kun malli luo tekstiä, joka saattaa vaikuttaa uskottavalta, mutta on itse asiassa virheellistä, harhaanjohtavaa tai järjetöntä.

Toisin sanoen, kun koulutat LLM AI:ta maailman datalla, kuinka vältät järjestelmän oppimasta vääriä tietoja? Laaja kielimalli, joka oppii ja kerää takaisin väärää tietoa ja salaliittoteorioita, voisi itse asiassa olla yksi suurimmista ansoista ja uhista, joita ihmiskunta kohtaa laajamittaisen LLM:n käyttöönoton yhteydessä. Tämä voisi itse asiassa olla yksi AGI:n suurimmista uhista, joka yllättävän unohdetaan, kun keskustellaan AGI:n vaaroista.

GPT-4 Älykkyyden todisteet

Paperi osoittaa, että ei ollut väliä minkä tyyppisiä monimutkaisia kehotteita siihen kohdistettiin, GPT-4 ylittäisi odotukset. Kuten lehdessä sanotaan:

Sen vertaansa vailla oleva luonnollisen kielen hallinta. Se ei voi ainoastaan luoda sujuvaa ja johdonmukaista tekstiä, vaan myös ymmärtää ja käsitellä sitä monin eri tavoin, kuten tiivistämällä, kääntämällä tai vastaamalla erittäin laajaan joukkoon kysymyksiä. Lisäksi käännös ei tarkoita vain eri luonnollisten kielten välillä, vaan myös käännöksiä sävyltään ja tyylillisesti sekä eri aloilla, kuten lääketiede, laki, kirjanpito, tietokoneohjelmointi, musiikki ja paljon muuta.

GPT-4:lle annettiin näennäisiä teknisiä arvioita, ja tässä yhteydessä se meni helposti merkitykseltään, jos kyseessä oli ihminen toisessa päässä, että heidät palkattaisiin välittömästi ohjelmistosuunnittelijaksi. Samanlainen alustava GPT-4:n pätevyyden testi Multistate Bar Examissa osoitti yli 70 %:n tarkkuuden. Tämä tarkoittaa, että tulevaisuudessa voisimme automatisoida monet lakimiehille tällä hetkellä annetut tehtävät. Itse asiassa niitä on startupit, jotka työskentelevät nyt robottijuristien luomiseksi käyttämällä GPT-4:ää.

Uuden tiedon tuottaminen

Yksi julkaisun argumenteista on, että GPT-4:n ainoa asia, joka voi todistaa todellisen ymmärryksen tasot, on tuottaa uutta tietoa, kuten todistaa uusia matemaattisia lauseita, mikä on tällä hetkellä LLM:n ulottumattomissa.

Sitten taas tämä on AGI:n pyhä malja. Vaikka AGI:n hallinnassa väärissä käsissä on vaaroja, AGI:n edut pystyvät analysoimaan nopeasti kaikki historialliset tiedot uusien teoreemojen, parannuskeinojen ja hoitojen löytämiseksi ovat lähes rajattomat.

AGI voisi olla puuttuva lenkki parannuskeinojen löytämisessä harvinaisiin geneettisiin sairauksiin, joista tällä hetkellä puuttuu yksityinen teollisuuden rahoitus, syövän parantamiseksi lopullisesti ja uusiutuvan energian tehokkuuden maksimoimiseksi, jotta voimme poistaa riippuvuudestamme kestämättömästä energiasta. Itse asiassa se voisi ratkaista minkä tahansa seurannaisongelman, joka syötetään AGI-järjestelmään. Tämän Sam Altman ja OpenAI:n tiimi ymmärtävät AGI on todella viimeinen keksintö jota tarvitaan useimpien ongelmien ratkaisemiseen ja ihmiskunnan hyödyksi.

Tämä ei tietenkään ratkaise ydinnapin ongelmaa siitä, kuka hallitsee AGI:tä ja mitkä ovat heidän aikeensa. Tästä huolimatta paperi tekee ilmiömäistä työtä väittäen, että GPT-4 on harppaus kohti tekoälytutkijoiden unelmansa saavuttamista koska 1956, kun alkuperäinen Dartmouth Summer Research Project on Artificial Intelligence -kesätyöpaja käynnistettiin.

Vaikka on kyseenalaista, onko GPT-4 AGI, voidaan helposti väittää, että ensimmäistä kertaa ihmiskunnan historiassa se on tekoälyjärjestelmä, joka voi läpäistä Turingin testi.