Connect with us

Ajatusjohtajat

Tuleva “exoluutio” tekoälyssä

mm

Tänään, ollessamme teknologisen murtolinjan reunalla, havainnoimme matkaa LLM:istä agenteihin ja lopulta agenteista tekoälyyn ja AGI:hin, eikä se ole vain suurempia malleja tai nopeampia vastauksia. Se on myös koneiden siirtymistä passiivisista avustajista aktiivisiksi yhteistyökumppaneiksi, ja ehkä jopa itsenäisiksi ajattelijoiksi.

Jäljitetään tämä polku ja tutkitaan, mitä se merkitsee työlle, asiantuntijuudelle ja ihmisen roolille muokkaamassa huomisen älykkyyttä.

LLMien, agenttipohjaisien järjestelmien ja agenteisen tekoälyn ero

Ymmärtääksemme eroa, tässä on esimerkki. Jos kysyn LLM:ltä jotain tällaista: “Haluan matkustaa Chicagosta Austinin kautta, ajaa enintään neljä tuntia päivässä ja pysähtyä maisemapaikoissa”, säännöllinen LLM palauttaa staattisen vastauksen tekstinä perustuen kielen generointiin. Se vastaa todennäköisesti vain pyynnölle ilman perusteellista analyysiä.

Agentti luokittelee ensin pyynnön matkailuun liittyväksi. Sitten se määrittää, mitä tietoja tarvitaan: reitit karttapalvelujen avulla, säätila, polttoainekustannukset, hotellit, ravintolat jne. Sen jälkeen agentti jakaa pyynnön alitehtäviin ja ohjaa ne erikoistuneille moduleille tai LLM:ille, jotka on koulutettu asiaankuuluvilla lähteillä. Tämä on orkestraatio ja useiden mallien ja työkalujen koordinointi yhdenmukaisen logiikan alla.

Tänään useimmat suuret järjestelmät, kuten ChatGPT tai Claude Anthropicista, ovat käytännössä jo agenteja. Vaikka käyttäjälle voi näyttää siltä, että he ovat vuorovaikutuksessa yksittäisen mallin kanssa, taustalla on monimutkainen arkkitehtuuri, joka käsittää useita malleja ja järjestelmiä. Ne voivat jo käsitellä monimutkaisia kysymyksiä, mutta heidän kykynsä on pääasiassa rajoitettu tietojen tarjoamiseen; he eivät tee vielä mitään.

Täysin autonominen agentti on järjestelmä, joka kerää tietoa ja voi esimerkiksi itsenäisesti varata hotellin, ostaa lipun tai aloittaa maksun, jos sillä on pääsy asiaankuuluvien API:en tai käyttäjätietojen. Tällaisia agenteja kehitetään parhaillaan. Tällä hetkellä ne ovat enemmän kuin puoliagenteja, jotka pystyvät prosessoimaan tietoa, mutta eivät vielä suorita itsenäisiä toimintoja.

Mielenkiintoinen keskustelun aihe tutkimusyhteisössä on agenteinen tekoäly. Toisin kuin tavallinen agentti, jonka käyttäytyminen on kirjoitettu kehittäjien toimesta, agenteinen tekoäly on järjestelmä, joka päättää itsenäisesti, mitä tehtäviä se suorittaa, mitä tietoja se tarvitsee, ja jopa miten se jatkaa omaa koulutustaan. Tämä menee ohjeiden toteuttamisen ulkopuolelle; se vaatii itsenäisiä päätöksiä. Agenteinen tekoäly on kuitenkin teoreettinen tällä hetkellä; tällaisia järjestelmiä ei ole vielä käytännössä.

AGI – uusi horisontti. Onko se saavutettavissa?

Meta on investoinut Scale AI:hin kolme kuukautta sitten. Tavoitteena oli liittyä voimiin AGI:n, tekoälyn, kehittämisessä, joka pystyy suorittamaan mitä tahansa tehtävää ihmisen tasolla tai jopa ylittämään sen. Jos nykyinen tekoäly on teknologinen vallankumous, AGI on todellinen megavallankumous; joskus kutsun sitä “exoluutioksi”, mikä tarkoittaa “tekoälyn eksodia” varjoista. Se, joka saavuttaa sen ensin, saa maailmanlaajuisen strategisen edun.

Mitä lähempänä olemme todellista AGI:ä, riippuu paljon siitä, miten määrittelemme sen. Olen samaa mieltä Ilya Sutskeverin kanssa: AGI on järjestelmä, joka pystyy suorittamaan mitä tahansa älyllistä tehtävää, jonka ihminen voi. Ei vain vastaamalla kysymyksiin, vaan myös päättämällä, yleistämällä ja tulkinnalla useilla aloilla. Todellinen AGI on universaali eikä rajoitu kapeisiin tehtävänrajoituksiin.

Yksikään nykyisistä malleista ei ole saavuttanut tätä tasoa. Liikumme siihen suuntaan, mutta todellinen AGI, teoreettisessa mielessä, ei vielä ole olemassa. Ja ehkä se on parasta. Olemme edelleen approksimaatiivaisessa vaiheessa, ja todennäköisesti pysymme siinä jonkin aikaa.

AGI:n perusta tulee todennäköisesti olemaan agenttipohjainen järjestelmä. Se ei välttämättä riipu yhdestä LLM:stä, koska kuten yksikään ihminen, olkoon kuinka nerokas tahansa, ei voi hallita kaikkia tieteen ja taitojen aloja, yksikään LLM ei voi käsitellä koko AGI-tehtävien spektriä yksin. Mitä tarvitsemme, on “kollektiivinen äly”: arkkitehtuuri, joka pystyy koordinoimaan useita malleja ja komponentteja.

AGI todennäköisesti tulee esiin ei pelkästään ihmisen suunnittelemana agenttina, vaan meta-agenttina. Se tulee olemaan järjestelmä, joka on osittain kehitetty ja evoluutioitunut itse tekoälyn avulla. Tämä on tärkeää, koska ihmisten suunnittelemat järjestelmät voivat kantaa sisällään sisäisiä rajoituksia. Tekoälyn osallistaminen suunnitteluprosessiin voi auttaa ylittämään nämä rajoitukset ja tehdä järjestelmästä sopeutuvamman.

AGI:ä ei todennäköisesti tule yhdestä tietystä läpimurrosta. Ei suuremmista LLM:istä, älykkäämmistä agenteista tai täysin uusista arkkitehtuureista, vaan niiden kaikkien yhdistelmästä. Todennäköisesti jostakin uudesta, joka ylittää kategoriat, joita käytämme tällä hetkellä.

“Ihmiskunnan viimeinen tentti” ja muut AGI-benchmarkit

“Ihmiskunnan viimeinen tentti” (HLE) on yksi kunnianhimoisimmista benchmarkkeista, joita tällä hetkellä keskustellaan LLM:ien, agenttien ja AGI:n yhteydessä. Se on perustuu noin 2 500 kysymykseen, jotka kattavat laajan valikoiman akateemisia aloja – matematiikkaa, fysiikkaa, biologiaa, kemiaa, insinööritieteitä, tietojenkäsittelytiedettä ja jopa shakkia. Ideana on arvioida, pystyykö tekoälyjärjestelmä ratkaisemaan ongelmia aidon ihmisen ymmärryksen tasolla.

Nykyiset kielen mallit suorittavat erittäin huonosti HLE:llä, usein saavuttaen alle 5 prosentin täsmällisyyden. Tämä on vastakohtana muihin benchmarkkeihin, kuten MMLU tai GPQA, joilla mallit saavuttavat huomattavasti korkeampia pisteytyksiä. Mallien vaikeudet HLE:n kanssa korostavat, kuinka kaukana ne ovat edelleen todellisesta yleisestä älykkyydestä.

On tärkeää huomata, että korkea suorituskyky benchmarkkeissa, joilla on tunnettuja tai kapeita tietoja, ei välttämättä osoita oikean yleisen älykkyyden läsnäoloa. Malli voidaan hienosäätää tai “kouluttaa testiin”, mikä voi paisuttaa sen näennäisiä kykyjä. Jopa täydellinen pisteytys HLE:llä ei merkitse, että olemme saavuttaneet AGI:n; se merkitsee vain, että olemme läpäisseet yhden tietyn testin.

Mikä liikuttaa AGI:ä

Olen täysin samaa mieltä siitä, että AGI:n ydinpylväät ovat data, laskenta ja kyvyt. Laskennan tilanne on selvä. Avainpelaajat, kuten Meta, ovat yrittäneet tuottaa omat sirut, investoimalla miljardeja sirujen kehittämiseen. Mutta yritykset riippuvat edelleen muiden siruista ja muiden pelaajien, kuten Nvidian, laskentakapasiteetista, jotka eivät ainoastaan toimittaa välttämätöntä laitteistoa, vaan myös ymmärtävät skaalautuvan tuotannon merkitystä.

Lisää kysymyksiä koskee dataa ja kykyjä. Internet on loppunut – ei ole enää yhtään inhimillisen tekstin palaa, jota ei olisi käytetty koulutuksessa tällä hetkellä. Kaiken tietojen määrä, jonka ihmiset ovat tuottaneet tähän asti, osoittautuu yllättävän pieneksi. Siksi yritykset alkavat aktiivisesti yhteistyöhön niiden kanssa, jotka voivat tuottaa laadukkaita inhimillisiä tietoja.

Täydellinen automaatio vai ihmisen osallistuminen?

Toinen pointti – manuaalisen datamerkinnän kysynnän lasku. Muutama vuosi sitten teollisuus laajeni täydellä teholla. Tuuhannet annotoijat otettiin käyttöön ruokkimaan tekoälyputkien nälkää. Tänään suurin osa tästä liikkeestä on siirtynyt automaatioon. Mallit ovat kypsiä, ja työkalut niiden ympärillä ovat kehittyneet.

Ota esimerkiksi kasvojen tunnistus. Se oli aikaisemmin yksi tärkeimmistä kuvien merkintätehtävistä. Mutta tämä kategoria on suurelta osin ratkaistu. Mallit, kuten YOLO, SAM ja Samurai, imevät nopeasti rutiininomaisen työn. Nämä järjestelmät pakkaavat viikkojen manuaalisen työn muutamiin minuutteihin, usein hämmästyttävällä tarkkuudella. Olemme myös toteuttaneet monia ML-tukea työkaluja omassa Keylabs-alustassamme. Se auttaa todella leikkaamaan rutiininomaisen työn.

Mutta kaikki nämä mallit ovat rajoitettuja yleistettävyydellään ja soveltuvat automaatioon standardien ja yhdenmukaisten toimintojen osalta. Monimutkaiset tai yksilölliset tapaukset vaativat edelleen ihmisen huomiota.

Siirrymme vanhasta paradigman, jossa annotoija oli yksinkertaisesti yksityiskohtainen henkilö, joka pystyi tunnistamaan esineen tai tunteen. Uudessa todellisuudessa ammattilaisia tarvitaan: lääkäreitä merkintään lääketieteellisissä kuvissa, ohjelmoijia koodaamiseen, arkkitehteja piirtämään piirustuksia, markkinoijia asiakastietämykseen ja sotilasasiantuntijoita puolustustilanteisiin.

Olemme jo näkemässä todellisia tapauksia, kuten hävittäjälentäjiä, jotka merkitsevät tietoja tekoälylle ja ansaitsevat 1 000 dollaria tunnilta asiantuntemuksestaan. Koska tällaiset asiantuntijat ovat harvinaisia, ja heidän tietämys on kriittistä kouluttamassa suorituskykyistä tekoälyä.

Michael Abramov on Introspectorin perustaja ja toimitusjohtaja, joka tuo yli 15 vuoden ohjelmistokehitys- ja tietokoneen näköAI-järjestelmien kokemuksen yritysasteisten merkintätyökalujen kehittämiseen.

Michael aloitti uransa ohjelmistosuunnittelijana ja tutkimus- ja kehitysjohtajana, jossa hän rakensi skaalautuvia tietojärjestelmiä ja johti monitoimisia insinööritiimejä. Vuoteen 2025 asti hän on toiminut Keymakrin toimitusjohtajana, joka on data-merkintäpalveluyritys, jossa hän on kehittänyt ihmisen silmän mukaisia työnteon prosesseja, edistyneitä laadunvalvontajärjestelmiä ja mukautettuja työkaluja suurten tietokoneen näön ja autonomisen datan tarpeiden tukemiseksi.

Hänellä on B.Sc. tietojenkäsittelytieteestä ja taustatutkinto insinööritieteestä ja luovista taiteista, mikä tuo monitieteisen näkökulman vaikeiden ongelmien ratkaisemiseen. Michael asuu teknologisen innovaation, strategisen tuotejohtamisen ja todellisen vaikuttavuuden risteyksessä, jossa hän ajaa eteenpäin autonomisen järjestelmien ja älykkään automaation seuraavaa etappia.