Connect with us

Ajatusjohtajat

Peliin generoitu data saattaa olla aliarvostetuin resurssi tekoälykoulutuksessa

mm

Tekoälyyritykset ovat viettäneet viimeiset viisi vuotta kuluttamalla jokaisen tekstin, jokaisen kuvan ja jokaisen sirpin julkisesti saatavilla olevaa dataa internetissä. Tämä tarjonta on äärellinen, ja lähennemme jo pistettä, jossa yksinkertaisesti ei ole riittävästi dataa ylläpitämään sitä edistystahtia, josta on tullut riippuvainen.

On kuitenkin ilmeinen ehdokas, jota tekoälyteollisuus on suurelta osin laiminlyönyt.

Rakennan pelijärjestelmiä elinkeinona, ja data, joka virtaa niiden läpi joka päivä, on aivan erilainen kuin mitä useimmat tekoälytutkijat ovat koskaan työskennelleet. Ja kuitenkin lähes kukaan pelien ulkopuolella ei vaikuta kiinnittävän siihen huomiota.

Pelialustat generoivat teratavun verran käyttäytymisdataa joka päivä, rakenteellisia virtoja reaaliaikaisista päätöksistä, taloudellisesta toiminnasta ja sosiaalisesta vuorovaikutuksesta, kaikki ympäristöissä, jotka on rakennettu johdonmukaisiin fysikaalisiin sääntöihin.

Lähes mikään tästä datasta ei ole käytetty tekoälykoulutukseen. Ja ne yhtiöt, jotka ovat käyttäneet sitä, kuten DeepMind ja NVIDIA, ovat tuottaneet joitakin alan merkittävimmistä läpimurroista.

Tekoälyn datongelma

Epoch AI:n tutkimus arvioi, että julkisesti saatavilla olevan, ihmisten luoman tekstin varasto on täysin käytetty jossakin vaiheessa vuosien 2026 ja 2032 välillä. ChatGPT:n, Gemini:n ja Claude:n taustalla olevat mallit ovat jo kuluttaneet käytännössä kaiken, mitä internet tarjoaa.

Synthetic data tai teksti, jonka tekoäly generoi syöttääkseen sen takaisin tekoälyyn, on alan oletusarvoinen ratkaisu. Mutta malleja, jotka on koulutettu omalla tuotoksellaan, heikentyy ajan myötä tutkijoiden kuvaamassa ilmiössä, jota kutsutaan mallin romahdukseksi.

Uskon, että alalle tarvitaan rikas, interaktiivinen, monitahoinen tieto, jossa syy ja seuraus tapahtuvat reaaliajassa ja jokaisella toiminnalla on mitattavissa oleva seuraus. Pelit tuottavat täsmälleen tämän, ja ne tekevät sen mittakaavassa, jota lähes mikään muu ei voi vastata.

Pelialustat työntävät teratavun verran käyttäytymisdataa järjestelmiinsä joka päivä. Pelaajien liikkeet, strategiset valinnat, reagointiajat, taloudelliset transaktiot ja sosiaaliset vuorovaikutukset kaikki virtaavat rakenteellisten, aikaleimattujen virtojen läpi, joita useimmat tekoälytutkijat eivät ole koskaan kosketteleita.

Äskettäinen akateeminen tutkimus peligeneroidusta datasta esittää yhdeksän luokan taksonomian tällaisesta tiedosta ja väittää, että suurin osa siitä on edelleen kokonaan käyttämätöntä tekoälyteollisuudessa.

Voin vahvistaa tämän omasta kokemuksestani. Datamäärä, joka virtaa pelijärjestelmiimme millä tahansa päivänä, olisi kultakaivos missä tahansa muussa tekoälytutkimuksen alueella. Peleissä se vain arkistoidaan tai hävitetään.

Miksi pelidata on erilainen

Kun rakennat pelimoottorissa tarpeeksi kauan, alat ymmärtää, kuinka paljon rakenteellista dataa istut päällä, jota kukaan tekoälytutkija ei ole vielä pyytänyt. Jokainen istunto tuottaa synchronoituja fysiikkaa, pelaajan käyttäytymistä ja järjestelmätasolla olevaa syy-seuraussuhdetta mittakaavassa, jota on vaikea löytää missään muualla.

Pelimoottorit pakottavat fysiikan noudattamista. Objektit putoavat, törmäilevät ja rikkoutuvat johdonmukaisesti, mikä tarkoittaa, että data sisältää syyn ja seurauksen suhteita, jotka on upotettu järjestelmään, eikä malleja, jotka on arvioitu tekstin korrelaatioiden perusteella.

Kun pelaaja laukaisee esineen, moottori laskee sen radan, ilmanvastuksen ja vaikutuksen. Tekoäly oppii ympäristöstä, joka havainnollistaa fysiikkaa suoraan jokaisen vuorovaikutuksen kautta, eikä ympäristöstä, joka kohdeltaa fysikaalisia lakeja tilastollisina approksimaatioina.

On myös monitahoinen linjausongelma. Pelissä visuaalidata, ääniohjeet, pelaajan syötteet ja ympäristön tila tapahtuvat samanaikaisesti ja kirjataan yhdessä. Tällainen luonnollinen synchronointi maksaa paljon rahaa, kun se replikoidaan oikeilla maailman dataseteilla, joissa tutkijat yleensä on merkittävä ja linjata jokainen modaalinen käsillä.

Pelit tuottavat myös ääririttejä mittakaavassa, proseduraalisen sisällön generoinnin kautta. No Man’s Sky on 18 kvintiljoonaa ainutlaatuista planeettaa, ja tekoälylle tämä vaihtelu on valtavan tärkeää, koska ääriritat määräävät, toimivatko mallit luotettavasti vai epäonnistuvat vaarallisesti.

Ja sitten on emergentti monimutkaisuus, joka saattaa olla arvokkain ominaisuus. Kun OpenAI asetti agenteja yksinkertaiseen piilosta-pelissä, ne kehittivät kuusi eri vaihetta monimutkaisesta strategiasta kokonaan itsestään satojen miljoonien kierrosten aikana.

Ne rakensivat suojia siirrettävistä esineistä, käyttivät rampeja rikkomalla linnoituksia ja jopa hyödynsivät fysiikan virheitä surffaamalla laatikoita seinien yli. Mitään ei ollut ohjelmoitu. Se kaikki emergoi peliympäristöstä, ilman yhtään koodiriviä, joka olisi kertonut niille tehdä mitään sitä.

Tällainen itsegeneroitu monimutkaisuus on täsmälleen sitä, mitä tekoälytutkimukselle tarvitaan mittakaavassa, ja pelit ovat ainoita ympäristöjä, jotka tuottavat sitä luotettavasti ilman kallista ihmisen valvontaa.

Pelilautoista Nobelin palkintoihin

Selvin todiste siitä, että pelikoulutettu tekoäly siirtyy todelliseen maailmaan, on järjestelmä, joka voitti Nobelin palkinnon, ja se on esimerkki, johon palannut aina, kun ihmiset kysyvät minulta, miksi rakensin urani peleihin ja tekoälyyn.

DeepMind aloitti AlphaGolla vuonna 2016, rakensi sitten AlphaZeron, järjestelmän, joka opetti itselleen shakin, gon ja shogin ilman mitään ihmisen tietämystä. AlphaZeron arkkitehtuuri muodosti perustan AlphaFoldille, joka ratkaisi 50-vuotiaan proteiinien taittumisen ongelman ja ansaitsi luojilleen vuoden 2024 Nobelin kemianpalkinnon.

DeepMindin toimitusjohtaja Demis Hassabis on ollut avoin tästä putkistosta. Hän kertoi Scientific Americanille, että pelit eivät olleet koskaan lopullinen tavoite, vaan ainoastaan tehokkain tapa kehittää ja testata tekoälytekniikoita ennen kuin sovelsi niitä todellisiin tieteellisiin ongelmiin.

Muistan lukeneeni sen ja tunteneeni, että joku oli ilmaissut täsmälleen sen, mitä olin nähnyt pelikehityksen sisältä vuosien ajan.

Tämä traektoria on toistunut sittemmin koko alalla. Vahvistusoppimisen ympäristöt, jotka OpenAI ensin standardoi Gymnasiumissa, muodostavat nyt tutkimuksen perustan robotiikassa, itseohjautuvissa ajoneuvoissa ja teollisessa automaatiassa.

Agentin, ympäristön, toiminnan ja palkkion pelimäinen rakenne alkoi tutkimuksen mukavuutena ja on sittemmin muodostunut oletusarvoiseksi kehykseksi mille tahansa tekoälyjärjestelmälle, joka tarvitsee toimia fyysisessä maailmassa.

Pelit uutena simulaatiokerroksena

Joulukuussa 2025 NVIDIA julkaisi NitroGenin, perusmallin, joka on koulutettu 40 000 tunnin peliajasta yli 1000 pelin kautta. Malli katsoo julkisesti saatavilla olevia pelivideoita, poimii pelaajien toimintoja ohjaimen päällysteistä ja oppii pelaamaan pelejä suoraan raakapikseleistä.

Näkymättömissä peleissä, joissa se ei ollut koskaan aiemmin kohdannut, NitroGen näytti jopa 52 %:n parannuksen tehtävän onnistumisessa verrattuna malleihin, jotka on koulutettu alusta alkaen. Mutta todellinen merkitys piilee arkkitehtuurissa sen alla.

NitroGen toimii NVIDIAN GR00T-robottiikkaohjelmistokehyksellä, samalla perustalla, jonka yhtiö käyttää fyysisten tekoälyjen ja simulaatio-todellisuuden siirtymisen Isaac Sim -alustalla. Pelin agentti ja tehdastelektrooninen robotti jakavat saman perustavanlaatuinen järjestelmän.

NVIDIAN Jim Fan kuvasi projektia “toimintojen GPT:ksi”, yleispäteväksi malliksi, joka oppii toimimaan missä tahansa ympäristössä.

Pelijärjestelmien rakentajana, joka tuottaa tarkalleen samaa dataa, jota nämä mallit kuluttavat, on vaikea yliarvioida, mitä se merkitsee alalle, jossa työskentelen.

Tämä ei kuitenkaan rajoitu NVIDIAan. Waymo on merkinnut yli 20 miljardia simuloitua mailia kouluttaakseen itseohjautuvia ajoneuvojaan, kaikki pelimoottorityylisissä ympäristöissä, jotka harjoittelevat skenaarioita, jotka ovat liian vaarallisia tai liian harvinaisia testata oikeilla teillä.

Kirurgiset alustat, jotka on rakennettu pelimoottorien päälle, ovat näyttäneet dramaattisia parannuksia koulutettujen suorituskyvyssä. Kaupunkisuunnittelijat käyttävät samankaltaisia työkaluja liikenteen optimointiin kaupunkitasolla.

Kirurgiset alustat, jotka on rakennettu pelimoottorien päälle, ovat näyttäneet dramaattisia parannuksia koulutettujen suorituskyvyssä. Kaupunkisuunnittelijat käyttävät samankaltaisia työkaluja liikenteen optimointiin kaupunkitasolla. Pelimoottori on muodostunut universaaliksi simulaatiokerrokseksi, missä tahansa tekoäly tarvitsee oppia vuorovaikutuksen kautta ympäristönsä kanssa.

Infrastruktuuri, josta kukaan ei puhu

Kun ihmiset keskustelevat tekoälyinfrastruktuurista, he tarkoittavat yleensä datakeskuksia, GPU-klustereita ja laskentaa. Kaiken aikaa, jonka olen työskennellyt peleissä, voin laskea yhdellä kädelläni, kuinka monta kertaa olen kuullut jonkun tekoälytilassa mainitsevan peliympäristöt samassa hengenvedossa. Tämä eroavaisuus tulee sulkeutumaan hyvin nopeasti.

Tämä tulee olemaan vielä ilmiselvempää, kun perinteiset datasetit loppuvat. Teollisuudet, jotka tuottavat rikkaimman interaktiivisen datan, siirtyvät vääjäämättä tekoälytutkimuksen keskipisteeseen, ja pelit, simulaatiot ja virtuaalimaailmat ovat paremmin asemoituneet täyttämään tämän aukon kuin mikään muu.

Raha on jo seuraamassa tätä trendiä. Tekoäly pelisektorissa arvioitiin 4,54 miljardiksi dollariksi vuonna 2025 ja on arvioitu nousevan 81 miljardiin dollariksi vuoteen 2035 mennessä.

Useimmat pelistudiot, joilla keskustelen, ajattelevat edelleen itseään viihteellisinä yhtiöinä. Mutta kun järjestelmäsi tuottavat täsmälleen sitä dataa, jota seuraavan sukupolven tekoälymallit tarvitsevat koulutukseen, olet infrastruktuuribisneksessä, olitpa sitä tietävätkin tai ei.

Ilman Shazhaev on Dizzaractin perustaja ja toimitusjohtaja, joka on suurin pelistudio MENA-alueella. Hän on tekoälytutkija ja Yhdistyneiden Kansakuntien asiantuntija UNODC-ohjelmassa, joka työskentelee tekoälyn ja todellisen vaikutuksen leikkauskohdassa.