Connect with us

Ajattelemalla kuin ihminen: Voivatko tekoälyjärjestelmät kehittää analogisen päättelyn?

Ajatusjohtajat

Ajattelemalla kuin ihminen: Voivatko tekoälyjärjestelmät kehittää analogisen päättelyn?

mm

Kun ihmiset kohtaavat jotain uutta, he etsivät vaistonvaraisesti vertailukohtia. Lapsi, joka oppii atomeista, saattaa kuulla, että elektronit kiertävät atomiydintä “kuin planeetat kiertävät aurinkoa”. Yrittäjä saattaa esittää startup-yrityksensä “kuin Uber-korjaamo”. Tieteilijä saattaa kertoa ei-asiantuntijayleisölle, että aivot prosessoi tietoa “kuin tietokone”.

Tämä mentaalinen loikkaus – näkeminen, miten yksi asia muistuttaa toista syvemmällä tasolla – kutsutaan analogiseksi päättelyksi. Ja se saattaa olla se aines, joka erottaa ihmisen älymystä tekoälystä sen nykyisessä muodossa. Jos haluamme kehittää koskaan Tekoälyä yleisesti (AGI) – Pyhä Graali tekoälystä, joka on osoittautunut hämmästyttävästi vaikeaksi – meidän on selvittävä, onko mahdollista, että koneet voivat oppia ajattelemaan analogisesti. Panokset eivät voi olla korkeammat. Jos vastaus on “Ei”, niin jopa kaikkein kehittyneimmät tekoälyjärjestelmät jäävät ikuisesti pelkiksi laskimiksi. Ne eivät pysty ratkaisemaan ongelmia, jotka vaativat enemmän kuin pelkän tietojen uudelleenjärjestelyn, joille se on koulutettu.

Ymmärryksen arkkitehtuuri

Analoginen päättely toimii rakenteellisten, ei pinnan tasolla olevien, samankaltaisuuksien tasolla. Esimerkiksi, mikä tekee sydämistä ja vesipumpeista samankaltaisia? Varmaankin ei niiden fyysinen ulkonäkö. Se on se, että molemmat suorittavat täsmälleen saman toiminnon, nimittäin nesteen kierrättämisen järjestelmässä. Ja juuri tämä kyky kartoittaa suhteita, jotka ovat tyypillisiä yhdessä asiayhteydessä toiseen asiayhteyteen, tekee ihmisen oppimisesta, luovuudesta ja ongelmanratkaisusta niin ainutlaatuisen.

Oikeasti on runsaasti esimerkkejä siitä. Otetaan esimerkiksi August Kekulé, loistava saksalainen kemisti, joka sai vihjeen bentseenin rakenteesta unessa, jossa hän näki käärmeen, joka puri omaa häntäänsä. Nykyään ohjelmoijat soveltavat oppeja keittiön järjestämisestä koodin rakenteeseen, ja opettajat selittävät sähkövirtaa vertaamalla sitä veteen, joka virtaa putkistossa.

Nykyiset tekoälyjärjestelmät kuitenkin löytävät tämän yleisen kognitiivisen taidon hyvin haastavaksi. Kun ne pyydetään, modernit suuret kielimallit (LLM) ovat vain liian iloisia selittämään, miksi “aika on rahaa” tai suorittamaan sanallisia päättelytehtäviä. Mutta kasvava näyttö viittaa siihen, että ne usein osallistuvat sofistikoituneeseen mallintamiseen, eikä aitoon rakenteelliseen kartoittamiseen. Kun tutkijat esittävät näille malleille uusia analogisia ongelmia, jotka poikkeavat heidän koulutusdatastaan, suorituskyky usein romahtaa. Tämä johtuu siitä, että LLM:t ovat erinomaisia toistamaan analogioita, joita he ovat nähneet aikaisemmin, mutta epäonnistuvat, kun pyydetään luomaan uusia yhteyksiä.

Ei analogista päättelyä, ei AGI:a

Ilmeisesti analoginen päättely onsine qua non AGI:lle. Ilman sitä tekoälyjärjestelmät jäävät hauraksi, kykenemättömiksi soveltamaan tietoa, joka on relevanttia yhdessä alueessa, ratkaisemaan ongelmia toisella alueella. Esimerkiksi kuvitellaan itsestään ajava auto, joka on oppinut navigoimaan Kalifornian aurinkoisilla teillä, mutta ei voi extrapoloida sitä tietoa käsittelyyn lumisissa olosuhteissa. Auton tekoälyjärjestelmä on kallis mallintaja, eikä järjestelmä, joka on todella älykäs. Todellinen älyvyys vaatisi kognitiivista joustavuutta tunnistaa, että ajaminen jäisillä teillä on rakenteellisesti verrattavissa muihin liukkaiden pintojen skenaarioihin, vaikka yksityiskohdat eroavatkin.

Sama periaate pätee myös muilla aloilla kuin itsestään ajava auto. Analoginen ajattelu ajaa myös edistystä tieteessä, lääketieteellisessä diagnosoinnissa, oikeudellisessa päättelyssä ja luovissa pyrkimyksissä. Tekoälyjärjestelmät ilman tätä kykyä muistuttavat tutkijaa, joka on muistanut koko kirjaston, mutta ei voi syntetisoida tietoa eri alojen välillä. Vaikuttava, kyllä, mutta vain kapeasti rajatulla tavalla.

Rakentaminen analogiseen mieliin

Mitä se vaatisi kehittää tekoälyjärjestelmiä, jotka pystyvät ajattelemaan analogisesti kuin ihmiset? Perustuen nousevaan tutkimukseen ja analogisen ajattelun perusrakenteeseen, useat kriittiset ehdot ja tekniikat näyttävät olevan välttämättömiä.

Rakenteellisesti rikkaat ja monipuoliset koulutusdatat

Ensimmäinen vaatimus on, että tekoälyjärjestelmien on koulutettava dataa, joka menee pinnan tasolla olevien tekstien mallien ulkopuolelle. Internet, joka on valtava repositorio tieteellisistä artikkeleista, teknisistä asiakirjoista, luovista teoksista ja selittävistä sisällöistä, on hyvä lähtökohta. Mutta ei mikä tahansa internet-data riitä. Mitä vaaditaan, on rakenteellinen monipuolisuus. Toisin sanoen, ohjaamaan tekoälyjärjestelmiä oppimaan tunnistamaan abstrakteja malleja, kehittäjien on aloitettava altistamaan niitä kontrasteille koulutuksen ensimmäisestä päivästä lähtien. Heidän koulutusdataansa voisi sisältää arkkitehtuurin piirustuksia yhdessä musiikin nuoteista, matemaattisia todistuksia yhdessä runouden kanssa tai oikeudellisia argumentteja yhdessä reseptien kanssa. Koska jokainen ala edustaa erilaisia relaatiomalleja, AGI-järjestelmä hyötyisi tästä harjoituksesta.

Tärkeämpää on, että tämä data on säilytetty ja korostettu rakenteellisia suhteita, eikä vain tilastollisia korrelaatioita. Tietokannat, kausaaliset kaaviot ja eksplisiittisesti kartoitetut suhteet käsitteiden välillä voivat auttaa tekoälyjärjestelmiä oppimaan “näkemään” rakenteen, eikä pelkästään mekaanisesti muistamaan assosiaatioita. Ajattele sitä opettamista tekoälylle, mitä asiat ovat, mutta myös, miten ne liittyvät toisiinsa periaatteellisilla tavoilla.

Testaaminen koulutusjoukon ulkopuolella

Varmistamaan, että tekoälyjärjestelmät oppivat päättelystä analogisesti, eikä pelkästään parantamaan mimiikkityyliään, tarvitsemme työkaluja, jotka tarkoituksella tutkivat kykyään kartoittaa rakennetta tilanteisiin, joita ne eivät ole koskaan kohdanneet aiemmin. Tämä edellyttää testitehtävien rakentamista, jotka ovat tarkoituksella erilaisia kuin mitä heidän koulutusdataansa on todennäköisesti. Mitä tutkijat kutsuvat “vastakkaisten tehtävien”.

Esimerkiksi sen sijaan, että pyytäisimme tekoälyä täyttämään standardianalogioita, kuten “koira on pennulle, mitä kissa on kissanpentuun”, esittäisimme sille ongelmia, jotka käyttävät keksittyjä käsitteitä tai pyytäisimme sitä kartoittamaan suhteita, joita se ei ole koskaan nähnyt yhdistettynä. Voisiko se tunnistaa, että suhde aineiden ja reseptin välillä vastaa suhdetta todisteiden ja oikeudellisen argumentin välillä, vaikka se ei ole koskaan kohdannut tätä tiettyä vertailua? Tällaiset testit paljastaisivat, onko järjestelmä omaksunut syvät rakenteet vai muistaa vain samankaltaisia esimerkkejä.

Mittaaminen, mitä on tärkeää

Hyvä uutinen tekoälykehittäjille on, että on olemassa kognitiivisen tieteen tutkimusta, joka käsittelee nimenomaan sitä, miten ihmiset prosessoi analogioita. He voivat käyttää tätä tutkimusta kehittääkseen vankat mittarit analogisen päättelyn arviointiin. Mutta nämä mittarit eivät saa rajoittua pelkästään oikeiden vastausten laskemiseen analogiatesteissä. Mitä tarvitaan, ovat mittarit, jotka havaitsevat, voivatko tekoälyjärjestelmät tunnistaa, mitkä suhteet ovat olennaisia kartoittaa, samalla kun ne jättävät huomiotta pinnan tasolla olevat samankaltaisuuksia ja säilyttävät johdonmukaisuutta kartoituksissaan.

Tämä saattaa vaatia arviointijärjestelmiä, jotka palkitsevat korkeamman tasoisia suhteita. Esimerkiksi tekoäly saa korkeamman arvosanan, jos se voi tunnistaa, että sekä atomit että aurinkokunnat liittyvät kiertämiseen, ja myös ymmärtää kausaaliset suhteet, jotka ohjaavat noita kiertokuluja. Toinen arvioitava osaaminen voisi olla kyky luoda spontaanisti sovellettavia analogioita selittämään uusia käsitteitä, eikä pelkästään suorittaa ennalta määrättyjä analogisia tehtäviä.

Tukirakenteet ohjaamalla

Viimeaikaiset tutkimukset osoittavat, että tekoälyjärjestelmien kyky ajatella analogisesti riippuu suurelta osin siitä, miten heitä pyydetään tekemään niin. Analoginen ohjaus – ohjaaminen eksplisiittisesti malleja rakenteellisen kartoittamisen prosessiin – voi herättää monimutkaisempaa päättelyä kuin yksinkertainen ongelman esittäminen. Tämä saattaa vaatia pyytämistä järjestelmältä tunnistamaan suhteita lähdemaailmassa, ja sitten eksplisiittisesti pyytämistä kartoittamaan ne suhteet kohdemaailmaan.

Tämä tekniikka saattaa palvella kahta tarkoitusta: parantamaan nykyisten tekoälyjärjestelmien analogista ajattelukykyä ja myös generoimaan koulutusdataa tuleville malleille. Onnistuneiden analogisen päättelyn ohjattujen esimerkkien tallentamisen kautta voidaan luoda esimerkkejä, jotka voivat opettaa myöhempinä järjestelmiä osallistumaan tähän prosessiin luonnollisemmin.

Hybridirakenteet

Saavuttaminen ihmisen kaltaista analogista päättelyä saattaa vaatia siirtymistä pelkästään neuroverkko-lähestymistapaan. Hybridijärjestelmät, jotka yhdistävät mallintamisen symboliseen päättelyyn – eksplisiittisesti edustaen ja manipuloivan rakenteellisia suhteita – voivat tarjota puuttuvan palan. Vaikka neuroverkot ovat erinomaisia oppimassa implisiittisiä malleja, symboliset järjestelmät voivat pakottaa rakenteellisen johdonmukaisuuden ja logisen kartoittamisen, mitä analoginen päättely vaatii.

Hybridirakenteet ovat edelleen vasta kehittymässä, mutta tutkijat ovat aktiivisesti tutkimassa niiden potentiaalia. Jotkut väittävät yhdistävänsä neuroverkkoja symboliseen päättelyyn, mikä saattaa johtaa parantuneisiin analogisiin kykyihin. Toiset edistävät hybridimalleja, jotka on suunniteltu ratkaisemaan tekoälymallien taipumusta keksimään ja ajattelemaan analogisesti pinnallisesti.

Missä seuraavaksi?

Riippuen siitä, keneltä kysyt, analoginen päättely on jo emergoivaa tai tekoäly on vain parantamassa jäljitelmiskykyään. Kumpi tahansa näkökulma on lähempänä totuutta, on selvää, että jos AGI-unelma on toteutettava, se vaatii enemmän kuin vain suurempia malleja tai enemmän dataa. Se vaatii myös joitain perustavanlaatuisia innovaatioita siinä, miten rakennamme, koulutamme ja arvioimme tekoälyjärjestelmiämme.

Kun tekoälyn muuntavat kyvyt kehittyvät, analoginen päättely tulee edustamaan sekä kriittistä suorituskykymittaria että hillitöntä muistutusta tekoälyn nykyisten kykyjen ja aidon ihmisen kognitiivisen kyvyn välisestä kuilusta. Kun tekoälyjärjestelmä voi nähdä, että demokratia on kansalaisille, mitä orkesteri on muusikoille – tunnistaa ei pinnan ominaisuuksia vaan syvät rakenteelliset suhteet koordinaatiosta, edustuksesta ja emergoivasta harmoniasta – se on ylittänyt kriittisen kynnyksen kohti todellista älykkyyttä.

Yli 13 vuoden ajan Gediminas Rickevicius on ollut voimakas kasvun tekijä markkinajohtavissa IT-, mainonta- ja logistiikkayrityksissä ympäri maailmaa. Hän on muuttanut perinteisen liiketoimintakehityksen ja myyntiä koskevan lähestymistavan integroimalla suuren datan strategisiin päätöksiin. Oxylabs: n Global Partnerships -seniorivise presidenttinä Gediminas jatkaa tehtäväänsä yritysten valtuuttamiseksi viimeisimmän sukupolven julkisen verkkodatan keräämismahdollisuuksilla.