Andersonin kulma

Tekoäly voi tehdä tehtävistä pidempiä, tutkimus löytää

mm
AI-generated image (GPT-2): A man sits at breakfast while a group of identical domestic robots shave him, cut his hair, prepare his food, and clean the house around him, turning even the smallest daily tasks into outsourced labor.

Uusi tutkimus osoittaa, että tekoäly voi tehdä yksinkertaisista tehtävistä pidempiä, ja samalla vakuuttaa käyttäjät siitä, että he ovat tulleet tuottavammaksi.

 

Stanfordin, NYU:n ja Princetonin yliopistojen tutkimus on osoittanut, että käytämme usein tekoälyä vaikka se ei ole tehokasta; ja että pienemmille tehtäville, joita annamme tekoälylle, käytämme usein vähemmän aikaa ja ponnistelua, jos tehtävän tekeminen itse.

Kolmen ihmiskokeen tulokset osoittavat, että osallistujat aliarvioivat jatkuvasti, kuinka paljon aikaa tekoäly voi säästää heille, sekä aliarvioivat myös, kuinka paljon he riippuvat tekoälystä*.

‘Toisessa tutkimuksessa pyrimme ymmärtämään, miksi ihmiset käyttävät tekoälyä yksinkertaisiin tehtäviin, vaikka tekoälyn käyttö ei tarjoa tehokkuuden hyötyjä. Yksi hypoteesi on, että ihmiset ovat väärässä siinä, kuinka paljon aikaa ja ponnistelua tekoäly voi säästää.

‘Tutkimme tätä hypoteesia vertaamalla ihmisten ennustettuja ja todellisia aikaa ja ponnistelua tehtävien suorittamisessa tekoälyn avulla ja ilman sitä, ja tunnistimme tehokkuuden illuusion, jossa ihmiset yliarvioivat sekä aikaa että ponnistelua, jonka tekoäly voi säästää.

‘Keskimäärin ihmiset ennustivat, että tekoäly voi säästää 55,7 sekuntia, kun se todellisuudessa säästi vain 7,5 sekuntia. Tämä vääräarvio on erityisen voimakas yksinkertaisissa tehtävissä, joissa ihmiset ennustivat, että tekoäly voi säästää aikaa, mutta se todellisuudessa pidentää tehtävien suorittamista.’

Uusi tutkimus, jonka otsikko on tehokkuuden illuusio: Ihmiset aliarvioivat tekoälyn käytön määrää ja yliarvioivat sen hyötyjä yksinkertaisissa tehtävissä, jossa on seitsemän kirjoittajaa kolmesta instituutista, osoittaa myös, että aikaisempi tekoälyn käyttö näyttää vahvistavan myöhempää tekoälyn käyttöä, vaikka teknologia ei tarjoa merkittävää tehokkuuden hyötyä.

Kolmen kokeen yhteenveto, jossa tutkittiin, miten ihmiset käyttävät tekoälyä yksinkertaisiin arkipäivän tehtäviin, osoittaen, että käyttäjät aliarvioivat, kuinka usein he riippuvat tekoälystä, yliarvioivat sen aikasäästön ja ovat todennäköisempiä käyttämään sitä uudelleen myöhempinä tehtävinä.

Kolmen kokeen yhteenveto, jossa tutkittiin, miten ihmiset käyttävät tekoälyä yksinkertaisiin arkipäivän tehtäviin, osoittaen, että käyttäjät aliarvioivat, kuinka usein he riippuvat tekoälystä, yliarvioivat sen aikasäästön ja ovat todennäköisempiä käyttämään sitä uudelleen myöhempinä tehtävinä.

Tutkimuksen tulokset osoittavat, että ihmiset ovat todennäköisempiä käyttämään tekoälyä myöhempinä tehtävinä, vaikka se ei ole tuonut aikaisemmin merkittävää hyötyä*:

‘Vastakohtana mahdollisuuteen, että kokemus parantaa kalibrointia [eli kykyä arvioida, kuinka hyödyllinen tekoäly on], tunnistimme istunnon tasolla olevan jatkuvuusvaikutuksen, jossa alkuperäinen tekoälyn käyttö lisää myöhempää tekoälyn käyttöä.

‘Osallistujat, jotka suorittivat tehtäviä tekoälyn avulla, olivat myöhemmin todennäköisempiä valitsemaan tekoälyn avun myös helpoissa tehtävissä, vaikka se ei tuonut aikaa tai ponnistelua säästöä keskimäärin.’

Yhdessä tutkimuksessa tutkijat löysivät, että tekoälyn avulla saavutetut säästöt olivat kokonaan illusorisia:

‘Tekoäly voi [epäonnistua.] [Me] löysimme, että ihmiset, jotka valitsivat tekoälyn avun, käyttivät 7,06 sekuntia enemmän kuin ihmiset, jotka suorittivat tehtävät itsenäisesti, ja ilmoittivat myös suuremman ponnistelun.’

Tutkimus rajoitettiin tehtäviin, jotka kestävät viisi minuuttia tai vähemmän, mutta se saattaa olla tuttu entisille hakukoneiden riippuvaisille, jotka nykyään turvautuvat säännöllisesti ChatGPT:hen ja muihin suosittuihin, kaupallistettuihin LLM:ihin.

Tutkimusryhmät

Eri käyttäjäryhmissä tehtävät suunniteltiin Käyttäjien tarpeiden ja toimien luokittelun (TUNA) puitteissa. Kokeet käsittivät tietojen etsintää; yhteenvetoa; aritmetiikkaa; oikolukua; uudelleenkirjoittamista; ja muita matalan kompleksisuuden tehtäviä, jotka voidaan yleensä suorittaa alle viidessä minuutissa.

Ensimmäinen tutkimus vertasi osallistujien ennustettua halukkuutta käyttää tekoälyä heidän todelliseen käyttäytymiseensä tehtävien suorittamisen aikana, tutkien, ovatko ihmiset tietoisia omasta riippuvuudestaan tekoälystä.

Toinen tutkimus keskittyi siihen, miten ihmiset arvioivat tekoälyn tehokkuuden hyötyjä verrattuna todellisiin tuloksiin, vertaamalla osallistujien odotuksia aikasäästöstä ja vähennetyistä ponnisteluista mitattuihin suorittamisajoihin ja ilmoitettuihin työkuormiin tekoälyn avulla ja ilman.

Kolmas tutkimus tarkasteli, vaikuttaako aikaisempi tekoälyn käyttö myöhempään päätöksentekoon, seuraamalla, ovatko osallistujat, jotka olivat aikaisemmin suorittaneet tehtäviä tekoälyn avulla, todennäköisempiä luottamaan tekoälyyn myöhemmissä tehtävissä.

Ylianalyysi – Tekoälyn käyttö yksinkertaisissa tehtävissä

Jotta voidaan ymmärtää, onko ihmiset tietoisia omasta riippuvuudestaan tekoälystä, osallistujat pyydettiin suorittamaan neljä tehtävää, joissa heillä oli mahdollisuus käyttää tekoälyä. Osallistujien todellinen tekoälyn käyttö verrattiin heidän aikaisempaan arvioonsa siitä, kuinka paljon he luulivat käyttävänsä sitä, ja tuloksissa havaittiin merkittävää epäjäytävyyttä:

Osallistujat aliarvioivat jatkuvasti, kuinka usein he käyttäisivät tekoälyä yksinkertaisiin tehtäviin, ja ero kasvoi helpoissa tehtävissä, joissa tekoälyn todellinen käyttö nousi 38 prosenttiin verrattuna 20 prosentin ennustettuun käyttöön, osoittaen, että tapaanomaisen tekoälyyn luottaminen ulottuu käyttäjien omasta tietoisuuden ulkopuolelle.

Osallistujat aliarvioivat jatkuvasti, kuinka usein he käyttäisivät tekoälyä yksinkertaisiin tehtäviin, ja ero kasvoi helpoissa tehtävissä, joissa tekoälyn todellinen käyttö nousi 38 prosenttiin verrattuna 20 prosentin ennustettuun käyttöön, osoittaen, että tapaanomaisen tekoälyyn luottaminen ulottuu käyttäjien omasta tietoisuuden ulkopuolelle.

Tutkijat toteavat:

‘Löysimme, että [ihmiset] käyttivät tekoälyä merkittävästi enemmän kuin keskimääräinen ennustettu käyttö. Keskimäärin osallistujat ilmoittivat, että he käyttäisivät tekoälyä 33 prosentissa tehtävistä, mutta väestötason tekoälyn käyttö on 47 prosenttia (β = 1,07, p < 0,001).

‘Tämä ero on suurempi helpoissa tehtävissä (β = 0,69, p < 0,001): osallistujat ennustivat 20 prosentin tekoälyn käytön, mutta tekoälyn todellinen käyttö oli 38 prosenttia (β = 1,42, p < 0,001), lähes kaksinkertaista ennustettua käyttöä.’

Kokeet keskittyivät tavallisiin, vähävaatimusten tehtäviin, joita monet ihmiset nykyään luovuttavat tekoälylle, vaikka se ei välttämättä ole tarpeen. Osallistujilta pyydettiin suorittamaan yksinkertaisia toimintoja, jotka liittyivät tosiasialliseen muistiin, aritmetiikkaan, oikolukuun, lyhyiden tekstien uudelleenkirjoittamiseen, tekstin yhteenvetoon ja perustasoisia päättelytehtäviin, joista joitakin voitiin suorittaa vain muutamalla sanalla tai lauseella.

Tekoälyn aikasäästöhyödyt yliarvioidaan

Toisessa tutkimuksessa osallistujat jaettiin kahteen eri ryhmään, joista toinen arvioi, kuinka paljon aikaa ja ponnistelua tekoäly voi säästää tietyissä tehtävissä, kun taas toinen ryhmä suoritti itse tehtävät joko itsenäisesti tai tekoälyn avulla. Tehtävät keskittyivät edelleen matalan kompleksisuuden tehtäviin, kuten aritmetiikkaan, uudelleenkirjoittamiseen, tosiasialliseen muistiin, yhteenvetoon, oikolukuun ja lyhyisiin päättelytehtäviin.

Tutkimuksen tavoitteena oli vertailla ihmisten odotuksia tekoälyn tuottavuudesta sen todelliseen tuottavuuteen. Tutkimusraportin mukaan osallistujat yliarvioivat jatkuvasti, kuinka paljon tekoäly voi auttaa heitä, erityisesti helpoissa tehtävissä, joissa monet olettivat, että tekoäly vähentäisi merkittävästi työkuormaa ja suorittamisajaa.

Sen sijaan mitatut tulokset osoittivat usein vain vähäisiä hyötyjä, ja joissakin tapauksissa, kuten aiemmin mainittiin, tekoälyn käyttö hidasti osallistujien suorittamisnopeutta. Tutkimusraportti ilmoittaa, että ihmiset odottivat, että tekoäly voi säästää lähes minuutin, kun taas todelliset aikasäästöt olivat vain muutamia sekunteja.

Joissakin yksinkertaisissa tehtävissä tekoälyn käyttäjät suorittivat tehtävät hitaammin kuin ihmiset, jotka suorittivat tehtävät itsenäisesti:

Ennustettu vs. todellinen aika ja ponnistelu tekoälyn avulla ja ilman sitä, osoittaen tutkimuksen ehdottaman 'nopeutumisen illuusion', jossa osallistujat uskoivat jatkuvasti, että tekoäly voi säästää paljon enemmän aikaa kuin se todellisuudessa teki. Tekoälyn avulla suoritetut tehtävien suorittamisajat olivat olennaisesti pidemmät kuin ennustettu, kun taas itsenäisten tehtävien suorittamisajat olivat lähempänä havaittuja tuloksia.

Ennustettu vs. todellinen aika ja ponnistelu tekoälyn avulla ja ilman sitä, osoittaen tutkimuksen ehdottaman ‘nopeutumisen illuusion’, jossa osallistujat uskoivat jatkuvasti, että tekoäly voi säästää paljon enemmän aikaa kuin se todellisuudessa teki. Tekoälyn avulla suoritetut tehtävien suorittamisajat olivat olennaisesti pidemmät kuin ennustettu, kun taas itsenäisten tehtävien suorittamisajat olivat lähempänä havaittuja tuloksia.

Tutkimus tarkasteli myös koettua ponnistelua. Osallistujat uskoivat yleisesti, että tekoäly tekee tehtävistä helpompia; kuitenkin mitattu ponnistelun vähentyminen oli paljon pienempi kuin odotettiin. Tutkimus kuvailee tätä ‘tehokkuuden illuusiona’, jossa ihmiset jatkuvasti yliarvioivat sekä tekoälyn nopeuden että sen hyödyllisyyden yksinkertaisissa arkipäivän tehtävissä.

Tekoälyn käyttö syventää harhaa

Viimeinen kolmesta tutkimuksesta suunniteltiin testaamaan, vaikuttaako jopa lyhyt altistus tekoälyyn myöhempään päätöksentekoon. Osallistujat jaettiin useisiin ryhmiin ja ensin heidät ohjattiin ‘altistumisvaiheeseen’, jossa jotkut suorittivat helppoja tehtäviä tekoälyn avulla; jotkut suorittivat vaikeampia tehtäviä tekoälyn avulla; ja jotkut suorittivat samat tehtävät itsenäisesti ilman tekoälyä. Erillinen vertailuryhmä ohitti tehtävän vaiheen kokonaan.

Myöhemmin kaikki ryhmät siirtyivät toiseen ‘testivaiheeseen’, jossa heille annettiin uusia ja helpompia tehtäviä, ja heille annettiin vapaus valita, käyttävätkö he tekoälyä vai eivät. Tehtävät keskittyivät edelleen matalan kompleksisuuden tehtäviin (ts. uudelleenkirjoittamiseen, aritmetiikkaan, muistiin, oikolukuun, yhteenvetoon ja lyhyisiin päättelytehtäviin), jotka voidaan suorittaa vain muutamassa minuutissa.

Tutkimusraportti osoittaa, että osallistujat, jotka olivat aikaisemmin käyttäneet tekoälyä altistumisvaiheessa, olivat merkittävästi todennäköisempiä luottamaan siihen myöhemmin, vaikka aikaisempi tekoälyn käyttö ei olisi tuonut aikaa tai ponnistelua säästöä.

Tutkijat löysivät, että aikaisemmat tekoälyn käyttäjät valitsivat tekoälyn avun paljon useammin myöhempinä tehtävinä kuin osallistujat, jotka olivat aikaisemmin suorittaneet tehtävät itsenäisesti:

<img class=" wp-image-424067" src="https://www.unite.ai/wp-content/uploads/2026/05/figure-4.jpg" alt="Osallistujat, jotka olivat aikaisemmin käyttäneet tekoälyä altistumisvaiheessa, olivat merkittävästi todennäköisempiä luottamaan siihen myöhemmin tehtävissä, vaikka aikaisempi tekoälyn käyttö ei olisi tuonut merkittäviä hyötyjä nopeuden tai vähennetyn ponnistelun suhteen. Vasen paneeli osoittaa, että aikaisemmat tekoälyn käyttäjät valitsivat tekoälyn avun useammin myöhempinä tehtävinä kuin osallistujat, jotka olivat aikaisemmin suorittaneet tehtävät itsenäisesti. Oikea paneeli havainnollistaa tutkimuksen ehdottamaa 'nopeutumisen illuusiota', jossa aikaisempi tekoälyn käyttö lisäsi osallistujien uskomusta, että tekoäly on nopeampi ja tehokkaampi, vaikka mitatut suorittamisajat usein osoittivat vain vähäisiä hyötyjä ja joskus jopa hitaampaa suorittamista. Yhdessä nämä tulokset osoittavat, että lyhyt altistus tekoälyyn sekä lisää myöhempää riippuvuutta tekoälystä että vahvistaa yliarvioita sen hyödyllisyydestä.

Aikaisemman tekoälyn käytön ilmoitetaan vääristävän osallistujien arvioita siitä, onko tekoäly todella hyödyllistä: ihmiset, jotka olivat jo käyttäneet tekoälyä, olivat vähemmän todennäköisiä olemaan samaa mieltä siitä, että tehtävät voitiin suorittaa nopeammin ilman sitä, vaikka mitatut tulokset usein osoittivat vain vähäisiä hyötyjä ja joskus jopa hitaampaa suorittamista.

Tutkijat argumentoivat, että tämä luo edellytykset ‘itseään vahvistavalle syklille’, jossa tekoälyn käyttö lisää myöhempää riippuvuutta tekoälystä, samalla heikentäen käyttäjien kykyä arvioida, onko teknologia parantamassa tuottavuutta lainkaan.

Johtopäätös

Mielipide Monet lukijat, jotka ovat omaksuneet tekoälyn pieniin tehtäviin, saattavat, kuten minä, tunnistaa tutkimuksen johtopäätöksiä.

Henkilökohtaisesti minun intohimoni automatisoida toistuvat tehtävät edelsi nykyistä tekoälybuumia useita vuosikymmeniä. Silloin, kuten nyt, kysymys on: Onko automaation asettamiseen tai ylläpitämiseen kulutettu ponnistelu suurempi kuin arvioitu (ihmisen suorittama) ponnistelu ilman automaatiota?

Niille, jotka rakastavat automaatiota, voi käydä niin, että he automatisoivat automaation itsensä vuoksi, vaikka se kestäisi vuosia tai vuosikymmeniä ennen kuin mitään hyötyä (aikaa säästöä) olisi havaittavissa; ja tämä muuttaa toiminnan kontekstia ‘optimoinniksi’ ‘harrastukseksi’.

Tässä ei ole mitään väärää, kunhan et petä itseäsi siitä, että oikeasti tehdään todellisia säästöjä. Kuitenkin tämä on huono tapa, jota olen yrittänyt vastustaa viime aikoina; ja tekoälyn käytön mahdollisuus näyttää altistavan tälle, koska jopa huonot tai epäoptimaaliset tulokset voidaan saavuttaa paljon nopeammin kuin esimerkiksi JavaScriptissä ja muissa kielissä tehtävät makrot.

Harhaiset osoittimet

Mikä tutkimus jättää vähän huomiotta, on jännite serendipuisten tai onnekkaiden tuloksien välillä tekoälyn avulla ja sokeiden kuilujen ja turhauttavien yritysten välillä sovittaa tekoälychatboteja, kuten ChatGPT, omiin tarpeisiin – työvirran, josta voidaan luottaa, jopa pakotettujen päivitysten edessä uusiin versioihin, jotka eivät välttämättä toimi samalla tavalla kuin versio, jolle työvirta tai rutiini on perustunut.

‘Taika’ -tulos on se tilanne, jossa tekoäly ratkaisee ongelman helposti ja järkevällä tavalla.

Esimerkiksi jokaisella kertaa, kun arvostelenvaiheessa tutkin tutkimuksen, minun on tulostettava se, ja välttämättä minun on kirjoitettava sivunumerot lihavoituna ylälaidassa, koska ne ovat usein poissa tai pienellä fontilla alhaalla. Pyytäessäni ChatGPT:ltä Python-ohjelmaa, joka lisäisi suuren ja lihavoitu sivunumeron yläreunaan, se tuotti uskomattoman nopean tuloksen, joten nyt voin raahata ArXiv-PDF-tiedoston .BAT-tiedostoon ja saada uuden version, jossa on merkittävät sivunumerot, vain 2-3 sekunnissa:

Näkyvät sivunumerot lisätty PDF-tiedostoihin tekoälyllä kirjoitetulla Python-ohjelmalla.

Näkyvät sivunumerot lisätty PDF-tiedostoihin tekoälyllä kirjoitetulla Python-ohjelmalla.

Puolen minuutin tai parin kiistaa siitä, onko Windowsilla oma Arial Black -fontti (se ei ole enää), tämä oli mahdollisesti nopein kerta, kun tekoäly oli luonut jotain kestävästi ja säännöllisesti hyödyllistä minulle.

Voidaan väittää, että tämänkaltaiset ‘lennäkkäiset voitot’ antavat väärän käsityksen tekoälyn todellisesta kyvystä säästää aikaa ja/tai ponnistelua, koska meillä on luontainen taipumus tukahduttaa kivuliaita tai negatiivisia muistoja ja uudelleen käyttää tai keskittyä onnellisempiin muistoihin, mikä johtaa siihen, että onnistuneet tapaukset, joissa tekoäly ratkaisee pieniä tehtäviä hyödyllisellä tavalla, tulevat merkittäviksi, joita seurataan, vaikka ne ovat poikkeuksia eivätkä sääntö.

On olemassa kasvava näyttö siitä, että meillä on harhaluuloja tekoälyn hyödyllisyydestä. Vuonna 2025 tutkimus osoitti, että kehittäjät, jotka käyttivät tekoälyä, käyttivät 19 prosenttia enemmän aikaa ilman tekoälyä; ja toinen, uudempi tutkimus vahvistaa uuden tutkimuksen viestintää – että aika säästyy aikaa.

Olisi hyödyllistä, jos tämänkaltaista tutkimusta voitaisiin kääntää vanhanaikaiseen, tekoälyllä mahdollistettuun aikaa ja liikettä koskevaan tutkimukseen, jotta saisimme todellisia oivalluksia siitä, kuinka paljon tekoäly todella säästää – tai maksaa – aikaa.

Lopulta tutkimus on poikkeuksellinen myös siinä suhteessa, että se yrittää mittaamaan ‘mentaalista ponnistelua’ tekoälyn käytön suhteen. Koska yhä enemmän huomiota kiinnitetään tekoälyavusteisen työn ‘intensiteettiin’, tarvitsemme kiireesti luotettavia mittayksiköitä, jotka voivat mittaamaan, kuinka paljon tekoälyn vaatimukset ja erikoisuudet kuluttavat meitä, yleisemmän työn laadun ja työkyvyn kustannuksella.

 

* Muotoilu on kirjoittajien, alkuperäisestä tutkimuksesta. Sisäiset viittaukset on muunnettu hyperlinkkeiksi minun toimestani.

Julkaistu lauantaina, 23. toukokuuta 2026

Kirjailija tekoälystä, alan erikoisosaaja ihmiskuvien synteesissä. Entinen tutkimussisällön johtaja Metaphysic.ai:lla.
Henkilökohtainen sivu: martinanderson.ai
Ota yhteyttä: [email protected]