Andersons hoek

AI-gebruik kan taken langer laten duren, blijkt uit onderzoek

mm
AI-generated image (GPT-2): A man sits at breakfast while a group of identical domestic robots shave him, cut his hair, prepare his food, and clean the house around him, turning even the smallest daily tasks into outsourced labor.

Nieuw onderzoek suggereert dat AI eenvoudige taken langer kan laten duren, terwijl het gebruikers ervan overtuigt dat ze productiever worden.

 

Een nieuwe studie van Stanford, NYU en Princeton heeft aangetoond dat we AI vaak gebruiken, zelfs als het niet efficiënt is; en dat voor de kleinere taken die we aan AI overlaten, we vaak minder mentale inspanning zouden leveren en meer tijd zouden besparen door de taak zelf uit te voeren.

In drie door de onderzoekers uitgevoerde menselijke studies werd vastgesteld dat deelnemers routinematig onderschatten hoeveel tijd AI zou besparen op een voorgestelde taak, evenals aanzienlijk onderschatten hoeveel ze afhankelijk zijn van en daadwerkelijk AI gebruiken*.

‘In [de tweede studie] proberen we te begrijpen waarom mensen AI voor eenvoudige taken gebruiken, ondanks dat AI-gebruik geen efficiencyvoordelen biedt. Een hypothese is dat mensen niet goed zijn ingeschat hoeveel tijd en inspanning AI-ondersteuning bespaart.

‘Om deze hypothese te testen, hebben we de voorspelde versus daadwerkelijke tijd en inspanning vergeleken bij het uitvoeren van taken met en zonder AI-ondersteuning en hebben we efficiency-gain illusies geïdentificeerd, waarbij mensen zowel de tijd als de inspanning die AI bespaart, overschatten.

‘Gemiddeld voorspelden mensen dat AI-ondersteuning 55,7 seconden zou besparen, terwijl het slechts 7,5 seconden bespaarde. Deze miscalibratie is bijzonder ernstig bij eenvoudige varianten van taken, waarbij mensen voorspelden dat AI-ondersteuning tijd zou besparen, maar waarbij het in werkelijkheid taken trager maakte. ‘

Het nieuwe artikel, getiteld The efficiency-gain illusion: People underestimate the rate of AI use and overestimate its benefits on simple tasks, geschreven door zeven auteurs van de drie instellingen, concludeert ook dat eerder AI-gebruik toekomstig AI-gebruik lijkt te versterken, zelfs wanneer de technologie weinig of geen echte efficiencyvoordelen biedt.

Overzicht van de drie experimenten die zijn uitgevoerd om te onderzoeken hoe mensen AI gebruiken voor eenvoudige dagelijkse taken, waaruit blijkt dat gebruikers onderschatten hoe vaak ze afhankelijk zijn van AI, de tijd die het bespaart overschatten en vaker AI gebruiken na eerder blootstelling. Bron - https://arxiv.org/pdf/2605.22687

Overzicht van de drie experimenten die zijn uitgevoerd om te onderzoeken hoe mensen AI gebruiken voor eenvoudige dagelijkse taken, waaruit blijkt dat gebruikers onderschatten hoe vaak ze afhankelijk zijn van AI, de tijd die het bespaart overschatten en vaker AI gebruiken na eerder blootstelling. Bron

Gegevens uit de drie studies toonden aan dat mensen vaker AI gebruiken na eerder blootstelling, zelfs op manieren die niet productief of tijdbesparend zijn (d.w.z. minder mentale inspanning op de taak)*:

‘In tegenstelling tot de mogelijkheid dat ervaring de kalibratie verbetert [d.w.z. de mogelijkheid om te schatten hoe nuttig AI is voor een taak], hebben we een sessie-niveau carryover-effect geïdentificeerd, waarbij initieel AI-gebruik het latere AI-gebruik verhoogt.

‘Deelnemers die eerst taken met AI-ondersteuning hadden uitgevoerd, werden nog vaker AI-ondersteuning gebruiken bij eenvoudige taakvarianten, zelfs als dit geen tijd- of inspanningsbesparingen opleverde.

In een van de menselijke studies vonden de auteurs dat de besparingen die werden behaald met AI-gebruik geheel illusoir waren:

‘AI-ondersteuning kan [tegenwerken.] [We] vonden dat mensen die AI-ondersteuning gebruikten 7,06 seconden langer deden over taken dan mensen die de taken onafhankelijk uitvoerden en hogere inspanning rapporteerden.’

De studie was beperkt tot taken die vijf minuten of minder duurden, maar kan relevant zijn voor voormalige zoekmachineverslaafden die nu routinematig gebruikmaken van ChatGPT en andere populaire, geïndustrialiseerde LLM’s in plaats daarvan.

Studiegroepen

Over de verschillende gebruikersstudies heen werden taken ontwikkeld op basis van het Taxonomie van Gebruikersbehoeften en Acties (TUNA)-kader. De experimenten omvatten informatiezoeke; samenvatting; rekenen; spellingscontrole; herschrijven; en andere laag-complexiteitstaken die over het algemeen in minder dan vijf minuten konden worden voltooid.

De eerste studie vergeleek de voorspelde bereidheid van deelnemers om AI te gebruiken met hun daadwerkelijk gedrag tijdens taakuitvoering, om te onderzoeken of mensen een nauwkeurig begrip hebben van hun eigen afhankelijkheid van AI-ondersteuning.

De tweede studie richtte zich op de verwachte versus daadwerkelijke efficiencyvoordelen, door de verwachtingen van deelnemers over tijdbesparingen en vermindering van mentale inspanning te vergelijken met de gemeten voltooiingstijden en gerapporteerde werklast tijdens AI-ondersteunde en onafhankelijke taakuitvoering.

De derde studie onderzocht of eerder blootstelling aan AI het latere besluitvormingsproces verandert, door te volgen of deelnemers die eerder taken met AI hadden uitgevoerd, vaker AI-ondersteuning zouden gebruiken bij latere taken.

Overdenken – AI-gebruik bij eenvoudige taken

Om te begrijpen of mensen een nauwkeurig begrip hebben van hun eigen afhankelijkheid van AI, werden deelnemers in een sessie gevraagd om vier taken uit te voeren, met de optie om AI-ondersteuning te gebruiken voor elke taak. Het niveau waarop de deelnemers daadwerkelijk AI gebruikten, werd vergeleken met hun eigen eerdere schatting van hoeveel ze dachten dat ze het zouden gebruiken, met aanzienlijke dissonantie in de resultaten:

Deelnemers overschatten consequent hoe vaak ze naar AI zouden grijpen voor eenvoudige taken, met een grotere kloof bij eenvoudige prompts waarbij het daadwerkelijke AI-gebruik tot 38% steeg tegen een voorspelde rate van 20%, wat suggereert dat gewoontegematig delegeren aan AI verder gaat dan de bewustzijn van gebruikers.

Deelnemers overschatten consequent hoe vaak ze naar AI zouden grijpen voor eenvoudige taken, met een grotere kloof bij eenvoudige prompts waarbij het daadwerkelijke AI-gebruik tot 38% steeg tegen een voorspelde rate van 20%, wat suggereert dat gewoontegematig delegeren aan AI verder gaat dan de bewustzijn van gebruikers.

De auteurs stellen:

‘We vinden dat [mensen] inderdaad AI aanzienlijk vaker gebruiken dan de gemiddelde voorspelde rate. Gemiddeld meldden deelnemers dat ze AI in 33% van de taken zouden gebruiken, maar het populatie-niveau van AI-gebruik is 47% (β = 1,07, p < 0,001).

‘Deze kloof is groter voor eenvoudige taakvarianten (β = 0,69, p < 0,001): deelnemers voorspelden een AI-gebruik van 20%, maar het daadwerkelijke AI-gebruik was 38% (β = 1,42, p < 0,001), bijna het dubbele van de gestelde voorkeursrate.’

De experimenten richtten zich op gewone lage-inspanningstaken die veel mensen nu routinematig aan AI overlaten, zelfs als dit onnodig is. Deelnemers werden gevraagd om eenvoudige activiteiten uit te voeren die feitelijk herinneren, rekenen, spellingscontrole, herschrijven van korte passages, samenvatting van tekst en het beantwoorden van basisredeneringsvragen omvatten, waarbij sommige taken slechts een paar woorden of een enkele zin vereisten om te voltooien.

De studie omvatte ook iets moeilijkere versies van dezelfde activiteiten, waardoor de onderzoekers konden vergelijken of AI-gebruik veranderde naarmate het werk moeilijker werd.

AI-tijdbesparingsvoordelen overschat

In de tweede studie werden deelnemers in twee aparte groepen verdeeld, waarvan de ene groep eerst schatte hoeveel tijd en mentale inspanning AI zou besparen op een reeks taken, terwijl de andere groep diezelfde taken daadwerkelijk uitvoerde, met of zonder AI-ondersteuning. De taken richtten zich op lage-complexiteitstaken die rekenen, herschrijven, feitelijk herinneren, samenvatting, spellingscontrole en korte redeneringoefeningen omvatten.

Het doel was om de verwachtingen van mensen over AI-productiviteit te vergelijken met wat er werkelijk gebeurde toen het werk werd uitgevoerd. Volgens het artikel overschatten deelnemers consequent hoeveel AI zou helpen, vooral bij eenvoudige taken waar veel mensen aannamen dat AI de werklast en voltooiingstijd aanzienlijk zou verminderen.

In plaats daarvan toonden de gemeten resultaten vaak slechts kleine voordelen, en in sommige gevallen, zoals eerder vermeld, vertraagde AI-gebruik de deelnemers zelfs. Het artikel meldt dat mensen verwachtten dat AI-ondersteuning gemiddeld bijna een minuut zou besparen, terwijl de daadwerkelijke tijdbesparingen slechts een paar seconden waren.

Bij sommige eenvoudigere taken deden AI-gebruikers inderdaad langer over het voltooien van taken dan mensen die het werk onafhankelijk uitvoerden:

Voorspelde versus daadwerkelijke tijd en mentale inspanning bij AI-ondersteunde en onafhankelijke taakuitvoering, waaruit het door het artikel voorgestelde 'snelheidsillusie' blijkt, waarbij deelnemers consequent geloofden dat AI veel meer tijd zou besparen dan het werkelijk deed. De daadwerkelijke AI-ondersteunde voltooiingstijden waren aanzienlijk langer dan voorspeld, terwijl de schattingen voor onafhankelijke taakuitvoering veel dichter bij de waargenomen resultaten lagen.

Voorspelde versus daadwerkelijke tijd en mentale inspanning bij AI-ondersteunde en onafhankelijke taakuitvoering, waaruit het door het artikel voorgestelde ‘snelheidsillusie’ blijkt, waarbij deelnemers consequent geloofden dat AI veel meer tijd zou besparen dan het werkelijk deed. De daadwerkelijke AI-ondersteunde voltooiingstijden waren aanzienlijk langer dan voorspeld, terwijl de schattingen voor onafhankelijke taakuitvoering veel dichter bij de waargenomen resultaten lagen.

De studie onderzocht ook de waargenomen mentale inspanning. Deelnemers geloofden vaak dat AI taken aanzienlijk gemakkelijker zou maken; toch was de gemeten reductie van cognitieve inspanning veel kleiner dan verwacht. Het artikel karakteriseert dit als een ‘efficiency-gain illusie’, waarbij mensen systematisch zowel de snelheid als de nuttigheid van AI-ondersteuning bij eenvoudige dagelijkse werkzaamheden overschatten.

AI-gebruik versterkt de illusie

De laatste van de drie studies was ontworpen om te testen of zelfs korte blootstelling aan AI het latere besluitvormingsproces verandert. Deelnemers werden in meerdere groepen verdeeld en eerst door een ‘blootstellingsfase’, waarin sommigen eenvoudige taken met AI-ondersteuning uitvoerden; sommigen moeilijkere taken met AI-ondersteuning uitvoerden; en anderen dezelfde categorieën taken onafhankelijk uitvoerden, zonder AI. Een aparte controlegroep sloeg de taakfase helemaal over.

Vervolgens gingen alle groepen een tweede ‘testfase’ in, deze keer met nieuwe en eenvoudige taken, en mochten ze zelf beslissen of ze AI wilden gebruiken of niet. De taken richtten zich op lage-complexiteitstaken (d.w.z. herschrijven, rekenen, herinneren, spellingscontrole, samenvatting en korte redeneringoefeningen) die elk in slechts een paar minuten konden worden voltooid.

Het artikel meldt dat deelnemers die eerder AI hadden gebruikt tijdens de blootstellingsfase, aanzienlijk vaker AI-ondersteuning kozen tijdens de latere testfase, zelfs als eerder AI-gebruik vaak geen tijd- of inspanningsbesparingen had opgeleverd.

De onderzoekers vonden dat eerder AI-gebruik de latere keuze voor AI-ondersteuning verhoogde:

Deelnemers die eerder AI hadden gebruikt tijdens de blootstellingsfase, werden aanzienlijk vaker AI-ondersteuning gebruiken tijdens latere taken, ondanks dat eerder AI-gebruik vaak geen significante voordelen had opgeleverd in termen van snelheid of vermindering van mentale inspanning. Het linkervak toont aan dat eerder AI-gebruikers AI-ondersteuning vaker kozen tijdens de latere testfase dan deelnemers die eerder taken onafhankelijk hadden uitgevoerd. Het rechtervak illustreert de door het artikel voorgestelde 'snelheidsillusie', waarbij eerder AI-blootstelling de overtuiging van deelnemers verhoogde dat AI-ondersteund werk sneller en efficiënter was, zelfs als de gemeten voltooiingstijden vaak weinig voordeel en soms langzamere prestaties toonden. Samen suggereren de resultaten dat korte blootstelling aan AI zowel toekomstig AI-gebruik verhoogt als de overtuiging van gebruikers over de nuttigheid van AI versterkt.

Deelnemers die eerder AI hadden gebruikt tijdens de blootstellingsfase, werden aanzienlijk vaker AI-ondersteuning gebruiken tijdens latere taken, ondanks dat eerder AI-gebruik vaak geen significante voordelen had opgeleverd in termen van snelheid of vermindering van mentale inspanning. Het linkervak toont aan dat eerder AI-gebruikers AI-ondersteuning vaker kozen tijdens de latere testfase dan deelnemers die eerder taken onafhankelijk hadden uitgevoerd. Het rechtervak illustreert de door het artikel voorgestelde ‘snelheidsillusie’, waarbij eerder AI-blootstelling de overtuiging van deelnemers verhoogde dat AI-ondersteund werk sneller en efficiënter was, zelfs als de gemeten voltooiingstijden vaak weinig voordeel en soms langzamere prestaties toonden.

Herhaalde AI-blootstelling wordt gemeld als een vertekening van het oordeel van deelnemers over de werkelijke nuttigheid van AI: mensen die eerder AI hadden gebruikt, werden minder geneigd om toe te geven dat taken zonder AI sneller konden worden uitgevoerd, ondanks dat de gemeten resultaten vaak weinig voordeel en soms langzamere voltooiingstijden toonden.

De onderzoekers beweren dat dit een ‘zelfversterkende cyclus’ creëert, waarbij AI-gebruik toekomstige afhankelijkheid van AI verhoogt, terwijl het tegelijkertijd de mogelijkheid van gebruikers om de productiviteit van AI te beoordelen, verzwakt.

Conclusie

Mening Veel lezers die AI voor kleine taken hebben geadopteerd, kunnen, net als ik, een gevoel van herkenning hebben bij de conclusies van het nieuwe artikel.

Persoonlijk gaat mijn obsessie om repetitieve taken te automatiseren de huidige AI-boom met enkele decennia vooruit. Toen, net als nu, was de vraag: Is de inspanning die nodig is om de automatisering op te zetten en/of te onderhouden, groter dan de geschatte (menselijke) inspanning om de taak zonder automatisering uit te voeren?

Diegenen die van automatisering houden, kunnen uiteindelijk automatiseren voor de sake van het automatiseren, zelfs als het jaren of decennia duurt voordat er enig rendement (in termen van bespaarde tijd) zichtbaar wordt; en dit verandert de context van de activiteit van ‘optimalisatie’ in ‘hobby’.

Er is niets mis mee, zolang je jezelf niet voor de gek houdt dat er echte voordelen worden behaald. Niettemin is dit een slechte gewoonte die ik de afgelopen jaren heb geprobeerd te weerstaan; en de optie om AI te gebruiken, lijkt de laatste tijd vatbaar voor het verergeren ervan, aangezien zelfs slechte of niet-optimale resultaten veel sneller kunnen worden behaald dan, bijvoorbeeld, wanneer macros in JavaScript en andere talen worden geschreven.

Misleidende indicatoren

Wat het artikel een beetje verwaarloost, is de spanning tussen serendipitische of gelukkige resultaten via AI en de dominantie van blinde steegjes en gefrustreerde pogingen om beschikbare AI-chatbots, zoals ChatGPT, aan te passen aan hun eigen behoeften – in een workflow die kan worden vertrouwd, zelfs in het licht van gedwongen upgrades naar nieuwe versies die niet op dezelfde manier werken als de versie waarop uw workflow of routine was gebaseerd.

Een ‘magisch’ resultaat is dus dat moment waarop AI onmiddellijk uw probleem oplost op een eenvoudige en rationele manier.

Elke keer dat ik een artikel beoordeel, moet ik het afdrukken en moet ik altijd paginanummers in vet bovenaan schrijven, omdat deze meestal ontbreken of in kleine letters onderaan staan. Het vragen aan ChatGPT om een Python-script te produceren dat een grote en vet paginanummer bovenaan zou toevoegen, bleek een ongelooflijk snel resultaat op te leveren, aangezien ik nu een Arxiv-PDF naar een .BAT-bestand kan slepen en een nieuwe versie met duidelijke paginanummers in 2-3 seconden kan krijgen:

Zichtbare paginanummers toegevoegd aan PDF's via een door AI geschreven Python-script.

Zichtbare paginanummers toegevoegd aan PDF’s via een door AI geschreven Python-script.

Afgezien van een minuut of twee van discussie over of Windows een native en apart Arial Black-lettertype heeft (het heeft het niet meer), was dit mogelijk het snelste dat AI ooit iets persistently en regelmatig nuttigs voor me had gemaakt.

Betwistbaar geeft dit soort ‘doorbraak’ of ‘gemakkelijke overwinning’ een vals beeld van de werkelijke capaciteit van AI om tijd en/of mentale inspanning te besparen, omdat we de neiging hebben om dergelijke voorbeelden onevenredig veel aandacht te geven: onze natuurlijke neiging om pijnlijke of negatieve herinneringen te onderdrukken en om gelukkige herinneringen te hergebruiken of te centreren betekent dat succesvolle voorbeelden waarin AI kleine taken op een nuttige manier oplost, als een soort lichtpunt kunnen fungeren dat we zullen nastreven, zelfs tegen de trend van statistisch bewijs, zoals aangetoond in het nieuwe artikel, en zelfs tegen onze eigen ervaring dat dergelijke ‘gemakkelijke overwinningen’ uitzonderingen zijn en niet de regel.

Er is groeiend bewijs, naast het nieuwe artikel, dat we onszelf voor de gek houden over de nuttigheid van AI. In 2025 toonde een studie aan dat ontwikkelaars die AI gebruikten 19% langer deden over taken dan zonder AI; en een recentere studie bevestigt de onderliggende boodschap van het nieuwe artikel dat in dit artikel wordt besproken – dat tijd besparen kost tijd.

Het zou nuttig zijn als onderzoek van deze soort kon worden omgezet in een (onvermijdelijk AI-gebaseerde) ouderwetse tijd- en bewegingsstudie, waardoor we echte inzichten kunnen krijgen in de mate waarin AI ons werkelijk tijd bespaart – of kost.

Tenslotte is de studie uitzonderlijk in een ander belangrijk opzicht, omdat het tenminste een poging doet om ‘mentale inspanning’ in verband met het gebruik van AI voor minder belangrijke taken te kwantificeren. Aangezien de aandacht steeds meer gericht is op de ‘intensiteit‘ van AI-ondersteund werk, hebben we dringend behoefte aan betrouwbare eenheden van meting die de mate waarin de eisen en eigenaardigheden van AI ons uitputten of verzwakken, kunnen kwantificeren, ten koste van de algemene kwaliteit van het werk en de geschiktheid voor het werk.

 

* Opmaak is van de auteurs, uit het bronartikel. Eventuele inline-citaten zijn door mij omgezet in hyperlinks.

Eerst gepubliceerd op zaterdag 23 mei 2026

Schrijver over machine learning, domeinspecialist in menselijke beeldsynthese. Voormalig hoofd onderzoekscontent bij Metaphysic.ai.