Andersons Blickwinkel
KI-Nutzung kann Aufgaben länger dauern lassen, zeigt Forschung

Neue Forschung legt nahe, dass KI einfache Aufgaben länger dauern lassen kann, während sie die Nutzer davon überzeugt, produktiver zu werden.
Eine neue Studie von Stanford, NYU und Princeton hat ergeben, dass wir häufig KI verwenden, auch wenn es ineffizient ist; und dass wir für die kleineren Aufgaben, die wir zwanghaft an KI auslagern, oft weniger geistige Anstrengung aufwenden und mehr Zeit sparen würden, wenn wir die Aufgabe selbst erledigen würden.
In drei menschlichen Studien, die für die Forschung in Auftrag gegeben wurden, fanden die Autoren heraus, dass die Teilnehmer routinemäßig unterschätzten, wie viel Zeit KI ihnen bei einer vorgeschlagenen Aufgabe sparen würde, sowie deutlich unterschätzten, wie sehr sie von KI abhängig sind und tatsächlich KI verwenden*.
‘In [der zweiten Studie] versuchen wir, zu verstehen, warum Menschen KI für einfache Aufgaben verwenden, obwohl KI keine Effizienzvorteile bietet. Eine Hypothese ist, dass Menschen falsch kalibriert sind, wie viel Zeit und Anstrengung KI-Assistenz spart.
‘Um diese Hypothese zu testen, verglichen wir die vorhergesagten und tatsächlichen Zeiten und Anstrengungen der Teilnehmer bei der Erledigung dieser Aufgaben mit und ohne KI-Assistenz und identifizierten Effizienzgewinn-Illusionen, bei denen Menschen sowohl die Zeit als auch die Anstrengung, die KI spart, überschätzen.
‘Im Durchschnitt sagten die Menschen voraus, dass KI-Assistenz 55,7 Sekunden sparen würde, während sie tatsächlich nur 7,5 Sekunden sparte. Diese Fehlkalibrierung ist besonders gravierend bei den einfachen Varianten der Aufgaben, bei denen die Menschen vorhersagten, dass KI-Assistenz Zeit sparen würde, aber tatsächlich die Aufgaben langsamer erledigten.’
Die neue Studie, die den Titel Die Effizienzgewinn-Illusion: Menschen unterschätzen die Rate der KI-Nutzung und überschätzen ihre Vorteile bei einfachen Aufgaben trägt und von sieben Autoren aus den drei Institutionen verfasst wurde, zeigt auch, dass vorherige KI-Nutzung zukünftige KI-Nutzung zu verstärken scheint, selbst wenn die Technologie wenig oder keinen realen Effizienzgewinn bietet.

Überblick über die drei Experimente, die verwendet wurden, um zu testen, wie Menschen KI für einfache alltägliche Aufgaben verwenden, und die zeigen, dass Benutzer unterschätzen, wie oft sie auf KI angewiesen sind, die Zeit, die KI spart, überschätzen und eher bereit sind, KI wieder zu verwenden, nachdem sie sie zuvor verwendet haben. Quelle
Daten aus den drei Studien zeigen, dass Menschen eher bereit sind, KI zu verwenden, nachdem sie sie zuvor verwendet haben, selbst wenn dies nicht produktiv oder zeitsparend ist, oder sogar stresssparend (d. h. weniger geistige Anstrengung auf die Aufgabe verwenden)*:
‘Im Gegensatz zur Möglichkeit, dass Erfahrung die Kalibrierung verbessert [d. h. die Fähigkeit, zu schätzen, wie nützlich KI für eine Aufgabe ist], identifizierten wir einen Sitzungsübergangseffekt, bei dem die anfängliche KI-Nutzung die spätere KI-Nutzung erhöht.
‘Teilnehmer, die anfänglich Aufgaben mit KI erledigten, wurden eher bereit, KI-Assistenz für einfache Aufgabenvarianten zu wählen, obwohl dies im Durchschnitt keine Zeit- oder Anstrengungseinsparungen bot.’
In einer der menschlichen Studien fanden die Autoren heraus, dass die durch KI-Nutzung erzielten Einsparungen vollständig illusorisch waren:
‘KI-Assistenz kann [kontraproduktiv sein]. [Wir] fanden heraus, dass Menschen, die sich für KI entschieden, 7,06 Sekunden länger brauchten als Menschen, die die Aufgaben unabhängig erledigten, und höhere Anstrengung berichteten.’
Die Studie beschränkte sich auf Aufgaben, die fünf Minuten oder weniger dauerten, aber möglicherweise bei ehemaligen Suchmaschinen-Abhängigen Anklang finden, die jetzt routinemäßig auf ChatGPT und andere beliebte, kommerzielle LLMs zurückgreifen.
Studiengruppen
Über die verschiedenen Benutzerstudien hinweg wurden Aufgaben auf der Grundlage des Taxonomie der Benutzerbedürfnisse und -aktionen (TUNA)-Frameworks entwickelt. Die Experimente umfassten Informationsabruf; Zusammenfassung; Arithmetik; Rechtschreibkorrektur; Umschreibung; und andere Aufgaben mit geringer Komplexität, die im Allgemeinen in weniger als fünf Minuten abgeschlossen werden konnten.
Die erste Studie verglich die vorhergesagte Bereitschaft der Teilnehmer, KI zu verwenden, mit ihrem tatsächlichen Verhalten während der Aufgabenerledigung und untersuchte, ob Menschen ihre eigene Abhängigkeit von KI-Assistenz genau verstehen.
Die zweite Studie konzentrierte sich auf die wahrgenommene versus tatsächliche Effizienzgewinne, indem die Erwartungen der Teilnehmer über Zeitersparnis und reduzierte geistige Anstrengung mit den tatsächlichen Abschlusszeiten und der berichteten Arbeitsbelastung während KI-gestützter und unabhängiger Aufgabenerledigung verglichen wurden.
Die dritte Studie untersuchte, ob vorherige KI-Exposition die spätere Entscheidungsfindung beeinflusste, indem sie verfolgte, ob Teilnehmer, die zuvor Aufgaben mit KI erledigt hatten, eher bereit waren, KI wieder zu verwenden, während späterer Aufgaben.
Überdenken – KI-Nutzung bei einfachen Aufgaben
Um zu verstehen, ob Menschen ihre eigene Abhängigkeit von KI genau schätzen, wurden Studienteilnehmer in einer Sitzung aufgefordert, vier Aufgaben zu erledigen, wobei sie die Option hatten, KI-Assistenz für jede Aufgabe zu verwenden. Das Maß, in dem die Teilnehmer tatsächlich KI verwendeten, wurde mit ihrer eigenen vorherigen Schätzung verglichen, wie sehr sie glaubten, sie würden es verwenden, wobei erhebliche Dissonanz in den Ergebnissen deutlich wurde:

Teilnehmer unterschätzten konsequent, wie oft sie sich für KI bei einfachen Aufgaben entscheiden würden, wobei die Lücke bei einfacheren Anfragen, bei denen die tatsächliche KI-Nutzung auf 38 % gegenüber einer vorhergesagten Rate von 20 % anstieg, sich verbreiterte, was darauf hindeutet, dass die gewohnheitsmäßige Delegation an KI weit über das Bewusstsein der Benutzer hinausgeht.
Die Autoren stellen fest:
‘Wir finden, dass [Menschen] tatsächlich KI erheblich mehr verwenden als die durchschnittliche vorhergesagte Rate. Im Durchschnitt sagten die Teilnehmer, dass sie KI in 33 % der Aufgaben verwenden würden, aber die Bevölkerungsrate der KI-Nutzung beträgt 47 % (β = 1,07, p < 0,001).
‘Diese Lücke ist größer für einfache Aufgabenvarianten (β = 0,69, p < 0,001): Teilnehmer sagten vorher, dass sie KI in 20 % der Aufgaben verwenden würden, aber die tatsächliche KI-Nutzungsrate betrug 38 % (β = 1,42, p < 0,001), fast doppelt so hoch wie die angegebene Vorliebe.’
Die Experimente konzentrierten sich auf gewöhnliche, geringe Anstrengung erfordernende Aufgaben, die viele Menschen jetzt routinemäßig an KI auslagern, auch wenn dies möglicherweise nicht notwendig ist. Die Teilnehmer wurden aufgefordert, einfache Aktivitäten durchzuführen, die tatsächliche Erinnerung, Arithmetik, Rechtschreibkorrektur, Umschreibung kurzer Passagen, Zusammenfassung von Texten und Beantwortung von grundlegenden Vernunftfragen umfassten, wobei einige Aufgaben nur ein paar Wörter oder einen Satz erforderten, um abgeschlossen zu werden.
Die Studie umfasste auch leicht schwierigere Versionen derselben Aktivitäten, um es den Forschern zu ermöglichen, zu vergleichen, ob die KI-Nutzung sich änderte, wenn die Arbeit anspruchsvoller wurde.
KI-Zeitersparnis-Vorteile überschätzt
In der zweiten Studie wurden die Teilnehmer in zwei separate Gruppen aufgeteilt, wobei eine Gruppe zunächst schätzte, wie viel Zeit und geistige Anstrengung KI bei einer Reihe von Aufgaben sparen würde, während eine andere Gruppe diese Aufgaben tatsächlich entweder unabhängig oder mit KI-Assistenz erledigte. Die Aufgaben konzentrierten sich erneut auf Aufgaben mit geringer Komplexität, die Arithmetik, Umschreibung, tatsächliche Erinnerung, Zusammenfassung, Rechtschreibkorrektur und kurze Vernunftübungen umfassten.
Das Ziel bestand darin, die Erwartungen der Menschen über die Produktivität von KI mit dem zu vergleichen, was tatsächlich passierte, wenn die Arbeit erledigt wurde. Laut dem Papier überschätzten die Teilnehmer konsequent, wie sehr KI ihnen helfen würde, insbesondere bei einfacheren Aufgaben, bei denen viele annahmen, dass KI die Arbeitsbelastung und die Abschlusszeit erheblich reduzieren würde.
Stattdessen zeigten die gemessenen Ergebnisse oft nur geringe Gewinne, und in einigen Fällen, wie bereits erwähnt, verlangsamte die KI-Nutzung die Teilnehmer tatsächlich. Das Papier berichtet, dass die Menschen erwarteten, dass KI-Assistenz im Durchschnitt fast eine Minute sparen würde, während die tatsächlichen Zeitersparnisse nur wenige Sekunden betrugen.
Bei einigen einfacheren Aufgaben dauerte es tatsächlich länger, die Arbeit abzuschließen, wenn KI verwendet wurde, als wenn die Arbeit unabhängig erledigt wurde:

Vorhergesagte versus tatsächliche Zeit und geistige Anstrengung während KI-gestützter und unabhängiger Aufgabenerledigung, die die ‘Geschwindigkeitsillusion’ des Papiers aufzeigt, bei der Teilnehmer konsequent glaubten, KI würde viel mehr Zeit sparen, als es tatsächlich tat. Die tatsächlichen KI-gestützten Abschlusszeiten waren erheblich länger als vorhergesagt, während die Schätzungen für die unabhängige Aufgabenerledigung viel näher an den beobachteten Ergebnissen lagen.
Die Studie untersuchte auch die wahrgenommene geistige Anstrengung. Die Teilnehmer glaubten oft, dass KI die Aufgaben erheblich einfacher machen würde; dennoch war die tatsächliche Reduzierung der geistigen Anstrengung viel geringer als erwartet. Das Papier bezeichnet dies als ‘Effizienzgewinn-Illusion’, bei der Menschen systematisch sowohl die Geschwindigkeit als auch die Nützlichkeit der KI-Assistenz bei einfachen alltäglichen Aufgaben überschätzen.
KI-Nutzung vertieft die Täuschung
Die letzte der drei Studien wurde designed, um zu testen, ob sogar kurze KI-Exposition die spätere Entscheidungsfindung beeinflusst. Die Teilnehmer wurden in mehrere Gruppen aufgeteilt und zunächst einer ‘Expositionsphase’ unterzogen, in der einige einfache Aufgaben mit KI-Assistenz erledigten; einige schwierigere Aufgaben mit KI-Assistenz erledigten; und andere die gleichen Kategorien von Aufgaben unabhängig, ohne KI, erledigten. Eine separate Kontrollgruppe übersprang die Aufgabenphase ganz.
Anschließend traten alle Gruppen in eine zweite ‘Testphase’ ein, diesmal mit neuen und einfacheren Aufgaben, und durften selbst entscheiden, ob sie KI verwenden wollten oder nicht. Die Aufgaben konzentrierten sich erneut auf Aufgaben mit geringer Komplexität (d. h. Umschreibung, Arithmetik, Erinnerung, Rechtschreibkorrektur, Zusammenfassung und kurze Vernunftübungen), die jeweils in nur wenigen Minuten abgeschlossen werden konnten.
Das Papier berichtet, dass Teilnehmer, die bereits KI während der Expositionsphase verwendet hatten, wesentlich eher bereit waren, KI wieder zu verwenden, auch wenn die vorherige KI-Nutzung nicht immer Zeit oder geistige Anstrengung gespart hatte.
Die Forscher fanden heraus, dass vorherige KI-Nutzer KI-Assistenz während der späteren Testphase viel häufiger wählten als Teilnehmer, die zuvor Aufgaben unabhängig erledigt hatten:

Teilnehmer, die zuvor KI während der Expositionsphase verwendet hatten, wurden wesentlich eher bereit, KI wieder zu verwenden, während späterer Aufgaben, obwohl die vorherige KI-Nutzung nicht immer Zeit oder geistige Anstrengung gespart hatte. Die linke Seite zeigt, dass vorherige KI-Nutzer KI-Assistenz während der späteren Testphase viel häufiger wählten als Teilnehmer, die zuvor Aufgaben unabhängig erledigt hatten. Die rechte Seite veranschaulicht die ‘Geschwindigkeitsillusion’ des Papiers, bei der vorherige KI-Exposition die Überzeugung der Teilnehmer erhöhte, dass KI-gestützte Arbeit schneller und effizienter ist, obwohl die tatsächlichen Abschlusszeiten oft wenig Nutzen und manchmal sogar langsameres Verhalten zeigten.
Wiederholte KI-Exposition wird berichtet, um das Urteil der Teilnehmer über die tatsächliche Nützlichkeit von KI zu verzerren: Menschen, die bereits KI verwendet hatten, wurden weniger bereit, zuzustimmen, dass die Aufgaben tatsächlich ohne KI schneller erledigt werden könnten, obwohl die tatsächlichen Ergebnisse oft wenig Nutzen und manchmal sogar langsameres Verhalten zeigten.
Die Forscher argumentieren, dass dies die Bedingungen für einen ‘selbstverstärkenden Zyklus’ schafft, bei dem KI-Nutzung die zukünftige Abhängigkeit von KI erhöht, während gleichzeitig die Fähigkeit der Benutzer, die Produktivität von KI genau zu beurteilen, geschwächt wird.
Schlussfolgerung
Meinung Viele Leser, die KI für kleine Aufgaben verwendet haben, mögen, wie ich, eine gewisse Vertrautheit mit den Schlussfolgerungen des neuen Papiers verspüren.
Persönlich geht meine Obsession, repetitive Aufgaben zu automatisieren, den aktuellen KI-Boom um mehrere Jahrzehnte voraus. Damals, wie jetzt, bleibt die Frage: Übersteigt der Aufwand, der mit der Einrichtung und/oder dem Unterhalt der Automatisierung verbunden ist, den geschätzten (menschlichen) Aufwand, die Aufgabe ohne Automatisierung zu erledigen?
Diejenigen, die Automatisierung lieben, könnten am Ende automatisieren, nur weil es automatisiert wird, auch wenn es Jahre oder Jahrzehnte dauern würde, bis sich eine Rendite (in Form von eingesparter Zeit) abzeichnet; und dies ändert den Kontext der Aktivität von ‘Optimierung’ zu ‘Hobby’.
Es gibt nichts falsch daran, solange man sich nicht selbst täuscht, dass tatsächliche Gewinne erzielt werden. Dennoch ist dies eine schlechte Angewohnheit, die ich in den letzten Jahren zu überwinden versucht habe; und die Option, KI zu verwenden, scheint anfällig zu sein, dies zu verschlimmern, da sogar schlechte oder nicht optimale Ergebnisse viel schneller erzielt werden können als beispielsweise durch das Erstellen von Makros in JavaScript und anderen Sprachen.
Täuschende Indikatoren
Was das Papier ein wenig vernachlässigt, ist die Spannung zwischen serendipischen oder glücklichen Ergebnissen durch KI und der Vorherrschaft von Sackgassen und frustrierten Versuchen, verfügbare KI-Chatbots wie ChatGPT an die eigenen Bedürfnisse anzupassen – in einem Arbeitsablauf, der verlässlich sein kann, selbst angesichts erzwungener Upgrades auf neue Versionen, die nicht auf die gleiche Weise funktionieren wie die Version, auf der der Arbeitsablauf oder die Routine konditioniert wurde.
Ein ‘magisches’ Ergebnis ist jene Gelegenheit, bei der KI das Problem sofort auf einfache und rationale Weise löst.
Beispielsweise muss ich bei jeder Papierbesprechung ausdrucken und unweigerlich die Seitenzahlen in fetter Schrift oben hinzufügen, da diese normalerweise fehlen oder in kleiner Schrift am unteren Rand stehen. Die Anfrage an ChatGPT, ein Python-Skript zu erstellen, das eine große und fette Seitenzahl oben hinzufügt, ergab ein unglaublich schnelles Ergebnis, da ich jetzt ein Arxiv-PDF auf eine .BAT-Datei ziehen und eine neue Version mit prominenten Seitenzahlen in 2-3 Sekunden erhalten kann:

Offensichtliche Seitenzahlen, die durch ein KI-geschriebenes Python-Skript zu PDFs hinzugefügt wurden.
Abgesehen von einem oder zwei Minuten Streit darüber, ob Windows eine native und separate Arial Black-Schriftart hat (es gibt sie nicht mehr), war dies möglicherweise das schnellste Mal, dass KI etwas Persönliches und Regelmäßiges für mich erstellt hat.
Man könnte argumentieren, dass diese Art von ‘Durchbruch’ oder ‘leichtem Gewinn’ einen falschen Eindruck von der tatsächlichen Fähigkeit von KI vermittelt, Zeit und/oder geistige Anstrengung zu sparen, da wir solche Instanzen unverhältnismäßig viel Gewicht beimessen: unsere natürliche Neigung, schmerzhafte oder negative Erinnerungen zu unterdrücken und glücklichere Erinnerungen wiederzuverwenden oder zu betonen, bedeutet, dass erfolgreiche Instanzen, bei denen KI kleine Aufgaben auf nützliche Weise löst, zu einem Leitstern werden, dem wir verfolgen, selbst gegen den Trend der statistischen Beweise, wie im neuen Papier gezeigt, und selbst gegen unsere eigene Erfahrung, dass solche ‘leichten Gewinne’ die Ausnahme und nicht die Regel sind.
Es gibt zunehmend Beweise, abgesehen von dem neuen Papier, dass wir uns selbst über die Nützlichkeit von KI täuschen. Im Jahr 2025 zeigte eine Studie, dass Entwickler, die KI verwendeten, 19 % länger brauchten als ohne KI; und eine weitere aktuellere Studie bestätigt die zugrunde liegende Botschaft des neuen Papiers, das in diesem Artikel diskutiert wird – dass Zeit sparen, braucht Zeit.
Es wäre nützlich, wenn Forschung dieser Art in eine (unvermeidlich KI-gestützte) altmodische Zeit- und Bewegungsstudie übersetzt werden könnte, um uns echte Einblicke in den Umfang zu geben, in dem KI tatsächlich Zeit spart oder uns kostet.
Schließlich ist die Studie in einem weiteren wichtigen Aspekt bemerkenswert, da sie zumindest versucht, ‘geistige Anstrengung’ im Hinblick auf die Verwendung von KI bei geringeren Aufgaben zu quantifizieren. Da zunehmend die Aufmerksamkeit auf die ‘Intensität’ der KI-gestützten Arbeit konzentriert wird, benötigen wir dringend zuverlässige Messungen, die den Umfang quantifizieren können, in dem die Anforderungen und Eigenheiten von KI uns erschöpfen oder entkräften, auf Kosten der allgemeinen Arbeitsqualität und der Eignung für die Arbeit.
* Formatierung ist die der Autoren, aus dem Quellenpapier. Alle Inline-Zitate wurden von mir in Hyperlinks umgewandelt.
Erstveröffentlicht am Samstag, den 23. Mai 2026












