Kąt Andersona

Użycie AI może sprawić, że zadania potrwają dłużej, wynika z badań

mm
AI-generated image (GPT-2): A man sits at breakfast while a group of identical domestic robots shave him, cut his hair, prepare his food, and clean the house around him, turning even the smallest daily tasks into outsourced labor.

Naukowcy odkryli, że AI może sprawić, że proste zadania potrwają dłużej, a użytkownicy będą przekonani, że stają się bardziej produktywni.

 

Naukowcy z Uniwersytetu Stanforda, NYU i Princeton odkryli, że często używamy AI, nawet gdy jest to niewydajne, a w przypadku mniejszych zadań, które zlecamy AI, często wydatkujemy mniej wysiłku umysłowego i oszczędzamy więcej czasu, wykonując zadanie samodzielnie.

W trzech badaniach nad ludźmi, zleconych w ramach badań, autorzy stwierdzili, że uczestnicy systematycznie nieprawidłowo szacowali, ile czasu AI zaoszczędzi im na danym zadaniu, a także znacznie zaniżali, jak bardzo polegają na AI*.

‘W [drugim badaniu], staraliśmy się zrozumieć, dlaczego ludzie mogą używać AI do prostych zadań, pomimo że AI nie zapewnia korzyści wydajnościowych. Jedna z hipotez jest taka, że ludzie są nieprawidłowo skalibrowani, jeśli chodzi o czas i wysiłek, który AI oszczędza.

‘Aby przetestować tę hipotezę, porównaliśmy przewidywane i rzeczywiste czasy oraz wysiłek potrzebny do wykonania zadań z i bez pomocy AI, i zidentyfikowaliśmy iluzję zysku wydajności, gdzie ludzie przeszacowali zarówno czas, jak i wysiłek, który AI oszczędza.

‘Średnio ludzie przewidywali, że AI zaoszczędzi im 55,7 sekund, podczas gdy w rzeczywistości zaoszczędziło tylko 7,5 sekund. To nieprawidłowe szacowanie jest szczególnie dotkliwe w przypadku prostych wariantów zadań, gdzie ludzie przewidywali, że AI zaoszczędzi im czas, ale w rzeczywistości zadania trwały dłużej. ‘

Nowy artykuł, zatytułowany Iluzja zysku wydajności: Ludzie zaniżają stopień użycia AI i przeszacowują jego korzyści w prostych zadaniach, napisany przez siedmiu autorów z trzech instytucji, stwierdza również, że wcześniejsze użycie AI wydaje się wzmacniać późniejsze użycie AI, nawet gdy technologia nie oferuje żadnych realnych korzyści wydajnościowych.

Przegląd trzech eksperymentów wykorzystanych do badania, jak ludzie używają AI do prostych zadań codziennych, ujawniając, że użytkownicy zaniżają, jak często polegają na AI, przeszacowują czas, który AI oszczędza, i stają się bardziej skłonni do używania go ponownie po wcześniejszym narażeniu.

Przegląd trzech eksperymentów wykorzystanych do badania, jak ludzie używają AI do prostych zadań codziennych, ujawniając, że użytkownicy zaniżają, jak często polegają na AI, przeszacowują czas, który AI oszczędza, i stają się bardziej skłonni do używania go ponownie po wcześniejszym narażeniu. Źródło

Dane z trzech badań wykazały, że ludzie stają się bardziej skłonni do używania AI po wcześniejszym narażeniu, nawet w sposób, który nie jest produktywny lub oszczędny czasu, lub nawet nie zmniejsza stresu (tj. wydatkowania mniejszego wysiłku umysłowego na zadanie)*:

‘W przeciwieństwie do możliwości, że doświadczenie poprawia kalibrację [tj. zdolność do szacowania, jak użyteczne jest AI dla zadania], zidentyfikowaliśmy efekt przeniesienia na poziomie sesji, w którym początkowe użycie AI zwiększa późniejsze użycie AI.

‘Uczestnicy, którzy początkowo wykonali zadania z AI, stali się bardziej skłonni do wyboru pomocy AI w łatwych wariantach zadań, nawet jeśli nie oferowało to żadnych korzyści czasowych lub wysiłkowych średnio.’

W jednym z badań nad ludźmi autorzy stwierdzili, że oszczędności uzyskane dzięki użyciu AI były całkowicie iluzoryczne:

‘Pomoc AI może [nie powieść]. [My] stwierdziliśmy, że ludzie, którzy wybrali użycie AI, spędzili 7,06 sekund więcej niż ludzie, którzy wykonali zadania [niezależnie] i zgłosili wyższy wysiłek.’

Badanie było ograniczone do zadań, które trwały pięć minut lub mniej, ale może odnosić się do byłych uzależnionych od wyszukiwarek, którzy teraz rutynowo korzystają z ChatGPT i innych popularnych, komercyjnych LLM, zamiast tego.

Grupy badawcze

W różnych badaniach nad ludźmi zadania były opracowane na podstawie klasyfikacji potrzeb i działań użytkowników (TUNA). Eksperymenty objęły wyszukiwanie informacji; streszczenie; arytmetykę; korektę pisowni; przepisywanie; i inne zadania o niskiej złożoności, które można było wykonać w ciągu pięciu minut.

Pierwsze badanie porównywało gotowość uczestników do użycia AI z ich rzeczywistym zachowaniem podczas wykonania zadania, badając, czy ludzie dokładnie rozumieją swoją własną zależność od pomocy AI.

Drugie badanie skupiło się na postrzeganych a rzeczywistych korzyściach wydajnościowych, porównując oczekiwania uczestników dotyczące oszczędności czasu i zmniejszenia wysiłku umysłowego z rzeczywistymi czasami wykonania zadań i zgłoszonym obciążeniem podczas wykonania zadań z AI i bez niej.

Trzecie badanie badało, czy wcześniejsze narażenie na AI zmienia późniejsze decyzje, śledząc, czy uczestnicy, którzy wcześniej wykonali zadania z AI, stali się bardziej skłonni do polegania na AI podczas późniejszych zadań.

Przekroczenie granicy – użycie AI w prostych zadaniach

Aby zrozumieć, czy ludzie dokładnie szacują swoją własną zależność od AI, uczestnicy badania w jednej sesji zostali poproszeni o wykonanie czterech zadań, z opcją użycia pomocy AI dla każdego zadania. Poziom, na którym uczestnicy rzeczywiście używali AI, został porównany z ich własnymi wcześniejszymi szacunkami, jak bardzo myśleli, że będą używać go, z istotną dyszonansą wyników:

Uczestnicy systematycznie zaniżali, jak często będą korzystać z AI do prostych zadań, z rozbieżnością, która rosła wraz z łatwiejszymi wskazówkami, gdzie rzeczywiste użycie AI wyniosło 38% w porównaniu z przewidywanym poziomem 20%, co sugeruje, że nawykowe delegowanie do AI wykracza poza świadomość użytkowników.

Uczestnicy systematycznie zaniżali, jak często będą korzystać z AI do prostych zadań, z rozbieżnością, która rosła wraz z łatwiejszymi wskazówkami, gdzie rzeczywiste użycie AI wyniosło 38% w porównaniu z przewidywanym poziomem 20%, co sugeruje, że nawykowe delegowanie do AI wykracza poza świadomość użytkowników.

Autorzy stwierdzili:

‘Stwierdziliśmy, że [ludzie] używają AI znacznie więcej niż średni przewidywany poziom. Średnio uczestnicy zgłosili, że będą używać AI w 33% zadań, ale populacyjny poziom użycia AI wyniósł 47% (β = 1,07, p < 0,001).

‘Ta luka jest większa dla łatwych wariantów zadań (β = 0,69, p < 0,001): uczestnicy przewidywali 20% użycia AI, ale rzeczywisty poziom użycia AI wyniósł 38% (β = 1,42, p < 0,001), co jest niemal dwukrotnie wyższym poziomem niż zgłoszony.'

Eksperymenty koncentrowały się na zwykłych zadaniach o niskim wysiłku, które wiele osób teraz rutynowo zleca AI, nawet jeśli nie jest to konieczne. Uczestnicy zostali poproszeni o wykonanie prostych działań, takich jak odwołanie do faktów, arytmetyka, korekta pisowni, przepisywanie krótkich fragmentów, streszczenie tekstu i odpowiedzi na podstawowe pytania logiczne, z niektórymi zadaniami wymagającymi tylko kilku słów lub jednego zdania do ukończenia.

Badanie obejmowało również nieco trudniejsze wersje tych samych działań, co pozwoliło badaczom porównać, czy użycie AI zmieniało się wraz ze zwiększaniem się trudności pracy.

Korzyści AI związane z oszczędnością czasu są przeszacowane

W drugim badaniu uczestnicy zostali podzieleni na dwie oddzielne grupy, z jedną grupą, która najpierw szacowała, ile czasu i wysiłku umysłowego AI zaoszczędzi na serii zadań, podczas gdy druga grupa rzeczywiście wykonała te same zadania albo niezależnie, albo z pomocą AI. Zadania ponownie koncentrowały się na zadaniach o niskiej złożoności, takich jak arytmetyka, przepisywanie, odwołanie do faktów, streszczenie i krótkie ćwiczenia logiczne.

Celem było porównanie oczekiwań ludzi dotyczących produktywności AI z tym, co rzeczywiście się wydarzyło, gdy praca została wykonana. Zgodnie z artykułem uczestnicy systematycznie przeszacowali, jak bardzo AI im pomoże, szczególnie w łatwiejszych zadaniach, gdzie wiele osób założyło, że AI dramatycznie zmniejszy obciążenie i czas wykonania.

Zamiast tego wyniki pomiarowe często wykazały tylko niewielkie korzyści, a w niektórych przypadkach, jak wcześniej wspomniano, użycie AI spowodowało, że uczestnicy zwolnili tempo. Artykuł podaje, że ludzie oczekiwali, że AI zaoszczędzi im prawie minutę, podczas gdy rzeczywiste oszczędności czasu wyniosły tylko kilka sekund.

W niektórych prostszych zadaniach użytkownicy AI rzeczywiście potrzebowali więcej czasu, aby je ukończyć niż ludzie, którzy wykonali pracę niezależnie:

Przewidywany a rzeczywisty czas i wysiłek umysłowy podczas wykonania zadań z AI i niezależnie, ujawniając proponowaną 'iluzję przyspieszenia', w której uczestnicy systematycznie wierzyli, że AI zaoszczędzi im znacznie więcej czasu, niż rzeczywiście zrobiło. Rzeczywiste czasy wykonania zadań z AI były znacznie dłuższe niż przewidywane, podczas gdy szacunki dla niezależnego wykonania zadań były znacznie bliższe rzeczywistym wynikom.

Przewidywany a rzeczywisty czas i wysiłek umysłowy podczas wykonania zadań z AI i niezależnie, ujawniając proponowaną ‘iluzję przyspieszenia’, w której uczestnicy systematycznie wierzyli, że AI zaoszczędzi im znacznie więcej czasu, niż rzeczywiście zrobiło. Rzeczywiste czasy wykonania zadań z AI były znacznie dłuższe niż przewidywane, podczas gdy szacunki dla niezależnego wykonania zadań były znacznie bliższe rzeczywistym wynikom.

Badanie również badało postrzegany wysiłek umysłowy. Uczestnicy często wierzyli, że AI sprawi, że zadania będą wydawać się znacznie łatwiejsze; jednak rzeczywista redukcja wysiłku umysłowego była znacznie mniejsza niż oczekiwano. Artykuł charakteryzuje to jako ‘iluzję zysku wydajności’, w której ludzie systematycznie przeszacowują zarówno szybkość, jak i użyteczność pomocy AI w prostych codziennych zadaniach.

Użycie AI pogłębia złudzenie

Ostatnie z trzech badań zostało zaprojektowane w celu przetestowania, czy nawet krótkie narażenie na AI zmienia późniejsze decyzje. Uczestnicy zostali podzieleni na wiele grup i najpierw przeszli ‘fazę narażenia’, w której niektórzy wykonali łatwe zadania z pomocą AI; niektórzy wykonali trudniejsze zadania z pomocą AI; a inni wykonali te same kategorie zadań niezależnie, bez AI. Oddzielna grupa kontrolna całkowicie pominęła etap zadania.

Następnie wszystkie grupy weszły w ‘fazę testową’, tym razem otrzymując nowe i łatwe zadania, i pozwolono im samodzielnie zdecydować, czy użyć AI, czy nie. Zadania ponownie koncentrowały się na zadaniach o niskiej złożoności (tj. przepisywanie, arytmetyka, odwołanie do faktów, korekta pisowni, streszczenie i krótkie ćwiczenia logiczne), które można było wykonać w ciągu kilku minut.

Artykuł podaje, że uczestnicy, którzy wcześniej używali AI w fazie narażenia, stali się znacznie bardziej skłonni do polegania na AI ponownie, nawet jeśli wcześniejsze użycie AI nie zaoszczędziło czasu ani nie zmniejszyło wysiłku umysłowego.

Badacze stwierdzili, że poprzedni użytkownicy AI wybrali pomoc AI znacznie częściej w późniejszej fazie testowej niż uczestnicy, którzy wcześniej wykonali zadania niezależnie:

Uczestnicy, którzy wcześniej używali AI w fazie narażenia, stali się znacznie bardziej skłonni do polegania na AI ponownie w późniejszych zadaniach, pomimo że wcześniejsze użycie AI często nie dawało żadnych znaczących korzyści czasowych lub wysiłkowych. Lewy panel pokazuje, że poprzedni użytkownicy AI wybrali pomoc AI znacznie częściej w późniejszej fazie testowej niż uczestnicy, którzy początkowo wykonali zadania niezależnie. Prawy panel ilustruje proponowaną 'iluzję przyspieszenia', w której wcześniejsze narażenie na AI zwiększyło przekonanie uczestników, że praca z AI jest szybsza i bardziej efektywna, nawet jeśli rzeczywiste czasy wykonania często nie wykazywały żadnych korzyści i czasem wykazywały gorszą wydajność. Wyniki wskazują, że krótkie narażenie na AI zwiększa przyszłe poleganie na AI i wzmacnia przeszacowane postrzeganie jego użyteczności.

Uczestnicy, którzy wcześniej używali AI w fazie narażenia, stali się znacznie bardziej skłonni do polegania na AI ponownie w późniejszych zadaniach, pomimo że wcześniejsze użycie AI często nie dawało żadnych znaczących korzyści czasowych lub wysiłkowych. Lewy panel pokazuje, że poprzedni użytkownicy AI wybrali pomoc AI znacznie częściej w późniejszej fazie testowej niż uczestnicy, którzy początkowo wykonali zadania niezależnie. Prawy panel ilustruje proponowaną ‘iluzję przyspieszenia’, w której wcześniejsze narażenie na AI zwiększyło przekonanie uczestników, że praca z AI jest szybsza i bardziej efektywna, nawet jeśli rzeczywiste czasy wykonania często nie wykazywały żadnych korzyści i czasem wykazywały gorszą wydajność.

Powtarzające się narażenie na AI jest zgłaszane jako zniekształcające osąd uczestników co do tego, czy AI jest rzeczywiście użyteczne: ludzie, którzy już używali AI, stali się mniej skłonni do zgody, że zadania mogą być wykonane szybciej bez niego, pomimo że wyniki pomiarowe często nie wykazywały żadnych korzyści i czasem wykazywały wolniejsze czasy wykonania.

Badacze twierdzą, że tworzy to warunki dla ‘samowzmacniającego się cyklu’, w którym użycie AI zwiększa przyszłą zależność od AI, jednocześnie osłabiając zdolność użytkowników do dokładnej oceny, czy technologia poprawia produktywność w ogóle.

Wnioski

Opinia Wiele osób, które przyjęły AI do małych zadań, może, jak ja, czuć znajomość z nowymi wnioskami artykułu.

Osobiście moja obsesja na punkcie automatyzacji powtarzalnych zadań poprzedza obecny boom AI o kilka dekad. Teraz, jak i wcześniej, pozostaje pytanie: Czy wysiłek wymagany do ustawienia i/lub utrzymania automatyzacji przekracza szacowany (wyłącznie ludzki) wysiłek niezbędny do wykonania zadania bez automatyzacji?

Ci, którzy kochają automatyzację, mogą skończyć automatyzacją dla samej automatyzacji, nawet jeśli zajmie to lata lub dekady, zanim jakikolwiek zwrot (w postaci czasu zaoszczędzonego) będzie widoczny; i to zmienia kontekst działania z ‘optymalizacji’ na ‘hobby’.

Nie ma nic złego w tym, o ile nie oszukujemy się, że robimy prawdziwe korzyści. Niemniej jednak jest to zły nawyk, który starałem się powstrzymać w ostatnich latach; i opcja użycia AI, ostatnio, wydaje się skłonna do nasilenia, ponieważ nawet złe lub nieoptymalne wyniki mogą być uzyskane znacznie szybciej niż na przykład podczas tworzenia makr w języku JavaScript i innych językach.

Złudne wskaźniki

Co artykuł nieco zaniedbuje, to napięcie między przypadkowymi lub szczęśliwymi wynikami za pomocą AI a dominacją ślepych zaułków i sfrustrowanych prób dostosowania dostępnych chatbotów AI, takich jak ChatGPT, do własnych potrzeb – w pracy, na której można polegać, nawet w obliczu wymuszonych uaktualnień do nowych wersji, które nie muszą działać w ten sam sposób co wersja, na której została warunkowana praca lub rutyna.

‘Magiczny’ wynik jest tym przypadkiem, w którym AI natychmiast rozwiązuje problem w łatwy i racjonalny sposób.

Na przykład, za każdym razem, gdy przeglądam artykuł, muszę go wydrukować i nieuchronnie muszę napisać numery stron w pogrubieniu u góry, ponieważ są one zwykle albo nieobecne, albo w małym druku u dołu. Poproszenie ChatGPT o napisanie skryptu Pythona, który doda duży i pogrubiony numer strony u góry, okazało się niezwykle szybkim wynikiem, ponieważ teraz mogę przeciągnąć plik PDF Arxiv na plik .BAT i uzyskać nową wersję z wyraźnymi numerami stron w ciągu 2-3 sekund:

Widoczne numery stron dodane do plików PDF za pomocą skryptu Pythona napisanego przez AI.

Widoczne numery stron dodane do plików PDF za pomocą skryptu Pythona napisanego przez AI.

Poza minutą lub dwiema sporu o to, czy Windows ma rodzimy i oddzielny czcionkę Arial Black (nie ma już), był to być może najszybszy sposób, w jaki AI kiedykolwiek stworzyło coś trwałego i regularnie użytecznego dla mnie.

Można argumentować, że ten rodzaj ‘przełomu’ lub ‘łatwego zwycięstwa’ daje fałszywe wrażenie prawdziwej zdolności AI do oszczędzania czasu i/lub wysiłku umysłowego, ponieważ skłonni jesteśmy do nadmiernego podkreślania takich przypadków: nasza naturalna tendencja do tłumienia bolesnych lub negatywnych wspomnień i do ponownego wykorzystania lub skupienia się na szczęśliwszych wspomnieniach oznacza, że udane przypadki, w których AI rozwiązuje małe zadania w użyteczny sposób, staną się gwiazdą, której będziemy śledzić, nawet wbrew trendowi dowodów statystycznych, jak podaje nowy artykuł, i nawet wbrew własnym doświadczeniom, że takie ‘łatwe zwycięstwa’ są wyjątkiem, a nie regułą.

Istnieje rosnące dowody, poza nowym artykułem, że oszukujemy się co do użyteczności AI. W 2025 roku badanie wykazało, że deweloperzy korzystający z AI spędzali 19% więcej czasu niż bez AI; i kolejne, bardziej niedawne badanie potwierdza podstawowe przesłanie nowego artykułu omawianego w tym artykule – że oszczędność czasu wymaga czasu.

Byłoby użyteczne, gdyby badania tego rodzaju mogły być przetłumaczone na (nieuchronnie AI-wspomagane) tradycyjne badanie czasu i ruchu, umożliwiając nam prawdziwe spojrzenie na stopień, w jakim AI rzeczywiście oszczędza nam czas – lub kosztuje nas czas.

Wreszcie, badanie wyróżnia się pod innym ważnym względem, ponieważ próbuje co najmniej zmierzyć ‘wysiłek umysłowy’ w odniesieniu do użycia AI w mniejszych zadaniach. Ponieważ coraz większą uwagę zwraca się na ‘intensywność’ pracy wspomaganej przez AI, pilnie potrzebujemy niezawodnych jednostek miary, które mogą zmierzyć stopień, w jakim kaprysy i dziwactwa AI wyczerpują lub osłabiają nas, przy ogólnym koszcie jakości pracy i zdolności do pracy.

 

* Formatowanie jest autorów, z oryginalnego artykułu. Wszystkie cytaty wewnętrzne zostały przekonwertowane na linki przez mnie.

Publikacja po raz pierwszy w sobotę, 23 maja 2026

Pisarz na temat uczenia maszynowego, specjalista ds. syntezowania obrazów ludzi. Były kierownik treści badawczych w Metaphysic.ai.