Погляд Anderson

Використання штучного інтелекту може зробити завдання тривалішими, стверджує дослідження

mm
AI-generated image (GPT-2): A man sits at breakfast while a group of identical domestic robots shave him, cut his hair, prepare his food, and clean the house around him, turning even the smallest daily tasks into outsourced labor.

Нові дослідження свідчать, що штучний інтелект може зробити прості завдання тривалішими, переконуючи користувачів у тому, що вони стають більш продуктивними.

 

Нове дослідження Стенфордського, Нью-Йоркського та Принстонського університетів виявило, що ми часто використовуємо штучний інтелект, навіть коли це неефективно; і що для менших завдань, які ми звичайно передаємо штучному інтелекту, ми часто витрачаємо менше розумових зусиль і економимо більше часу, якщо виконувати завдання самостійно.

У трьох дослідженнях, проведених серед людей, автори виявили, що учасники систематично недооцінювали час, який штучний інтелект може заощадити їм на виконанні завдання, а також суттєво недооцінювали свою залежність від штучного інтелекту*.

‘У [другому дослідженні] ми намагаємося зрозуміти, чому люди можуть використовувати штучний інтелект для простих завдань, незважаючи на те, що використання штучного інтелекту не забезпечує переваги з точки зору ефективності. Одна з гіпотез полягає в тому, що люди неправильно оцінюють час і зусилля, які штучний інтелект може заощадити.

‘Для перевірки цієї гіпотези ми порівняли передбачуваний і фактичний час та зусилля учасників під час виконання завдань зі штучним інтелектом та без нього, і виявили ілюзію вигоди від ефективності, коли люди переоцінювали як час, так і зусилля, які штучний інтелект може заощадити.

‘У середньому люди передбачали, що штучний інтелект заощадить їм 55,7 секунд, тоді як насправді він заощадив лише 7,5 секунд. Ця недооцінка особливо велика для простих завдань, де люди передбачали, що штучний інтелект заощадить їм час, але насправді завдання виконувалися довше в реальності.’

Нова робота, опублікована під назвою Ілюзія вигоди від ефективності: Люди недооцінюють рівень використання штучного інтелекту і переоцінюють його переваги для простих завдань, написана сімома авторами з трьох інститутів, також виявила, що попереднє використання штучного інтелекту, здається, підтримує майбутнє використання штучного інтелекту, навіть якщо технологія пропонує мало або жодної вигоди з точки зору ефективності.

Огляд трьох експериментів, проведених для вивчення того, як люди використовують штучний інтелект для простих щоденних завдань, які показують, що користувачі недооцінюють свою залежність від штучного інтелекту, переоцінюють час, який він може заощадити, і стають більш схильними до використання його знову після попереднього досвіду.

Огляд трьох експериментів, проведених для вивчення того, як люди використовують штучний інтелект для простих щоденних завдань, які показують, що користувачі недооцінюють свою залежність від штучного інтелекту, переоцінюють час, який він може заощадити, і стають більш схильними до використання його знову після попереднього досвіду. Джерело

Дані трьох досліджень показали, що люди стають більш схильними до використання штучного інтелекту після попереднього досвіду, навіть якщо це не продуктивно або не економить час, тобто не зменшує розумових зусиль*:

‘На відміну від можливості того, що досвід покращує оцінку [тобто здатність оцінювати, наскільки корисний штучний інтелект для завдання], ми виявили ефект переносу на рівні сесії, коли початкове використання штучного інтелекту збільшує подальше використання штучного інтелекту.

‘Учасники, які спочатку виконували завдання зі штучним інтелектом, стали ще більш схильними до використання штучного інтелекту під час виконання завдань легкого рівня, навіть якщо це не давало вигоди з точки зору часу чи зусиль на виконання.’

У одному з досліджень серед людей автори виявили, що вигоди від використання штучного інтелекту були повністю ілюзорними:

‘Допомога штучного інтелекту може [зазнавати невдачі]. [Ми] виявили, що люди, які вирішили використовувати штучний інтелект, витратили на 7,06 секунд більше часу, ніж ті, хто виконав завдання самостійно, і повідомили про більші зусилля.’

Дослідження було обмежене завданнями, які тривали п’ять хвилин або менше, але може бути актуальним для тих, хто раніше був залежний від пошукових систем і тепер регулярно використовує ChatGPT та інші популярні комерційні великомасштабні мови моделі.

Групи дослідження

У різних дослідженнях серед людей завдання були розроблені на основі Таксономії потреб і дій користувачів (TUNA)框架. Експерименти охоплювали пошук інформації; підсумовування; арифметику; корекцію орфографії; переписування; та інші завдання низької складності, які можна було виконати менш ніж за п’ять хвилин.

Перше дослідження порівнювало передбачувану готовність учасників використовувати штучний інтелект проти їх фактичної поведінки під час виконання завдань, вивчаючи, чи люди точно розуміють свою залежність від допомоги штучного інтелекту.

Друге дослідження зосереджувалося на передбачуваних проти фактичних виграхів з точки зору ефективності, порівнюючи очікування учасників щодо часу та розумових зусиль, які штучний інтелект може заощадити, з виміряними результатами та звітом про навантаження під час виконання завдань зі штучним інтелектом та без нього.

Третє дослідження вивчало, чи попередній досвід використання штучного інтелекту змінює подальше прийняття рішень, відстежуючи, чи учасники, які раніше виконували завдання зі штучним інтелектом, стали більш схильними до використання його знову під час подальших завдань.

Переоцінка вигод штучного інтелекту з точки зору часу

У другому дослідженні учасники були розділені на дві окремі групи, одна з яких спочатку оцінювала, скільки часу та розумових зусиль штучний інтелект може заощадити на виконанні завдань, тоді як інша група фактично виконувала ці завдання зі штучним інтелектом або без нього. Завдання знову були зосереджені на завданнях низької складності, які включали арифметику, переписування, пошук інформації, підсумовування, корекцію орфографії та короткі завдання з логіки.

Мета полягала в тому, щоб порівняти очікування людей щодо продуктивності штучного інтелекту з тим, що насправді відбувається під час виконання роботи. За даними статті, учасники систематично переоцінювали вигоди штучного інтелекту, особливо на легших завданнях, де багато хто вважав, що штучний інтелект суттєво зменшить навантаження та час виконання.

Натомість виміряні результати часто показували лише незначні вигоди, а в деяких випадках використання штучного інтелекту насправді сповільнювало учасників. У статті зазначається, що люди очікували, що допомога штучного інтелекту заощадить їм майже хвилину в середньому, тоді як фактичні вигоди з точки зору часу становили лише кілька секунд.

На деяких простіших завданнях користувачі штучного інтелекту виконували завдання довше, ніж ті, хто виконував роботу самостійно:

Порівняння передбачуваного та фактичного часу та розумових зусиль під час виконання завдань зі штучним інтелектом та без нього, яке показує запропоновану в статті 'ілюзію прискорення', при якій учасники постійно вважали, що штучний інтелект заощадить їм значно більше часу, ніж насправді зробив. Фактичні часи виконання завдань зі штучним інтелектом були суттєво довшими, ніж передбачувані, тоді як оцінки для виконання завдань самостійно були набагато ближчими до спостережуваних результатів.

Порівняння передбачуваного та фактичного часу та розумових зусиль під час виконання завдань зі штучним інтелектом та без нього, яке показує запропоновану в статті ‘ілюзію прискорення’, при якій учасники постійно вважали, що штучний інтелект заощадить їм значно більше часу, ніж насправді зробив. Фактичні часи виконання завдань зі штучним інтелектом були суттєво довшими, ніж передбачувані, тоді як оцінки для виконання завдань самостійно були набагато ближчими до спостережуваних результатів.

Дослідження також вивчало сприймане розумове навантаження. Учасники часто вважали, що штучний інтелект зробить завдання значно легшими; однак виміряне зниження розумових зусиль було значно меншим, ніж очікувалося. У статті це характеризується як ‘ілюзія вигоди від ефективності’, при якій люди систематично переоцінюють і швидкість, і корисність допомоги штучного інтелекту під час простих щоденних завдань.

Використання штучного інтелекту поглиблює оману

Останнє з трьох досліджень було розроблено для перевірки того, чи навіть короткочасний досвід використання штучного інтелекту змінює подальше прийняття рішень. Учасники були розділені на кілька груп, деякі з яких спочатку виконували легкі завдання зі штучним інтелектом; деякі виконували складніші завдання зі штучним інтелектом; а інші виконували ті самі категорії завдань самостійно, без штучного інтелекту. Відокремлена група контролю пропустила стадію завдання зовсім.

Пізніше всі групи перейшли до другої ‘тестової’ фази, цього разу отримавши нові та легші завдання, і мали можливість самостійно вирішити, використовувати штучний інтелект чи ні. Завдання знову були зосереджені на завданнях низької складності (тобто переписуванні, арифметиці, пошукові запитах, корекції орфографії, підсумовуванні та коротких завданнях з логіки), які можна було виконати менш ніж за кілька хвилин.

У статті зазначається, що учасники, які вже використовували штучний інтелект під час фази експозиції, стали суттєво більш схильними до використання його знову пізніше:

Дослідники виявили, що попередні користувачі штучного інтелекту вибирали допомогу штучного інтелекту значно частіше під час пізнішої тестової фази, ніж учасники, які спочатку виконували завдання самостійно:

Учасники, які раніше використовували штучний інтелект під час фази експозиції, стали суттєво більш схильними до використання його знову під час подальших завдань, навіть якщо попереднє використання штучного інтелекту часто не давало суттєвих вигод з точки зору швидкості чи зменшення розумових зусиль. Лівель панель показує, що попередні користувачі штучного інтелекту вибирали допомогу штучного інтелекту значно частіше під час пізнішої тестової фази, ніж учасники, які спочатку виконували завдання самостійно. Права панель ілюструє запропоновану в статті 'ілюзію прискорення', при якій попередній досвід використання штучного інтелекту збільшував переконання учасників у тому, що робота зі штучним інтелектом була швидшою та більш ефективною, навіть якщо фактичні часи виконання завдань часто показували мало вигод або іноді навіть повільніше виконання.

Учасники, які раніше використовували штучний інтелект під час фази експозиції, стали суттєво більш схильними до використання його знову під час подальших завдань, навіть якщо попереднє використання штучного інтелекту часто не давало суттєвих вигод з точки зору швидкості чи зменшення розумових зусиль. Лівель панель показує, що попередні користувачі штучного інтелекту вибирали допомогу штучного інтелекту значно частіше під час пізнішої тестової фази, ніж учасники, які спочатку виконували завдання самостійно. Права панель ілюструє запропоновану в статті ‘ілюзію прискорення’, при якій попередній досвід використання штучного інтелекту збільшував переконання учасників у тому, що робота зі штучним інтелектом була швидшою та більш ефективною, навіть якщо фактичні часи виконання завдань часто показували мало вигод або іноді навіть повільніше виконання.

Повторне використання штучного інтелекту, як повідомляється, спотворювало судження учасників щодо того, чи справді корисний штучний інтелект:

Люди, які вже використовували штучний інтелект, стали менш схильними погодитися з тим, що завдання можна було виконати швидше без нього, хоча фактичні результати часто показували мало вигод або іноді навіть повільніше виконання завдань.

Дослідники стверджують, що це створює умови для ‘самоутверджувального циклу’, при якому використання штучного інтелекту збільшує подальшу залежність від штучного інтелекту, одночасно ослаблюючи здатність користувачів точно оцінювати, чи технологія покращує продуктивність взагалі.

Висновок

Відгук Багато читачів, які прийняли штучний інтелект для малих завдань, можливо, відчуватимуть певну знайомість із висновками нової статті.

Особисто моя одержимість автоматизацією повторюваних завдань передує сучасному буму штучного інтелекту на кілька десятиліть. Тоді, як і зараз, питання залишається: Чи зусилля, пов’язані з налаштуванням та/або підтриманням автоматизації, перевищують передбачувані (людські) зусилля просто на виконання завдання без автоматизації?

Ті, хто любить автоматизувати, можуть закінчитися тим, що автоматизують все, навіть якщо це займе роки або десятиліття, перш ніж будь-яка вигода (у вигляді збереженого часу) стане очевидною; і це змінює контекст діяльності з ‘оптимізації’ на ‘хобі’.

Немає нічого поганого в цьому, поки ви не обманюєте себе, що реальні вигоди досягнуті. Тим не менш, це погана звичка, яку я намагався подолати в останні роки; і можливість використання штучного інтелекту, останнім часом, здається, схильна посилити цю звичку, оскільки навіть погані або неефективні результати можна отримати значно швидше, ніж, наприклад, при написанні макросів на JavaScript та інших мовах.

Обманливі індикатори

Що статті нехтують трохи, це напруженість між серпендітними або щасливими результатами через штучний інтелект та переважаючими тупиками та розчарованими спробами адаптувати доступні чат-боти штучного інтелекту, такі як ChatGPT, до своїх власних потреб – у робочому процесі, який можна довіряти, навіть перед лицем примусових оновлень до нових версій, які можуть не працювати так само, як версія, на якій ваш робочий процес або рутина була заснована.

‘Магічний’ результат, отже, є тим випадком, коли штучний інтелект негайно вирішує вашу проблему легким і раціональним способом.

Наприклад, кожного разу, коли я переглядаю статтю, мені потрібно роздрукувати її, і мені завжди потрібно написати номери сторінок жирним шрифтом зверху, оскільки вони зазвичай відсутні або написані дуже маленьким шрифтом внизу. Запит до ChatGPT про створення скрипту Python, який додав би великий і жирний номер сторінки, дав інкредибльний результат, оскільки тепер я можу просто перетягнути PDF з Arxiv на файл .BAT і отримати нову версію з видимими номерами сторінок за 2-3 секунди:

Яскраво видимі номери сторінок, додані до PDF за допомогою скрипту Python, написаного штучним інтелектом.

Яскраво видимі номери сторінок, додані до PDF за допомогою скрипту Python, написаного штучним інтелектом.

Крім хвилини чи двох суперечок щодо того, чи має Windows окремий шрифт Arial Black (він не має), це, можливо, був найшвидший випадок, коли штучний інтелект створив щось постійно і регулярно корисне для мене.

Аргументно, такий ‘прорив’ або ‘легка перемога’ дає хибне враження про справжню здатність штучного інтелекту економити час і/або розумові зусилля, оскільки ми схильні надавати таким випадкам непропорційну вагу: наша природна спроможність пригнічувати болісні або негативні спогади і переозначувати або фокусуватися на щасливіших спогадах означає, що успішні випадки, коли штучний інтелект вирішує малі завдання корисним способом, будуть виступати як орієнтир, яким ми, ймовірно, будемо слідувати, навіть проти тенденції статистичних доказів, як показано в новій статті, і навіть проти нашого власного досвіду, який свідчить про те, що такі ‘легкі перемоги’ є винятком, а не правилом.

Є зростаючі докази, крім нової статті, що ми обманюємо себе щодо корисності штучного інтелекту. У 2025 році дослідження показало, що розробники, які використовували штучний інтелект, витрачали на 19% більше часу; і ще одне недавнє дослідження підтверджує основну думку нової статті, обговорюваної в цій статті – що економія часу потребує часу.

Було б корисно, якщо дослідження цього типу могли б бути переведені в (неминуче штучно-інтелектно-спрямоване) старомодне вивчення часу та руху, що дозволило б нам отримати справжні знання про те, наскільки штучний інтелект насправді економить нам – або коштує нам – часу.

Нарешті, дослідження виняткове ще одним важливим аспектом, оскільки воно хоча б намагається кількісно оцінити ‘розумові витрати’ щодо використання штучного інтелекту на менших завданнях. Оскільки все більше уваги приділяється ‘інтенсивності’ роботи зі штучним інтелектом, нам терміново потрібні надійні одиниці вимірювання, які можуть кількісно оцінити, наскільки вимоги та особливості штучного інтелекту виснажують або виснажують нас, при загальній вартості якості роботи та придатності до роботи.

 

* Форматування належить авторам, з джерельної статті. Будь-які внутрішні посилання, перетворені на гіперпосилання, мною.

Перше опубліковано в суботу, 23 травня 2026 року

Писатель про машинне навчання, домен-спеціаліст у сфері синтезу зображень людини. Колишній керівник дослідницького контенту в Metaphysic.ai.
Особистий сайт: martinanderson.ai
Контакт: [email protected]