Лідери думок

Як я передав свої знання в системи штучного інтелекту, які можуть приймати рішення як люди-експерти

mm
A human expert in a technical control room teaching an AI system to make complex decisions through a holographic interface.

Коли я покинув Microsoft і продовжував працювати з підприємствами над їхніми розгорнутими системами штучного інтелекту, я постійно бачив, що більшість систем штучного інтелекту, які люди вважали цікавими, насправді не могли приймати рішення з справжнім людським судженням. Так, вони могли писати, підсумовувати та створювати надзвичайно плавний текст, який звучав як рішення, але коли ви розміщуєте ці системи в реальному оперативному середовищі, де є компроміси, невизначеність, неповні інструкції та реальні наслідки, вони швидко починають мати труднощі. Це відповідає даним проекту MIT Project NANDA, який показує, що хоча 60% організацій оцінювали інструменти штучного інтелекту, лише 20% досягли стадії пілотного проекту, а лише 5% досягли стадії виробництва. Іншими словами, галузь бореться з будівництвом систем, які можуть справлятися всередині реальних робочих процесів.

У корпоративних умовах, особливо в таких галузях, як ланцюжки постачання, виробництво та операції, отримання відповіді не є складним; складним є знання, яку відповідь можна довіряти, які змінні мають найбільше значення, і що, ймовірно, зламається внизу, якщо ви помилилися. На мою думку, це і питання експертизи, і питання судження.

Щоб бути ясним, штучний інтелект зробив надзвичайні кроки у створенні кращих виходів. Але кращий вихід не є тим самим, що і краще рішення. Це два різні етапи, і я думаю, що галузь витратила багато часу на те, щоб вважати їх взаємозамінними.

Відсутність експертизи та судження є причиною, з якої я став цікавитися будівництвом штучного інтелекту, який люди-експерти можуть навчати приймати складні рішення так само, як вони роблять. Штучний інтелект не повинен бути тільки про автоматизацію завдань, але й про ефективну та безпечну передачу людського судження в системи штучного інтелекту, які можуть справлятися.

Моделі великих мов (LLM) говорять як приймають рішення, але вони не є такими

Не є сумнівом, що LLM корисні, але вони не є, за замовчуванням, системами прийняття рішень. Вони є системами прогнозування, обгорнутими в мову. І мова є переконливою, що є частиною проблеми. Якщо система може пояснити себе плавно, ми легко переоцінюємо те, що вона розуміє. Ви запитуєте її діловий питання, вона дає вам структуровану відповідь з компромісами, застереженнями та гарним підсумком в кінці, роблячи її більш розумною, ніж вона є. Звучання кохерентно та бути оперативно компетентним не є тим самим, і це місце, де багато корпоративного штучного інтелекту ламається. Моделі можуть сказати вам, як виглядає хороше рішення, не маючи жодного розуміння того, що робить рішення хорошим під тиском, з часом або в контексті. Це одна з причин, з яких багато організацій борються з переходом за межі експериментів. Gartner виявив, що щонайменше 50% проектів генеративного штучного інтелекту припиняються після доказів концепції, ще до того, як вони принесуть реальний оперативний вплив, часто через неясну вартість і контроль ризику.

Інформація не є тим самим, що й експертиза

Одна з найлегших пасток, в які можна потрапити зі штучним інтелектом, полягає в тому, що якщо система має достатньо інформації, вона повинна бути здатною виконувати дії як експерт. Звучить логічно, але коли ви подумаєте про це в нашому повсякденному житті, збільшення нашої інформації про щось не автоматично робить нас експертами. Ви можете прочитати кожен авіаційний посібник і все одно не бути готовим приземлити літак. Ви можете запам’ятати кожну найкращу практику в ланцюжку постачання і все одно замерзнути, коли три речі підряд ідуть не так.

Я міг би продовжувати, але суть полягає в тому, що інформація не дорівнює здатності. Здатність походить від досвіду, зокрема, повторної експозиції до ситуацій, в яких відповідь не очевидна.

Кожного дня я бачу, що більшість сучасних систем штучного інтелекту тренуються на статичних прикладах. Це корисно для прогнозування, але це лише мала частина прийняття рішень. Підприємства не мають браку даних як такого, але їм потрібні структуровані середовища для практики, що означає надання системам середовищ, в яких вони можуть повторно:

  • Зустріти реалістичні сценарії
  • Принимати рішення
  • Бачити, що відбувається
  • Отримувати зворотний зв’язок
  • Покращуватися з часом

Штучний інтелект можна тренувати за допомогою прогнозувальних алгоритмів, але цей підхід має обмеження. Що потрібно далі, це штучний інтелект, який можна тренувати в симульованому середовищі з наглядом людини. Я називаю це машинним навчанням, методологією, яка розбиває складні рішення на сценарії та навички, надаючи керівництво для експертів людини, щоб навчати штучний інтелект через симуляцію. Результируючий зворотний зв’язок і спроби та помилки в кінцевому підсумку дозволяють агентам навчатися та діяти з реальною автономією безпосередньо від людей, які створили ці процеси.

Перестаньте вважати штучний інтелект монолітом

Інша помилка, яку я часто бачу, полягає в тому, що одна велика модель повинна якимось чином робити все. Жодна баскетбольна команда не складається лише з однієї людини. Жоден завод не керується однією людиною. Складні системи працюють, тому що різні компоненти виконують різні завдання, і є структура, яка тримає їх разом.

Штучний інтелект повинен бути побудований так само. Я не думаю, що довгострокове майбутнє корпоративного прийняття рішень полягає в одному гігантському моделі, який сидить в центрі компанії, видаючи себе за універсально компетентного. Воно, ймовірно, буде виглядати як команди спеціалізованих агентів.

Один агент міг би бути експертом з витягування даних. Інший краще оцінює сценарії. Інший займається плануванням. Один перевіряє відповідність вимогам або виявляє протиріччя. Інший діє як наглядач, вирішуючи, коли слід підвищувати рівень або коли рівень впевненості занадто низький, щоб продовжувати. Архітектура команди має набагато більше сенсу для мене, оскільки вона відповідає тому, як реальні організації насправді працюють, і узгоджується з більш широкими ринковими тенденціями. Дослідження McKinsey підтверджують, що організації отримують найбільшу вартість від штучного інтелекту, переробляючи робочі процеси та оперативні структури навколо нього.

Не всі рішення приймаються однаково, і надто часто ми припускаємо, що одна й та сама модель, одні й ті самі дані та один і той же тип міркування можуть обробляти все.

Чотири способи, як приймаються рішення насправді

За мого досвіду, більшість рішень tend до кількох категорій:

  1. Системи контролю (правила та формули): Рішення приймаються шляхом застосування попередньо визначених рівнянь або правил до відомих входів. Якщо X відбувається, зробіть Y.
  2. Пошук та оптимізація: Рішення приймаються шляхом оцінки багатьох можливих варіантів та вибору найкращого на основі визначеної мети.
  3. Зміцнювальне навчання (спроби та помилки): Рішення вивчаються з часом шляхом виконання дій, спостереження результатів та коригування на основі винагороди чи покарання.
  4. Практика та досвід (людське навчання): Рішення формуються через повторну експозицію, спрямований зворотний зв’язок та накопичене судження в реальних сценаріях.

Більшість корпоративного штучного інтелекту добре працює в перших двох категоріях. Третя та четверта категорії є більш складними для штучного інтелекту, оскільки саме там живе людське судження.

Аутономія без структури є ризиком

Коли люди говорять про автономний штучний інтелект, розмова tend до розділення на два крайності. Одна сторона вважає, що системи є майже магічними та готовими керувати всім. Інша сторона діє так, як якщо вони ніколи не повинні бути довірені чимось значимим.

Я не думаю, що будь-яка з цих точок зору є корисною. Ми повинні зосередитися на автономії в межах структури, оскільки автономія без нагляду, логіки ескалації, меж або підзвітності є основним джерелом ризику. Обговорення ризиків з’являються зараз, зокрема в розмовах, сформованих зусиллями, такими як Рамка управління ризиками штучного інтелекту Національного інституту стандартів та технологій, яка відображає, як серйозно організації ставляться до питань нагляду, підзвітності та оперативної довіри.

Майбутнє корпоративного штучного інтелекту лежить у командах агентів. Організації, які отримують найбільшу вартість від штучного інтелекту, не будуть тими, які автоматизують найбільше слів. Вони будуть тими, хто зможе передати справжню експертизу в системи, які можуть справлятися, коли середовище стає складним. Це, на мою думку, є різницею між штучним інтелектом, який виглядає вражаючим, та штучним інтелектом, який стає真正 корисним, створюючи реальну віддачу від інвестицій.

Кенс Андерсон є засновником та генеральним директором AMESA та колишнім директором з прийняття автономного штучного інтелекту в Microsoft. Він є піонером у сфері інтелектуальних автономних агентів, створивши методологію "Machine Teaching", яка дозволяє штучним інтелектам розвивати реальну автономію через симуляцію, зворотний зв'язок та спроби та помилки. За останні сім років Кенс зосередився виключно на розробці, створенні та розгортанні інтелектуальних автономних агентів для виробництва та логістики, очолюючи понад 200 реальних розгортань для великих корпорацій, включаючи Shell, PepsiCo та Delta Airlines. Він також є автором книги "Designing Autonomous AI" (O'Reilly, 2022) та зараз розробляє горизонтальну платформу для оркестрування штучних інтелектів для прийняття рішень на мільйони доларів у корпоративних операціях.