Лідери думок
Як я передав свої знання в системи штучного інтелекту, які можуть приймати рішення, як людські експерти

Коли я покинув Microsoft і продовжував працювати з підприємствами над їхніми розгорнутими системами штучного інтелекту, я постійно бачив, що більшість систем штучного інтелекту, які люди вважали цікавими, насправді не могли приймати рішення з справжнім людським судженням. Так, вони могли писати, підсумовувати та створювати надзвичайно плавний текст, який звучав, як рішення, але коли ви розміщуєте ці системи в реальному оперативному середовищі, де є компроміси, невизначеність, неповні інструкції та реальні наслідки, вони швидко починають відчувати труднощі. Це відповідає даним проекту MIT Project NANDA, який показує, що хоча 60% організацій оцінювали інструменти штучного інтелекту, лише 20% досягли стадії пілотного проекту, а лише 5% досягли стадії виробництва. Іншими словами, галузь бореться з створенням систем, які можуть справлятися всередині реальних робочих процесів.
У підприємницьких умовах, особливо в таких областях, як ланцюжок постачання, виробництво та операції, отримання відповіді не є складним; складно зрозуміти, яку відповідь можна довіряти, які змінні мають найбільше значення, а що, ймовірно, зламається внизу, якщо ви помилилися. На мою думку, це проблема як експертизи, так і судження.
Щоб бути ясним, штучний інтелект зробив надзвичайні кроки у створенні кращих виходів. Але кращий вихід не означає кращих рішень. Це дві різні віхи, і я думаю, що галузь витратила багато часу на те, щоб вважати їх взаємозамінними.
Відсутність експертизи та судження є причиною, чому мене цікавить створення штучного інтелекту, якого людські експерти можуть навчати приймати складні рішення так, як вони роблять. Штучний інтелект не повинен бути тільки про автоматизацію завдань, а про ефективне та безпечне передавання людського судження в штучний інтелект, який може витримувати.
Великі мовні моделі (LLM) говорять, як рішенняmakers, але вони не є
Не є сумнівом, що LLM корисні, але вони не є, за замовчуванням, системами прийняття рішень. Вони є системами прогнозування, огорнутими в мову. І мова є переконливою, що є частиною проблеми. Якщо система може пояснити себе плавно, ми легко переоцінюємо, що вона розуміє. Ви питаєте її ділове питання, вона дає вам структуровану відповідь з компромісами, застереженнями та маленьким підсумком в кінці, роблячи її більш розумною, ніж вона є. Звучання переконливого та оперативної компетентності не є однією й тією ж речі, і це місце, де багато підприємств штучного інтелекту ламається. Моделі можуть сказати вам, як виглядає хороша відповідь, не маючи жодного розуміння того, що робить рішення хорошим під тиском, з часом або в контексті. Це одна з причин, чому багато організацій борються з переходом за рамки експериментів. Gartner виявив, що щонайменше 50% проектів генеративного штучного інтелекту припиняються після доказів концепції, ще до того, як вони доставлять реальний оперативний вплив, часто через невизначені значення та ризики контролю.
Інформація не є тією ж, що й експертиза
Одна з найлегших пасток, у які можна потрапити з штучним інтелектом, полягає в тому, що якщо система має достатньо інформації, вона повинна бути能够 виконувати як експерт. Звучить розумно, але коли ви про це думаєте в нашому повсякденному житті, збільшення нашої інформації про щось не автоматично робить нас експертами. Ви можете прочитати кожну авіаційну довідку та все ще не бути готовим приземлити літак. Ви можете запам’ятати кожну кращу практику в ланцюжку постачання та все ще замерзнути, коли три речі підряд ідуть неправильно.
Я міг би продовжувати, але суть полягає в тому, що інформація не дорівнює здатності. Здатність виникає з досвіду, зокрема, повторної експозиції до заплутаних ситуацій, де відповідь не очевидна.
Кожного дня я бачу, що більшість сучасних систем штучного інтелекту тренуються на статичних прикладах. Це все корисно для прогнозування, але це лише мала частина прийняття рішень. Підприємства не бідують у даних як такому, але їм потрібні структуровані середовища для практики, що означає надання системам середовища, де вони можуть повторно:
- Зустріти реалістичні сценарії
- Прийняти рішення
- Побачити, що відбувається
- Отримати зворотний зв’язок
- Покращити з часом
Штучний інтелект можна тренувати за допомогою передбачувальних алгоритмів, але такий підхід має обмеження. Що потрібно далі, це штучний інтелект, який можна тренувати в симульованому середовищі з наглядом людини. Я називаю це машинним викладанням, методологією, яка розбиває складні рішення на сценарії та навички, надаючи керівництво для людських експертів, щоб навчати штучний інтелект через симуляцію. Результируючий зворотний зв’язок та спроби і помилки в кінцевому підсумку дозволяють агентам навчатися та діяти з реальною автономією безпосередньо від людей, які створили ці процеси.
Прекратіть розглядати штучний інтелект як моноліт
Інша помилка, яку я часто бачу, полягає в припущенні, що одна велика модель повинна якимось чином робити все. Жодна баскетбольна команда не складається лише з однієї людини. Жоден завод не керується однією людиною. Складні системи працюють, тому що різні компоненти виконують різні завдання, і є структура, яка їх тримає разом.
Штучний інтелект повинен бути побудований тим же чином. Я не думаю, що довгострокове майбутнє підприємницького прийняття рішень полягає в одному гігантському моделі, який сидить в центрі компанії, видаючи себе за універсально компетентного. Це більш імовірно буде виглядати як команди спеціалізованих агентів.
Один агент може бути експертом у витягуванні даних. Інший краще оцінює сценарії. Інший займається плануванням. Один перевіряє відповідність або ловить суперечності. Інший діє більш як наглядач, вирішуючи, коли ескалувати або коли впевненість занадто низька, щоб продовжувати. Архітектура команди має більше сенсу для мене, оскільки вона відповідає тому, як реальні організації насправді працюють, і відповідає більш широким ринковим тенденціям. Висновки McKinsey підтверджують, що організації отримують найбільшу цінність від штучного інтелекту, переробляючи робочі процеси та оперативні структури навколо нього.
Не всі рішення приймаються однаково, і занадто часто ми припускаємо, що одна й та ж модель, одні й ті ж дані та один і той же тип міркування можуть обробляти все.
Чотири способи, як рішення фактично відбуваються
За мого досвіду, більшість рішень мають тенденцію падати у кілька категорій:
- Системи контролю (правила та формули): Рішення приймаються шляхом застосування попередньо визначених рівнянь або правил до відомих входів. Якщо X відбувається, зробіть Y.
- Пошук та оптимізація: Рішення приймаються шляхом оцінки багатьох можливих варіантів та вибору найкращого на основі визначеної мети.
- Зміцнювальне навчання (спроба та помилка): Рішення вивчаються з часом шляхом прийняття дій, спостереження за результатами та коригування на основі винагороди чи покарання.
- Практика та досвід (людське навчання): Рішення формуються через повторну експозицію, керований зворотний зв’язок та накопичене судження в реальних сценаріях.
Більшість підприємницького штучного інтелекту добре працює в перших двох категоріях. Третя та четверта категорії є більш складними для штучного інтелекту, оскільки це місце, де живе людське судження.
Автономія без структури є ризиком
Коли люди говорять про автономний штучний інтелект, розмова часто розділяється на два крайності. Одна сторона вважає, що системи є майже магічними та готовими керувати всім. Інша сторона діє, як якщо б вони ніколи не повинні бути довірені чимось значимим.
Я не думаю, що будь-який з цих поглядів є корисним. Ми повинні зосередитися на автономії в межах структури, оскільки автономія без нагляду, логіки ескалації, меж або підзвітності є основним джерелом ризику. Ризикові проблеми зараз з’являються частіше, включаючи розмови, сформовані зусиллями, такими як Національний інститут стандартів і технологій рамки управління ризиком штучного інтелекту, які відображають, як серйозно організації ставляться до питань нагляду, підзвітності та оперативної довіри.
Майбутнє підприємницького штучного інтелекту лежить у командах агентів. Організації, які отримують найбільшу цінність від штучного інтелекту, не будуть тими, які автоматизують найбільш слова. Вони будуть тими, хто вирішить, як передати справжню експертизу в системи, які можуть витримувати. Це, на мою думку, різниця між штучним інтелектом, який виглядає вражаючим, і штучним інтелектом, який стає дійсно корисним, виробляючи реальний ROI.












