Моделі та платформи ШІ
Ми більше не виводимо АІ. Ми виводимо цивілізації

Багато років основним питанням у сфері штучного інтелекту (АІ) було те, як вивести моделі АІ у відповідність з людськими цінностями. Дослідники намагалися визначити правила безпеки, принципи етики та механізми контролю, які керують рішеннями АІ. Ця робота досягла значного прогресу. Але тепер, коли ці системи АІ стають все більш потужними та поширеними, фокус уваги щодо виводу АІ починає зміщуватися. Що розпочалося як виклик виводу однієї моделі до однієї сукупності інструкцій, тепер стало набагато більшим викликом – виводу цілих цивілізацій, які використовують ці системи у глобальному масштабі. АІ вже не просто інструмент. Воно еволюціонує в середовище, де суспільства працюють, спілкуються, ведуть переговори та конкурують. Як наслідок, вивід АІ вже не залишається технічною проблемою. Він став проблемою цивілізацій. У цій статті я пояснюю, чому вивід АІ вже не тільки про моделі, і чому нам потрібно почати думати у термінах цивілізацій, а не машин. Я також обговорюю, як цей зсув впливає на наші обов’язки та що це означає для глобальної співпраці.
Чийі цінності АІ справді представляє?
Якщо ви запитаєте у АІ про чутливу історичну подію, його відповідь залежить від даних, які він вивчив. Якщо ці дані походять переважно з західного інтернету, відповідь буде мати західну упередженість. Вона буде пріоритизувати індивідуалізм, відкриту мову та демократичні ідеали. Це хороші цінності для багатьох людей. Але вони не єдині цінності у світі.
Користувач у Сінгапурі, користувач у Ер-Ріяді та користувач у Сан-Франциско мають різні визначення того, що є “корисним” і що є “шкідливим”. У деяких культурах соціальна гармонія важливіша за абсолютну свободу слова. У інших шанобливе ставлення до ієрархії важливіше за порушення.
Коли компанія з Кремнієвої долини використовує “Reinforcement Learning from Human Feedback” (RLHF), вони наймають людей, щоб оцінити відповіді АІ. Але хто ці люди? Які їхні переконання? Якщо вони виводять модель у відповідність з американськими стандартами, вони випадково будують американський культурний експорт. Вони будують цифрового дипломата, який примусово впроваджує правила однієї конкретної цивілізації у решту світу.
Поява петльових зв’язків
Виклик не тільки у тому, що АІ відображає переконання однієї культури. Це у тому, як ці переконання можуть змінити нас. Сучасні системи АІ мають потенціал формувати поведінку окремих осіб, організацій та навіть націй. Вони можуть впливати на те, як ми думаємо, працюємо, довіряємо та конкуруємо. Це створює петльові зв’язки між системами АІ та людськими суспільствами; ми тренуємо АІ, а АІ формує наше мислення та дії. Ці петлі стають сильнішими, оскільки АІ стає все більш поширеним. Щоб побачити, як працює цей петльовий зв’язок, ось два приклади:
- Широке впровадження АІ змінює соціальну поведінку, а соціальна поведінка змінює дані, які тренують нові системи. Наприклад, алгоритм рекомендацій може формувати те, що люди дивляться, читають та вірять. Інструменти продуктивності змінюють те, як команди співпрацюють та як студенти вчаться. Ці зрушення у поведінці змінюють закономірності даних у вигляді різних звичок перегляду, моделей спілкування на робочому місці чи стилів письма. Коли ці дані потрапляють у майбутні навчальні набори даних, моделі коригують свої припущення та виходи відповідно. Поведінка людини формує моделі, а моделі, у свою чергу, формують поведінку людини.
- Автоматичні інструменти прийняття рішень впливають на державну політику, а державна політика впливає на майбутнє тренування моделей. Наприклад, багато урядів зараз використовують АІ, щоб запропонувати, де виділити ресурси, такі як визначення районів, які потребують більшої підтримки у сфері охорони здоров’я, або території, які можуть мати вищу ризикову злочинність. Коли політики приймають рішення на основі цих рекомендацій, результати цих рішень пізніше стають частиною нових навчальних наборів даних. З часом політичні рішення, сформовані АІ, стають основою для наступного покоління моделей АІ.
Як тільки ви визнаєте цей петльовий зв’язок, стає зрозуміло, що АІ поступово формує та виводить цивілізації. Як наслідок, нації починають питати: Як вони можуть захистити свої цінності, інтегруючи АІ у свої суспільства та інститути?
Поява суверенного АІ
Цей виклик виводу АІ спровокував значну реакцію урядів усього світу. Нації зрозуміли, що залежність від імпортованого АІ є ризиком для їхньої суверенітету. Вони не можуть дозволити собі мати своїх громадян, яких навчають, інформують та радять чорна скринька, яка думає як іноземець.
Цей висновок призвів до появи “суверенного АІ“. Франція інвестує великі кошти у будівництво моделей, які розмовляють французькою та розуміють французьке право та культуру. Індія будує корінні моделі АІ, щоб забезпечити свої культурні цінності. Об’єднані Арабські Емірати та Китай будують моделі АІ, виведені у відповідність з їхніми національними баченнями.
Це нова гонка озброєння. Це гонка за контроль над нарративом. Цивілізація, яка не має свого АІ, врешті-решт втратить свою пам’ять. Якщо ваші діти запитують у машини питання, а машина відповідає логікою іншої культури, ваша культура починає руйнуватися. Це розуміння, однак, може привести до формування окремих цифрових блоків. Ми можемо закінчити з західним АІ, китайським АІ, індійським АІ тощо. Ці системи будуть працювати з різними фактами та різними моральними компасами. Ці розробки роблять зрозумілим, що якщо ми хочемо створити єдину, справді виведену модель АІ, нам потрібно спочатку знайти спосіб вивести цивілізації.
Потрібен дипломатичний АІ
Традиційний вивід припускає, що модель можна вивести за допомогою ретельного тренування, підказок та обмежень. Це мислення походить з технічної точки зору раннього дослідження безпеки АІ. Але навіть ідеальний вивід моделі не може вирішити проблеми виводу цивілізацій. Вивід не може залишатися стабільним, коли суспільства тягнуть у протилежні боки. Якщо країни, компанії та спільноти мають конфліктуючі цілі, вони будуть штовхати системи АІ до відображення цих конфліктів. Ці обмеження показують, що вивід не тільки технічна проблема. Це проблема управління, культури та координації. І ці проблеми потребують не тільки експертів чи розробників. Вони включають цілі цивілізації.
Як ми рухаємось далі? Якщо ми приймаємо, що універсальний вивід неможливий, нам потрібно змінити свою стратегію. Нам потрібно зупинити пошук технічного рішення філософської проблеми. Нам потрібно почати думати як дипломати. Нам потрібно будувати протоколи для “Цивілізаційного виводу”. Нам потрібно визначити, як АІ може поважати переконання суспільства та його цінності без нав’язування переконань іншої культури. Інакше кажучи, нам потрібно цифрове Об’єднане Королівство для наших алгоритмів.
Це вимагає прозорості. Наразі ми не знаємо, які цінності приховані у глибоких шарах нейронної мережі. Ми бачимо тільки вихід. Щоб вивести цивілізації, нам потрібно бути чіткими щодо “Конституції” кожної моделі. Модель повинна бути здатна декларувати свою упередженість. Вона повинна бути здатна сказати: “Я тренуюся на цих даних, з цими правилами безпеки, пріоритезуючи ці цінності”. Лише коли упередженість видима, ми можемо довіряти системі. Користувач повинен бути здатний перемикатися між перспективами. Ви повинні бути здатні задати питання та побачити, як “західна” модель відповідає порівняно з “східною” моделлю. Це перетворить АІ на інструмент для розуміння, а не інструмент для індоктринації.
Основне
Ми витратили занадто багато часу, турбуючись про Термінатора. Реальний ризик не у тому, що робот знищить нас. Реальний ризик у тому, що робот зробить нас забути, хто ми є. Вивід не код, який ми можемо написати один раз і забути. Це постійна домовленість з моделями АІ, щоб тримати їх у відповідності з нашими переконаннями та цінностями. Це політичний акт. Як ми рухаємось до цієї наступної фази інтелектуальної доби, нам потрібно дивитися за межі екрана. Нам потрібно розглядати, як АІ інтерпретує нашу історію, наші кордони та наші переконання. Ми будуємо розуми, які допоможуть нам керувати світом. Нам потрібно забезпечити, щоб ці розуми поважали відмінності між цивілізаціями.












