Лідери думок
Чому Industry 5.0 потребує штучного загального інтелекту

Від: Bas Steunebrink, співзасновник і директор штучного загального інтелекту, Eric Nivel, провідний інженер AGI та Jerry Swan, науковий співробітник у NNAISENSE.
Ми приймаємо автоматизацію як щось звичайне у нашому сучасному світі, користуючись кожен день з ланцюгів постачання, які охоплюють увесь світ, доставляючи величезний вибір товарів на наші полиці. Але за кулісами виробництво і рух товарів генерують багато проблем оптимізації, таких як упаковка, планування, маршрутизація та автоматизація виробничої лінії. Ці проблеми оптимізації є динамічними і постійно змінюються в тандемі з реальним світом. Наприклад, очікувані маршрути постачання можуть раптом стати недоступними через непередбачені обставини – наприклад, Суецький канал може бути заблокований; повітряні маршрути можуть змінитися через виверження вулканів; цілі країни можуть бути недоступними через конфлікти. Зміни в законодавстві, колапс валют і дефіцит ресурсів також є прикладами змінних постачання, які постійно перебувають у русі.
Щоб надати інший приклад, іноді необхідно інтегрувати новий компонент до машини або робочого процесу (користувачі можуть бажати різні матеріали або кольори, наприклад). Наразі для цього потрібна кваліфікована людська праця, або – у випадку з машинним навчанням – додатково перенастройка і повторне розгортання рішення. Аналогічно, “цифрові двійники” Industry 4.0 все ще сильно залежать від припущення, що опис проблеми і розподіл входів можна визначити раз і назавжди на етапі первинного проектування системи.
Недавня пандемія підкреслює хрупкість планування ланцюгів постачання “just-in-time”. Стає все більш очевидним, що в дедалі більш складному і невизначеному світі промисловість вже не може собі дозволити такої інфлексибільності. Наразі виробництво має зробити фіксований вибір між “Низьким змішуванням високим об’ємом” (LMHV) і “Високим змішуванням низьким об’ємом” (HMLV). Industry 5.0 передбачає перспективу “Високого змішування високим об’ємом” (HMHV), в якому робочий процес можна перепрофілювати за низької вартості для задоволення рідинних вимог. Для цього потрібно “автоматизувати автоматизацію”, щоб ліквідувати необхідність людського втручання і/або простою системи, коли проблема або середовище змінюється. Це вимагає систем, які “працюють на команду”, реагуючи на такі зміни, залишаючи при цьому розумну перспективу виконання призначених завдань у реальному часі. Розгляньте, наприклад, інструктування роботизованої лінії збірки, яка зараз зайнята завданням X, наступним чином:
“Негайно зупиніте збірку X: ось специфікація Y, і ось більшість ваших старих і кілька нових ефекторів. Тепер почніть збірку Y, уникайте таких і таких видів дефектів і відходів.”
Незважаючи на широке недавнє обговорення про швидке прибуття “Штучного загального інтелекту” (AGI) через так звані великі мовні моделі, такі як GPT-3, жоден з запропонованих підходів не здатний真正 “працювати на команду”. Тобто, вони не можуть бути призначені для чогось цілком поза їхнім навчальним набором без простою офлайн-перенастройки, верифікації та повторного розгортання.
Звичайно, зрозуміло, що будь-яке реальне поняття інтелекту нерозривно пов’язане з реакцією на зміну. Система, яка залишається незмінною – незалежно від того, скільки несподіваних подій вона переживає – не є ні автономною, ні інтелектуальною. Це не відкидає недвозначних сильних сторін таких підходів глибокого навчання (DL), які мали великий успіх як засіб синтезу програм для проблем, які важко явно визначити.
Що за системна функціональність могла б дозволити штучному інтелекту рухатися за межі цього тренувального, заморожувального і розгортального парадигми, до тієї, яка здатна на безперервне адаптивне навчання? Розгляньте необхідність заміни дефектного компонента у виробничому робочому процесі на компонент від іншого постачальника, який міг би мати інші допуски. З моделлю кінцевого чорного ящика сучасного штучного інтелекту процес цифрового двійництва потрібно робити заново. Для подолання обмежень сучасних підходів потрібно радикальна зміна: модель, яка могла б прямо міркувати про наслідки зміни компонента – і, загалом, більш загальні контрфактичні “що якщо” сценарії. Розкладання робочого процесу на компоненти з відомими властивостями і повторне поєднання їх за потребою вимагає того, що називається “композиційністю”.
Композиційність досі уникала сучасного штучного інтелекту, де її часто плутають з більш слабким поняттям модульності. Модульність стосується здатності “склеїти” компоненти, але це не відображає суті композиційності, яка полягає в здатності міркувати про поведінку результатного робочого процесу для визначення і забезпечення збереження деякої бажаної властивості. Ця здатність є життєво важливою з причин верифікації і безпеки: наприклад, здатність системи міркувати, що “прийняття двигуна від альтернативного виробника збільшить загальну потужність заводу, поки всі інші компоненти залишаються в температурних межах”.
Хоча сучасні підходи нейронних мереж добре вчаться вивчати правила з даних, їм бракує композиційного міркування. Як альтернатива сподіванню, що композиційне міркування виникне зсередини архітектур нейронних мереж, можна зробити прямий використовуватися конструкціями категоріальної теорії, математичної студії композиційності. Зокрема, її підгалузь категоріальна кібернетика займається двонаправленими контролерами як фундаментальними представницькими елементами. Двонаправленість – це здатність виконувати як прямий, так і зворотний висновок: прогнозування з причин до наслідків і навпаки. Композиційне зворотне міркування особливо важливе, оскільки воно дозволяє включати зворотній зв’язок від середовища в будь-якому масштабі структуальної репрезентації – це сприяє швидкому навчанню з малиої кількості прикладів.
При деякій бажаній поведінці системи завдання навчання полягає в побудові агрегатної контрольної структури, яка відповідає їй. Спочатку вивчені структури діють як скелет для наступного навчання.
Як знання системи зростає, цей скелет можна прикрасити вивченими композиційними властивостями, подібно до того, як молекула H2O може бути визначена як володіюча різними властивостями, ніж її складові атоми. Крім того, як “кидання м’яча” і “махання тенісною ракеткою” можна розглядати як пов’язані м’язові дії для людини, так і пов’язані завдання можуть мати спільну скелетну структуру контролера, яку можна прикрасити у завдань-специфічному порядку через зворотній зв’язок від середовища. Це роз’єднання каузальної структури від завдань-специфічних може сприяяти навчанню нових завдань без катастрофічного забуття, яке переслідує сучасні підходи. Отже, гібридний числово-символічний підхід описаної форми може поєднати сильні сторони як нейронних, так і символічних підходів, маючи як явне поняття структури, так і здатність вивчати адаптивно, як властивості складаються. Міркування про композиційні властивості ґрунтуються на тривалому основі роботою, яку система зараз виконує.
У висновку, зрозуміло, що потрібен новий підхід для створення真正 автономних систем: систем, здатних пристосовуватися до значних змін і/або працювати в невідомих середовищах. Це вимагає безперервного адаптивного навчання і узагальнення з того, що вже відомо. Незважаючи на свою назву, підходи глибокого навчання мають лише поверхневе представлення світу, яке не може бути маніпульованим на високому рівні навчанням. Натомість ми пропонуємо, що системи AGI наступного покоління будуть включати глибоке навчання в ширшу архітектуру, оснащену здатністю міркувати прямо про те, що воно знає.
Здатність системи символічно міркувати про своє власне представлення надає значні переваги для промисловості: з явно композиційним представленням система може бути перевірена – чи людьми, чи внутрішньо самою системою – для задоволення життєво важливих вимог безпеки і справедливості. Хоча існує багато академічних турбот про так званий x-ріск AGI, відповідним фокусом є радше конкретна інженерна проблема перепрограмування системи контролю, зберігаючи ці життєво важливі вимоги, процес, який ми називаємо інтерактивним вирівнюванням. Лише через прийняття такого типу систем контролю, які є довіреними і ефективними постійними учнями, ми зможемо реалізувати наступне покоління автономності, передбачене Industry 5.0.






