Connect with us

Думати як людина: Чи може штучний інтелект розвинути аналогічне мислення?

Лідери думок

Думати як людина: Чи може штучний інтелект розвинути аналогічне мислення?

mm

Коли людина стикається з чимось новим, вона інстинктивно шукає порівняння. Дитина, яка вчиться про атоми, може почути, що електрони обертаються навколо ядра “як планети обертаються навколо Сонця”. Підприємець може представити свій стартап як “Uber для догляду за тваринами”. Ученій може розповісти неспеціалізованій аудиторії, що мозок обробляє інформацію “як комп’ютер”.

Цей ментальний стрибок – побачити, як одна річ схожа на іншу в своїй глибинній структурі – називається аналогічним мисленням. І воно може бути інгредієнтом, який відокремлює людську інтелект від штучного інтелекту у його поточній формі. Якщо ми хочемо коли-небудь розробити штучний загальний інтелект – Святий Грааль штучного інтелекту, який досі виявився недосяжним – нам потрібно визначити, чи можливо для машин навчитися думати аналогічно. Ставки не можуть бути вищими. Якщо відповідь “Ні”, то навіть найскладніші системи штучного інтелекту будуть назавжди лише вдосконаленими калькуляторами. Вони будуть не в змозі вирішувати проблеми, які вимагають більше, ніж просто зміну даних, на яких вони були навчені.

Архітектура розуміння

Аналогічне мислення працює на рівні структурних, а не поверхневих, подібностей. Наприклад, що робить серце і водяний насос подібними? Звичайно, не їхній фізичний вигляд. Це те, що обидва виконують точно одну й ту ж функцію, а саме циркуляцію рідини через систему. І саме ця здатність відображати відносини, типові в одному контексті, на інший контекст, робить людське навчання, творчість і розв’язування проблем так унікальними.

Є багато реальних прикладів. Візьмімо Августа Кекуле, талановитого німецького хіміка, який отримав підказку про структуру бензену у вигляді сну, в якому він побачив змія, яка кусає свій власний хвіст. Сьогодні програмісти застосовують уроки з організації кухні при структуризації коду, а вчителі пояснюють електричний струм, порівнюючи його з водою, яка тече через труби.

Поточні системи штучного інтелекту, однак, знаходять цю загальну когнітивну здібність дуже складною. Коли їх запитують, сучасні великі мовні моделі (LLM) з задоволенням пояснюють, чому “час – це гроші” або завершують вербальні завдання з розв’язування проблем. Але накопичувальні докази свідчать про те, що вони часто займаються складним підігоном моделей, а не справжнім структурним відображенням. Коли дослідники представляють ці моделі новими аналогічними проблемами, які відхиляються від їхніх навчальних даних, продуктивність часто падає. Це відбувається тому, що LLM відмінно повторюють аналогії, які вони бачили раніше, але спотикаються, коли їх просять створити нові зв’язки.

Немає аналогічного мислення, немає AGI

Очевидно, що аналогічне мислення єsine qua non AGI. Без нього системи штучного інтелекту залишаються крихкими, не 能уть пристосувати знання, яке є актуальним в одному домені, для вирішення проблем в іншому. Наприклад, уявіть собі самоходний автомобіль, який навчився рухатися по сонячним вулицям Каліфорнії, але не може екстраполювати це навчання для обробки снігових умов. Система штучного інтелекту автомобіля – це дорогий підігон моделей, а не система, здатна до справжньої інтелектності. Справжня інтелектність вимагатиме когнітивної гнучкості для визнання того, що водіння по крижаних дорогах є структурно порівнянним з іншими слизькими поверхнями, навіть якщо подробиці відрізняються.

Той же принцип застосовується в галузях, що виходять за рамки автономних транспортних засобів, звичайно. Аналогічне мислення також сприяє прогресу в науці, медичній діагностиці, юридичному мисленні та творчих заняттях. Системи штучного інтелекту без цієї здатності схожі на ученого, який запам’ятав цілу бібліотеку, але не може синтезувати це знання через дисципліни. Вражаюче, звичайно, але тільки в вузькому сенсі.

Будівництво аналогічного мислення

Так, чого потрібно для розробки систем штучного інтелекту, здатних до людського аналогічного мислення? На основі новітніх досліджень і фундаментальної природи аналогічного мислення декілька критичних умов і технік здаються необхідними.

Структурно багате і різноманітне навчальне дані

Першим вимогам є те, щоб системи штучного інтелекту були навчені на даних, які виходять за рамки поверхневих текстових моделей. Інтернет з його величезним репозиторієм наукових робіт, технічної документації, творчих робіт та пояснювального контенту є хорошою точкою відліку. Але не будь-які інтернет-дані будуть достатніми. Що потрібно, це структурна різноманітність. Іншими словами, щоб спрямувати системи штучного інтелекту до навчання розпізнаванню абстрактних моделей, розробники повинні почати піддавати їх контрастам з першого дня навчання. Їхні навчальні дані могли б містити архітектурні плани поряд з музичними партитурами, математичні доведення разом з поезією або юридичні аргументи поряд з рецептами.

Найважливіше, що ці дані повинні зберігати і підкреслювати структурні відносини, а не просто статистичні кореляції. Графи знань, каузальні діаграми та явно відображені відносини між концепціями могли б допомогти системам штучного інтелекту навчатися “бачити” структуру, а не механічно запам’ятовувати асоціації. Подумайте про це, як навчання штучного інтелекту не тільки про те, що є речі, а й про те, як вони пов’язані між собою принциповим чином.

Тестування за межами навчального набору

Щоб переконатися, що системи штучного інтелекту навчаються аналогічному мисленню, а не просто покращують свої імітаційні здібності, нам потрібно інструменти, які навмисно досліджують їхню здатність відображати структуру на ситуації, з якими вони ніколи не стикалися раніше. Це передбачає створення тестових завдань, які є свідомо несхожими на все, що може з’явитися в навчальних даних – те, що дослідники називають “контрфактичними” завданнями.

Наприклад, замість того, щоб запитати у штучного інтелекту завершення стандартних аналогій, таких як “щеня – це собака, як котеня – це ____”, ми могли б представити йому завдання, що використовують вигадані концепції або попросити його відобразити відносини між доменами, яких він ніколи не бачив з’єднаними. Чи може він визнати, що відносини між інгредієнтами та рецептом паралельні відносинам між доказами та юридичним аргументом, навіть якщо він ніколи не зустрічав це конкретне порівняння? Такі тести б показали, чи система розуміє глибинні структури або просто запам’ятовує подібні приклади.

Вимірювання того, що важливо

Хороша новина для розробників штучного інтелекту полягає в тому, що існує багаторічна науково-дослідницька робота, пов’язана конкретно з тим, як люди обробляють аналогії. Вони можуть використовувати ці дослідження для розробки надійних критеріїв для аналогічного мислення. Однак ці критерії повинні виходити за рамки простого підрахунку правильних відповідей на аналогічні тести. Що насправді потрібно, це метрики, які захоплюють, чи системи штучного інтелекту можуть визначити, які відносини важливі для відображення, одночасно ігноруючи поверхневі подібності та підтримуючи послідовність у своїх відображеннях.

Це могло б включати системи оцінювання, які винагороджують визнання вищого порядку відносин. Наприклад, штучний інтелект отримуватиме вищу оцінку, якщо він може не тільки визнати, що атоми та сонячні системи включають орбітальні рухи, але й зрозуміти каузальні відносини, які керують цими орбітами. Інша компетенція, яку можна оцінювати, полягає в тому, чи штучний інтелект може спонтанно генерувати відповідні аналогії для пояснення нових концепцій, а не просто завершувати попередньо структуровані аналогічні завдання.

Спорудження через підказки

Недавні дослідження свідчать про те, що здатність штучного інтелекту думати аналогічно залежить у великому ступені від того, як його просять зробити це. Аналогічна підказка – явне спрямування моделей через процес структурного відображення – може викликати більш складне мислення, ніж просте подання завдань. Це могло б включати запитання системи спочатку визначити відносини в джерельному домені, а потім явно прохання відобразити ці відносини на цільовий домен.

Ця техніка могла б служити подвійній меті: покращенню поточних систем штучного інтелекту аналогічних здібностей та генерації навчальних даних для майбутніх моделей. Записуючи успішні випадки спрямованого аналогічного мислення, приклади можна створити, які можуть навчити наступні системи займатися цим процесом більш природним чином.

Гібридні архітектури

Досягнення людського аналогічного мислення може потребувати виходу за рамки чистих підходів нейронних мереж. Гібридні системи, які поєднують розпізнавання моделей з символічним мисленням – явним представленням і маніпулюванням структурними відносинами – могли б надати відсутню частину. Хоча нейронні мережі відмінно вчаться на явних моделях, символічні системи можуть забезпечити структурну послідовність і логічне відображення, яке аналогічне мислення вимагає.

Гібридні архітектури ще в своїй зародковості, але дослідники активно досліджують їхній потенціал. Деякі, наприклад, стверджують про поєднання нейронних мереж з символічним мисленням, яке могло б привести до покращених аналогічних здібностей. Інші пропагують гібридні моделі, побудовані для вирішення тенденції моделей штучного інтелекту до фабрикації та аналогічного мислення в мілкому сенсі.

Де далі?

Залежно від того, кого ви запитаєте, аналогічне мислення або вже є емерджентним, або системи штучного інтелекту просто стають більш складними в своїй імітації. Яка б позиція не була ближчою до правди, ясно, що, якщо мрія про AGI має бути реалізована, це буде потребувати більше, ніж просто більших моделей або更多 даних. Це також буде вимагати деяких фундаментальних інновацій у тому, як ми структуруємо, навчаємо та оцінюємо наші системи штучного інтелекту.

Як трансформативні можливості штучного інтелекту розгортаються, аналогічне мислення стає критичним критерієм для продуктивності та стримуючим нагадуванням про розрив між поточними можливостями штучного інтелекту та справжньою людською когніцією. Коли система штучного інтелекту зможе побачити, що демократія для громадян є тим же, чим оркестр є для музикантів – визнаючи не поверхневі ознаки, а глибинні структурні відносини про координацію, представництво та емерджентну гармонію – вона перетне критичний поріг до справжньої інтелектності.

Більше 13 років Gediminas Rickevicius є рухом зростання в компаніях лідерах ринку в галузі ІТ, реклами та логістики по всьому світу. Він змінює традиційний підхід до розвитку бізнесу та продажів шляхом інтеграції великих даних у стратегічне прийняття рішень. Як старший віце-президент глобальних партнерств у Oxylabs, Gediminas продовжує свою місію з надання підприємствам сучасних рішень для збору публічних даних у мережі Інтернет.