Connect with us

Похмура інтелект: чому ІІ успішно справляються з олімпійськими завданнями, але потопають у шкільній математиці

Штучний інтелект

Похмура інтелект: чому ІІ успішно справляються з олімпійськими завданнями, але потопають у шкільній математиці

mm

Спільнота штучного інтелекту відсвяткувала видатний рубіж у 2025 році, коли як Google DeepMind, так і системи OpenAI досягли золотої медалі на Міжнародній математичній олімпіаді. Ці моделі ІІ розв’язали завдання, які могли розв’язати лише небагато з найкращих молодих математиків світу. Тим не менше, ці самі системи часто спотикаються, коли їх просять виконати базові арифметичні дії, які будь-який учень середньої школи міг би виконати легко. Ця вражаюча парадоксальність розкриває щось фундаментальне про природу штучного інтелекту сьогодні. Ми є свідками появи того, що можна назвати лише похмурим інтелектом, де машини демонструють надлюдські здібності в певних областях, тоді як не справляються з завданнями, які ми вважаємо елементарними.

Олімпійський тріумф

Міжнародна математична олімпіада є провідним стандартом у передуніверситетських математичних змаганнях. Кожного року найкращі молоді математиків з усього світу намагаються розв’язати шість завдань, які вимагають глибокого розуміння, творчого мислення та високорівневих методів доведення. У 2025 році системи ІІ від Google DeepMind та OpenAI набрали 35 балів із 42, що було достатньо для отримання золотих медалей. AlphaGeometry 2 від DeepMind розв’язала складну геометричну задачу всього за 19 секунд, тоді як AlphaProof розв’язала завдання з теорії чисел та алгебри, які поставили в тупик більшість людських учасників.

Ці досягнення будуються на років інкрементального прогресу. Системи використовують формальні математичні мови, такі як Lean, для створення суворих доведень. Вони використовують техніки, такі як curriculum learning, де ІІ тренується на завданнях зростаючої складності. Ця підготовка дозволяє ІІ зрозуміти складні взаємозв’язки між математичними об’єктами, розпізнати тонкі закономірності та створити елегантні доведення.

Елементарна боротьба

Ті самі системи ІІ, які досягли золотої медалі на олімпійських завданнях, часто не справляються з завданнями, які здаються тривіальними. Наприклад, якщо ви попросите їх помножити великі числа, вони можуть впевнено надати неправильні відповіді. Аналогічно, якщо ви спробуєте виконати інші базові арифметичні операції, їхня продуктивність стає непередбачуваною. Проблема не обмежується простими обчисленнями. Ці системи часто не справляються з завданнями з словами, які вимагають відстежування кількох величин, розуміння реального контексту чи застосування базових математичних операцій послідовно.

Ця слабкість по суті випливає з того, як ці моделі ІІ фундаментально працюють. Великі мовні моделі передбачають, який текст повинен йти далі на основі закономірностей, які вони бачили в тренувальних даних. Коли вони зустрічають “2 + 2”, вони розпізнають цю закономірність і правильно передбачають “4” не тому, що вони розуміють додавання, а тому, що ця послідовність з’являється безліч разів у їхніх тренувальних даних. Коли ви представляєте їм незвичайні розрахунки, які рідко з’являються в тексті, їхня продуктивність швидко погіршується. Вони є суттєво машинами, які розпізнають закономірності, які блискуче виконують свою роботу, коли закономірності чіткі та послідовні, але не справляються, коли їм доводиться обчислювати незнайому задачу.

Парадокс архітектури

Протиріччя між олімпійським успіхом та арифметичною невдачею розкриває глибшу архітектурну проблему. Сучасні системи ІІ блискуче виконують завдання, які можна розв’язати за допомогою розпізнавання закономірностей, логічного висновку та систематичного пошуку у просторі рішень. Олімпійські завдання, попри свою складність, часто мають елегантні структури, які ІІ можуть використати. Системи можуть досліджувати різні стратегії доведення, перевіряти логічні кроки та будувати на засадах математичних рамок. Вони діють у світі символів та правил, де панують послідовність та логіка.

Натомість базова арифметика, парадоксально, ставить інші виклики. Вона вимагає точної маніпуляції величинами, а не розпізнавання закономірностей. Вона вимагає розуміння числової величини та відносин, які не можуть бути наближені. Коли система ІІ підходить до арифметики через мовну модель, вона розглядає числа як токени, які потрібно передбачити, а не величини, які потрібно обчислити. Ця фундаментальна невідповідність між вимогами завдання та архітектурою моделі створює прогалину у продуктивності, яку ми спостерігаємо.

Тренувальні дані та їх обмеження

КапабILITIES ІІ в значній мірі залежать від якості та природи тренувальних даних. Математичні доведення та складні завдання часто з’являються у добре структурованих форматах в Інтернеті. Академічні статті, підручники та освітні ресурси містять чіткі приклади математичного мислення. Інтернет містить обширні обговорення математичних понять, технік доведення та стратегій розв’язання завдань. Ця багата корпус дозволяє системам ІІ вивчити просунуте математичне мислення.

Елементарна математика, однак, страждає від іншої проблеми. Хоча базова арифметика з’являється часто в Інтернеті, вона рідко супроводжується детальними ланцюгами розумування, які допоможуть ІІ зрозуміти основні процеси. Прості розрахунки заявляються як факти, а не пояснюються як процедури. Тренувальні дані містять результати обчислень, але не сам процес обчислень. Це створює фундаментальну прогалину у розумінні, яка проявляється як погана продуктивність на базових завданнях.

Вплив на розвиток ІІ

Ця нерівна модель інтелекту має важливі наслідки для того, як ми проектуємо та використовуємо системи ІІ. Ми не можемо припускати, що успіх у складних завданнях означає компетентність у простіших завданнях. Система ІІ, яка може довести математичні теореми, може не справитися з балансуванням чекового рахунку. Система, яка пише комп’ютерний код, може боротися з базовим підрахунком. Ця реальність вимагає ретельного розгляду можливостей та обмежень ІІ у реальних застосунках.

Ця поява також розкриває важливість гібридних підходів. Натомість очікувати, що одна модель зможе виконувати кожне завдання, ми можемо потребувати спеціалізованих систем для різних типів завдань. Наприклад, поєднання символічних обчислень для арифметики з мовними моделями для розуміння могло б створити більш надійні рішення. Майбутнє ІІ може полягати у координуванні багатьох спеціалізованих систем замість прагнення до монолітного загального інтелекту.

Шлях вперед

Розпізнавання похмурого інтелекту надає чітке напрямок для побудови більш здатних систем ІІ. Дослідники розробляють методи для інтеграції обчислювальних інструментів у мовні моделі, що дозволяє їм делегувати арифметику калькуляторам. Нові стратегії навчання зосереджені на навчанні моделей, коли використовувати зовнішні інструменти, а не намагатися інтерналізувати кожну умість. Цій підхід відповідає людський інтелект, де ми покладаємося на калькулятори для обчислень та зберігаємо наші зусилля для вищого рівня розуміння.

Парадокс похмурого інтелекту в кінцевому підсумку вчить нас скромності про штучний інтелект. Ці системи ні універсально перевершують, ні універсально обмежені. Натомість вони демонструють складну суміш сильних та слабких сторін, яких ми повинні бути свідомі, щоб ефективно використовувати та покращувати можливості ІІ. Успіх вимагає не тільки розширення того, що може зробити ІІ, але й звернення до його фундаментальних прогалин. Машини, які можуть довести теореми, але не справляються з базовим додаванням, показують, що інтелект, штучний чи людський, залишається багатогранным явищем, яке не легко визначити.

Основне

Успіх ІІ у розв’язанні олімпійських завдань, але невдача у простій математиці, показує, що інтелект не розвивається рівномірно. Ці системи можуть бути блискучими в одній області та слабкими в іншій. Розуміння цієї нерівної моделі має важливе значення для того, як ми проектуємо та використовуємо ІІ. Натомість очікувати, що одна модель зможе виконувати все, ми можемо потребувати поєднання різних підходів, які грають на сильних сторонах кожної системи. Реальний прогрес буде полягати у побудові ІІ, який працює надійно на практиці, а не з припущенням, що він буде хорошим у кожному завдання.

Доктор Техсін Зія є доцентом COMSATS University Islamabad, який має ступінь PhD з штучного інтелекту у Віденському технічному університеті, Австрія. Спеціалізується на штучному інтелекті, машинному навчанні, науці про дані та комп'ютерному баченні, він зробив значний внесок з публікаціями в авторитетних наукових журналах. Доктор Техсін також очолював різні промислові проекти як головний дослідник і служив консультантом з штучного інтелекту.