Зв'язатися з нами

AlphaGeometry2: штучний інтелект, який перевершує чемпіонів олімпіади з геометрії

Штучний Інтелект

AlphaGeometry2: штучний інтелект, який перевершує чемпіонів олімпіади з геометрії

mm

Штучний інтелект давно намагається імітувати логічне мислення, схоже на людське. Незважаючи на величезний прогрес у розпізнаванні образів, абстрактне мислення та символічна дедукція залишаються складними викликами для ШІ. Це обмеження стає особливо очевидним, коли штучний інтелект використовується для вирішення математичних задач, дисципліни, яка вже давно є свідченням таких когнітивних здібностей людини, як логічне мислення, креативність і глибоке розуміння. На відміну від інших розділів математики, які спираються на формули та алгебраїчні маніпуляції, геометрія відрізняється. Це вимагає не лише структурованого, покрокового міркування, але й здатності розпізнавати приховані зв’язки та вміння створювати додаткові елементи для вирішення проблем.

Довгий час вважалося, що ці здібності властиві тільки людям. Однак Google DeepMind працював над розробкою штучного інтелекту, який може вирішити ці складні логічні завдання. Торік запровадили АльфаГеометрія, система штучного інтелекту, яка поєднує передбачувальну силу нейронних мереж із структурованою логікою символічного міркування для вирішення складних геометричних проблем. Ця система справила значний вплив, розв’язавши 54% геометричних завдань Міжнародної математичної олімпіади (IMO), щоб досягти результатів на рівні з срібні медалісти. Нещодавно вони пішли ще далі АльфаГеометрія2, яка досягла неймовірного показника розв’язання у 84%, перевершивши середніх золотих медалістів IMO.

У цій статті ми досліджуємо ключові інновації, які допомогли AlphaGeometry2 досягти такого рівня продуктивності, і що ця розробка означає для майбутнього ШІ у вирішенні складних проблем міркування. Але перш ніж занурюватися в те, що робить AlphaGeometry2 особливим, важливо спочатку зрозуміти, що таке AlphaGeometry і як він працює.

AlphaGeometry: піонерський штучний інтелект у розв’язанні геометричних задач

АльфаГеометрія це система ШІ, призначена для вирішення складних геометричних задач на рівні ІМО. По суті, це нейросимволічна система, яка поєднує модель нейронної мови з механізмом символічної дедукції. Модель нейронної мови допомагає системі передбачати нові геометричні конструкції, тоді як символічний ШІ застосовує формальну логіку для створення доказів. Ця установка дозволяє AlphaGeometry мислити більше як людина, поєднуючи можливості розпізнавання образів нейронних мереж, які відтворюють інтуїтивне людське мислення, зі структурованим міркуванням формальної логіки, яка імітує людські здібності до дедуктивного мислення. Одним із ключових нововведень у AlphaGeometry було те, як він генерував навчальні дані. Замість того, щоб покладатися на людські демонстрації, він створив один мільярд випадкових геометричних діаграм і систематично виводив співвідношення між точками та лініями. Цей процес створив величезний набір даних із 100 мільйонів унікальних прикладів, що допомогло нейронній моделі передбачити функціональні геометричні конструкції та скерувало символьний механізм до точних рішень. Цей гібридний підхід дозволив AlphaGeometry розв’язати 25 із 30 олімпіадних геометричних завдань за стандартний час змагань, майже відповідаючи продуктивності найкращих спортсменів-людей.

Як AlphaGeometry2 досягає покращеної продуктивності

Незважаючи на те, що AlphaGeometry стала проривом у математичному міркуванні, керованому ШІ, вона мала певні обмеження. Їй було важко розв’язувати складні проблеми, не вистачало ефективності в розв’язанні широкого спектру геометричних завдань і було обмежено охоплення проблем. Щоб подолати ці перешкоди, АльфаГеометрія2 вносить низку значних покращень:

  1. Розширення можливостей ШІ для розуміння складніших геометричних проблем

Одним із найважливіших удосконалень AlphaGeometry2 є його здатність працювати з більш широким спектром геометричних задач. Колишній AlphaGeometry боровся з проблемами, які стосувалися лінійних рівнянь кутів, співвідношень і відстаней, а також тих, які вимагали міркування про рухомі точки, лінії та кола. AlphaGeometry2 долає ці обмеження, запроваджуючи вдосконалену модель мови, яка дозволяє описувати й аналізувати ці складні проблеми. Як наслідок, тепер він може вирішувати 88% усіх геометричних проблем IMO за останні два десятиліття, що значно перевищує попередні 66%.

  1. Швидший і ефективніший механізм вирішення проблем

Ще одна ключова причина, чому AlphaGeometry2 працює так добре, це його покращений символічний механізм. Цей механізм, який є логічною основою цієї системи, було вдосконалено кількома способами. По-перше, його вдосконалено для роботи з більш витонченим набором правил вирішення проблем, що робить його ефективнішим і швидшим. По-друге, тепер він може розпізнавати, коли різні геометричні конструкції представляють ту саму точку в проблемі, що дозволяє йому міркувати більш гнучко. Нарешті, двигун було переписано на C++, а не на Python, завдяки чому він став більш ніж у 300 разів швидшим, ніж раніше. Це збільшення швидкості дозволяє AlphaGeometry2 генерувати рішення швидше та ефективніше.

  1. Навчання ШІ складнішим і різноманітнішим геометричним завданням

Ефективність нейронної моделі AlphaGeometry2 пояснюється її широким навчанням проблемам синтетичної геометрії. AlphaGeometry спочатку згенерувала один мільярд випадкових геометричних діаграм, щоб створити 100 мільйонів унікальних прикладів навчання. AlphaGeometry2 робить цей крок далі, генеруючи більш широкі та складніші діаграми, які включають складні геометричні зв’язки. Крім того, тепер він містить задачі, які вимагають введення допоміжних конструкцій — щойно визначених точок або ліній, які допомагають розв’язати проблему, дозволяючи передбачати та генерувати більш складні рішення

  1. Пошук найкращого шляху до рішення за допомогою розумніших стратегій пошуку

Ключовим нововведенням AlphaGeometry2 є новий підхід до пошуку під назвою Shared Knowledge Ensemble of Search Trees (SKEST). На відміну від свого попередника, який покладався на базовий метод пошуку, AlphaGeometry2 запускає кілька пошуків паралельно, причому кожен пошук навчається в інших. Ця техніка дозволяє досліджувати ширший діапазон можливих рішень і значно покращує здатність штучного інтелекту вирішувати складні проблеми за менший проміжок часу.

  1. Вивчення більш просунутої моделі мови

Іншим ключовим фактором успіху AlphaGeometry2 є його впровадження Модель Gemini від Google, найсучасніша модель штучного інтелекту, яка була навчена на ще більшому та різноманітнішому наборі математичних задач. Ця нова мовна модель покращує здатність AlphaGeometry2 генерувати покрокові рішення завдяки вдосконаленому ланцюжку думок. Тепер AlphaGeometry2 може підійти до проблем більш структурованим способом. Завдяки тонкому налаштуванню своїх прогнозів і навчанню на різних типах задач система тепер може розв’язувати значно більший відсоток геометричних завдань олімпіадного рівня.

Досягнення результатів, які перевершують чемпіонів людських олімпіад

Завдяки вищезгаданим досягненням AlphaGeometry2 вирішує 42 із 50 геометричних задач IMO за 2000-2024 роки, досягаючи 84% успішності. Ці результати перевершують показники ан середній золотий медаліст IMO і встановити новий стандарт для математичних міркувань, керованих ШІ. Окрім вражаючої продуктивності, AlphaGeometry2 також досягає успіхів у автоматизації доведення теорем, наближаючи нас до систем штучного інтелекту, які можуть не лише вирішувати геометричні проблеми, але й пояснювати свої міркування у спосіб, зрозумілий людям.

Майбутнє штучного інтелекту в математичному міркуванні

Прогрес від AlphaGeometry до AlphaGeometry2 показує, як штучний інтелект стає кращим у вирішенні складних математичних проблем, які вимагають глибокого мислення, логіки та стратегії. Це також означає, що штучний інтелект більше не призначений лише для розпізнавання шаблонів — він може міркувати, встановлювати зв’язки та вирішувати проблеми способами, які більше нагадують людське логічне міркування.

AlphaGeometry2 також показує нам, на що ШІ може бути здатний у майбутньому. Замість того, щоб просто слідувати інструкціям, штучний інтелект може почати досліджувати нові математичні ідеї самостійно і навіть допомагати в наукових дослідженнях. Завдяки поєднанню нейронних мереж із логічними міркуваннями штучний інтелект може бути не просто інструментом, який може автоматизувати прості завдання, але й кваліфікованим партнером, який допомагає розширити людські знання в галузях, які покладаються на критичне мислення.

Чи можемо ми вступати в епоху, коли штучний інтелект доводить теореми та робить нові відкриття у фізиці, техніці та біології? Оскільки штучний інтелект переходить від обчислень грубої сили до більш продуманого вирішення проблем, ми можемо бути на порозі майбутнього, де люди та штучний інтелект працюватимуть разом, щоб розкрити ідеї, які ми ніколи не вважали можливими.

Доктор Техсін Зія є штатним доцентом Університету COMSATS Ісламабад, має ступінь доктора філософії зі штучного інтелекту у Віденському технологічному університеті, Австрія. Спеціалізуючись на штучному інтелекті, машинному навчанні, науці про дані та комп’ютерному зорі, він зробив значний внесок публікаціями в авторитетних наукових журналах. Доктор Техсін також керував різними промисловими проектами як головний дослідник і працював консультантом зі штучного інтелекту.