AGI та майбутній ШІ

AlphaEvolve: революційний крок Google DeepMind до AGI

mm

Google DeepMind представив AlphaEvolve, агент кодування, який автономно відкриває нові алгоритми та наукові рішення. Представлений у статті під назвою AlphaEvolve: Агент кодування для наукових та алгоритмічних відкриттів,” ця робота представляє фундаментальний крок до штучного загального інтелекту (AGI) та навіть штучного суперінтелекту (ASI). Натомість ніж спиратися на статичне тонке налаштування або людські дані, AlphaEvolve використовує зовсім інший підхід – один, який базується на автономній творчості, алгоритмічному інноваціях та безперервному самозміненні.

У серці AlphaEvolve лежить самодостатній еволюційний трубопровід, який працює на основі великих мовних моделей (LLM). Цей трубопровід не тільки генерує вивід, а й мутує, оцінює, вибирає та покращує код протягом поколінь. AlphaEvolve починається з початкової програми та ітеративно уточнює її, вводячи ретельно структуровані зміни.

Ці зміни приймають форму LLM-генерованих змін – кодових модифікацій, запропонованих мовною моделлю на основі попередніх прикладів та явних інструкцій. “Зміна” у програмній інженерії означає різницю між двома версіями файлу, зазвичай виділяючи рядки, які потрібно видалити або замінити, та нові рядки, які потрібно додати. У AlphaEvolve LLM генерує ці зміни, аналізуючи поточну програму та пропонуючи невеликі редагування – додавання функції, оптимізацію циклу або зміну гіперпараметра – на основі запиту, який включає метрики продуктивності та попередні успішні редагування.

Кожна змінена програма потім тестується за допомогою автоматизованих оцінювачів, спеціально розроблених для завдання. Найефективніші кандидати зберігаються, посилаються та рекомбінуються як джерело натхнення для майбутніх ітерацій. З часом цей еволюційний цикл призводить до появи все більш складних алгоритмів – часто перевершуючи ті, які були розроблені людськими експертами.

Поняття науки за AlphaEvolve

У своєму ядрі AlphaEvolve побудований на принципах еволюційної обчислювальної техніки – підгалузі штучного інтелекту, яка надихається біологічною еволюцією. Система починається з базової реалізації коду, яку вона розглядає як початкову “організм”. Через покоління AlphaEvolve змінює цей код – вводячи варіації або “мутації” – та оцінює придатність кожної варіації за допомогою добре визначеної функції оцінювання. Найкращі варіанти виживають та служать шаблонами для наступного покоління.

Цей еволюційний цикл координується через:

  • Вибір запиту: AlphaEvolve будує запити, вибираючи та вкладуючи попередньо успішні зразки коду, метрики продуктивності та інструкції, специфічні для завдання.
  • Мутація коду та пропозиція: Система використовує поєднання потужних LLM – Gemini 2.0 Flash та Pro – для генерації конкретних модифікацій поточного кодового базису у вигляді змін.
  • Механізм оцінювання: Автоматизований механізм оцінювання оцінює продуктивність кожного кандидата, виконуючи його та повертаючи скалярні оцінки.
  • База даних та контролер: Розподілений контролер координує цей цикл, зберігаючи результати в еволюційній базі даних та балансуючи дослідження з експлуатацією через механізми, такі як MAP-Elites.

Цей процес, багатіший на зворотний зв’язок, автоматизований еволюційний процес радикально відрізняється від стандартних технік тонкого налаштування. Він наділяє AlphaEvolve можливістю генерувати нові, високопродуктивні та іноді контрінтуїтивні рішення – розширюючи межі того, чого може досягти машинне навчання автономно.

Порівняння AlphaEvolve з RLHF

Щоб оцінити інновації AlphaEvolve, потрібно порівняти його з Reinforcement Learning from Human Feedback (RLHF), домінуючим підходом, який використовується для тонкого налаштування великих мовних моделей.

У RLHF людські переваги використовуються для навчання моделі винагороди, яка спрямовує процес навчання LLM через алгоритми навчання з підкріпленням, такі як Proximal Policy Optimization (PPO). RLHF покращує узгодженість та корисність моделей, але він вимагає широкого людського втручання для генерації даних зворотного зв’язку та зазвичай працює в статичному режимі тонкого налаштування.

AlphaEvolve, натомість:

  • Видаляє людський зворотний зв’язок з циклу на користь машинно-виконуваних оцінювачів.
  • Підтримує безперервне навчання через еволюційний відбір.
  • Досліджує набагато ширші простори рішень завдяки стохастичним мутаціям та асинхронному виконання.
  • Може генерувати рішення, які не тільки узгоджені, а й нові та науково значущі.

Де RLHF уточнює поведінку, AlphaEvolve відкриває та винаходить. Ця відмінність критична при розгляді майбутніх траєкторій до AGI: AlphaEvolve не тільки покращує передбачення – він знаходить нові шляхи до істини.

Застосування та прориви

1. Алгоритмічні відкриття та математичні досягнення

AlphaEvolve продемонстрував свою здатність до революційних відкриттів у核心 алгоритмічних проблем. Найбільш помітно, він відкрив новий алгоритм для множення двох 4×4 комплексних матриць, використовуючи лише 48 скалярних множень – перевершуючи результат Страсена 1969 року з 49 множеннями та порушуючи 56-річну теоретичну межу. AlphaEvolve досяг цього через просунуті техніки тензорного розкладу, які він еволюціонував протягом багатьох ітерацій, перевершуючи кілька сучасних підходів.

Поза множенням матриць, AlphaEvolve зробив суттєві внески у математичні дослідження. Його оцінили за понад 50 відкритих проблем у галузях, таких як комбінаторика, теорія чисел та геометрія. Він відповідав найкращим відомим результатам у близько 75% випадків та перевершував їх у близько 20%. Ці успіхи включали покращення проблеми мінімального перекриття Ердеша, щільніше рішення проблеми поцілунків у 11 вимірах та більш ефективні геометричні конфігурації упаковки. Ці результати підкреслюють його здатність діяти як автономний математичний дослідник – уточнюючи, ітеруючи та еволюціонуючи все більш оптимальні рішення без людського втручання.

2. Оптимізація по всьому стеку обчислень Google

AlphaEvolve також приніс відчутні покращення продуктивності по всьому інфраструктурі Google:

  • У розподілі даних центру він відкрив новий евристичний метод, який покращив розміщення завдань, відновивши 0,7% раніше втрачених обчислювальних ресурсів.
  • Для ядер тренування Gemini AlphaEvolve розробив кращу стратегію тайлінгу для множення матриць, що дало 23% прискорення ядра та 1% загальне скорочення часу тренування.
  • У дизайні схеми ТПУ він визначив спрощення арифметичної логіки на рівні РТЛ (Рівень передачі реєстрів), підтверджене інженерами та включене до наступних чіпів ТПУ.
  • Він також оптимізував код, згенерований компілятором FlashAttention, редагуючи проміжні представлення XLA, скорочуючи час висновку на ГПУ на 32%.

Разом ці результати підтверджують здатність AlphaEvolve працювати на різних рівнях абстракції – від символічних математичних до низькорівневої апаратної оптимізації – та приносити реальні покращення продуктивності.

  • Еволюційне програмування: Парадигма штучного інтелекту, яка використовує мутацію, відбір та спадковість для ітеративного уточнення рішень.
  • Супероптимізація коду: Автоматичний пошук найбільш ефективної реалізації функції – часто даючи несподівані, контрінтуїтивні покращення.
  • Еволюція мета-запиту: AlphaEvolve не тільки еволюціонує код, а й еволюціонує, як він передає інструкції LLM – дозволяючи самозміненню процесу кодування.
  • Втрата дискретизації: Регуляризаційний член, який заохочує вивід до вирівнювання з півцілочисельними або цілими значеннями, критичними для математичної та символічної ясності.
  • Втрата галюцинації: Механізм, який вводить випадковість у проміжні рішення, заохочуючи дослідження та уникання локальних мінімумів.
  • Алгоритм MAP-Elites: Тип алгоритму якості-різноманітності, який підтримує різноманітне населення високопродуктивних рішень по всім розмірам функції – дозволяючи надійний інноваційний розвиток.

Імплікації для AGI та ASI

AlphaEvolve – це більше, ніж оптимізатор – це погляд у майбутнє, де інтелектуальні агенти можуть демонструвати творчу автономію. Спроможність системи формулювати абстрактні проблеми та розробляти свої підходи до їх розв’язання представляє суттєвий крок до штучного загального інтелекту. Це виходить за межі передбачення даних: це涉лює структуроване міркування, формування стратегії та адаптацію до зворотного зв’язку – ознаки інтелектуальної поведінки.

Його здатність ітеративно генерувати та уточнювати гіпотези також сигналізує про еволюцію того, як машини вчаться. На відміну від моделей, які вимагають широкого наглядового тренування, AlphaEvolve покращує себе через цикл експериментування та оцінювання. Ця динамічна форма інтелекту дозволяє йому навігацію у складних просторах рішень, відкидання слабких рішень та підвищення сильніших без прямого людського нагляду.

Виконуючи та валідуючи свої власні ідеї, AlphaEvolve функціонує як теоретик та експериментатор. Він рухається за межі виконання попередньо визначених завдань та у сферу відкриттів, симулюючи автономний науковий процес. Кожне запропоноване покращення тестується, оцінюється та реінтегровується – дозволяючи безперервне уточнення на основі реальних результатів, а не статичних цілей.

Можливо, найважливіше, AlphaEvolve – це рання інстанція рекурсивного самозмінення – де система штучного інтелекту не тільки вчиться, а й покращує компоненти себе. У кількох випадках AlphaEvolve покращив інфраструктуру тренування, яка підтримує його власні базові моделі. Хоча ще обмежена поточними архітектурами, ця здатність встановлює прецедент. З більшою кількістю проблем, сформульованих у оцінюваних середовищах, AlphaEvolve міг би масштабуватися до все більш складних та самозмінюваних поведінок – фундаментальної ознаки штучного суперінтелекту (ASI).

Обмеження та майбутня траєкторія

Поточне обмеження AlphaEvolve полягає в його залежності від автоматизованих функцій оцінювання. Це обмежує його корисність проблемами, які можуть бути формалізовані математично або алгоритмічно. Він ще не може працювати значуще у галузях, які вимагають неявного людського розуміння, суб’єктивної оцінки або фізичного експериментування.

Однак майбутні напрями включають:

  • Інтеграцію гібридної оцінки: поєднання символічного міркування з людськими перевагами та природно-мовними критиками.
  • Розгортання у симуляційних середовищах, що дозволяє втілене наукове експериментування.
  • Дистиляція еволюованих виводів у базові LLM, створюючи більш здатні та зразкові базові моделі.

Ці траєкторії вказують на все більш агентські системи, здатні до автономного, високоризикового розв’язання проблем.

Висновок

AlphaEvolve – це суттєвий крок вперед – не тільки у інструментуванні штучного інтелекту, а й у нашому розумінні самої машини інтелекту. Об’єднавши еволюційний пошук з міркуванням LLM та зворотним зв’язком, він переозначає те, що машини можуть автономно відкрити. Це рання, але суттєва ознака того, що самозмінювані системи, здатні до справжньої наукової думки, вже не теоретичні.

Оглядаючи майбутнє, архітектура, що лежить в основі AlphaEvolve, могла б бути рекурсивно застосована до себе: еволюціонуючи自己的 оцінювачі, покращуючи логіку мутації, уточнюючи функції оцінювання та оптимізуючи базові тренувальні трубопроводи для моделей, на які він залежить. Цей рекурсивний оптимізаційний цикл представляє технічний механізм для завантаження до AGI, де система не тільки виконує завдання, а й покращує саму інфраструктуру, яка дозволяє її навчання та міркування.

З часом, оскільки AlphaEvolve масштабується по більш складних та абстрактних галузях – та оскільки людське втручання у процес зменшується – він може демонструвати прискорені інтелектуальні здобутки. Цей самоз підтримуючий цикл ітеративного покращення, застосований не тільки до зовнішніх проблем, а й до внутрішньої алгоритмічної структури, є ключовим теоретичним компонентом AGI та всіх його потенційних вигод для суспільства. З його поєднанням творчості, автономії та рекурсії, AlphaEvolve може бути запам’ятований не тільки як продукт DeepMind, а й як блупrint для першої справжньої загальної та самозмінюваної штучної свідомості.

Антуан - видний лідер і засновник Unite.AI, який рухається незламною пристрасті до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом революційних технологій і AGI.

Як футуролог, він присвячений вивченню того, як ці інновації будуть формувати наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє і змінюють цілі сектори.