Штучний загальний інтелект

AlphaEvolve: новаторський крок Google DeepMind до штучного інтелекту (ЗШІ)

опублікований Травень 17, 2025

Антуан Тардіф, Генеральний директор та засновник Unite.AI

Google представив DeepMind АльфаЕволюція, еволюційний кодуючий агент, призначений для автономного пошуку нових алгоритмів та наукових рішень. Представлено в статті під назвою "AlphaEvolve: Кодувальний агент для наукових та алгоритмічних відкриттів, Â € це дослідження є фундаментальним кроком до Штучний загальний інтелект (AGI) і навіть Штучний суперінтелект (ASI)Замість того, щоб покладатися на статичне налаштування або набори даних з мітками, наданими людиною, AlphaEvolve обирає зовсім інший шлях — шлях, що зосереджений на автономній творчості, алгоритмічних інноваціях та постійному самовдосконаленні.

В основі AlphaEvolve лежить автономний еволюційний конвеєр, що працює на базі великі мовні моделі (LLM)Цей конвеєр не просто генерує виходи — він змінює, оцінює, вибирає та покращує код протягом поколінь. AlphaEvolve починає з початкової програми та ітеративно вдосконалює її, вводячи ретельно структуровані зміни.

Ці зміни мають форму згенерованих LLM різниць — модифікацій коду, запропонованих мовною моделлю на основі попередніх прикладів та явних інструкцій. «Різниця» в програмній інженерії стосується різниці між двома версіями файлу, зазвичай виділяючи рядки, які потрібно видалити або замінити, та нові рядки, які потрібно додати. В AlphaEvolve LLM генерує ці різниці, аналізуючи поточну програму та пропонуючи невеликі редагування — додавання функції, оптимізацію циклу або зміну гіперпараметра — на основі запиту, який включає показники продуктивності та попередні успішні редагування.

Кожна модифікована програма потім тестується за допомогою автоматизованих оцінювачів, адаптованих до завдання. Найефективніші кандидати зберігаються, на них посилаються та рекомбінують як натхнення для майбутніх ітерацій. З часом цей еволюційний цикл призводить до появи дедалі складніших алгоритмів, які часто перевершують ті, що розроблені експертами-людьми.

Розуміння науки, що лежить в основі AlphaEvolve

По суті, AlphaEvolve побудований на принципах еволюційне обчислення— підгалузь штучного інтелекту, натхненна біологічною еволюцією. Система починається з базової реалізації коду, який вона розглядає як початковий «організм». Протягом поколінь AlphaEvolve модифікує цей код — впроваджуючи варіації або «мутації» — та оцінює придатність кожної варіації за допомогою чітко визначеної функції оцінювання. Найкраще продуктивні варіанти виживають і служать шаблонами для наступного покоління.

Цей еволюційний цикл координується через:

Оперативний відбір проб: AlphaEvolve створює підказки, вибираючи та вбудовуючи раніше успішні зразки коду, показники продуктивності та інструкції для конкретних завдань.
Мутація коду та пропозиція: Система використовує поєднання потужних LLM — Gemini 2.0 Flash та Pro — для створення специфічних модифікацій поточної кодової бази у вигляді дифференцій.
Механізм оцінювання: Автоматизована функція оцінювання оцінює ефективність кожного кандидата, виконуючи її та повертаючи скалярні бали.
База даних та контролер: Розподілений контролер керує цим циклом, зберігаючи результати в еволюційній базі даних та балансуючи дослідження з експлуатацією за допомогою таких механізмів, як MAP-Elites.

Цей автоматизований еволюційний процес, що базується на зворотному зв'язку, радикально відрізняється від стандартних методів точного налаштування. Він дозволяє AlphaEvolve створювати нові, високопродуктивні та часом нелогічні рішення, розширюючи межі того, що машинне навчання може досягти автономно.

Порівняння AlphaEvolve з RLHF

Щоб оцінити інновації AlphaEvolve, важливо порівняти їх з Навчання з підкріпленням на основі зворотного зв’язку людини (RLHF), домінуючий підхід, що використовується для точного налаштування моделей великих мов.

У RLHF людські уподобання використовуються для навчання моделі винагороди, яка спрямовує процес навчання LLM через навчання алгоритми, такі як Проксимальна оптимізація політики (PPO)RLHF покращує узгодженість та корисність моделей, але вимагає значної участі людини для генерації даних зворотного зв'язку та зазвичай працює в статичному режимі одноразового точного налаштування.

AlphaEvolve, навпаки:

Видаляє зворотний зв'язок від людини з циклу на користь машинно-виконуваних обчислювачів.
Підтримує безперервне навчання через еволюційний відбір.
Досліджує набагато ширші простори рішень завдяки стохастичним мутаціям та асинхронному виконанню.
Може генерувати рішення, які не просто узгоджені, а роман та науково значущими.

Там, де RLHF точно налаштовує поведінку, AlphaEvolve виявляє та винаходитьЦя відмінність є критично важливою при розгляді майбутніх траєкторій розвитку ЗШІ: AlphaEvolve не просто робить кращі прогнози — він знаходить нові шляхи до істини.

Застосування та прориви

1. Алгоритмічне відкриття та математичні досягнення

AlphaEvolve продемонструвала свою здатність до новаторських відкриттів у ключових алгоритмічних проблемах. Найвідомішим є відкриття нового алгоритму для множення двох комплекснозначних матриць 4×4, використовуючи лише 48 скалярних множень, перевершивши результат Штрассена 1969 року, який складався з 49 множень, та подолавши 56-річну теоретичну стелю. AlphaEvolve досягла цього завдяки передовим методам тензорної декомпозиції, які розроблялися протягом багатьох ітерацій, перевершуючи кілька найсучасніших підходів.

Окрім множення матриць, AlphaEvolve зробив значний внесок у математичні дослідження. Його оцінювали на понад 50 відкритих проблемах у таких галузях, як комбінаторика, теорія чисел та геометрія. Він збігався з найвідомішими результатами приблизно у 75% випадків і перевершував їх приблизно у 20%. Ці успіхи включали вдосконалення задачі мінімального перекриття Ердеша, щільніше рішення задачі чисел поцілунку в 11 вимірах та ефективніші геометричні конфігурації пакування. Ці результати підкреслюють його здатність діяти як автономний математичний дослідник, який удосконалює, ітерує та розвиває все більш оптимальні рішення без втручання людини.

2. Оптимізація в обчислювальному стеку Google

AlphaEvolve також забезпечив відчутні покращення продуктивності всієї інфраструктури Google:

In планування центрів обробки даних, було виявлено нову евристику, яка покращила працевлаштування, відновивши 0.7% раніше заблокованих обчислювальних ресурсів.
для Тренувальні ядра GeminiAlphaEvolve розробила кращу стратегію мозаїчного розбиття для множення матриць, що призвело до прискорення ядра на 23% та загального скорочення часу навчання на 1%.
In Конструкція схеми ТПУ, у ньому було визначено спрощення арифметичної логіки на рівні RTL (реєстрово-передавальному рівні), перевірене інженерами та включене до мікросхем TPU наступного покоління.
Він також оптимізував код FlashAttention, згенерований компілятором шляхом редагування проміжних представлень XLA, скорочення часу виведення на графічних процесорах на 32%.

Разом ці результати підтверджують здатність AlphaEvolve працювати на кількох рівнях абстракції — від символьної математики до низькорівневої оптимізації апаратного забезпечення — та забезпечувати реальні прирости продуктивності.

Еволюційне програмування: Парадигма штучного інтелекту, що використовує мутацію, відбір та успадкування для ітеративного вдосконалення рішень.
Супероптимізація коду: Автоматизований пошук найефективнішої реалізації функції, який часто призводить до несподіваних, нелогічних покращень.
Еволюція метапідказок: AlphaEvolve не просто розвиває код; він також розвиває спосіб передачі інструкцій до LLM, що дозволяє самовдосконалювати процес кодування.
Втрати дискретизації: Термін регуляризації, що заохочує виходи узгоджуватися з напівцілими або цілими значеннями, що є критично важливим для математичної та символічної ясності.
Втрата галюцинацій: Механізм впровадження випадковості в проміжні рішення, що заохочує дослідження та уникає локальних мінімумів.
Алгоритм MAP-еліт: Тип алгоритму різноманітності якості, який підтримує різноманітну популяцію високопродуктивних рішень за різними вимірами функцій, що забезпечує надійні інновації.

Наслідки для AGI та ASI

AlphaEvolve — це більше, ніж просто оптимізатор, це погляд у майбутнє, де інтелектуальні агенти можуть демонструвати творчу автономію. Здатність системи формулювати абстрактні проблеми та розробляти власні підходи до їх вирішення є значним кроком до розвитку штучного інтелекту. Це виходить за рамки прогнозування даних: воно включає структуроване мислення, формування стратегії та адаптацію до зворотного зв'язку — ознаки інтелектуальної поведінки.

Його здатність ітеративно генерувати та уточнювати гіпотези також сигналізує про еволюцію в тому, як навчаються машини. На відміну від моделей, які потребують значного навчання під наглядомAlphaEvolve вдосконалюється через цикл експериментів та оцінок. Ця динамічна форма інтелекту дозволяє їй орієнтуватися в складних проблемних просторах, відкидати слабкі рішення та знаходити сильніші без прямого людського контролю.

Виконуючи та перевіряючи власні ідеї, AlphaEvolve функціонує одночасно як теоретик та експериментатор. Він виходить за рамки виконання заздалегідь визначених завдань і переходить у сферу відкриттів, імітуючи автономний науковий процес. Кожне запропоноване вдосконалення тестується, порівнюється з іншими показниками та реінтегрується, що дозволяє постійно вдосконалювати його на основі реальних результатів, а не статичних цілей.

Мабуть, найпримітніше те, що AlphaEvolve є раннім прикладом рекурсивного самовдосконалення, коли система штучного інтелекту не лише навчається, а й удосконалює свої компоненти. У кількох випадках AlphaEvolve покращив навчальну інфраструктуру, яка підтримує власні базові моделі. Хоча ця можливість все ще обмежена сучасними архітектурами, вона створює прецедент. З більшою кількістю проблем, що формулюються в середовищах, що піддаються оцінці, AlphaEvolve може масштабуватися до дедалі складнішої та самооптимізованої поведінки — фундаментальної риси штучного суперінтелекту (ШСІ).

Обмеження та майбутня траєкторія

Поточне обмеження AlphaEvolve полягає в його залежності від автоматизованих функцій оцінювання. Це обмежує його корисність проблемами, які можна формалізувати математично або алгоритмічно. Він поки що не може осмислено працювати в областях, що вимагають неявного людського розуміння, суб'єктивного судження або фізичних експериментів.

Однак, майбутні напрямки включають:

Інтеграція гібридного оцінювання: поєднання символічного мислення з людськими уподобаннями та критикою природної мови.
Розгортання в середовищах моделювання, що дозволяє проводити втілені наукові експерименти.
Дистиляція розвинених результатів у базові LLM, створюючи більш потужні та ефективні для вибірки базові моделі.

Ці траєкторії вказують на дедалі більш агентивні системи, здатні до автономного вирішення проблем з високими ставками.

Висновок

AlphaEvolve — це суттєвий крок вперед не лише в інструментарії штучного інтелекту, а й у нашому розумінні самого машинного інтелекту. Об'єднуючи еволюційний пошук із міркуваннями та зворотним зв'язком за принципами LLM, він переосмислює те, що машини можуть відкривати автономно. Це ранній, але важливий сигнал того, що самовдосконалювані системи, здатні до справжнього наукового мислення, більше не є теоретичними.

Забігаючи вперед, архітектуру, що лежить в основі AlphaEvolve, можна рекурсивно застосувати до самої системи: розробка власних оцінювачів, покращення логіки мутацій, удосконалення функцій оцінювання та оптимізація базових конвеєрів навчання для моделей, від яких вона залежить. Цей рекурсивний цикл оптимізації являє собою технічний механізм для переходу до ЗШІ, де система не просто виконує завдання, а вдосконалює саму інфраструктуру, яка забезпечує її навчання та міркування.

З часом, оскільки AlphaEvolve масштабується в більш складних та абстрактних областях — і оскільки втручання людини в процес зменшується — він може демонструвати прискорене зростання інтелекту. Цей самопідсилювальний цикл ітеративного вдосконалення, що застосовується не лише до зовнішніх проблем, а й до власної алгоритмічної структури, є ключовим теоретичним компонентом ЗШІ та всі переваги, які він може надати суспільствуЗавдяки поєднанню креативності, автономності та рекурсії, AlphaEvolve можна запам'ятати не лише як продукт Deepmind, але як план для перших справді загальних та саморозвиваючихся штучних розумів.

Схожі теми:AGI АльфаЕволюція АСИ Deepmind

Вгору Далі

Як ЗШІ створить універсальну мову для трансформації людського мислення

Не пропустіть

PRISM запускається як перша в світі некомерційна організація, що займається дослідженнями розумного ШІ

Антуан Тардіф

Антуан — далекоглядний лідер і партнер-засновник Unite.AI, керований непохитною пристрастю до формування та просування майбутнього ШІ та робототехніки. Будучи серійним підприємцем, він вірить, що штучний інтелект буде таким же руйнівним для суспільства, як електрика, і його часто ловлять на захопленні потенціалом революційних технологій і AGI.

Як футурист, він присвячений дослідженню того, як ці інновації впливатимуть на наш світ. Крім того, він є засновником Securities.io, платформа, орієнтована на інвестиції в передові технології, які переосмислюють майбутнє та змінюють цілі сектори.