Connect with us

Творець AlphaGo збирає рекордні $1 млрд для створення штучного інтелекту без LLM

Фінансування

Творець AlphaGo збирає рекордні $1 млрд для створення штучного інтелекту без LLM

mm

Девід Сільвер, піонер навчання з підкріпленням, який очолював створення AlphaGo у Google DeepMind, збирає $1 млрд у вигляді початкового фінансування для Ineffable Intelligence, лондонського стартапу, заснованого на припущенні, що великі мовні моделі – це неправильний шлях до надінтелекту.

Ця угода, яку очолює Sequoia Capital, стане найбільшим раундом початкового фінансування, коли-небудь закритим європейським стартапом, якщо буде завершена. Nvidia, Google та Microsoft ведуть переговори про участь, хоча переговори все ще тривають, а остаточні умови можуть змінитися. Раунд оцінює компанію у $4 млрд до грошей.

Сільвер, який обіймав посаду віце-президента з навчання з підкріпленням у DeepMind, тихо зареєстрував Ineffable Intelligence у листопаді 2025 року та був призначений директором у січні 2026 року. Місія компанії, як її описував Сільвер, – створити “надінтелект, який безперервно вчиться і сам відкриває основи всіх знань”.

Цей опис містить свідому провокацію. У галузі, яка витрачає сотні мільярдів на масштабування LLM, навчених на інтернет-тексті, Сільвер стверджує, що весь підхід має обмеження.

Аргумент проти людських даних

Теза Сільвера безпосередньо пов’язана з роботою, яка зробила його знаменитим. У 2017 році CEO DeepMind Деміс Хассабіс та Сільвер опублікували AlphaGo Zero, версію AlphaGo, яка навчилася цілком через самограї з нульовими людськими ігровими даними. Вона перемогла оригінальний, людський AlphaGo у 100 іграх з рахунком 0.

Результат шокував спільноту штучного інтелекту. Система, яка навчилася з нуля, через взаємодію та винагороду, не тільки дорівняла людським знанням, а й перевершила їх так сильно, що людський, навчений AlphaGo не зміг виграти жодної гри.

Сільвер розширив цей підхід через AlphaZero, який освоїв шахи, сьоґі та ґо з нуля, та MuZero, який навчився планувати, не знаючи навіть правил гри, яку він грав. Кожна система підкріплювала той самий висновок: найкраща продуктивність досягається не шляхом імітації людей, а шляхом навчання через досвід.

У подкасті DeepMind, записаному до його від’їзду, Сільвер описав дві епохи штучного інтелекту: поточну “епоху людських даних” та майбутню “епоху досвіду”. Сучасні LLM, стверджував він, залежать від людських даних та зворотного зв’язку, створюючи вроджені обмеження. Шлях до штучного надінтелекту вимагає руху за межі людських знань цілком.

Це філософія “Альбертської школи” – названа на честь Університету Альберти, де Сільвер вивчав під керівництвом піонера навчання з підкріпленням Річа Саттона. Впливова стаття Саттона 2019 року “Горький урок” стверджувала, що методи, які залежать від людських знань, невинятково програють методам, які масштабують обчислення та навчання. Сільвер будує цілу компанію на цьому принципі.

Перегони стартапів надінтелекту

Сільвер не перший елітний дослідник, який покинув велику лабораторію та зібрав надзвичайні суми для підприємства, орієнтованого на надінтелект. Ілля Суцкевер, колишній головний вчений OpenAI, запустив Safe Superintelligence у 2024 році з подібною тезою – що зосереджена спроба поза тиском компанії, яка створює продукти, може досягти надінтелекту швидше. SSI з тих пір зібрав мільярди доларів при оцінці понад $30 млрд.

Паралель інструктивна. Обидва дослідники покинули організації, які вони допомогли визначити. Обидва вважають, що поточний парадигма – масштабування LLM та продаж підписок на чат-боти – це об’їзд. І обидва привернули величезний капітал лише завдяки своїй репутації, до того як створили будь-який продукт або опублікували будь-які результати.

Але підходи розходяться. Суцкевер сказав мало публічно про технічний напрям SSI. Сільвер, навпаки, був явним: навчання з підкріпленням, самограї та навчання з першої принципи – а не мовні моделі. Там, де більшість лабораторій штучного інтелекту обговорюють, як зробити LLM розумнішими, Сільвер питає, чи повинні вони бути основою взагалі.

$1 млрд початкового фінансування також відображає, як драматично змінився ландшафт фінансування штучного інтелекту. Anthropic最近 підійшов до оцінки $350 млрд. Конкурентний тиск у сфері передового штучного інтелекту посилився, оскільки OpenAI, Google та Anthropic випускають нові моделі при прискореному темпі. На цьому тлі $4 млрд до грошей оцінка компанії для компанії без продукту під керівництвом одного дослідника – це новий норм.

Для Sequoia, яка очолює раунд через керуючого партнера Альфреда Ліну та партнера Соню Хуан, ставка проста: Сільвер – одна з, можливо, п’яти людей, які мають правдоподібне право на створення систем, які真正 перевершують людський інтелект у конкретних областях. Якщо навчання з підкріпленням – правильний шлях до загального надінтелекту, він найбільш імовірно знайде його.

Ризик також чіткий. AlphaGo та AlphaZero успішно діяли в областях з чіткими правилами, повною інформацією та добре визначеними сигналами винагороди. Реальний світ не має жодної з цих властивостей. Масштабування самограї за межі ігор у відкриті області – наука, інженерія, розуміння – це нерозв’язана проблема, над якою Сільвер сам працював роки у DeepMind без остаточного прориву.

Ineffable Intelligence, базована в Лондоні, також позиціонує себе як потенційний якорь для амбіцій Європи у сфері штучного інтелекту. Континент виробив світового рівня дослідників штучного інтелекту, але бореться за утримання їх, оскільки американські лабораторії пропонують більшу компенсацію та швидше масштабування інфраструктури. $1 млрд європейського початкового фінансування, підтриманого прем’єр-venture-фірмою Кремнієвої долини, сигналізує про те, що географія дослідження передового штучного інтелекту може розширюватися – хоча варто зазначити, що Sequoia, Nvidia, Google та Microsoft – це всі американські інвестори.

Ставка Сільвера полягає в тому, що фіксація галузі на LLM представляє локальний максимум – вражаючий, але в кінцевому підсумку обмежений. Питання полягає в тому, чи може навчання з підкріпленням вирватися з контрольованих середовищ, де воно процвітало, та діяти у заплутаному, двозначному реальному світі. $1 млрд та кар’єра, побудована на доведенні скептиків неправильними, свідчать про те, що Сільвер вважає, що це можливо.

Алекс Макфарленд - журналіст та письменник з питань штучного інтелекту, який досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та виданнями з штучного інтелекту у світі.