Зв'язатися з нами

OpenAI використовує Cerebras для інвестування 10 мільярдів доларів у обчислення з низькою затримкою

Партнерство

OpenAI використовує Cerebras для інвестування 10 мільярдів доларів у обчислення з низькою затримкою

mm

OpenAI оголосила про багаторічну угоду зі стартапом-розробником чіпів Cerebras Systems, яка поставить 750 мегават виділених обчислень штучного інтелекту виробнику ChatGPT, що обидві компанії описують як найбільше розгортання високошвидкісного логічного висновку коли-небудь намагалися.

За даними джерел, знайомих з умовами, угода, вартість якої перевищує 10 мільярдів доларів, є найважливішою інфраструктурною ставкою OpenAI поза межами її основних відносин з Microsoft. Cerebras створюватиме та розміщуватиме системи поетапно до 2028 року, а перші потужності будуть запущені цього року.

Партнерство спрямоване на вирішення конкретної проблеми: швидкості. Хоча OpenAI масштабував ChatGPT до 800 мільйонів користувачів щотижня, компанія стикається з обчислювальними обмеженнями, які уповільнюють час відгуку, особливо для вимогливих робочих навантажень, таких як генерація коду, агентські завдання та голосова взаємодія в режимі реального часу.

«Cerebras додає до нашої платформи спеціалізоване рішення для логічного висновку з низькою затримкою», — сказав Сачін Катті, який очолює обчислювальну стратегію OpenAI. «Це означає швидші реакції, більш природні взаємодії та міцнішу основу для масштабування штучного інтелекту в реальному часі для набагато більшої кількості людей».

Чому кремній вафельного масштабу має значення

Презентація Cerebras зосереджена на її процесорах вафельного масштабу — чіпах розміром з обідню тарілку, які усувають затримки зв'язку, властиві системам, зшитим з багатьох менших графічних процесорів. Компанія стверджує, що її архітектура забезпечує швидкість виведення даних до 15 разів вищу, ніж альтернативи на основі графічних процесорів, а моделі, такі як GPT-OSS-120B, працюють зі швидкістю приблизно 3,000 токенів за секунду.

Для OpenAI ця швидкість безпосередньо впливає на користувацький досвід. Коли ШІ реагує в режимі реального часу — без затримки, яка робить розмови штучними — користувачі взаємодіють глибше та досягають більшого. За словами генерального директора Cerebras Ендрю Фельдмана, компанія протестувала кремнієвий процесор Cerebras зі своїми моделями відкритої ваги перед Днем подяки, і технічні переговори між командами швидко переросли в підписаний аркуш умов.

«Так само, як широкосмуговий зв’язок трансформував інтернет, так і логічний висновок трансформує штучний інтелект», – сказав Фельдман. «Це відкриває абсолютно нові способи створення моделей штучного інтелекту та взаємодії з ними».

Це порівняння не є перебільшенням. Ранній dial-up інтернет підтримував електронну пошту та базовий перегляд веб-сторінок; широкосмуговий доступ забезпечував потокове відео, голосові дзвінки, а згодом і економіку додатків для смартфонів. OpenAI, схоже, робить ставку на те, що достатньо швидкий висновок аналогічним чином розблокує додатки, які поточна затримка робить непрактичними, особливо для агентів ШІ, яким доводиться об'єднувати кілька операцій, не вичерпуючи людського терпіння.

Гонка озброєнь в інфраструктурі загострюється

Угода з Церебрасом укладена як Оцінка інфраструктури штучного інтелекту різко зросли, нещодавно Databricks залучила 134 мільярди доларів, а сама Cerebras, як повідомляється, веде переговори про нове фінансування з оцінкою в 22 мільярди доларів. Потреби в обчислювальних ресурсах передових моделей штучного інтелекту не демонструють ознак стабілізації, і компанії намагаються зафіксувати потужності, перш ніж це зроблять конкуренти.

Для Cerebras партнерство з OpenAI вирішує проблему концентрації бізнесу. На G42 Об'єднаних Арабських Еміратів припадало 87% доходу Cerebras у першій половині 2024 року — концентрація клієнтів, яка викликала занепокоєння у інвесторів. Додавання OpenAI як основного клієнта перед потенційним IPO значно зменшує ризики для бізнесу.

Для OpenAI угода диверсифікує її Інфраструктура AI поза межами хмари Microsoft Azure. Хоча Microsoft залишається основним постачальником обчислювальних послуг для OpenAI, партнерство з Cerebras надає OpenAI виділену потужність з низькою затримкою, оптимізовану спеціально для логічного висновку — це робоче навантаження, відмінне від навчальних запусків, які обробляє інфраструктура Microsoft.

Час також має значення. OpenAI нещодавно випустив GPT-5.2 на тлі посилення конкуренції з боку Gemini від Google. У міру того, як моделі стають більш потужними, компанії, що їх впроваджують, виявляють, що простого інтелекту недостатньо — користувачі також очікують майже миттєвих відповідей. Блискучий ШІ, якому потрібно десять секунд для відповіді, здається несправним; той самий ШІ, який відповідає менш ніж за секунду, здається чарівним.

Сем Альтман, генеральний директор OpenAI, вже є інвестором Cerebras, і OpenAI колись розглядала можливість повного придбання компанії. Ця угода свідчить про те, що відносини розвиваються у щось більш стратегічне: партнерство, де долі обох компаній переплітаються у гонці за те, щоб зробити штучний інтелект справді предметом обговорення.

Алекс МакФарланд — журналіст і письменник, що займається штучним інтелектом, досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та публікаціями зі штучного інтелекту по всьому світу.