Партнёрства
OpenAI сотрудничает с Cerebras за 10 миллиардов долларов в области низкозадержечных вычислений

OpenAI объявила о многолетнем соглашении с стартапом Cerebras Systems, которое обеспечит 750 мегаватт вычислительной мощности, посвященной производителю ChatGPT, в том, что обе компании описывают как крупнейшее развертывание высокоскоростной инференции, когда-либо предпринимаемое.
Сделка, оцененная в более чем 10 миллиардов долларов по данным источников, знакомых с условиями, является наиболее значимой ставкой OpenAI в инфраструктуру вне ее основной связи с Microsoft. Cerebras построит и разместит системы поэтапно до 2028 года, при этом первая емкость будет введена в эксплуатацию в этом году.
Партнерство направлено на решение конкретной проблемы: скорости. Хотя OpenAI масштабировала ChatGPT до 800 миллионов еженедельных пользователей, компания сталкивается с ограничениями вычислительной мощности, которые замедляют время ответа – особенно для требовательных рабочих нагрузок, таких как генерация кода, агентные задачи и взаимодействие в режиме реального времени.
“Cerebras добавляет к нашей платформе посвященное решение для низкозадержечной инференции”, – сказал Сачин Катти, который руководит вычислительной стратегией OpenAI. “Это означает более быстрые ответы, более естественные взаимодействия и более прочную основу для масштабирования реального времени ИИ для многих людей”.
Почему важно шаблонное кремниевое производство
Предложение Cerebras основано на его шаблонных процессорах – чипах размером с тарелку, которые устраняют задержки связи, присущие системам, сшитым из многих меньших GPU. Компания утверждает, что ее архитектура обеспечивает скорость инференции до 15 раз быстрее, чем альтернативы на основе GPU, при этом модели, такие как GPT-OSS-120B, работают примерно на 3000 токенах в секунду.
Для OpenAI эта скорость напрямую переводится в опыт пользователя. Когда ИИ реагирует в реальном времени – без задержки, которая делает разговоры искусственными – пользователи более глубоко взаимодействуют и достигают большего. Компания протестировала кремниевую продукцию Cerebras с открытыми моделями перед Днем благодарения, и технические разговоры между командами быстро переросли в подписанный документ, согласно генеральному директору Cerebras Эндрю Фельдману.
“Как и широкополосный интернет преобразовал интернет, так и инференция в реальном времени преобразует ИИ”, – сказал Фельдман. “Это позволяет создавать совершенно новые способы построения и взаимодействия с моделями ИИ”.
Сравнение не является преувеличением. Ранний интернет с помощью набора символов поддерживал электронную почту и базовое просмотр; широкополосный интернет позволил потоковое видео, голосовые звонки и в конечном итоге экономику смартфонов. OpenAI, кажется, делает ставку на то, что достаточно быстрая инференция аналогичным образом откроет приложения, которые текущая задержка делает непрактичными – особенно для агентов ИИ, которые должны объединять несколько операций без утомления человеческого терпения.
Усиление инфраструктурной гонки
Сделка с Cerebras происходит на фоне инфраструктурных оценок ИИ, которые взлетели, причем Databricks недавно привлекла 134 миллиарда долларов, а Cerebras herself, как сообщается, ведет переговоры о свежем финансировании по оценке 22 миллиарда долларов. Вычислительные требования передовых моделей ИИ не показывают признаков плато, и компании спешат закрепить емкость до того, как это сделают конкуренты.
Для Cerebras партнерство с OpenAI решает проблему концентрации бизнеса. Объединенные Арабские Эмираты’ G42 составили 87% выручки Cerebras в первой половине 2024 года – концентрация клиентов, которая заставила нервничать инвесторов. Добавление OpenAI в качестве крупного клиента перед потенциальным IPO значительно снижает риски бизнеса.
Для OpenAI сделка диверсифицирует инфраструктуру ИИ за пределами облачного сервиса Microsoft Azure. Хотя Microsoft остается основным поставщиком вычислительной мощности OpenAI, партнерство с Cerebras дает OpenAI посвященную низкозадержечную емкость, оптимизированную конкретно для инференции – рабочую нагрузку, отличную от рабочих нагрузок обучения, которые инфраструктура Microsoft обрабатывает.
Сроки также имеют значение. OpenAI недавно выпустила GPT-5.2 на фоне усиления конкуренции со стороны Google’s Gemini. По мере роста возможностей моделей компании, развертывающие их, обнаруживают, что сырая интеллект не достаточно – пользователям также ожидается практически мгновенный ответ. Гениальный ИИ, который отвечает за десять секунд, кажется сломанным; тот же ИИ, отвечающий менее чем за секунду, кажется магическим.
Сэм Альтман, генеральный директор OpenAI, уже является инвестором Cerebras, и OpenAI когда-то рассматривала возможность приобретения компании целиком. Эта сделка предполагает, что отношения эволюционируют в нечто более стратегическое: партнерство, при котором судьбы обеих компаний становятся неразрывно связаны в гонке за создание действительно разговорного ИИ.












