Connect with us

合作伙伴

OpenAI 与 Cerebras 合作,价值 100 亿美元的低延迟计算

mm

OpenAI 宣布与芯片初创公司 Cerebras Systems 签署了一份多年协议,该协议将为 ChatGPT 制造商提供 750 兆瓦的专用 AI 计算能力,据两家公司称,这是有史以来尝试的最大高速度推理部署

据接近交易条款的消息来源称,这笔交易价值超过 100 亿美元,这是 OpenAI 在其与 Microsoft 的主要关系之外的最重要的基础设施投资。Cerebras 将分阶段建设和托管这些系统,第一批容量将于今年上线。

该合作关系针对一个特定的问题:速度。虽然 OpenAI 已将 ChatGPT 扩展到8000 万周活跃用户,但该公司面临计算约束,导致响应时间变慢——尤其是对于代码生成、代理任务和实时语音交互等计算密集型工作负载。

“Cerebras 为我们的平台添加了专用的低延迟推理解决方案,”OpenAI 计算策略负责人 Sachin Katti 说。“这意味着更快的响应时间、更自然的交互和更强大的基础设施来扩展实时 AI 到更多人。”

为什么晶圆级硅重要

Cerebras 的推销重点是其晶圆级处理器——与许多小型 GPU 相比,这些处理器的尺寸像餐盘一样大,可以消除系统中的通信延迟。该公司声称,其架构的推理速度比基于 GPU 的替代方案快多达 15 倍,像 GPT-OSS-120B 这样的模型以每秒大约 3000 个令牌的速度运行。

对于 OpenAI来说,这种速度直接转化为用户体验。当 AI 实时响应——没有使对话感觉人工的延迟时,用户会更深入地参与并完成更多任务。该公司在感恩节之前用其开放权重模型测试了 Cerebras 的硅片,技术团队之间的对话迅速升级为签署的条款,据 Cerebras 首席执行官 Andrew Feldman 说。

“就像宽带改变了互联网一样,实时推理将改变 AI,”Feldman 说。“这使得完全新的方式来构建和与 AI 模型交互成为可能。”

这种比较并非夸张。早期的拨号互联网支持电子邮件和基本浏览;宽带使流媒体视频、语音通话和最终智能手机应用经济成为可能。OpenAI 似乎正在押注足够快的推理将类似地解锁当前延迟使其变得不切实际的应用——特别是对于必须将多个操作链接在一起而不需要人类耐心的 AI 代理。

基础设施军备竞赛加剧

Cerebras 协议出台之际,AI 基础设施估值已经激增,Databricks 最近以 1340 亿美元的估值融资,而 Cerebras 本身据报道正在谈判以 220 亿美元的估值获得新资金。前沿 AI 模型的计算需求没有任何减缓的迹象,公司正在争相在竞争对手之前锁定容量。

对于 Cerebras来说,OpenAI合作伙伴关系解决了业务集中度问题。阿联酋的G42占Cerebras2024年上半年收入的87%——这种客户集中度让投资者感到紧张。在可能的IPO之前,添加OpenAI作为主要客户显著降低了业务风险。

对于 OpenAI来说,这笔交易使其AI 基础设施多元化,超出了其与 Microsoft 的主要关系。虽然 Microsoft 仍然是 OpenAI 的主要计算提供商,但 Cerebras 合作伙伴关系为 OpenAI 提供了专用的低延迟容量,专门针对推理进行了优化——这与 Microsoft 的基础设施处理的训练运行的工作负载不同。

时机也很重要。OpenAI 最近发布了GPT-5.2,此前 Google 的 Gemini 引发了激烈的竞争。随着模型变得更加强大,部署它们的公司发现,原始智力是不够的——用户还期望几乎瞬间的响应。一个反应需要十秒的天才 AI 感觉是有缺陷的;同样的 AI 在一秒内做出反应感觉是神奇的。

OpenAI 首席执行官 Sam Altman 已经是 Cerebras 的投资者,OpenAI 曾经考虑过完全收购这家公司。这笔交易表明这种关系正在演变成更具战略性的合作伙伴关系:两家公司的命运在争夺让 AI 感觉真正对话式的竞争中变得密不可分。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。