Connect with us

公告

OpenAI 发布 GPT-5.2 后内部“代码红”应对 Google 的 Gemini 3

mm

OpenAI 今天发布了 GPT-5.2,在 CEO Sam Altman 宣布内部“代码红”以应对 Google 的 Gemini 3 超越公司之前的旗舰产品后不到一个月内发布了该模型。

加速发布标志着 OpenAI 到目前为止最快的主要模型迭代。GPT-5.1 花了三个月的时间来跟进 GPT-5,但竞争压力大大压缩了这一时间表。在 OpenAI 的基准图表中,GPT-5.2 Thinking 在各种推理测试中超越了 Gemini 3 和 Anthropic 的 Claude Opus 4.5。

“我们设计 5.2 来解锁更多的经济价值给人们,” OpenAI 应用程序 CEO Fidji Simo 说。“它更擅长创建电子表格,构建演示文稿,编写代码,感知图像,理解长上下文,使用工具,然后链接复杂的多步骤项目。”

代码红备忘录

Altman 于 12 月 1 日发送了内部备忘录,动员资源改进 ChatGPT,因为 Google 新发布的 Gemini 3 在基准测试中超越了 GPT-5.1。“我们处于 ChatGPT 的关键时刻,” Altman 写道,根据报道。

备忘录呼吁优先顺序转变,包括推迟计划中的广告功能,以专注于产品质量。这种举动呼应了 Google 三年前自己的“代码红”,当时 ChatGPT 的发布威胁到搜索巨头的主导地位——这种逆转凸显了竞争地位在 AI 中如何迅速转变。

COO Brad Lightcap 在本月早些时候的 Fortune 活动中发言,将警报框定为标准的商业惯例,而不是恐慌。“许多企业偶尔会进行此类操作以集中注意力,”他说,淡化了竞争叙事,同时承认了 GPT-5.2 开发背后的紧迫性。

基准性能

OpenAI 的内部测试显示 GPT-5.2 在推理基准测试中重新占据了领先地位,在这些测试中 Gemini 3 曾经领先。该模型在代码生成、文档创建、图像理解和多步骤任务完成方面有所改进——这些是企业客户要求保持一致性能的领域。

这些改进的到来是因为 ChatGPT 接近 8 亿每周活跃用户,但面临着从免费到付费层的转换率问题。更好的模型性能可以帮助为订阅成本辩护,因为竞争对手提供了越来越有能力的替代品,价格点也相似。

GPT-5.2 增强的工具使用功能还加强了 ChatGPT Atlas,OpenAI 的具有代理模式的浏览器,该浏览器于十月份推出。使 ChatGPT 能够自主执行多步骤任务的代理功能直接受益于改进的推理和工具协调。

使用 GPT-5.2 进行前端软件开发(OpenAI)

竞争动态

对 Gemini 3 的快速响应反映了一个市场,其中模型领导地位迅速易手。Google 十一月份的发布让 OpenAI措手不及,在 GPT-5 和 GPT-5.1 持续占据基准测试领先地位数月后。Anthropic 的 Claude Opus 4.5 于当月晚些时候发布,增加了另一个竞争对手。

OpenAI 同时推动了企业采用,聘请 Slack CEO Denise Dresser 作为其首位首席收入官。本周,公司服务超过一百万家企业客户,包括沃尔玛、摩根士丹利和塔吉特——这些合同依赖于模型性能保持竞争力。

代码红方法表明 OpenAI 将模型质量视为生死攸关的问题,而不是渐进式的。推迟收入产生的功能(如广告)以加速模型开发,表明了对能力主导市场地位的信心——至少目前如此。

GPT-5.2 立即可用于 ChatGPT Plus、Pro 和 Enterprise 订阅者。API 访问按照 OpenAI 的开发者平台的标准推出程序进行。该公司尚未宣布随发布而来的价格变化。

GPT-5.2 是否能够保持其基准测试领先地位将取决于 Google 和 Anthropic 如何快速做出反应。压缩的开发周期表明,数月的模型领先地位的时代可能即将结束,取而代之的是持续迭代,在这种情况下,竞争优势仅持续数周,而不是季度。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。