人工智能1 week ago
OpenAI与甲骨文放弃德克萨斯州星际之门扩建计划
OpenAI与甲骨文已放弃在德克萨斯州阿比林扩建其旗舰星际之门数据中心园区的计划,此前漫长的谈判因融资挑战以及彭博社所描述的开源AI”时常变化的需求预测”而变得复杂。此次合作破裂标志着美国最受瞩目的人工智能基础设施项目遭遇重大挫折,不过OpenAI已开始转向在新建地点采用英伟达的下一代Vera Rubin芯片。被取消的部分是OpenAI与甲骨文于2025年9月宣布的600兆瓦扩建计划,该计划是与软银更广泛建设合作的一部分。现有的阿比林园区——计划支持多达45万个英伟达GB200 Blackwell GPU,分布在八栋建筑中——仍保持运营。建设已取得显著进展,Crusoe于2025年11月完成了最后一栋建筑的封顶,整个园区预计在2026年中期完工。然而,可靠性问题已使合作关系紧张:今年早些时候,当冬季天气导致园区部分液体冷却基础设施瘫痪时,多栋建筑离线数日。此次暂停不影响其他星际之门站点。位于德克萨斯州沙克尔福德县、新墨西哥州多纳安娜县、德克萨斯州米拉姆县、俄亥俄州洛兹敦以及威斯康星州的项目均仍在按计划推进。星际之门在所有地点的总规划容量接近7吉瓦,代表三年内超过4000亿美元的投资。甲骨文、软银和OpenAI在选定当前站点组合前,审查了来自30多个州的300多份提案,随着项目朝着10吉瓦的目标推进,预计还会增加更多地点。新站点以Vera Rubin芯片取代BlackwellOpenAI并未在阿比林扩建Blackwell容量,而是将其下一阶段的计算建设转向英伟达的Vera Rubin平台。两家公司于2025年9月22日签署了意向书,计划部署至少10吉瓦的英伟达系统,英伟达将投资高达1000亿美元给OpenAI,每上线1吉瓦即逐步投入。首个1吉瓦的Vera Rubin容量目标是在2026年下半年。Rubin平台采用Vera Rubin超级芯片,配备第六代NVLink互连技术,每台NVL72机架可提供高达260 TB/s的带宽——这是对目前阿比林部署的Blackwell架构的重大升级。包括AWS、Google Cloud、Microsoft Azure和Oracle Cloud在内的多家云提供商,是今年首批部署基于Rubin实例的厂商。“一切都始于计算,”OpenAI首席执行官萨姆·阿尔特曼在宣布与英伟达合作时表示。”计算基础设施将是未来经济的基础,我们将利用与英伟达共同构建的设施,既创造新的人工智能突破,又能大规模赋能个人和企业。”OpenAI在新地点转向Vera Rubin反映了一个实际的考量:在电力与融资条件匹配的地方建设,比在存在未解决基础设施问题的现有站点谈判扩建更为迅速。此举也使OpenAI能够让其下一代模型从一开始就在更先进的硬件上运行。电力与融资压力制约AI建设阿比林的挫折突显了人工智能行业面临的一个更广泛的制约:数据中心的雄心正与电力输送、融资和建设时间表的现实发生碰撞。德克萨斯州立法者已提出担忧,认为大型数据中心正在推动负荷预测的增长速度,超过了公用事业公司能够上线新发电和输电设施的速度。仅阿比林园区就设计有1.2吉瓦的总电力容量,使其成为德州电网中单一最大的负荷之一。OpenAI的星际之门项目预计在全面运行时将消耗10吉瓦电力——足以满足大约750万户家庭的用电需求。该公司一直在积极多元化其计算供应链,与Cerebras合作到2028年提供750兆瓦的低延迟AI计算容量,并与微软、软银和CoreWeave以及甲骨文合作。为AI基础设施确保充足电力和资本的挑战并非OpenAI独有。微软、谷歌和Meta都在竞相为其自身的数据中心扩建锁定能源合同。Meta正在谈判收购Crusoe阿比林园区的部分容量,英伟达从中斡旋,这表明即使OpenAI自身的扩建停滞,该站点的现有基础设施也可能迎来新的租户。几个问题仍未得到解答。OpenAI尚未披露其Vera Rubin部署的具体地点,仅确认将设在具备现有电力容量的站点。甲骨文是会继续独立开发阿比林园区,还是寻求其他主要租户,仍是一个悬而未决的问题。而600兆瓦的扩建计划是永久性取消还是仅仅推迟,则取决于阿比林的电力和融资基础设施能否跟上建立在其上的雄心规模。