公告

谷歌云下一代 2025:以硅、软件和开放代理生态系统加倍下注于 AI

mm

拉斯维加斯正在举办谷歌云下一代 2025,这是一个在技术行业关键时刻举行的活动。云巨头之间的人工智能军备竞赛——亚马逊网络服务(AWS)、微软 Azure 和谷歌云——正在迅速升级。谷歌,经常被视为第三位竞争者,尽管其拥有强大的技术实力和深厚的 AI 研究基础,占领了云下一代的舞台,阐述了一种全面而激进的战略,直接针对企业 AI 市场。

这个叙述由谷歌云 CEO 托马斯·库里安(Thomas Kurian)和谷歌及 Alphabet CEO 桑达尔·皮查伊(Sundar Pichai)提出,集中在将 AI 转型从可能性变为现实。谷歌强调了其所谓的势头,引用了过去一年中超过 3,000 项产品进步,Vertex AI 平台的使用量自上一次云下一代活动以来增加了二十倍,超过四百万开发者正在使用其Gemini 家族模型进行构建,并在会议期间展示了超过 500 个客户成功故事。

然而,谷歌云下一代 2025 不仅仅是一个展示增量更新或令人印象深刻的指标的活动。它还推出了多管齐下的进攻。通过推出强大的、针对推理优化的定制硅(Ironwood TPU),完善其旗舰 AI 模型组合,重点关注实用性(Gemini 2.5 Flash),开放其庞大的全球网络基础设施给企业(云 WAN),并对开放、可互操作的 AI 代理生态系统进行了重大战略性押注(代理到代理协议),谷歌正在积极地将自己定位为下一代企业 AI 的定义者——公司所说的“代理时代”。

铁木,Gemini 和网络效应

谷歌的 AI 野心的核心是其持续投资于定制硅。云下一代 2025 的明星是铁木,谷歌的第七代张量处理单元(TPU)。关键的是,铁木被呈现为第一款专门为AI 推理设计的 TPU——使用训练模型在现实世界应用中进行预测或生成输出的过程。

对于铁木的性能声明是巨大的。谷歌详细介绍了可扩展到一个巨大的 9,216 个液冷芯片在一个单元中相互连接的配置。 该最大配置被称为每个单元的计算能力达到惊人的 42.5 艾克斯浮点运算。谷歌声称这代表了比当前世界上最强大的超级计算机埃尔卡皮坦每个单元的计算能力多 24 倍。

虽然令人印象深刻,但需要注意的是,这样的比较通常涉及不同的数字精度水平,使得直接等效性变得复杂。尽管如此,谷歌将铁木定位为比其前一代高性能 TPU 生成性能提高了十倍以上。

除了原始计算能力,铁木在内存和互联方面与其前身 Trillium(TPU v6)相比也有显著的改进。

也许同样重要的是对能效的强调。谷歌声称铁木的性能每瓦特比 Trillium 提高了两倍,并且比 2018 年的第一代云 TPU 的能效提高了近 30 倍。这直接解决了数据中心为 AI 而扩展的电力可用性日益增长的限制。

谷歌 TPU 代际比较:铁木(v7)与 Trillium(v6)

特征 Trillium(TPU v6) 铁木(TPU v7) 改进因子
主要焦点 训练和推理 推理 专业化
每芯片的峰值计算 不可直接比较(不同代) 4,614 TFLOPs(FP8 可能)
每芯片的 HBM 容量 32 GB(基于 6 倍的估计) 192 GB 6 倍
每芯片的 HBM 带宽 ~1.6 Tbps(基于 4.5 倍的估计) 7.2 Tbps 4.5 倍
ICI 带宽(双向) ~0.8 Tbps(基于 1.5 倍的估计) 1.2 Tbps 1.5 倍
与前一代的性能/瓦特 基准比较 2 倍比 Trillium 2 倍
与 TPU v1(2018 年)的性能/瓦特 ~15 倍(估计) 几乎 30 倍 ~2 倍比 Trillium

注意:一些 Trillium 数字是基于谷歌为铁木声明的改进因子进行估计的。峰值计算比较由于代际差异和可能的精度变化而复杂。

铁木是谷歌“AI 超级计算机”概念的关键部分——一个集成优化硬件(包括 TPU 和 GPU,如Nvidia 的 Blackwell和即将推出的Vera Rubin),软件(如 Pathways 分布式 ML 运行时),存储(Hyperdisk Exapools,Managed Lustre),和网络来处理苛刻的 AI 工作负载。

在模型方面,谷歌推出了 Gemini 2.5 Flash,一种针对高端Gemini 2.5 Pro的战略对应物。虽然 Pro针对复杂推理的最大质量,但 Flash 显然针对低延迟和成本效率进行了优化,使其适合高容量、实时应用,如客户服务交互或快速摘要。

Gemini 2.5 Flash 具有一个动态的“思考预算”,根据查询复杂性调整处理,使用户能够平衡速度、成本和准确性。这一同时关注高性能推理芯片(铁木)和成本/延迟优化模型(Gemini Flash)的重点,凸显了谷歌将 AI 的实际运营化的推动,认识到在生产中运行模型的成本和效率对于企业来说变得至关重要。

补充硅和模型更新的是云 WAN 的推出。谷歌有效地将其内部的庞大全球网络——跨越超过 200 万英里的光纤,通过超过 200 个点连接 42 个地区——直接提供给企业客户。

谷歌声称此服务可以比公共互联网快 40%,并且与自管理的 WAN 相比,总拥有成本可以降低 40%,支持 99.99% 的可靠性 SLA。主要针对数据中心之间的高性能连接和连接分支/校园环境,云 WAN 利用谷歌现有的基础设施,包括网络连接中心。

虽然谷歌提到了 Nestle 和 Citadel Securities 作为早期采用者,但这一举动本质上是将核心基础设施资产武器化。它将内部运营必要性转化为竞争优势和潜在的收入来源,直接挑战传统电信提供商和竞争对手云平台(如 AWS Cloud WAN 和 Azure Virtual WAN)的网络产品。

代理进攻:使用 ADK 和 A2A 构建桥梁

超越基础设施和核心模型,谷歌云下一代 2025 对AI 代理和构建和连接它们的工具给予了非凡的强调。所呈现的愿景超出了简单的聊天机器人,设想了能够进行自主推理、规划和执行复杂、多步骤任务的复杂系统。焦点明显转向了实现多代理系统,其中专用代理合作以实现更广泛的目标。

为了促进这一愿景,谷歌推出了代理开发工具包(ADK)。ADK 是一个开源框架,最初在 Python 中可用,旨在简化个别代理和复杂多代理系统的创建。谷歌声称开发者可以使用不到 100 行代码构建一个功能代理。

关键功能包括代码优先方法以获得精确控制,原生支持多代理架构,灵活的工具集成(包括对模型上下文协议,或 MCP 的支持),内置评估功能,以及从本地容器到托管 Vertex AI 代理引擎的部署选项。ADK 还唯一支持双向音频和视频流媒体,以实现更自然的人机交互。一个名为“代理花园”的工具提供了可用的示例和超过 100 个预构建的连接器,以启动开发。

然而,谷歌的代理策略的真正中心是代理到代理(A2A)协议。 A2A 是一种新的、开放标准,专门为代理互操作性而设计。其基本目标是允许 AI 代理,无论它们是用什么框架构建(ADK、LangGraph、CrewAI 等)或由什么供应商创建,都可以安全地进行通信、交换信息和协调行动。 这直接解决了企业内部 AI 系统的重大挑战,在那里为不同任务或部门构建的代理通常无法相互交互。

这一推动开放 A2A 协议的举动代表着一个重大的战略赌注。谷歌没有建立一个专有的、封闭的代理生态系统,而是试图建立代理通信的实际标准。这一方法可能会牺牲短期的锁定,以换取长期的生态系统领导地位,并且,至关重要的是,减少阻碍企业采用复杂多代理系统的摩擦。

通过倡导开放,谷歌旨在加速整个代理市场,将其云平台和工具定位为多代理系统的核心促进者。

云竞赛的重新校准:谷歌的竞争策略

这些公告直接落在了云竞赛的背景下。谷歌云虽然展示了令人印象深刻的增长,通常由 AI 的采用推动,但仍然占据了第三位的市场份额,落后于 AWS 和微软 Azure。云下一代 2025 展示了谷歌的战略,以其独特的优势和解决感知到的弱点来重新校准这一竞赛。

谷歌的关键区别在于其全面的展示。对定制硅的长期投资,导致了针对推理的铁木 TPU,提供了一个与 AWS 的 Trainium/Inferentia 芯片和 Azure 的 Maia 加速器不同的硬件叙述。谷歌一贯强调每瓦特的性能领导,这可能是 AI 能源需求激增时的一个关键因素。云 WAN 的推出利用了谷歌的无与伦比的全球网络基础设施,提供了一个不同的网络优势。

此外,谷歌继续利用其 AI 和机器学习的遗产,这些遗产来自DeepMind 的研究,并体现在全面性的 Vertex AI 平台中,与其作为 AI 和数据分析领导者的市场认知相一致。

同时,谷歌发出信号,试图解决历史上的企业问题。就在云下一代之前不久宣布的32 亿美元收购云安全公司 Wiz,这是一个明确的意图声明,旨在加强其安全态势并改善其安全产品的可用性和体验——这些对于企业信任至关重要的领域。

继续强调行业解决方案、企业就绪性和战略伙伴关系,进一步旨在重塑市场认知,从纯粹的技术提供商转变为可靠的企业合作伙伴。

总的来说,谷歌的战略似乎不再专注于在每个服务上与 AWS 和 Azure 匹配,而是集中于利用其独特的资产——AI 研究、定制硬件、全球网络和开源亲和力——来确立在其认为的云计算下一波浪潮中的领导地位:大规模 AI,特别是高效推理和复杂的代理系统。

谷歌 AI 的未来之路

谷歌云下一代 2025 提出了一个令人信服的雄心和战略一致性的叙述。谷歌正在加倍下注于人工智能,动员其资源,横跨定制硅、针对推理时代的优化(铁木),一个平衡且实用的 AI 模型组合(Gemini 2.5 Pro 和 Flash),其独特的全球网络基础设施(云 WAN),以及对开放、可互操作的 AI 代理生态系统的大胆方法(代理到代理协议)。

最终,这个活动展示了一个公司正在积极地将其深厚的技术能力转化为一个全面、有区别的企业 AI 时代产品的过程。集成的战略——硬件、软件、网络和开源标准——是合理的。然而,前进的道路需要的不仅仅是创新。

谷歌面临的最大挑战可能不在于技术,而在于克服企业采用中的惯性,并建立持久的信任。将这些雄心壮志的公告转化为持续的市场份额增长,需要在面对深度根植的竞争对手时,需要无缝的执行、清晰的市场策略,以及持续说服大型组织相信谷歌云是其 AI 驱动未来的不可或缺的平台。谷歌所设想的代理未来是令人信服的,但其实现取决于在拉斯维加斯聚光灯熄灭后长时间内导航这些复杂的市场动态。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。