AI 模型与平台

超越检索：NVIDIA 为生成计算时代绘制蓝图

发布于 2025年3月19日

更新于 2026年5月19日

作者

Alex McFarland

NVIDIA CEO 黄仁勋在公司的 GTC 2025 主题演讲中宣布了一系列突破性的 AI 计算能力进展，他称之为“1 万亿美元的计算转折点”。主题演讲揭露了 Blackwell GPU 架构的生产就绪状态，未来架构的多年路线图，AI 网络的重大突破，新的企业 AI 解决方案，以及机器人和物理 AI 的重大发展。

“令牌经济” 和 AI 工厂

黄仁勋的愿景中心是“令牌”作为 AI 的基本构建块和“AI 工厂”作为专门为生成计算设计的数据中心的概念。

“这就是如何制造智能，一种新的工厂生成器令牌，AI 的构建块。令牌已经开启了一个新的前沿，”黄仁勋告诉观众。他强调了令牌可以“将图像转换为科学数据，绘制外星大气”，“解码物理定律”，“在疾病爆发之前看到它”。

这一愿景代表了从传统的“检索计算”到“生成计算”的转变，在那里 AI 理解上下文并生成答案，而不是简单地检索预存储的数据。根据黄仁勋的说法，这种转变需要一种新的数据中心架构，其中“计算机已经成为令牌的生成器，而不是文件的检索器”。

Blackwell 架构带来巨大的性能提升

NVIDIA Blackwell GPU 架构现在处于“完全生产”状态，据公司称，其性能是“Hopper 的 40 倍”，在相同的功耗条件下，用于推理模型。该架构包括对 FP4 精度的支持，从而带来显著的能效改进。

“ISO 功耗，Blackwell 是 25 倍，”黄仁勋表示，强调了新平台的显著效率提升。

Blackwell 架构还支持极端的扩展，通过如 NVLink 72 的技术，实现了大规模、统一的 GPU 系统的创建。黄仁勋预测，Blackwell 的性能将使前几代 GPU 对于需求苛刻的 AI 工作负载显得不那么理想。

(来源：NVIDIA)

AI 基础设施的可预测路线图

NVIDIA 概述了其 AI 基础设施创新每年一次的常规节奏，使客户能够更有信心地规划他们的投资：

Blackwell Ultra（2025 年下半年）： Blackwell 平台的升级，增加了 FLOPs、内存和带宽。
Vera Rubin（2026 年下半年）： 一种新架构，具有性能翻倍的 CPU、新的 GPU 和下一代 NVLink 和内存技术。
Rubin Ultra（2027 年下半年）： 一种极端扩展架构，目标是每个机架实现 15 exaflops 的计算能力。

民主化 AI：从网络到模型

为了实现广泛的 AI 采用，NVIDIA 宣布了涵盖网络、硬件和软件的综合解决方案。在基础设施层面，公司正在通过对硅光子技术的重大投资来解决在 AI 工厂中连接数十万甚至数百万个 GPU 的挑战。他们的第一个同包光学（CPO）硅光子系统，是一个基于微环谐振器调制器（MRM）技术的每秒 1.6 太比特 CPO，承诺与传统收发器相比具有显著的功耗节省和密度增加，从而实现更多 GPU 之间的高效连接。

在为大规模 AI 工厂构建基础的同时，NVIDIA 同时将 AI 计算能力带给个人和小团队。该公司推出了新的 DGX 个人 AI 超级计算机产品线，采用 Grace Blackwell 平台，旨在赋予 AI 开发人员、研究人员和数据科学家权力。产品线包括 DGX Spark，一款紧凑的开发平台，以及 DGX Station，一款具有液体冷却和令人印象深刻的 20 皮塔浮点运算能力的高性能台式工作站。

NVIDIA DGX Spark (来源：NVIDIA)

补充这些硬件进步，NVIDIA 宣布了开放的 Llama Nemotron 模型家族，具有推理能力，旨在为企业打造高级 AI 代理而设计。这些模型集成到 NVIDIA NIM（NVIDIA 推理微服务）中，允许开发人员将其部署在从本地工作站到云端的各个平台上。这种方法代表了企业 AI 采用的全栈解决方案。

黄仁勋强调，这些计划正在通过与各个行业的主要公司进行广泛的合作而得到加强，这些公司正在将 NVIDIA 模型、NIM 和库集成到他们的 AI 战略中。这种生态系统方法旨在加速采用，同时为不同的企业需求和用例提供灵活性。

物理 AI 和机器人：50 万亿美元的机会

NVIDIA 将物理 AI 和机器人视为“50 万亿美元的机会”，根据黄仁勋的说法。该公司宣布了开源的 NVIDIA Isaac GR00T N1，被描述为“人形机器人的通用基础模型”。

对 NVIDIA Cosmos 世界基础模型的重大更新为使用 NVIDIA Omniverse 进行机器人训练提供了前所未有的对合成数据生成的控制。正如黄仁勋解释的那样，“使用 Omniverse 条件化 Cosmos，并使用 Cosmos 生成无限数量的环境，允许我们创建受控的、系统无限的数据”。

该公司还推出了一个名为“Newton”的新开源物理引擎，开发于 Google DeepMind 和迪士尼研究的合作下。该引擎旨在进行高保真机器人模拟，包括刚性和柔性体、触觉反馈和 GPU 加速。

Isaac GR00T N1 (来源：NVIDIA)

代理 AI 和行业转型

黄仁勋将“代理 AI”定义为具有“代理性”的 AI，可以“感知和理解上下文”，“推理”，“计划和采取行动”，甚至使用工具并从多模态信息中学习。

“代理 AI 基本上意味着您拥有一个具有代理性的 AI。它可以感知和理解情况的上下文。它可以推理，非常重要的是可以推理如何回答或解决问题，并且可以计划和采取行动。它可以使用工具，”黄仁勋解释道。

这种能力正在推动计算需求的激增：“由于代理 AI，推理和代理 AI 的计算需求量，AI 的缩放定律更加强韧，实际上是超级加速的。由于代理 AI 和推理，我们现在需要的计算量比我们一年前预期的要多一百倍，”他补充道。

结论

黄仁勋的 GTC 2025 主题演讲呈现了一个全面而详细的 AI 驱动的未来愿景，包括智能代理、自主机器人和专用 AI 工厂。NVIDIA 在硬件架构、网络、软件和开源模型方面的公告表明了该公司为加速下一代计算时代而做出的决心。

随着计算从检索型转向生成型，NVIDIA 关注令牌作为 AI 的核心货币，并在云端、企业和机器人平台上扩展能力，为技术的未来提供了路线图，对全球各个行业都有深远的影响。