Connect with us

思想领袖

物理AI:新时代的英雄

mm

今天,所有与AI行业相关的人都在谈论物理AI。这个词迅速从小众讨论转移到主流议程中。一个典型的例子是NVIDIA,它将物理AI放在了其战略的中心——从新的机器人模型和模拟框架到专门为自主机器设计的边缘计算硬件。

当万亿美元的基础设施玩家开始重新组织他们的产品路线图时,这就变成了一个方向。

那么,什么是物理AI呢——是一种新技术还是一个新范式?它的背后到底是什么?

旧的新事物

如果我们从全球角度思考,物理AI一直存在。与机器人和自主系统相关的一切基本上都属于这个定义。早在20世纪60年代,就出现了一辆使用人工智能元素进行控制的车辆。按照今天的标准,这些都是非常原始的计算机视觉系统,但车辆可以根据它“看到”的东西调整其运动。这是物理AI的第一次体现。

任何将自主性与环境感知结合的机器人系统都是物理AI。简单地说,它是将人工智能应用于分析和理解物理世界,然后做出决定和采取行动。

这就是为什么我们不是在谈论一项根本新技术。自主机器已经存在很长时间了。另外,航天器,包括火星漫游车,都是基于相同的基本原理运行的:它们配备了计算机视觉系统,导航空间,移动表面,收集样本。所有这些都代表了物理AI的形式。

2026年发生了什么变化是人们的关注点。这个词本身变得流行起来。

市场的结构是这样的:它不断需要一个新的“英雄”——一个可以形成讨论和投资兴趣的概念。曾经,焦点在于加密货币。然后出现了智能合约,基本上是同样的想法,但以新的、更有投资吸引力的名字出现。这是一种方式,重新包装现有的技术,激发新的兴趣浪潮。

类似的事情正在发生在物理AI身上。这个词本身并不是新鲜的,但今天它已经获得了新的相关性、新的轮廓和发展方向。

我们已经教会计算机说话、生成文本,甚至模仿推理。自主车辆已经在没有司机的情况下行驶了几年:特斯拉的Full Self-Driving系统、Waymo和Zoox运送乘客;自主卡车正在被测试并在现实世界中运行。这个领域的许多挑战已经被解决或已经非常成熟。

与此同时,机器人仍然无法可靠地执行简单的日常任务,如整齐地折叠衣服或装载洗碗机。因此,市场开始寻找新的增长点——一个领域,仍然存在未解决的问题,并且仍然有扩张的空间。

在这个背景下,物理AI的概念作为描述下一阶段技术发展的框架是很方便的,在这个阶段,智能开始超越屏幕,开始在真实的物理世界中发挥作用。

科技巨头的逻辑

从宏观角度来看,物理AI日益受到关注并非偶然。

NVIDIA的历史是一个很好的例子。该公司最初生产游戏图形处理器。后来,其芯片成为加密货币挖矿热潮中的骨干。之后,相同的计算能力被证明对于训练深度神经网络至关重要。每个新技术周期都加强了对硬件的需求。

但是,有一个细微差别。随着技术开始优化,对过度计算能力的需求逐渐下降。LLM变得更加高效。中国公司展示了强大的模型可以以显著降低的成本进行训练。对于基础设施制造商来说,这是一个警告信号。如果模型变得更加紧凑和廉价,如果推理转移到边缘设备,如果训练变得更加优化,那么市场不再需要服务器容量的指数级增长。这意味着需要一个新的驱动力。

物理AI完美地适应了这一角色。与纯软件模型不同,物理AI需要集成传感器、实时处理、数据流处理、模拟和持续实验。一个机器人不能“做梦”——文本中的错误是无害的,但一个操作臂的运动错误可能会损坏设备或伤害人类。这代表了一个完全不同的可靠性要求和计算负载水平。例如,我们在Introspector上大量工作,以满足这一点,充分意识到高质量数据和边缘情况的重要性。

总之,当一个技术周期接近成熟时,资本开始寻找下一个——更复杂、结构更松散、潜在更可扩展的周期。世界科技巨头拥有资源来投资这一新周期,并积极推广它,塑造围绕它的叙事、生态系统和标准。

机器人领域的狂野边疆

仔细观察过去十年的技术市场,很明显在几乎每个主要的AI领域中,已经出现了一批核心的主导玩家。在LLM中,有一批全球平台支撑着整个生态系统。在自主运输中,一批公司已经投资了数十亿美元用于传感器、地图、车队和基础设施。在智能手机中,基本上是一个封闭的俱乐部。

本质上,初创公司寻找的是尚未固化的领域。投资者寻找的是具有指数级增长潜力的市场。只要一个领域接近成熟,注意力就会不可避免地转移到尚未固化的结构、尚未固定的标准和仍然可以定义游戏规则的地方。

从这个意义上说,机器人领域看起来像是一个真正的狂野边疆,拥有数百种潜在应用。家用助手、零售服务机器人、仓库自动化、农业、建筑、医疗支持和老年护理。这不是一个市场——这是一个广泛的技术层中的几十个市场。

关键的区别在于,还没有单一的主导架构。没有通用的“操作系统”用于物理AI,没有标准化的传感器配置,也没有建立的模型可以简单地使用模板进行微调和扩展。每个团队基本上都是从头开始解决基本问题——感知、导航、操作、平衡和人机交互。

这就是它的吸引力所在。今天,机器人领域是一个边界尚未划定的领地。这就是为什么它再次成为一个大市场的原因。

一切从B2B开始

我与机器人领域的许多专家交谈,他们相信下一波发展将从B2B段开始。工业一直是首先扩大新技术的领域——经济学是明确的,过程是高度可重复的,结果是可衡量的。

同时,必须记住,工业机器人已经存在很长时间了。我们都知道所谓的“黑色工厂”,即几乎没有人的工厂,也就没有照明的需要。生产线是完全自动化的:机器人操作臂处理装配、移动、焊接和包装。

汽车行业是最引人注目的例子。像特斯拉或丰田这样的公司每年生产数百万辆汽车。很明显,如此规模的生产如果没有深度机器人化是不可能的。

传送带上运载车辆零件。一个机器人操作臂必须降下,抓住物体,抬起并将其放入容器中。你可以简单地编程一系列固定的动作:降下、抓取、抬起、移动、释放。即使没有物体,操作臂也会执行预定义的周期。这就是自动化。

AI开始于推理的出现——在不确定性下评估情况的能力。

例如,一个自主车辆看到一个人站在路边。它考虑到速度、天气条件和这个人可能会滑倒并意外进入交通流的可能性。根据这些因素,系统可能会提前减速。这不再只是对信号的反应——这是预测和风险评估。我记得在Keymakr,我们为汽车公司提供了高精度的数据解决方案,以帮助他们管理道路标记的复杂3D标签。这都是为了帮助模型“思考”。

现在让我们回到工业机器人操作臂。它不需要推理。所有参数都是预定义的,系统的任务不是适应性,而是可重复性和精度。这就是为什么在生产线上使用通用的人形机器人往往是过度的。更有效的方法是使用专门为特定任务优化的专用操作臂。但是,一旦任务超出了严格定义的场景,情况就会改变。

这就是物理AI今天的核心挑战所在——从自动化到智能适应性的转变。

现代智能机器人系统仍然很昂贵。在需要灵活性和适应性的任务中,它们仍然不如人类。需要区分:经典自动化往往优于人类,但智能组件——至少目前——还不如人类。

工厂地板上的机器人操作臂之所以能够完美地工作,是因为它不需要解释背景。它以高精度和速度重复一系列预编程的动作。在这个意义上,它超越了人类,人类无法无休止地执行单调的工作而不降低质量。但是,一旦环境变得不可预测,真正的挑战就开始了。正是在那里,自动化和真正的人工智能之间的界限被划定。

与物质合作

于是,我们来到了核心思想。

物理AI并不是关于硬件或趋势。它是关于将智能转移到一个环境中,在那里错误具有物理后果。人工智能发展的下一个阶段将由其在真实世界中可靠操作的能力来定义。这一转变比以前的更复杂,需要集成传感器、硬件、局部计算、新的模型架构、新的数据集和新的安全标准。这是一个重建整个技术栈的过程。在这个意义上,物理AI真正成为新时代的英雄。

每个技术周期都遵循类似的阶段:首先是实验室,然后是演示,接着是投资高峰,最后是真正的工业化。物理AI今天处于演示和工业化之间的某个位置。

这就是关键问题被定义的地方:谁将第一个使其可扩展、安全和经济可行?这就是我们下次要讨论的内容。

Michael Abramov 是 Introspector 的创始人和 CEO,他带来了 15 年以上的软件工程和计算机视觉 AI 系统经验,用于构建企业级标注工具。

Michael 开始他的职业生涯作为软件工程师和研发经理,构建可扩展的数据系统和管理跨功能的工程团队。直到 2025 年,他曾担任 Keymakr 的 CEO,该公司是一家数据标注服务公司,他在那里开创了人机协同工作流、先进的 QA 系统和定制工具,以支持大规模计算机视觉和自主驾驶数据需求。

他拥有计算机科学学士学位,并具有工程和创意艺术背景,这使他能够从多学科的角度解决棘手的问题。Michael 活跃在技术创新、战略产品领导和现实世界影响力的交叉点,推动自主系统和智能自动化的下一个前沿。