思想领袖

为什么物理AI比我们想象的更难

mm

物理AI正迅速从令人印象深刻的演示转变为工程现实。如果注意力曾经主要集中在其能力上,那么今天,扩展性的问题变得越来越紧迫:是什么阻止了这些系统成为真正普遍和可靠的?

物理AI人形机器人现在站在三个主要挑战的交叉点:工程、认知和投资相关。物理世界中的智能带来与软件基于AI不同的要求:这里,错误是昂贵的,环境仍然不可预测。这就是为什么对话从“哇”效果转变为具体的技术、市场和监管障碍的原因。

必须学会思考的机械师

第一个挑战是精细运动技能。我们有能够执行高精度微运动的电机和伺服器。但是,复制人类的敏感性、灵活性和处理小物体时的适应能力是非常困难的。人类的手无意识地调节力、角度、速度和轨迹——所有这些都在几分之一秒内发生,并不断适应甚至最小的变化。

第二个挑战是平衡和力控制。机器人必须与不同形状、重量和质地的物体交互作用:一个苹果、一个玻璃、一个珠宝、一个金属部件、一个湿滑的物体。机器人可能具有显著的物理力量,但它必须能够正确地计算和应用这种力量。这需要触觉传感器、允许它“感觉”压力、阻力和表面接触的系统。同样重要的是,不仅仅是检测力,还要在特定动作的背景下正确地解释它。这成为理解物体的物理属性的问题:材料阻力、弹性、摩擦和其他参数。

另一个严重的挑战是空间定位——所谓的6D表示。这并不指“六维世界”在科幻意义上的东西,而是指三个位置坐标、高度、宽度和深度,加上三个方向坐标:沿每个轴的旋转角度。例如,一个管子或一个玻璃是三维物体。但是,对于机器人来说,知道其坐标是不够的。它必须了解物体的方向、其相对于重力的位置以及其位置如何随着操作器的旋转而改变。如果机器人拿起一个玻璃并想从中倒水,它不能简单地“倾斜物体”。它必须计算精确的轨迹、角度和旋转速度,同时考虑到内部的液体、惯性和重力的力量。所有这些都需要复杂的空间建模和预测行动的后果。

为什么市场仍然谨慎

当考虑物理AI在人形机器人背景下的问题时,必须承认仍然存在相当程度的怀疑主义。

这种怀疑主义的一部分是心理上的。令人毛骨悚然的谷底效应——当某事物看起来几乎像人类,但又不够真实时——会产生不适和焦虑。非自然的面部表情、稍微僵硬或“断裂”的动作、机械化的语调——所有这些都会产生情感上的抵抗。那些引起不适的技术往往会被更慢地采用。

但是,主要的障碍是经济上的。投资者看到,公司已经展示了令人印象深刻的原型数十年了,但可扩展的商业模式仍然有限。技术进步是明显的,但可持续的大众市场尚未完全出现。

像波士顿动力这样的公司制造出工程杰作,但他们的应用仍然是小众和昂贵的。特斯拉正在开发自己的人形项目。像Figure AI这样的新公司正在吸引大量投资,承诺为制造业、物流和护理行业提供机器人。

制造业仍然是一个明显的方向。在这个背景下,机器人化没有疑问,只是部署的速度和成本的问题。

一个更明显的例子是物流和仓储。物流机器人已经是今天机器人领域中最盈利和广泛采用的部分之一。我记得,在Keymakr,许多物流公司在实施此类技术时接洽我们进行注释服务,并计划进一步扩大这些技术的规模。全球电子商务的规模要求巨大的货物以高速和精度运输。人类在身体上无法以这样的速度运作。因此,仓库自动化已经成为一个“热点”话题,催生了一个整个行业:自主平台导航路线、分类、运输和分发货物。

然而,行业的大部分仍然处于试验阶段,并且正在做出雄心勃勃的承诺。公司仍然在寻找能够带来可预测的盈利的有说服力的用例。投资者反过来评估投资回报时间、技术风险和工程挑战的规模。

这就是为什么市场正在逐步发展。这个领域的资本不仅需要愿景,还需要经过验证的经济效益。

风险成为建筑的一部分

一个单独的讨论层面涉及监管和网络安全。物理AI尚未完全形成一个全面性的监管框架。该行业仍处于其形成阶段:没有成熟的标准,没有广泛的日常环境存在,也没有建立的认证协议。监管最终会出现——但就像其他技术周期一样,它们将是扩张的结果。

现在更重要的是一个不同的问题——对获得物理自主性的系统的信任。家中、仓库或关键基础设施设施中的机器人是一个具有传感器、摄像头、麦克风和通信渠道的网络节点。其行为由软件和更新决定。即使机器人最初被编程为仅执行安全操作,网络威胁的可能性仍然存在。具有不充分保护的机器人,恶意行为者可能会理论上访问设备网络并尝试将其用于有害目的。

涉及自主车辆或机器人网络被黑客攻击的场景已经在卡片中。它们被视为风险评估的一部分——就像曾经发生在银行系统、互联网和云服务上的事情一样。

但是,历史表明,技术进步很少会因为威胁而停止。相反,行业会通过建立标准、实施监控和构建多层安全系统来加强保护。物理AI将遵循相同的路径。问题不在于是否会出现风险,而在于安全性何时会融入整个生态系统中。

一个行业正在围绕它建立

所有提到的挑战,技术、市场和监管,共享一个重要的特征:没有一个可以在孤立中解决。

物理AI不能被视为一个独立的产品,甚至不能被视为单一的技术。我们正在见证的是一个完整的基础设施的形成,在这里,硬件、计算、能量、数据和材料同步演进。就在这里,很明显:这是一个新工业生态系统的出现。

机器人是自主和移动的。这意味着它不能仅仅依赖于云端。与在服务器集群上运行的LLM不同,物理智能必须在本地、实时做出决定。这从根本上改变了芯片的要求:它们必须强大、节能,并针对边缘设备进行优化。

这反过来又创造了一个广泛的新开发领域:为机器人设计的节能芯片;用于边缘部署的紧凑、优化的AI模型;用于训练此类模型的平台;数据注释系统和专用数据集的准备,如我们在Introspector所做的,以及电池和自主电源系统的进步。

已经有关于机器人更换自己的电池的概念:移除一个耗尽的模块,将其放在充电器上,并在系统完全关闭之前连接一个充电的模块。仅此一项就可能成为一个单独的市场。

一个全面性的行业正在逐渐围绕物理AI形成。除了计算和能量之外,材料科学也需要演进:模仿皮肤的合成涂层、柔性传感器表面、安全且触觉愉悦的材料用于人类交互。如果机器人与人类一起工作,其外观和物理特征成为用户对技术的感知和信任的一部分。

在这个意义上,物理AI是关于整个技术栈,从芯片和电池到传感器、软件、材料和人类感知因素。就在这种复杂性中,未来的行业的真正规模所在。

迈克尔·阿布拉莫夫(Michael Abramov)是Introspector的创始人兼首席执行官,拥有15多年的软件工程和计算机视觉AI系统经验,致力于打造企业级标注工具。

迈克尔在软件工程师和研发经理的职位上开始了他的职业生涯,构建了可扩展的数据系统,并管理着跨功能的工程团队。直到2025年,他曾担任Keymakr的首席执行官,Keymakr是一家数据标注服务公司,他在那里开创了人机协同工作流程、先进的QA系统和定制工具,以支持大规模计算机视觉和自主驾驶数据需求。

他拥有计算机科学学士学位,并具有工程和创意艺术背景,带来多学科视角解决复杂问题。迈克尔生活在技术创新、战略产品领导和现实世界影响的交叉点,推动自主系统和智能自动化的下一个前沿。