Connect with us

人工智能

物理AI的崛起:波士顿动力学-谷歌DeepMind联盟如何改变一切

mm
The Rise of Physical AI: Why the Boston Dynamics–Google DeepMind Alliance Changes Everything

物理AI指的是能够在物理世界中感知、推理和行动的智能系统。这些系统不仅限于屏幕、服务器或数字空间,而是能够在重力、摩擦和无结构条件下运行的环境中操作。因此,物理AI必须满足比传统人工智能(AI)更严格的技术和安全要求。与仅软件模型不同,物理AI直接将感知和决策连接到执行器。这一连接使得机器人能够处理真实对象,导航真实空间,并与人类操作员实时合作。

多年来,机器人和人工智能的发展一直走在不同的道路上。机器人研究主要集中在机械系统上,包括电机、关节和控制算法。相比之下,人工智能研究则集中在数字环境中的推理和学习,包括大型语言模型和基础模型。这一分离限制了通用机器人的进步。因此,机器人实现了高精度,但缺乏适应性。人工智能系统则展示了强大的推理能力,但缺乏在工厂或物流中心的物理存在。

这种分离开始在2026年缩小。波士顿动力学和谷歌DeepMind的联盟,由现代汽车集团支持,将先进的机器人硬件和基础模型智能结合在一起,部署在真实的工业环境中。因此,物理系统和智能推理开始作为一个单一的系统运行,而不是两个独立的层次。因此,物理AI超出了实验研究,进入了真正的操作使用。

物理AI和GPT-3时刻

物理AI在真实世界中运行,而不仅仅是在屏幕或服务器上。与生成式AI不同,后者可以生成文本、图像或代码,具有低风险错误,物理AI移动真实的机器人,周围有人员、机器和设备。这种世界中的错误可能会造成损害、停止生产,甚至造成安全隐患。因此,可靠性、时序和安全性被构建到系统设计的每一层,从感知到运动。

GPT-3模型有助于解释物理AI的重要性。GPT-3展示了一个大型语言模型可以执行诸如翻译、摘要和编码等任务,而无需为每个任务创建单独的系统。同样,基于Gemini的机器人模型为机器人提供了一个共享的认知层,处理多个任务和不同的机器。工程师不需要为每种情况编写详细的指令,机器人可以通过数据和模型更新来改进。它们的智能增长和传播到所有机器中。

通过将先进的硬件与基础模型智能结合,波士顿动力学-谷歌DeepMind合作伙伴关系标志着机器人的真正GPT-3时刻。它展示了机器人可以在复杂的、真实的环境中安全、适应性和持续学习地运行。

视觉语言动作模型(VLA)和机器人新方法

VLA模型解决了机器人中的一个重大问题。传统机器人将感知、规划和控制视为单独的系统。每个模块都是独立设计、调试和测试的。这使得机器人变得脆弱。即使是小的环境变化,例如放错的物体或不同的照明,也可能会导致错误。

VLA模型将这些步骤合并为一个系统。它们将机器人看到的东西、被告知要做的事情和应该采取的行动联系起来。这一统一使得机器人能够更顺畅地计划和执行任务。没有必要为每个步骤单独编程。

例如,使用VLA模型的机器人可以在接收指令(如“清理这个工作站并按大小对金属零件进行分类”)的同时获取图像和深度数据。该模型直接将其转换为动作命令。由于该系统从大型数据集和模拟中学习,因此它可以处理照明、物体位置和杂乱的变化,而无需不断重新编程。

这种设计使得机器人更加灵活和可靠。它们可以在复杂的环境中工作,例如混合产品仓库或与人类共享的装配线。此外,VLA模型减少了在新环境中部署机器人的时间和精力。因此,物理AI可以执行传统机器人难以或不可能完成的任务。

使用Atlas和Gemini机器人扩展物理AI

传统的工业机器人在可预测的环境中运行良好,零件固定,运动可重复。但是,它们在变化的环境中,例如混合产品仓库或任务不断变化的装配线中,难以应对。主要问题是脆弱性,即使是小的变化也经常需要工程师重新编写控制逻辑。因此,扩展性受到限制,自动化仍然昂贵且不灵活。

波士顿动力学和谷歌DeepMind的合作伙伴关系通过将先进的机器人硬件与基础模型智能结合,解决了这个问题。Atlas被重新设计为一种适用于工业操作的全电动人形机器人。电动执行器提供精确的控制、能效和降低维护,这对于连续生产至关重要。此外,Atlas并不完全模仿人类解剖结构。其关节超出了人类的限制,提供了额外的伸展和灵活性。高自由度支持复杂的操作任务,并允许机器人适应狭窄的空间或不寻常的零件方向。因此,Atlas可以在不需要专用夹具的情况下执行更广泛的功能。

Gemini机器人作为Atlas的数字神经系统,持续处理视觉、触觉和关节反馈,以维持对环境的最新理解。这使得机器人能够在实时调整运动,纠正错误,并从干扰中恢复。另外,一个Atlas单元学习的技能可以在其他机器人中共享,提高了机群级别的性能。因此,多个机器人可以在工厂和地点中高效运行,同时从经验中持续学习。

早期的人形机器人严重依赖远程操作,人类控制每一个动作。这一方法引入了延迟,增加了成本,并限制了可扩展性。相比之下,Gemini机器人支持基于意图的任务执行。人类提供一个目标,例如“组织这些零件”,然后Atlas计划和执行必要的操作。监督者监控操作,但直接控制被最小化。因此,任务执行变得更加高效,在工业环境中大规模部署成为可能。

现代的物理AI愿景和工业优势

现代汽车集团已经将其重点扩展到机器人和智能系统之外,超出了车辆制造。其元移动愿景包括工厂、物流中心和服务环境。因此,物理AI自然适合这一战略,因为它使机器人能够执行传统自动化无法处理的任务。此外,机器人在工作过程中收集操作数据,这提高了它们的性能。因此,它们成为核心基础设施的一部分,而不仅仅是实验工具。

佐治亚元工厂,即现代汽车集团元工厂美国,是物理AI的第一个真实世界测试场。在这里,自动化、数字孪生和机器人在生产车间上紧密合作。模拟中学习的技能直接应用于真实任务。另外,来自这些操作的反馈更新了训练模型。这一持续的循环提高了机器人的性能并降低了运营风险。因此,跨多个工厂的大规模部署成为可能,该模型可以在全球范围内扩展。

传统的自动化在处理变异性和高编程成本时存在困难,这使得许多任务仍然是手动完成的。同样,劳动力短缺和产品多样性限制了传统机器人可以做的事情。配备了物理AI的人形机器人克服了这些限制,适应了不断变化的环境,并执行了复杂的任务。此外,这种灵活性弥补了自动化的差距,并实现了以前不可能的操作。市场预测表明,人形机器人在未来十年内可能会达到数十亿美元的规模。因此,现代汽车集团通过控制部署环境和驱动机器人的智能,获得了战略优势。

谷歌DeepMind的Gemini类模型为这些机器人提供了智能。工人可以使用自然语言给出指令,机器人使用视觉、触觉反馈和空间意识来解释这些指令。因此,机器人将人类的意图转化为精确的行动,而无需手动编码。多模式感知增强了材料处理。例如,机器人结合视觉和触觉数据来调整握力、力和运动。因此,精细或高价值的零件被安全处理。

数字孪生使得大规模部署成为可能且可靠。技能和策略首先在模拟中测试,然后应用于真实机器人。一旦验证,更新可以在整个机器队中共享。因此,物理AI以类似软件的方式扩展。这一先进硬件、基础模型智能和连接部署的组合为现代汽车集团带来了运营效率和明显的战略优势,在物理AI的新兴领域中。

人形机器人中的物理AI的未来

特斯拉的Optimus计划遵循一种垂直集成的方法。硬件、AI和部署都保持在内部,初始推出主要发生在特斯拉工厂内。相比之下,波士顿动力学-现代汽车集团的模型将专用机器人、基础模型智能和工业部署通过协调的合作伙伴结合在一起。因此,机器人可以在更广泛的环境中运行,并处理更广泛的应用。这种合作也使开发者受益,他们获得了灵活性和进入更广泛的生态系统的机会。

与人类共享工作空间增加了安全性的重要性。物理AI系统必须预测人类的运动,并主动调整行动。因此,认证的控制层、冗余和机群级别的监控对于安全操作至关重要。另外,连接的机器人引入了新的网络物理风险。安全的认证、加密和运行时监控对于防止滥用是必要的。因此,网络安全与数字安全一样,是一个物理问题,必须从设计阶段就将其纳入其中。

模拟优先的工作流程降低了运营风险和成本。机器人在部署之前在虚拟环境中进行了广泛的训练。增量式推出允许在真实世界中进行验证和改进。此外,遥测和反馈循环告知持续更新,提高了性能和采用信心。这样,波士顿动力学和现代汽车集团展示了如何使人形机器人中的物理AI在未来工厂和物流运营中扩展、智能和可靠地运行。

结论

波士顿动力学-谷歌DeepMind-现代汽车集团的联盟展示了机器人和人工智能合作方式的重大变化。通过将Atlas的先进硬件与Gemini类智能结合,机器人现在可以在真实世界的环境中安全和适应性地运行。因此,物理AI从实验研究转变为实用、通用应用。

此外,通过基础模型和数字孪生实现的共享学习,使机器人能够不断改进。一个环境中学习的技能可以转移到其他环境中,提高了效率和可靠性,适用于整个机器人队。因此,人类可以专注于监督和复杂的决策,而机器人可以处理重复或危险的任务。

此外,早期采用物理AI的行业可能会在生产力和灵活性方面获得竞争优势。相反,延迟采用者可能会在运营效率方面落后。总之,这一联盟不仅制造了更具创新性的机器人,还展示了一个新的管理和扩展物理空间工作的模型。

阿萨德·阿巴斯博士(Dr. Assad Abbas)是巴基斯坦伊斯兰堡COMSATS大学的终身副教授,他在美国北达科他州立大学获得了博士学位。他的研究重点是包括云计算、雾计算、边缘计算、大数据分析和人工智能在内的先进技术。阿巴斯博士在著名的科学期刊和会议上发表了大量的论文,并做出了重要的贡献。他也是 MyFastingBuddy 的创始人。