Connect with us

人工智能

NVIDIA Isaac GR00T N1 如何重新定义人形机器人

mm

几十年来,科学家和工程师一直致力于创造能够像人类一样行走、交谈和互动的人形机器人。虽然在这方面取得了显著进展,但构建能够适应新环境或学习新技能的机器人仍然是一个复杂且昂贵的挑战。NVIDIA 通过 Isaac GR00T N1 解决了这个问题,后者是世界上第一个开放和可定制的人形机器人推理和技能基础模型。这个创新模型使机器人能够批判性地思考,推理复杂场景,并适应新挑战。本文探讨了 NVIDIA 的创新,详细介绍了 GR00T N1 的功能及其对人形机器人的影响。

人形机器人的当前状态

人形机器人在近年来取得了显著进展。它们可以在不平坦的地形上行走,进行基本的对话,并在受控环境中处理诸如组装产品等任务。像 Boston Dynamics 这样的公司已经展示了可以跳舞或表演杂技的机器人。然而,尽管取得了这些进展,这些机器人在面临特定编程以外的任务时仍然存在局限性。例如,一个设计用于仓库中堆叠箱子的机器人可能难以在杂乱的储物室中分类物品或在没有大量重新编程的情况下切换任务。主要是,构建一个能够处理多种任务的人形机器人需要从头开始,每次过程可能需要数月甚至数年。

人形机器人的基础模型

Isaac GR00T N1 是专门为人形机器人设计的基础模型。它为感知和运动等基本功能提供了预建框架,消除了从头开发这些核心能力的需要。这简化了机器人构建过程,之前需要机械工程和 AI 编程方面的专业知识以及大量的财务资源。开发人员现在可以采用 GR00T N1 并根据特定任务进行定制,减少时间和成本。这一便捷性和灵活性可能会推动更广泛的采用,使这些机器人从研究实验室转移到实际应用中。

像人类一样思考:双系统设计

GR00T N1 采用了受人类认知启发的双系统设计。根据 双过程理论,人类以两种模式思考:快速和本能的(如反射)以及缓慢和刻意的(如规划)。按照这种认知模型,GR00T N1 配备了系统 1 和系统 2。系统 1 允许 GR00T 处理快速反应,例如躲避障碍或接住移动物体,类似于人类的反射。另一方面,系统 2 允许 GR00T 处理更复杂的任务,例如处理指令、分析视觉数据或规划多步骤的操作,例如整理杂乱的房间。通过结合这些系统,GR00T N1 驱动的机器人可以以类似人类的灵活性处理多样化的挑战。例如,一个机器人可以拾起散落的物品,决定它们属于哪里,并在实时中导航意外的障碍。

训练 GR00T N1

训练 GR00T 以像人类一样思考和移动需要大量的数据,这些数据在现实世界中收集起来可能很慢且昂贵。NVIDIA 通过 Isaac GR00T Blueprint 解决了这个问题,后者是一种在虚拟环境中生成合成运动数据的工具。从一小组人类演示开始,蓝图可以快速生成大量数据集。在一个例子中,NVIDIA 在仅 11 小时内创建了 780,000 个合成轨迹,相当于 6,500 小时的人类努力。将这些合成数据与现实世界的数据结合起来,提高了 GR00T N1 的性能,相比仅使用真实数据,性能提高了 40%。这种方法加速了学习,增强了适应性,并在不依赖大量物理试验的情况下改进了技能。

对人形机器人的影响

从头开始构建机器人及其 AI 以来一直是一个缓慢且昂贵的过程。GR00T N1 通过提供预训练的推理和运动模型改变了这一点,使开发人员能够专注于定制。这可能会加速制造、物流和医疗保健等行业的部署,在这些行业中,需要越来越多的适应性解决方案。GR00T N1 驱动的机器人可能会移动材料、包装货物或协助患者护理,并根据需要切换角色。
NVIDIA 已将 GR00T N1 免费提供给全球机器人社区,与限制访问的专有系统不同。这一开放性允许初创公司、研究人员和大公司下载、修改和适应它,使资源有限的小团队能够与行业领袖一起创新。
GR00T N1 处理多种输入类型,例如语言和视觉数据,使机器人能够解释语音命令、识别对象并适应不断变化的环境。在人形机器人操作的不可预测的人类空间中,这种多功能性至关重要。与传统的机器人不同,传统机器人是为结构化环境中的重复任务而构建的,GR00T N1 驱动的机器人在动态角色中表现出色,例如医疗保健协助或物流管理,在这些角色中,灵活性和自然交互至关重要。

GR00T 实践:实际应用

Agility Robotics1X Technologies 这样的公司正在测试 GR00T N1。在制造业中,这些机器人可以组装零件或分类包裹,并适应生产变化。它们轻松切换任务的能力适合需要灵活性的工厂。
在医疗保健领域,它们可以使用护士的语音指导将患者从床上抬到轮椅上。它们还可以通过取物和自然对话来帮助老年人。GR00T N1 对语言和上下文的理解使这些交互更加自然和人性化。例如,1X Technologies 的 NEO Gamma 机器人 使用 GR00T N1 自主地整理了一个家庭。它评估了空间,决定了要做什么,例如拾起玩具或修理桌子,然后自行行动。这表明了 GR00T 驱动的机器人如何成为家庭助手,帮助完成家务或支持行动不便的人。

NVIDIA 推进人形机器人的未来计划

除了 GR00T 之外,NVIDIA 还与 Google DeepMind 和 Disney Research 合作开发人形机器人的物理引擎 Newton。这个开源工具使机器人开发人员能够模拟机器人如何移动和与周围环境交互。它可以与 MuJoCo 和 NVIDIA Isaac Lab 等平台集成,并帮助在机器人进入现实世界之前在虚拟环境中测试它们。这种发展将进一步降低成本,减少风险,并加速机器人开发。

结论

NVIDIA 的 Isaac GR00T N1 通过提供可定制的推理和运动基础模型,在人形机器人领域取得了重大进展。其双系统设计允许机器人快速响应变化并处理复杂任务,适应各种环境。通过使用合成数据进行训练,该模型减少了开发时间和成本。GR00T N1 作为开放模型的提供鼓励了制造业、医疗保健和物流等行业的创新。早期实施表明了该模型在实际应用中增强灵活性和效率的潜力。

Dr. Tehseen Zia 是 COMSATS University Islamabad 的终身副教授,拥有来自奥地利维也纳科技大学的人工智能博士学位。专攻人工智能、机器学习、数据科学和计算机视觉,他在著名的科学期刊上发表了重要贡献。 Dr. Tehseen 还作为首席调查员领导了各种工业项目,并担任人工智能顾问。