

想象一下“雇用”一台机器人而不是购买一台。这是机器人即服务(RaaS)的核心思想,一种正在迅速改变公司采用自动化方式的商业模式。就像软件即服务(SaaS)革命了软件交付一样,RaaS提供订阅式机器人,让企业在没有机器人所有权高昂前期价格的情况下获得最先进的机器人技术。从工厂车间到医院大厅,RaaS正在降低障碍,推动智能机器的普及。什么是RaaS以及它如何工作?在其核心,机器人即服务意味着将机器人能力作为按需服务租用,而不是直接购买机器人。在实践中,RaaS提供商提供一个完整的包:物理机器人、驱动它的AI软件以及持续的支持,如维护、升级和监控。客户支付订阅或基于使用的费用(例如,按月、按小时或按任务),提供商确保机器人始终以最佳状态运行。这一模式将自动化成本从资本支出(CapEx)转移到运营支出(OpEx),使采用更加便捷。与其进行一次性的大额投资,公司可以支付可预测的费用——将一次性购买转变为可管理的运营成本。在工业环境中,如仓库和工厂,RaaS尤其具有革命性意义。考虑一个需要自动化重复性拣货或托盘移动任务的仓库。在RaaS协议下,仓库可以立即部署机器人群,而无需购买每台机器。RaaS提供商处理安装、与现有系统的集成以及云连接。机器人执行其工作——运送货物、取回零件、扫描库存——公司只需为服务付费(例如,按机器人工作小时或移动的物品数量)。所有技术复杂性都留给提供商:他们远程监控机器人性能,推送软件更新以提高效率,并根据需要处理维修或更换零件。客户在无需内部机器人专业知识或维护团队的情况下享受先进机器人的生产力提升。其他行业也正在采用RaaS。在医疗保健领域,医院可以订阅机器人快递或消毒机器人,根据患者数量的变化扩大或减少机器人群。在零售领域,商店使用库存扫描机器人或客户服务机器人,采用服务模式——例如,按店铺访问或完成任务付费。这种灵活性为以前认为自动化成本过高的领域打开了机器人的大门。事实上,RaaS正在通过消除巨额前期投资的需要,将机器人扩展到酒店、农业、安全和零售等新领域。无论是医院中的机器人护士助手还是超市中的自主地板清洁机,按服务方式的方法意味着这些机器人可以快速部署并根据需求进行扩展。RaaS的经济和战略优势对于客户和机器人公司来说,RaaS解锁了一个超越简单租赁的双赢机会。最直接的好处是财务灵活性。企业不再需要花费数十万(或数百万)美元购买可能需要数年才能收回成本的机器人。相反,他们按使用付费——只为他们使用的服务付费。这显著降低了自动化的风险和前期成本,使先进的机器人即使对于中型公司也变得负担得起。公司可以从小开始,证明机器人在一个设施中的投资回报率,然后根据需要扩大或缩小订阅。这一按需的可扩展性是一个巨大的战略优势:它使运营能够与季节峰值或新项目保持一致,而无需长时间的采购周期。至关重要的是,RaaS将许多责任转移给了提供商。维护、维修、软件更新,甚至操作员培训通常都包含在服务中。对于客户来说,这意味着更少的停机时间和头痛——他们的机器人始终运行最新的软件,如果出现问题,通常会立即修复,而无需额外费用。提供商通常在合同中保证性能水平(例如,正常运行时间或每小时任务),因此他们有动力让机器人顺畅运行。实际上,RaaS客户购买的是结果(自动化生产力),而不是产品,这使得所有人的利益都保持一致。对于机器人公司来说,RaaS代表着他们产生收入的战略性转变。他们不再依赖一次性销售,而是获得了持续的收入流和更密切的客户关系。这可以平滑传统硬件销售的波动性。在RaaS模式下,初创公司可能无法立即收回建造机器人的全部成本,但随着时间的推移,订阅支付通常总和超过一次销售——同时提供稳定的现金流。重要的是,他们可以将软件和数据与硬件一起货币化。在服务合同下,提供商继续通过云分析、AI升级和新功能添加价值,可能会销售高级功能。这不仅增加了收入,还与客户建立了更牢固的关系,客户不断依赖提供商的专业知识,而不仅仅是在销售点。从SaaS到RaaS:订阅思维将RaaS置于熟悉的术语中是有帮助的。如果软件即服务(SaaS)将软件转变为订阅,那么RaaS对机器人做了同样的事情。与其购买许可证,不如订阅机器人的劳动力。这一类比不仅仅是营销用语——它捕捉到了思维方式的根本转变。就像SaaS允许公司通过云使用复杂的软件而无需自己安装或维护一样,RaaS允许公司部署世界级的机器人而无需拥有或托管复杂性。机器人成为了一种云资源:需要更多单位或额外功能?只需更改计划。再也不需要它们?取消或缩小规模。这一服务思维方式正在传播,因为企业在IT和其他领域越来越习惯订阅模式。正如一位高管所说,“有了RaaS,你不是在买产品——你是在支付服务”,降低了进入成本,让供应商处理棘手的部分。这是按需的自动化。人形机器人订阅:现实世界中的RaaS示例RaaS浪潮并非理论上的——它正在发生,领先的下一代机器人公司正在为实际工作构建人形机器人。2022年 – 1X Technologies开始人形机器人租赁和服务模式在美国以外,1X Technologies作为服务型人形机器人部署的早期领导者出现。在此期间,该公司通过租赁和服务协议提供其人形机器人,特别是用于安全和监控用例。客户有效地订阅了机器人劳动力,支付年度费用用于部署、维护和升级,而不是直接拥有机器。这种方法展示了如何在有限的前期风险下将人形机器人引入现实世界环境,并保持运营可扩展性。2024年 – Figure AI与宝马的商业协议2024年,Figure AI与宝马制造公司签署了一项商业协议</a》,将其人形机器人引入南卡罗来纳州斯巴达堡的宝马工厂的汽车生产中。这一早期合同标志着一家主要制造客户和一家下一代人形机器人公司之间的首次商业合作伙伴关系。该协议不仅仅是一项产品销售,而是标志着工厂环境中真正的机器人自动化的转变,为未来的服务导向部署奠定了基础。2024年 – Agility Robotics推进商业人形RaaS部署到2024年,机器人即服务已经从试点和演示转变为持续的商业使用,领先的下一代机器人公司专注于为实际工业工作构建人形系统。一个显著的例子来自Agility Robotics,即Digit的创造者。该年,Agility 宣布了一项美国基于的商业部署,Digit在一个活跃的配送中心内运行,执行每日仓库操作中的托特移动任务,作为机器人即服务安排的一部分。Agility没有直接出售机器人,而是保留所有权,并将Digit作为托管服务交付。客户为机器人访问以及用于操作、监控和更新机器人群的云平台付费,包括持续支持。该部署展示了如何将人形机器人作为持续管理的服务集成到生产环境中,强调RaaS作为引入人形劳动力而无需长期资本承诺的实用商业模式。2024年 – Apptronik通过汽车试验推进人形即服务紧随其后,Apptronik通过准备其Apollo机器人用于服务型部署来推进其人形战略。2024年全年,Apollo在汽车制造环境中进行试验,直接集成到工厂工作流中。Apptronik没有将Apollo定位为要出售的产品,而是将部署结构为服务协议,允许机器人的能力根据客户需求不断改进和适应。这种模式强调了人形机器人作为不断演进的系统部署的好处,在这种系统中,软件、控制策略和任务执行随着时间的推移而改进,而无需更换硬件。2026年 – 人形和舍弗勒在欧洲建立RaaS路径这一势头现在通过人形和舍弗勒之间的一项新合作伙伴关系扩展到欧洲。根据为期多年的合作,人形计划将其数百台人形机器人部署到舍弗勒的生产环境中,首先进行受控验证阶段,然后逐步扩大部署范围。关键的是,合作伙伴关系包括一条明确的路径,旨在一旦满足性能、安全性和集成基准后,将这些系统提供为机器人即服务模型。除了部署之外,合作伙伴关系还包括执行器供应、联合硬件开发以及大规模数据收集,以训练与实际工业工作流相符的特定任务技能。RaaS实践:设计灵活的劳动力在这些例子中,出现了一个一致的模式:机器人即服务将人形机器人转变为灵活、不断改进的劳动力。人形因素尤其具有吸引力,因为它自然适应为人类设计的环境,减少了昂贵的基础设施更改的需要。RaaS被证明是将这些复杂的机器引入日常运营的机制,使组织能够在有限的财务风险下测试、扩大和改进人形部署——同时使机器人公司能够更快地迭代、从现实世界的数据中学习并提供可衡量的成果,而不是静态机器。RaaS的崛起:为什么它是机器人的未来所有迹象表明,RaaS将成为下一代机器人的主导商业模式。市场采用正在迅速加速,因为公司意识到他们可以在无需拥有机器人的情况下获得高级自动化。服务机器人安装基数的增长速度远远超过传统机器人销售,推动这一增长的因素包括物流、制造、医疗保健和零售的需求。投资者行为反映了这一势头。风险投资和战略投资者正在支持承诺可扩展、基于服务的收入的机器人公司,押注长期的经常性收入而非一次性硬件销售。吸引力是显而易见的:作为服务提供的机器人产生可预测的现金流、实现持续改进并加深客户关系。最终,RaaS符合一种更广泛的转向基于结果的服务的趋势。组织越来越多地希望获得结果,而不是资产。他们希望获得生产力、安全性和可靠性——而无需管理复杂的硬件。RaaS实现了这一承诺,将机器人打包为不断改进的服务,而不是静态机器。同样,云计算改变了IT基础设施,机器人即服务即将使机器人成为按需的公用事业。机器人不再是仅为大型企业保留的实验性工具。通过RaaS,它们变得可及、可扩展且在整个经济中具有实用性。机器人已经准备好工作——您只需要订阅。


Nvidia 在 CES 2026 发布了一套综合的机器人生态系统,结合开放基础模型、模拟工具和边缘硬件,旨在成为通用机器人的默认平台——就像 Android 成为智能手机的操作系统一样。该公告是在 1 月 5 日 Jensen Huang 的主题演讲中宣布的,Nvidia 将在机器人超越狭隘、特定任务功能、能够在多样环境中推理、规划和适应的新兴市场中占据一席之地。该公司发布了 Isaac GR00T N1.6、Cosmos 世界基础模型和新的模拟框架——所有这些都可以在 GitHub 上以开源方式获取。“物理 AI 的 ChatGPT 时刻已经到来——当机器开始理解、推理和在现实世界中行动时,”Huang 在公司的官方公告中...


中国国家发展和改革委员会周四发出了一份罕见的警告,关于该国人形机器人行业形成泡沫的风险,警告说,超过150家公司正在向市场推出几乎相同的产品。国家发展和改革委员会发言人李超在北京新闻发布会上告诉记者,人形机器人行业必须平衡“增长速度与泡沫风险”。这一警告是在投资大量涌入该行业之际发出,尽管在工厂或家庭中对机器人的实用案例尚未得到证明。“前沿行业长期以来一直面临着平衡增长速度与泡沫风险的挑战——这也是人形机器人行业目前面临的问题,”李说,根据新华社的报道。李指出,人形机器人“在技术路径、商业模式和应用场景方面尚未完全成熟”。中国150多家人形机器人公司中,有超过一半是初创公司或跨行业进入者,她补充说,这些公司创造了同质化产品的过剩条件,这可能会挤占研发空间。战略行业受到审视这一警告标志着北京的语气发生了显著的转变,北京一直将具身智能——人形机器人背后的技术——定位为核心战略优先事项。中国2025年政府工作报告将具身人工智能与量子技术、生物制造和6G一起列为需要增加投资的关键未来产业。人形机器人是中国共产党确定的六个被视为国家发展计划至2030年的经济增长驱动器之一。今年早些时候,工业和信息化部成立了一个由Unitree和AgiBot等领先机器人公司创始人领导的标准委员会。Unitree和AgiBot。尽管存在监管担忧,但投资者的热情仍然很高。跟踪中国人形机器人公司股票的Solactive中国人形机器人指数今年已经上涨了大约38.91%。包括Unitree和AgiBot在内的几家公司正在争相上市,部分原因是风险投资条件的收紧。中国在机器人领域的更广泛的主导地位为这一激增提供了背景。自2021年以来,中国占据了世界上新安装的工业机器人数量的半数以上。其“机器人密度”——每10,000名员工中的机器人数量——从2017年的97增加到2023年的470,几乎增加了四倍。商业进展与整合推动一些公司已经展示了商业上的进展。UBTech Robotics开始了其Walker S2工业人形机器人的量产和交付,并向工厂合作伙伴交付了几百台。深圳-based公司已经获得了超过800 million元(约合112 million美元)的Walker系列订单,并计划在今年年底前交付500台。UBTech的客户包括比亚迪、吉利汽车和一汽-大众等主要汽车制造商,以及物流巨头富士康。该公司计划将生产能力扩大到2026年的5,000台和2027年的10,000台。预计今年的人形机器人出货量将超过10,000台,尽管这仍然是一个很小的基数,难以支撑如此激烈的投资活动。花旗银行预计,明年中国人形机器人制造商的生产将实现“指数级”增长。为了应对这些风险,国家发展和改革委员会表示,它正在与相关部门合作加强政策支持和推动技术突破。李说,政府将改善市场进入和退出机制,促进行业整合和技术共享,并支持关键研究领域。政府还将加强测试和培训设施的资源,并鼓励公司共享知识和技术——这是北京希望该行业蓬勃发展,但不以牺牲稳定为代价的明确信号。随着中国的生成式人工智能用户数量在几个月内翻倍,人工智能和机器人之间的交叉点仍然是国家关注的重点。北京的干预是否能够在保持创新势头的同时防止损害性的纠正,将考验其管理战略性新兴产业发展的能力。国家发展和改革委员会的警告表明,虽然中国仍然致力于在人形机器人领域领先,但它越来越警惕地意识到投机过度可能压倒真正的技术进步的风险。


本月早些时候,在中国,一个名为 Shuang Shuang 的人形机器人在福建的一所高中毕业典礼上走上了舞台,接受了毕业证书 —— 与学生和老师握手,令他们感到高兴。这样的时刻代表着一个有意义的转变,即人形机器人开始以非常明显的方式进入公共生活。这些时刻不仅仅代表着公众的好奇心 —— 它们标志着向现实世界整合的转变。这篇文章探讨了如何使人形机器人从展示和壮观转变为功能性 —— 以及为什么看似仅仅是硬件上的壮举,实际上是关于使这些机器能够在非自动化脚本的环境中行走、交互和学习的集成智能。我们还将讨论如何通过早期部署和长期合作来实现商业化。人形机器人如何将 AI 推向现实世界虚拟性能和物理可靠性之间的差距仍然是 AI 中最被忽视的挑战之一。一个聊天机器人可以生成几段流利的文本而无需执行它们 —— 就像一个视觉模型可以在图像中识别一个步骤而无需物理地导航它或冒着跌倒的风险。人形机器人没有这种奢侈。为了在现实世界中发挥作用,AI 必须抛弃静态数据集和受控条件。它必须在每秒都在变化的环境中看到、决定和行动。这包括不平的地板、放错的物体、不可预测的人类行为和依赖上下文的非语言暗示。结果是每天都面临着噪音、模糊性和潜在的失败。这就是身体化推理 —— 语言在空间、时间和后果中根植 —— 开始比标记预测更重要的原因。例如,如果一个人说“小心,地上很滑”,机器人需要将这个短语不仅仅连接到一个词的定义,还要连接到空间意识、潜在风险和实时调整。同时,多模态学习变得至关重要,因为没有单一的输入通道足以独立操作。一个摄像头可能会错过一个光滑的表面,但脚部的压力传感器可以检测到突然失去牵引力的情况。或者,在另一种情况下,语音识别可能会在一个嘈杂的仓库中失败,但视觉提示或手势可以填补这个空白。泛化也变得至关重要。一个机器人不能依赖于看到相同的环境两次。它需要在楼层湿、光线变化或盒子不在昨天的位置时调整其行为。这成为成功执行和失败之间的区别。在 Humanoid,我们就是这样开始与商业合作伙伴进行早期测试的。我们将我们的机器人集成到实时环境中,以便及时发现潜在的缺陷并确保最佳功能在部署之前。一个在模拟或演示中表现良好的机器人与一个在压力下赢得信任的机器人是不一样的,因为这种信任最终是建立在现实世界学习基础上的。我们知道,人形机器人将在未来两年内商业化 —— 但我们不会等待。对于我们来说,商业化从早期开始。这意味着围绕真正的用例建立长期合作伙伴关系。通过一系列试点计划,我们不仅教育我们的合作伙伴关于这项技术 —— 我们还与他们一起学习。这种共享的学习过程还帮助我们从第一天开始完善成本结构和性能可靠性...


Meta 的 视频联合嵌入预测架构 2 (V-JEPA 2) 是人工智能 (AI) 领域的一项重大进展。它帮助机器人理解和预测物理交互。该模型是在超过一百万小时的视频上训练的。这使得机器人能够学习和预测接下来会发生什么。它还使机器人能够在新环境中计划行动,使它们能够更有效地与不熟悉的物体交互。V-JEPA 2 使用 自监督学习。它直接从视频数据中学习,而无需人工注释。这使它与其他依赖标记数据的 AI 模型不同。机器人可以根据视觉上下文预测结果。它们可以根据需要适应和计划行动。这使我们更接近实现 高级机器智能 (AMI)。在 Meta 的联合嵌入预测架构 (JEPA) 的基础上,V-JEPA 2 提高了行动预测和世界建模,能够让机器人在不熟悉的环境中处理新任务。Meta 正在与研究社区分享该模型,以加速 AI 进展和改进机器人能力。为什么机器人中的常识一直很难实现常识是指做出基本决策的能力。例如,知道杯子如果倾斜会溢出,或者理解椅子可能会阻挡路径。对于人类来说,这些知识通过经验自然而然地获得。然而,机器人在发展这种直觉方面面临挑战。大多数机器人是为特定任务和受控环境而编程的。在这些任务中,它们表现良好。但是,当情况发生变化或出现意外元素时,机器人会挣扎。它们经常无法识别因果关系或预测行动的后果。例如,机器人可能知道如何将杯子放在平面上,但它可能无法预见倾斜杯子会导致它溢出。当前的 AI...


制造业中采用机器人的好处是明显的,企业可以获得提高效率和安全性的优势。然而,对于决策者来说,实施机器人仍然是一个挑战。复杂的制造过程可能会在自动化中产生新的和意想不到的问题,但是,人工智能启用的协作移动机器人可以与人类工人合作,提供一个更为精简的解决方案。协作优势:人工智能与人类直觉的结合全球协作机器人市场正在经历爆炸性的增长,预计到2025年销量将达到735千台。这一增长是由最有效和成功的自动化实施都是增强人类能力而不是取代人类能力这一事实所驱动的。传统的工业机器人需要安全屏障和大量投资,而协作机器人或“cobots”则被设计为与人类共享工作空间。它们易于使用和从人类学习的能力使其能够快速被现有操作采用,最近的人工智能进步也为人类编程、部署和与机器人交互开辟了更多途径。老式机器人需要强大的现场支持团队,这对于大多数中小型制造企业来说是不现实的,因为他们已经面临着显著的专业知识差距,并努力吸引和留住具有自动化技能的人才。转向人工智能驱动的协作系统弥补了这一差距。通过自然语言和直观的“示范学习”,您可以简单地带领机器人在工厂地板上,向其展示任务。专用编程的需要被消除了,随之而来的是一种主要的采用障碍。安全第一:人工智能驱动的cobots如何减少工伤安全是任何制造环境中的首要考虑,无论工人是在工厂地板上处理重型材料还是简单地在仓库中整理库存。受伤意味着停工,停工意味着损失收入。随着物体检测和识别技术的进步,人工智能驱动的自主机器人可以让员工放心。安全优势来自多种因素:高级碰撞检测: 协作机器人被设计为具有安全地与人类操作员交互的功能,包括速度和分离监测(SSM)以防止碰撞,以及功率和力限制(PFL)以减轻碰撞后受伤的严重性。危险任务自动化: 当人工智能启用的机器人接管人类操作员的重复任务时,受伤的风险被完全消除。危险、重复的任务是工厂工人面临的最高风险的工作例子,也是人类参与不利于工作结果的工作例子。实时环境感知: 研究已经改进 传感器技术,以实现更好的人类检测和环境感知,减少事故的可能性,使人工智能cobots对人类存在更加响应。可扩展性而非复杂性:扩展您的自动化战略人工智能还使协作机器人可以几乎无限地扩展。在材料搬运机器人将托盘从一个位置运输到另一个位置的大型设施中,所需的机器人数量直接随着需求而增长。随着业务的增长,新的机器人可以以相对较低的成本添加到现有的基础设施中,而不是进行全面的大规模机器人改造。这种可扩展性体现在多个方面:任务灵活性: 单个协作机器人可以服务多种目的,并根据公司的需要处理不同复杂度的任务。许多此类机器人可以配备附件或仪器,使其能够快速更改用途。部署速度: 为全面自动化改造工厂可能需要数月甚至数年时间,需要进行大量的改造和安装新的电源。人工智能协作机器人可以在几周或更短的时间内添加到工作流中并开始产生投资回报率。网络效应: 无法或不愿意改造其流程的组织可以引入单个协作机器人,并在时间的推移中扩展到多个单位,这需要更低的学习曲线。此外,协作机器人通常体积紧凑,适合有狭窄走道和快速变化的工厂布局。这种适应性在美国至关重要,因为制造业的格局主要是“棕地”——充满现有的、较旧的工厂,不适合自动化。与其他国家的“绿地”项目不同,工厂从头开始建造,棕地自动化需要能够集成到现有的、往往不同的布局中,而无需昂贵的改造。凭借其紧凑的尺寸和与现有资产和基础设施合作的能力,人工智能驱动的协作机器人独特地适应于克服这一核心挑战,使自动化变得可及,而无需进行全面操作改造。实际应用:人工智能启用的协作机器人在哪里表现出色协作的人工智能启用的机器人在执行人类无法或不愿执行的任务时表现最佳。需要极高精度或强烈重复的任务既有压力,又可能造成伤害,人类的错误可能会阻碍生产。它们通常与制造任务相关联,例如装配线或材料处理,但它们也可以通过以下方式增强公司的劳动力:电子制造: 电子行业 预计从2025年到2030年将注册最快的复合年增长率,这归因于电子制造过程日益复杂,需要高精度和可重复性。医疗支持: 具有先进人工智能的协作机器人正在被考虑用于协助医疗保健提供者进行患者护理。相对平凡的任务,如药物递送和协助康复锻炼,是协作机器人出色的机会。物流和仓储: 供应链中的机器人使用意味着材料以更快的速度和更高的准确性到达其目的地。这个领域也是人类和机器人可以快速、轻松地合作的领域,执行类似的任务,同时人类提供指导。展望未来:人类-机器人协作的未来人工智能启用的协作机器人代表了制造业自动化的光明未来。 cobots的未来 很有前途,它们的作用将继续扩展到农业、医疗保健和物流等行业。随着人工智能和机器学习技术的发展,协作机器人将从增强的智能和更大的自主性中受益最多。展望未来,我们无法真正预测什么新的功能将被开发或在什么时间表上实现。然而,研究人员和行业领袖已经表达了他们希望人工智能能够以更自然的方式直接从人类学习,保留指令,甚至在不确定时提出问题的愿望。视觉语言理解和自然语言处理对于人工智能和协作机器人来说都是重要的,因为它们允许没有技术知识或编码经验的人们几乎毫无犹豫地与这些系统交互。在实际方面,能够预测自身维护需求并轻松解释需要什么和何时需要的人工智能机器人,将使维护比以往任何时候都更容易。配备互联网访问的机器人群甚至可以提前订购维修用品,确保最短的停机时间。制造业的未来不是人类与机器的对立,而是合作伙伴关系。通过将熟练的工人的聪明才智与智能、适应性强的机器相结合,我们可以解决劳动力危机,释放我们最重要的制造商的全部潜力。这种以人为本的自动化之路是我们将如何建设一个更加有弹性、竞争力和生产力的工业未来。


机器人是否最终会接管一切?这是一个仍然未解答的问题,但如果以纯粹的能力作为标准,答案是肯定的。机器人已经可以做几乎所有人类能做的事情——甚至比尔·盖茨也将他们的能力描述为“无限的”——而且它们仍处于初期阶段。对于企业来说,机器人意味着效率和降低成本,特别是在工厂、仓库和其他需要大量人工劳动的设施中;至少这是他们被认为的那样。然而,管理人员经常假设用机器人取代人类工人会带来零美元工资的员工——并且可以24/7工作,如果需要的话。虽然机器人和其他自主和自动移动设备(AMRs和AGVs),以及车辆和叉车,确实需要花钱,但人们认为,由于它们替代的劳动力带来的费用减少,投资回报率应该很高。但事实并非如此;许多管理人员没有完全意识到或没有给予足够的重视这样一个事实:机器人和自主移动设备带有自己的费用,其中一些是直接的,另一些是隐藏的。管理人员经常没有考虑到的隐藏成本包括机器人由于充电而导致的停机时间,计算机升级以管理机队,丢失的存储或生产空间——甚至交通堵塞。停机效率低下机器人和自动移动设备运行在电池上——这些电池需要充电。充电时间取决于机器人或车辆的大小,但可能占到它们应该运行的时间的20%。此外,数据显示,其他问题经常使机器人停机另外12%的时间,这意味着许多机器人可能会在管理人员期望它们工作的时间中有多达三分之一的时间处于离线状态。这种停机时间——当机器无法完成任务时——需要在计算投资回报率时予以反映。除了停机时间外,工作周期中小的中断或错误可能会导致自动化机器人车队的其他低效。例如,在许多仓库中,拣货是由机器人完成的,而包装和订单验证是由人类完成的。如果机器人未能拣货并将物品交付到包装区,或者带来错误的物品,工人就无法完成该订单,整个系统通常会暂停,引发延迟和机器人空闲时间的涟漪效应。如果公司致力于同日发货,如许多在线网站要求供应商这样做,这可能会导致失望的客户和失去的业务等涟漪效应。扩大机队意味着扩大预算为了弥补大多数机器人需要的停机时间,许多仓库或工厂都有一个备份机队——多达35%的机器人或机器来弥补充电和维护的停机时间。这些额外机器的相关费用包括额外的维护和电池更换(例如,每年一次)。但有一项费用可能没有被考虑在内,即需要更强大的服务器来控制额外的机器人或机器。这可能需要对新硬件和软件进行大量投资——这是一项可能会影响投资回报率计算的费用。此外,额外的机器人可能需要比预期更多的维护。闲置的机器人容易出现额外的维护问题,例如润滑剂降解、备用电池耗尽、传感器中的灰尘积累和电机问题。如果机器人有多达20%的时间处于闲置状态——正如许多机器人那样——这可能意味着与这些与长时间闲置相关的问题相关的额外维护成本会增加。不要忘记考虑失去的空间机器人需要电力,在标准的仓库和工厂设置中,这意味着为充电器和停靠站分配空间,通常每个充电器需要10平方英尺或更多。这种额外的空间成本钱——无论是租赁成本、土地购买还是房地产税——这些费用需要在计算投资回报率时予以考虑。这假设还有空间可以添加;虽然这不太可能成为大型分销中心的问题,但对于在城市和郊区开设较小仓库以更好地适应同日发货的公司来说,这可能是一个大问题。不管怎样,当空间被充电器或停靠站占用时,它就不能用于其他用途,并可能阻碍扩张或扩大的能力。充电站更多的空间意味着商品的空间更少——这意味着从分销中心运送商品到城市和郊区仓库的运输成本更高,等待订单完成的时间更长,库存和跟踪问题更多。这也可能导致错过或错误的订单——以及与客户的另一个黑眼。一个解决方案是简单地扩大仓库以弥补额外所需的空间;另一个解决方案是添加垂直货架以适应更多的商品,如果地板空间不可用。然而,这些解决方案也需要花钱——这意味着投资回报率可能会受到显著影响。机器人交通堵塞是一个真实的风险随着工厂或仓库地板上机器人的增加,机器人之间发生碰撞的可能性也会增加,或者与人类工人发生碰撞。这些碰撞可能会导致损坏、受伤和其他重大问题。当机器人相互碰撞时,它们可能需要维修,这将增加维护成本,并使设施变得效率更低,因为现在没有足够的机器人来弥补充电的停机时间。如果机器人撞到人类,受害者可能会起诉——因此,设施需要增加保险以覆盖潜在的损失。管理人员可以选择碰撞检测系统,但这些系统也需要花钱。虽然大多数设施管理人员不太可能想到这些因素,但这些因素可能会严重损害投资回报率估计。很明显,机器人的投资回报率不是一个简单的问题。那些考虑到大局并包括所有这些隐藏成本的人可能会感到失望或不愿意自动化他们的仓库。但是,有方法可以进一步抵消这些成本并提高投资回报率。 人工智能在解决机器人交通堵塞方面显示出希望,但当一个设施需要添加额外的机器人来弥补充电的停机时间时,算法需要进行调整——这可能需要软件或硬件升级,或者聘请人工智能专家来更改控制系统。解决这些问题的有前途的解决方案之一在于创新充电方法,这些方法可以减少甚至消除充电停机时间的需要。这些方法,例如使机器人能够在工作时充电,可能会减少对备份机器人的需求,并解决一些与空闲时间、拥挤的工作地板或仓库、等待机器人完成任务的时间、由于充电码头而丢失的空间以及与机队控制相关的费用等挑战。自动化确实是未来,专家认为;美国完全自动化的仓库数量已经稳步增加近十年。此外,物流和仓库人员越来越难以找到,而同日发货的需求也推动了对可靠员工的需求。这种自动化趋势可能会继续,尤其是当解决与充电、机器人停机时间和交通堵塞以及物流相关的问题的解决方案被找到时,使得自动化的真实投资回报率更加有吸引力。然而,在那之前,设施管理人员和所有者需要考虑自动化的隐藏成本,并确保它们被准确地计算到他们的投资回报率中。自动化确实可以让组织的底线受益——如果它知道自己面临的是什么,并且可以控制隐藏的成本。


医学机器人首先在20世纪80年代进入普通外科,使用腹腔镜工具,实现微创手术,减少切口大小和恢复时间。这些早期系统扩展了外科医生的能力,改变了外科手术的格局。今天,人工智能(AI)正在引领外科手术室内精度和控制的新时代。然而,尽管取得了如此进步,机器人系统仍然仅限于特定的手术程序,大多数手术仍依赖于传统方法——许多患者无法享受到增强的一致性和结果。随着医疗技术的不断发展,如何扩大AI在外科机器人中的应用,以便在更广泛的层面上改变医疗保健?增加的市场潜力在过去五年中,机器人领域的风险投资增加和数字化转型的推动下,机器人行业正在看到快速的市场结果,并没有停止的迹象。今年早些时候,Nvidia宣布计划增加对机器人开发的投资,这是机器人领域未来发展的积极信号。类似的机器人投资将进一步推进机器人技术的发展,通过数据收集和机器学习提供更多的资源和见解。外科机器人行业的领先者,如Intuitive Surgical、Medtronic和Stryker,已经开创了机器人辅助手术的先河。自2000年推出da Vinci系统用于普通外科手术以来,Intuitive Surgical继续迭代其机器人平台,以扩大其在心脏、肥胖、妇科和胸部外科手术等领域的应用。随着机器人辅助手术的广泛采用,外科机器人以更快的速度被采用。在2012年至2018年之间,机器人辅助手术在普通外科领域增长了738%。展望未来,外科机器人具有更大的市场潜力,预计到2026年将增长到超过140亿美元——从2023年的100亿美元左右。这主要是由于机器人外科手术程序的可及性增加,自动化和数字技术的进步,以及新的参与者,他们旨在提供利用AI的尖端医疗解决方案。深度技术方法深度技术是多学科技术的交叉点,包括人工智能、量子计算、生物技术和机器人技术,引领技术的新时代。采用深度技术方法的机器人外科创业公司正在创造未来医疗的创新解决方案,如健康技术的发展,可以改善患者对关键医疗服务的获取。通过深度技术的发展,外科手术可能在未来完全自动化,需要最少的外科医生协助,并显著扩大治疗的可及性。外科机器人中的新兴深度技术可以对全球产生持久的影响。由于全球大约三分之二的人口——50亿人——缺乏外科手术的机会,这些由AI驱动的新方法可以扩大普通人对外科手术的获取机会,并弥合外科医疗服务的差距。融合AI和外科机器人人工智能已经改变了我们与不同技术和彼此的交互方式。在过去的五年中,人工智能带来的转变加速了机器人技术的发展,并为不同模式(包括机器人外科手术)中的AI创造了更多应用。以下是AI对机器人外科手术产生快速和深远影响的三个重要方式:1. 体现式AI技术正在改变我们与环境和周围人交互的方式。体现式AI,包括自主车辆和人形机器人,是AI与物理系统的融合,用于执行复杂的现实世界任务。当体现式AI应用于机器人外科手术时,它有可能对改善外科手术服务和提高现有技术产生持久的影响。然而,体现式AI需要大量的现实世界数据来开发训练模拟模型,这些模型用于训练和扩展AI能力,提高数据驱动的洞察力。直到最近,获取大量训练数据有一定的限制;然而,随着行业继续投资于AI模型的训练和开发,模拟数据池正在以更快的速度增长,提高体现式AI的功能。2. 持续的数据洞察和指导基于AI的系统可以在几秒钟内吸收和理解大量信息——比人类大脑快得多。通过训练机器学习大量数据集,数据驱动的洞察力可以在外科医生进入手术室之前就告知外科决策。AI驱动的训练模拟可以显著造福外科医生,因为基于成千上万的手术的数据集可以为外科医生提供趋势和技术,以提供更好的患者体验,并使他们能够为罕见或复杂的手术做好准备和理解。在手术过程中,AI驱动的数据还可以增强外科医生的决策能力。通过为外科医生提供调整手术计划的洞察力,AI驱动的系统可以使外科医生能够优化技术和方法。通过AI驱动的成像系统,外科医生可以获得高级成像分析和实时3D“地图”来查看手术现场。这些增强的叠加层可以为外科医生提供对手术现场的扩展洞察力,并在手术过程中提供实时反馈。此外,通过提供手术后的持续反馈,AI驱动的系统可以为外科医生提供有关他们在手术过程中的表现的有价值反馈——突出他们的弱点和优势,并建议如何改进。这些平台还可以根据每个患者的病史和特定手术的数据分析,推荐新的治疗计划,并为外科医生提供更多信息,以增强进一步的治疗。因此,AI平台有可能在整个外科手术周期(手术前、手术中和手术后)中吸收和适应外科反馈,以提高外科医生的精度和性能。3. 提高准确性和精度个体外科医生的技能往往因他们的机会、地点和外科导师的不同而有所不同。例如,眼科手术有很陡的学习曲线。平均而言,需要至少15年的训练和外科经验才能达到眼科外科医生的巅峰表现。随着人口老龄化和外科医生数量的减少,需要一种新的解决方案来减少外科医生的训练周期,并标准化所有患者的准确性和精度。除了减少外科医生的学习曲线和使他们能够更快地达到巅峰表现外,引入AI驱动的平台到外科手术过程中还可以提高准确性和精度,并可能改善次优结果。半自主和日益自主的机器人平台可以消除外科医生的自然手抖,并提高整体精度和准确性,从而提高临床结果。此外,AI驱动的系统识别独特的解剖结构并提供切口和其他外科步骤的确切位置的能力——尤其是在复杂的手术或解剖区域——可以显著减少外科医生的错误率,通过提高对解剖结构的空间意识。因此,所有使用AI驱动的系统的外科医生都将能够提供更精确的护理。当AI驱动的机器人平台被纳入外科手术过程中时,它们可以提供无价的洞察力,以增强患者和外科医生的整体体验。结论人工智能将继续在未来医疗保健的发展中发挥重要作用。将先进的AI技术融入我们的医疗服务中,例如电子档案、诊断、健康监测和跟踪,以及外科手术,是至关重要的。通过这样做,我们可以改善患者和外科医生的整体体验。在机器人外科手术中,AI正在加速技术的转变和患者对一致的高级治疗的获取。机器人技术和AI、自动化的进步将继续引领新的应用,创造更高的标准化护理水平,并将医疗保健的质量和可及性推向新的高度。


物理AI系统(如工厂车间中的机器人和街道上的自动驾驶汽车)的开发严重依赖于大量高质量的数据集进行训练。然而,收集现实世界的数据是昂贵的,耗时的,并且通常仅限于少数大型科技公司。 NVIDIA的Cosmos 平台通过使用高级物理模拟来生成现实的合成数据,以解决这一挑战。这样,工程师就可以在没有收集现实世界数据的成本和延迟的情况下训练AI模型。这篇文章讨论了Cosmos如何改善对基本训练数据的访问,并加速安全、可靠的AI的开发,以适用于现实世界的应用。了解物理AI物理AI 指的是可以感知、理解和在物理世界中行动的智能系统。与传统的AI不同,传统AI可能会分析文本或图像,物理AI必须处理现实世界的复杂性,例如空间关系、物理力和动态环境。例如,自动驾驶汽车需要识别行人,预测他们的移动,并在实时调整其路径,同时考虑天气和道路条件等因素。同样,仓库中的机器人必须在障碍物中导航并精确操纵物体。 开发物理AI具有挑战性,因为它需要大量数据来训练模型以适应多种现实世界场景。收集这些数据,无论是驾驶录像的小时数还是机器人任务的演示,都可能耗时且昂贵。另外,在现实世界中测试AI可能存在风险,因为错误可能导致事故。NVIDIA Cosmos通过使用基于物理的模拟来生成现实的合成数据来解决这些挑战。什么是世界基础模型?在 NVIDIA Cosmos 的核心是称为世界基础模型(WFMs)的AI模型集合。 这些AI模型专门设计用于模拟模拟物理世界的虚拟环境。通过生成物理感知的视频或场景,WFMs模拟对象如何基于空间关系和物理定律进行交互。例如,WFM可以模拟汽车在雨中行驶,显示水如何影响牵引力或车头灯如何在湿表面上反射。 WFMs对于物理AI至关重要,因为它们提供了一个安全、可控的空间来训练和测试AI系统。开发人员可以使用WFMs生成合成数据——环境和交互的现实模拟——而不是收集现实世界的数据。这种方法不仅降低了成本,还加速了开发过程,并允许在没有现实世界测试相关风险的情况下测试复杂、罕见的场景(例如,异常的交通情况)。WFMs是通用模型,可以为特定应用程序进行微调,类似于大型语言模型被适应用于诸如翻译或聊天机器人等任务。揭开NVIDIA Cosmos的面纱NVIDIA Cosmos是一款旨在使开发人员能够为物理AI应用程序(尤其是在自动驾驶汽车(AVs)和机器人领域)构建和自定义WFMs的平台。Cosmos集成了高级生成模型、数据处理工具和安全功能,以开发与物理世界交互的AI系统。该平台是开源的,模型在宽松许可下可用。 平台的关键组件包括: 生成世界基础模型(WFMs): 预训练模型,模拟物理环境和交互。 高级标记器: 高效压缩和处理数据的工具,以实现更快的模型训练。 加速数据处理管道: 由NVIDIA的计算基础设施驱动的处理大型数据集的系统。 Cosmos的一个关键创新是其物理AI的推理模型。该模型为开发人员提供了创建和修改虚拟世界的能力。他们可以根据特定的需求定制模拟,例如测试机器人拾取物体的能力或评估AV对突然障碍的反应。NVIDIA Cosmos的关键功能NVIDIA Cosmos提供了各种组件来解决物理AI开发中的特定挑战: Cosmos传输WFMs: 这些模型接受结构化的视频输入,例如分割图、深度图或激光扫描,并生成可控的、逼真的视频输出。这种功能对于创建用于训练感知AI(例如,帮助AV识别物体或机器人识别其周围环境的系统)的合成数据尤其有用。 Cosmos预测WFMs:...


近年来,人工智能(AI)在各个领域(如自然语言处理(NLP)和计算机视觉)取得了显著进步。然而,AI的一个主要挑战是其与物理世界的整合。虽然AI在推理和解决复杂问题方面取得了卓越的成就,但这些成就大多局限于数字环境。为了使AI能够通过机器人执行物理任务,它必须对空间推理、物体操作和决策具有深刻的理解。为了应对这一挑战,Google推出了双子机器人技术,这是一套专门为机器人和具身人工智能开发的模型。基于双子2.0,这些AI模型将先进的AI推理与物理世界相结合,实现机器人执行广泛的复杂任务。理解双子机器人技术双子机器人技术是一对建立在双子2.0基础上的AI模型,双子2.0是一种最先进的视觉语言模型(VLM),能够处理文本、图像、音频和视频。双子机器人技术本质上是视觉语言模型(VLM)扩展到视觉语言动作(VLA)模型,这使得双子模型不仅能够理解和解释视觉输入、处理自然语言指令,还能够在现实世界中执行物理动作。这种组合对于机器人至关重要,使机器不仅能够“看到”环境,还能在人类语言的背景下理解它,并执行从简单的物体操作到更复杂的灵巧活动的复杂任务。 双子机器人技术的一个关键优势在于其能够在不需要大量重新训练的情况下泛化到各种任务。该模型可以遵循开放词汇指令,适应环境变化,甚至处理未预见的任务,这些任务并未包含在其初始训练数据中。这对于创建能够在动态、不可预测的环境中(如家庭或工业环境)运行的机器人尤为重要。具身推理机器人领域一直面临的一个重大挑战是数字推理与物理交互之间的差距。虽然人类可以轻松理解复杂的空间关系并无缝地与周围环境交互,但机器人却难以复制这些能力。例如,机器人在理解空间动态、适应新情况和处理不可预测的现实世界交互方面受到限制。为了应对这些挑战,双子机器人技术融入了“具身推理”,这是一种使系统能够像人类一样理解和与物理世界交互的过程。 与数字环境中的AI推理相比,具身推理涉及几个关键组件,例如: 物体检测和操作:具身推理使双子机器人技术能够检测和识别环境中的物体,即使这些物体以前从未见过。它可以预测物体的抓取位置,确定物体的状态,并执行打开抽屉、倒液体或折叠纸张等动作。 轨迹和抓取预测:具身推理使双子机器人技术能够预测运动的最有效路径并确定持有物体的最佳点。这一能力对于需要精度的任务至关重要。 3D理解:具身推理使机器人能够感知和理解三维空间。这一能力对于需要复杂空间操作的任务尤为重要,例如折叠衣服或组装物体。理解3D还使机器人能够在多视图3D对应和3D边界框预测等任务中表现出色。这些能力对于机器人准确处理物体至关重要。 灵巧性和适应性:现实世界任务的关键虽然物体检测和理解至关重要,但机器人的真正挑战在于执行需要精细运动技能的灵巧任务。无论是折叠一个纸狐狸还是玩一场牌游戏,需要高精度和协调性的任务通常超出了大多数AI系统的能力。然而,双子机器人技术专门设计用于在这些任务中表现出色。 精细运动技能:该模型处理复杂任务(如折叠衣服、堆叠物体或玩游戏)的能力表明其先进的灵巧性。经过进一步的微调,双子机器人技术可以处理需要在多个自由度上协调的任务,例如使用双臂进行复杂操作。 少样本学习:双子机器人技术还引入了少样本学习的概念,使其能够通过最少的示例学习新任务。例如,只需100个示例,双子机器人技术就可以学习执行可能需要大量训练数据的任务。 适应新型机器人体:双子机器人技术的另一个关键特性是其能够适应新型机器人体。无论是双臂机器人还是具有更多关节的类人机器人,该模型都可以无缝地控制各种类型的机器人体,使其具有多样性和适应不同硬件配置的能力。 零样本控制和快速适应双子机器人技术的一个突出特点是其能够以零样本或少样本学习的方式控制机器人。零样本控制是指在不需要为每个任务进行特定训练的情况下执行任务的能力,而少样本学习则是从少量示例中学习。 通过代码生成实现零样本控制:双子机器人技术可以生成代码来控制机器人,即使所需的具体动作以前从未见过。例如,当提供高级任务描述时,双子机器人技术可以使用其推理能力来理解物理动态和环境,从而创建执行任务所需的代码。 少样本学习:在需要更复杂的灵巧性的情况下,该模型还可以从示例中学习,并立即将该知识应用于有效地执行任务。这一适应新情况的快速能力是机器人控制的一个重大进步,尤其是在需要不断变化或不可预测的环境中。 未来影响双子机器人技术是通用机器人领域的一个重要进步。通过将AI的推理能力与机器人的灵巧性和适应性相结合,它使我们更接近创建可以轻松集成到日常生活并执行需要类似人类交互的各种任务的机器人的目标。 这些模型的潜在应用是巨大的。在工业环境中,双子机器人技术可以用于复杂的装配、检查和维护任务。在家庭中,它可以协助完成家务、护理和个人娱乐。随着这些模型的不断进步,机器人可能会成为广泛的技术,开启多个领域的新可能性。总结双子机器人技术是一套建立在双子2.0基础上的模型,旨在使机器人能够执行具身推理。这些模型可以帮助工程师和开发人员创建能够以类似人类的方式理解和与物理世界交互的AI驱动机器人。凭借执行复杂任务的高精度和灵活性,双子机器人技术融入了具身推理、零样本控制和少样本学习等特性。这些能力使机器人能够在不需要大量重新训练的情况下适应环境。双子机器人技术有可能改变从制造到家庭辅助的各个行业,使机器人在现实世界应用中更加强大和安全。随着这些模型的不断演进,它们有可能重新定义机器人的未来。


乔治亚理工学院的研究人员最近揭示了一个令人印象深刻的成就:一款5英寸长的软机器人可以在没有腿的情况下将自己弹射到10英尺高的空中——相当于篮球筐的高度。该设计的灵感来自于卑微的线虫,一种比人类头发还细的圆虫,可以跳跃多次自己的身体长度。通过将身体挤压成紧密的褶皱,蠕虫储存了弹性能量,然后突然释放它,将自己像杂技演员一样抛向空中或向后。工程师们模仿了这种运动。他们的“SoftJM”机器人本质上是一个具有刚性碳纤维骨架的柔性硅胶棒。根据它的弯曲程度,它可以向前或向后跳跃——即使它没有轮子或腿。在行动中,线虫启发的机器人像一个蹲着的人一样卷曲,然后爆炸性地伸展以跳跃。高速摄像机显示蠕虫如何将头部弯曲并在身体中间形成褶皱以向后跳跃,然后直ening并在尾部形成褶皱以向前跳跃。乔治亚理工学院的团队发现,这些紧密的褶皱——通常是软管或电缆中的问题——实际上使蠕虫和机器人能够储存更多的能量。正如一位研究人员指出的,扭曲的吸管或软管是无用的,但一个扭曲的蠕虫就像一个装满弹簧的容器。实验室中的软机器人复制了这个技巧:它“夹紧”中间或尾部,紧张起来,然后在一阵爆发(约十分之一毫秒)中释放以飞入空中。https://www.youtube.com/watch?v=j7FlI0atGAc软机器人崛起软机器人是一门年轻但迅速发展的领域,经常从自然界中汲取灵感。与刚性金属机器不同,软机器人由柔性材料制成,可以挤压、拉伸和适应周围环境。该领域的早期里程碑包括哈佛的Octobot——一款完全由硅胶和流体通道制成的自主机器人,没有任何刚性部件,灵感来自于章鱼的肌肉。从那时起,工程师们建造了一系列软机器人:从蠕虫状的爬行机器人和凝胶状抓握器到可穿戴的“外骨骼”和滚动的藤状机器人。例如,耶鲁研究人员创建了一个受乌龟启发的软机器人,其腿可以在游泳或行走时在松弛的鳍和坚固的“陆地腿”之间切换。在UCSB,科学家们制造了一个像藤蔓一样的机器人,它使用仅具有光敏“皮肤”的方式朝着光源生长——它可以像植物茎一样延伸到狭窄的空间中。这些和其他生物启发的创新展示了软材料如何创建新的运动模式。https://www.youtube.com/watch?v=uhEnmVUxAPs总体而言,支持者认为软机器人可以进入传统机器人无法进入的地方。美国国家科学基金会指出,自适应的软机器可以“探索传统机器人无法到达的空间”——甚至包括人体内部。一些软机器人具有可编程的“皮肤”,可以改变刚度或颜色以融入或抓住物体。工程师们还在探索折纸/刻纸技术、形状记忆聚合物和其他技巧,以便这些机器人可以在飞行中重新配置。工程柔性运动让软机器人像动物一样移动带来了巨大的挑战。没有硬关节或电机,设计师必须依靠材料特性和巧妙的几何形状。例如,乔治亚理工学院的跳跃机器人必须在其橡胶身体内部包含一根碳纤维骨架,以使弹簧作用足够强大。集成传感器和控制系统也是一个棘手的问题。正如宾夕法尼亚州立大学的工程师指出,传统的电子元件是刚性的,会使软机器人僵硬。为了使他们的小型爬行救援机器人“智能化”,他们必须小心地将柔性电路分布在整个身体上,以便它仍然可以弯曲。即使找到能量来源也更加困难:一些软机器人使用外部磁场或压缩空气,因为携带重型电池会使它们变得沉重。另一个障碍是利用正确的物理学。线虫-机器人团队了解到,褶皱实际上有帮助。在正常的橡胶管中,褶皱会迅速停止流动;但在软蠕虫中,它会缓慢地积累内部压力,允许在释放之前进行更多的弯曲。通过使用模拟和甚至水填充的气球模型,研究人员展示了他们的柔性身体可以在弯曲时储存大量的弹性能量,然后以快速的跳跃释放出来。结果是令人惊讶的:从静止状态,机器人可以跳跃10英尺高,反复跳跃,只需通过弯曲其脊柱。这些突破——找到方法来储存和释放橡胶材料中的能量——是软机器人工程的典型特征。现实世界中的跳跃者和助手所有这些软机器人有什么用?原则上,它们可以处理传统机器人无法处理的情况。在灾区,例如,软机器人可以在碎片下或倒塌的建筑物中蠕动以找到幸存者。宾夕法尼亚州立大学展示了一个磁性控制的软爬行机器人原型,它可以在狭窄的碎片中导航,甚至可以通过血管大小的通道移动。在医学领域,微观软机器人可以直接在体内输送药物。在麻省理工学院的一项研究中,设想了一种线程般薄的软机器人,可以漂浮在动脉中并清除血栓,可能无需开放式手术即可治疗中风。哈佛科学家也正在开发软可穿戴外骨骼——一种轻量的充气袖子,可以帮助ALS患者抬起肩膀,立即改善他们的活动范围。航天机构也在关注软跳跃机器人。轮子可能会卡在沙子或岩石中,但跳跃机器人可以跳过陨石坑和沙丘。NASA甚至想象了月球和冰月上的新型跳跃机器人。在一个概念中,一个足球大小的机器人称为SPARROW,将使用蒸汽喷射(来自熔化的冰)在欧罗巴或恩克拉多斯上跳跃数英里。在这些月球的低重力下,一个小跳跃可以走很远——科学家指出,机器人在地球上的1米跳跃可以使其在恩克拉多斯上行驶100米。这个想法是,数十个这样的跳跃机器人可以在外星地形上自由移动,“完全自由地行进”在轮式巡视器会停滞的地方。回到地球上,未来的软跳跃机器人可以帮助搜索和救援任务,跳过河流、泥泞或不稳定的地面,这些地形会阻止传统机器人。https://www.youtube.com/watch?v=nkimUw3GqLQ软机器人也在工业和农业领域找到工作。NSF指出,它们可以成为工厂车间或农场上的安全助手,因为它们会在遇到人时让开。研究人员甚至建造了软抓握器,可以轻轻地抓住精致的水果而不会将其压伤。软机器的柔性意味着它们可以在刚性设备无法进入的狭小或柔性空间中工作。最终,专家们认为软机器人将从根本上改变许多领域。从蠕虫到可穿戴套装再到月球跳跃机器人,这些研究线索展示了如何从微小生物中汲取灵感,以实现技术上的巨大飞跃。


日本人对合作式人工智能代理以同等于对人类的尊重对待,而美国人更有可能将人工智能用于个人利益,根据来自慕尼黑路德维希·马克西米利安大学和东京早稻田大学的研究人员在科学报告上发表的新研究随着自动驾驶车辆和其他人工智能自主机器人逐渐融入日常生活,人工智能的文化态度可能决定这些技术在不同社会中实施的速度和成功程度人机合作的文化鸿沟“随着自动驾驶技术成为现实,这些日常遭遇将定义我们如何与智能机器共享道路,”来自慕尼黑路德维希·马克西米利安大学的首席研究员Jurgis Karpus博士在研究中说该研究代表了首批全面跨文化检查人类如何与人工智能代理在利益不总是对齐的场景中交互的研究。这些发现挑战了算法剥削——利用合作式人工智能的趋势——是一个普遍现象的假设结果表明,随着自主技术变得更加普遍,社会可能会根据人工智能的文化态度而经历不同的整合挑战研究方法:博弈论揭示行为差异研究团队采用了经典的行为经济学实验——信任游戏和囚徒困境——比较了日本和美国的参与者如何与人类合作伙伴和人工智能系统交互在这些游戏中,参与者在自利和互利之间做出选择,有真正的经济激励来确保他们正在做真正的决定,而不是假设性的决定。这种实验设计使研究人员能够直接比较参与者如何以人类和人工智能为对手游戏被仔细设计以复制日常情况,包括交通场景,人类必须决定是否与其他代理合作。参与者玩了多轮游戏,有时与人类合作伙伴,有时与人工智能系统,这使得他们的行为可以直接比较“我们的参与者在美国与人工智能代理合作的程度显著低于他们与人类的合作程度,而日本的参与者则表现出与人类和人工智能代理相同的合作水平,”论文指出内疚作为文化差异的关键因素研究人员提出,内疚的差异是观察到的文化变异的主要驱动力,即人们如何对待人工智能代理研究发现,西方人,特别是美国人,当剥削其他人类时会感到后悔,但当他们剥削机器时不会。相比之下,日本人似乎会经历类似的内疚,无论他们是对待一个人还是人工智能代理Karpus博士解释说,在西方思维中,切断机器人在交通中的路线不会伤害它的感情,突出了一个可能导致更愿意剥削机器的观点该研究包括一个探索性组成部分,参与者在游戏结果被揭示后报告了他们的情绪反应。这些数据提供了对行为差异的潜在心理机制的关键见解情绪反应揭示更深层次的文化模式当参与者剥削合作式人工智能时,日本参与者报告了显著更多的负面情绪(内疚、愤怒、失望)和更少的正面情绪(幸福、胜利、宽慰),与他们的美国同行相比研究发现,日本的背叛者在剥削人工智能合作伙伴时感到的内疚比美国的背叛者更强烈。这种更强烈的情绪反应可能解释了日本参与者更不愿意剥削人工智能代理的原因相反,美国人在剥削人类时比剥削人工智能时感到更多的负面情绪,这种区别在日本参与者中没有被观察到。对于日本人来说,无论他们是剥削人类还是人工智能代理,情绪反应都是相同的该研究指出,日本参与者对剥削人类和人工智能合作伙伴的态度相同,表明与西方态度相比,人工智能代理的道德认知是根本不同的拟人主义和对机器人的看法日本的文化和历史背景可能在这些发现中发挥了重要作用,为观察到的行为差异提供了潜在的解释,包括对人工智能和具身人工智能的看法该论文指出,日本对拟人主义的历史亲和力和非生物体可以在佛教中拥有灵魂的信念导致了这样的假设,即日本人比其他文化的个体更能接受和关心机器人这种文化背景可能为人工智能代理的看法创造了一个根本不同的起点。在日本,人类和非人类实体之间可能没有明显的区别研究表明,日本人比美国人更有可能相信机器人可以体验情绪,并且更愿意接受机器人作为人类道德判断的对象论文中引用的研究表明,日本人更倾向于将人工智能代理视为与人类类似,机器人和人类经常被描绘为伙伴而不是等级关系。这可能解释了为什么日本参与者在情感上以相同的考虑对待人工智能代理和人类对自主技术采用的影响这些文化态度可能会直接影响自主技术在不同地区被采用的速度,并可能具有深远的经济和社会影响Karpus博士推测,如果日本人以同等于人类的尊重对待机器人,那么完全自主的出租车可能会在东京比西方城市如柏林、伦敦或纽约更快地变得普遍在某些文化中剥削自主车辆的意愿可能会为其在社会中的顺利整合带来实际挑战。如果驾驶员更有可能切断自主驾驶汽车的路线,占用他们的路权,或者以其他方式利用他们的谨慎编程,那么可能会阻碍这些系统的效率和安全性研究人员建议,这些文化差异可能会显著影响像送货无人机、自主公共交通和自主私人车辆等技术被广泛采用的时间表有趣的是,该研究发现日本和美国参与者在与其他人类合作时几乎没有差异,与行为经济学的前期研究一致该研究观察到日本和美国参与者在与其他人类合作时的意愿几乎没有差异。这一发现突出了差异仅在人机交互的背景下出现,而不是反映更广泛的文化差异在合作行为中这种人类间合作的连贯性为研究的结论提供了一个重要的基准,即观察到的模式的独特性对人工智能开发的更广泛影响这些发现对设计和部署与人类交互的人工智能系统具有重要意义,尤其是在不同文化背景下该研究强调了在设计和实施与人类交互的人工智能系统时考虑文化因素的关键性。人们对人工智能的看法和交互方式并非普遍,可能会在不同文化中有显著差异忽视这些文化细微差别可能会导致意想不到的后果,采用速度变慢,并可能在某些地区滥用或剥削人工智能技术。这突出了跨文化研究在理解人机交互和确保人工智能全球负责任开发和部署方面的重要性研究人员建议,随着人工智能越来越融入日常生活,了解这些文化差异将变得越来越重要,以便成功实施需要人类和人工智能代理之间合作的技术限制和未来研究方向研究人员承认他们的工作中存在某些限制,这些限制指向了未来调查的方向该研究主要集中在两个国家——日本和美国——虽然这提供了有价值的见解,但可能无法捕捉到人机交互的文化变异的全部范围。需要在更广泛的文化范围内进行进一步的研究来概括这些发现此外,虽然博弈论实验提供了理想的可比研究的受控场景,但它们可能无法完全捕捉现实世界中人机交互的复杂性。研究人员建议,验证这些发现在具有实际自主技术的实地研究中将是一个重要的下一步基于内疚和对机器人的文化信仰的解释虽然得到数据的支持,但需要进一步的实证研究来明确建立因果关系。研究人员呼吁进行更多有针对性的研究来检查这些文化差异的根本心理机制“我们的研究结果缓和了这些结果的普遍性,并表明算法剥削并不是一个跨文化现象,”研究人员总结道


多年来,创造能够像人类一样移动、交流和适应的机器人一直是人工智能领域的一个主要目标。虽然取得了显著进展,但开发能够适应新环境或学习新技能的机器人仍然是一个复杂的挑战。最近在大型语言模型(LLMs)方面的进展现在正在改变这一状况。这些在大量文本数据上训练的AI系统使机器人变得更智能、更灵活,并能够更好地在现实世界环境中与人类合作。理解具身人工智能具身人工智能 指的是存在于物理形式的AI系统,例如机器人,它们可以感知和与环境交互。与仅在数字空间中运行的传统AI不同,具身人工智能使机器能够与物理世界交互。例如,机器人捡起一个杯子,飞行器避开障碍,或者机器人臂在工厂中组装零件。这些动作需要AI系统解释感官输入,如视觉、声音和触觉,并实时做出精确的动作。 具身人工智能的重要性在于它能够弥合数字智能和现实世界应用之间的差距。在制造业中,它可以提高生产效率;在医疗保健中,它可以协助外科医生或支持患者;在家庭中,它可以执行清洁或烹饪等任务。具身人工智能使机器能够完成需要更多计算的任务,使其在各个行业中更加有形和有效。 传统的具身人工智能系统受到僵化编程的限制,每个动作都需要明确定义。早期系统擅长于特定任务,但在其他任务中却失败了。然而,现代具身人工智能则注重适应性,使系统能够从经验中学习并自主行动。这一转变是由传感器、计算能力和算法的进步驱动的。大型语言模型的集成开始重新定义具身人工智能可以实现什么,使机器人更具学习和适应能力。大型语言模型的作用大型语言模型(LLMs),如GPT,是在大量文本数据上训练的AI系统,能够理解和产生人类语言。最初,这些模型用于写作和回答问题等任务,但现在它们正在 演变 成为能够进行多模态通信、 推理、规划和 问题解决 的系统。这一大型语言模型的演变使工程师能够将具身人工智能发展到执行某些重复任务之外。 大型语言模型的一个主要优势是其能够提高机器人与自然语言的交互能力。例如,当你告诉机器人“请给我拿一杯水”,大型语言模型使机器人能够理解请求背后的意图,识别所涉及的对象,并规划必要的步骤。这种处理口头或书面指令的能力使机器人更加用户友好和易于交互,即使对于没有技术专业知识的人来说也是如此。 除了通信,大型语言模型还可以帮助决策和规划。例如,当在障碍物遍布的房间中导航或堆叠盒子时,大型语言模型可以分析数据并建议最佳行动方案。在动态环境中,预编程的动作不足时,这种预先思考和实时适应的能力至关重要。 大型语言模型还可以帮助机器人学习。传统上,教机器人新任务需要大量编程或反复试验。现在,大型语言模型使机器人能够从语言反馈或存储在文本中的过去经验中学习。例如,如果机器人难以打开一个罐子,一个人可能会说“下次更用力地转”,大型语言模型帮助机器人调整其方法。这种反馈循环改进了机器人的技能,而无需不断的人类监督。最新发展大型语言模型与具身人工智能的结合不仅仅是一个概念——它正在发生。一个重大突破是使用大型语言模型帮助机器人处理复杂的、 多步骤任务。例如,制作一个三明治需要找到原料、切面包、涂抹黄油等。最近的研究表明,大型语言模型可以将此类任务分解为较小的步骤,并根据实时反馈(如缺少原料)调整计划。这对于家庭辅助或工业流程等需要灵活性的应用至关重要。 另一个令人兴奋的发展是多模态集成,其中大型语言模型将语言与其他感官输入(如视觉或触觉)结合起来。例如,机器人可以看到一个红色的球,听到命令“捡起红色的那个”,并使用大型语言模型将视觉提示与指令联系起来。像 Google 的 PaLM-E 和 OpenAI 的努力展示了机器人如何使用多模态数据来识别对象、理解空间关系并根据集成输入执行任务。 这些进步正在导致现实世界的应用。像特斯拉这样的公司正在 将大型语言模型集成到他们的Optimus人形机器人中,旨在协助工厂或家庭工作。同样,大型语言模型驱动的机器人已经在医院和实验室中工作,遵循书面指令并执行取物或进行实验等任务。挑战和考虑尽管大型语言模型具有潜力,但在具身人工智能中使用它们也带来了挑战。一个重大问题是确保在将语言转化为行动时的准确性。如果机器人误解命令,结果可能会有问题甚至危险。研究人员正在努力将大型语言模型与专门从事运动控制的系统集成,以提高性能,但这仍然是一个正在进行的挑战。 另一个挑战是大型语言模型的计算需求。这些模型需要大量的处理能力,这对于具有有限硬件的机器人来说可能很难在实时处理中管理。一些解决方案涉及将计算卸载到云端,但这引入了延迟和对互联网连接的依赖等问题。其他团队正在努力开发更高效的大型语言模型,专门为机器人设计,尽管扩展这些解决方案仍然是一个技术挑战。 随着具身人工智能变得更加自主,伦理问题也出现了。谁将负责机器人犯错造成的损害?如何确保在敏感环境中(如医院)运行的机器人的安全性?此外,自动化可能导致的工作岗位流失是一个需要通过深思熟虑的政策和监督来解决的社会问题。结论大型语言模型正在使具身人工智能重获新生,将机器人转变为能够理解我们、推理问题和适应意外情况的机器。从自然语言处理到多模态感知,这些发展使机器人更加多才多艺和易于使用。随着我们看到更多的现实世界部署,大型语言模型与具身人工智能的融合正在从愿景转变为现实。然而,准确性、计算需求和伦理问题等挑战仍然存在,克服这些挑战将是塑造这一技术未来的关键。
几十年来,科学家和工程师一直致力于创造能够像人类一样行走、交谈和互动的机器人。虽然取得了显著进展,但构建能够适应新环境或学习新技能的机器人仍然是一个复杂且昂贵的挑战。NVIDIA 通过 Isaac GR00T N1 解决了这个问题,后者是世界上第一个开放且可定制的机器人推理和技能基础模型。这个创新模型使机器人能够批判性地思考,推理复杂场景,并适应新挑战。本文探讨了 NVIDIA 的创新,详细介绍了 GR00T N1 的功能及其对人形机器人的影响。人形机器人的当前状态人形机器人在近年来取得了显著进展。它们可以在不平坦的地形上行走,进行基本的对话,并在受控环境中执行任务,如组装产品。像 Boston Dynamics 这样的公司已经展示了可以跳舞或表演杂技的机器人。然而,尽管取得了这些进展,这些机器人在面对特定编程以外的任务时仍然存在局限性。例如,一个设计用于仓库中堆叠箱子的机器人可能难以在杂乱的储物室中整理物品或在没有大量重新编程的情况下切换任务。主要是,构建一个能够处理多种任务的人形机器人需要从头开始,每次都需要几个月甚至几年的时间。人形机器人的基础模型Isaac GR00T N1 是专门为人形机器人设计的基础模型。它为感知和运动等基本功能提供了预建框架,消除了从头开发这些核心能力的需要。这简化了机器人构建过程,之前需要机械工程和人工智能编程方面的专业知识以及大量的财务资源。开发人员现在可以获取 GR00T N1 并将其定制为特定任务,减少时间和成本。这一便捷性和灵活性可能会推动更广泛的采用,使这些机器人从研究实验室转移到现实世界应用中。像人类一样思考:双系统设计GR00T N1 采用了受人类认知启发的双系统设计。根据 双过程理论,人类以两种模式思考:快速和本能的(如反射)以及慢速和刻意的(如规划)。按照这种认知模型,GR00T N1 配备了系统 1...


一家北欧深科技初创公司宣布在人工智能领域取得突破,创建了第一个功能性的“数字神经系统”,能够实现自主学习。 IntuiCell,来自隆德大学的分公司,于2025年3月19日宣布,他们成功地设计了能够像生物体一样学习和适应的AI,可能会使当前的AI范式在许多应用中变得过时。这一创新代表了对传统静态机器学习模型的重大突破,通过复制生物神经系统中学习的核心原理。与传统的AI相比,传统AI依赖于大量数据和反向传播算法,IntuiCell的技术使机器能够通过直接与环境交互来学习。“IntuiCell已经破解了生物体中学习的发生方式,并将其作为软件进行了工程化,”该公司在其公告中表示,将这一突破描述为“超越静态机器学习模型(传统AI的主要依赖)通过创建一个完全功能性的‘数字神经系统’,能够自然扩展到人类智能水平。”该公司通过“Luna”机器狗展示了其创新成果,Luna通过试错学习控制其身体和站立,类似于新生动物。该公司发布的视频显示,Luna在没有任何预编程智能或指令的情况下,仅通过数字神经系统从经验中学习站立。“与传统的AI模型不同,传统AI模型受到静态训练数据的限制,机器狗Luna通过直接与其世界的交互来感知、处理和改进自己,”根据公司的新闻稿。https://www.youtube.com/watch?v=CBqBTEYSEmA技术工作原理IntuiCell创新背后的核心是一种机器学习方式的根本转变。与传统的AI系统不同,传统AI系统通过静态算法处理大量数据,IntuiCell的方法模仿了人类和动物自然学习的生物机制。IntuiCell的CEO和联合创始人Viktor Luthman在公告中强调了这一区别。根据Luthman的说法,传统的AI已经擅长数据处理,但缺乏真正的智能,而他们的生物启发系统使机器能够以前所未有的方式进化和与环境交互。该系统的架构代表了对标准神经网络的重大偏离。IntuiCell开发了一种类似于生物脊髓的技术,创建了自主学习的基础架构。这是更大系统的一部分,旨在复制大脑区域的处理能力,大脑区域负责感官处理和世界建模。IntuiCell的数字神经系统采用了递归网络和去中心化学习算法,模仿了大脑过程,而不是依赖反向传播算法和大量训练数据。这种架构使得AI代理能够通过直接经验获得知识,并在实时适应新情况——这些能力在传统机器学习中一直难以实现。该技术的实际应用反映了其生物启发。与其编程行为或通过传统算法输入数据,IntuiCell计划雇用狗训练师来教他们的AI代理新技能。这代表了对典型AI开发实践的根本性转变,强调了与计算规模相比的现实世界交互的重要性。正如研究人员和联合创始人Udaya Rongala解释的那样,他们的工作源自三十年的神经科学研究,专注于理解智能如何从神经系统的结构和动态中产生。“对蛮力扩展、数十亿参数、更多计算和更多数据的痴迷是对实现智能的根本方法的错误,”Rongala指出。“IntuiCell并不追求更大更好的范式。智能不是我们的最终目标,而是我们的起点。”IntuiCell的技术旨在创建“第一个真正的可教导系统;机器从我们身上学习,就像我们教动物新技能一样。”该公司设想其数字神经系统成为“所有非生物智能的基础设施——使他人能够解决我们今天无法预见的现实世界问题,而无需依赖大量训练数据。”研究基础和团队专业知识该公司的基础建立在隆德大学三十年的神经科学研究之上。教授Henrik Jörntell,IntuiCell的联合创始人和神经生理学教授,领导了该公司所描述的“世界上唯一能够记录整个神经系统的单个神经元活动的实验室”,为IntuiCell的技术提供了独特的科学基础。领导团队包括具有神经科学、AI、机器人和商业专业知识的经验丰富的企业家和研究人员。除了Luthman、Jörntell和Rongala,创始团队还包括医生Jonas Enander,具有神经科学专业知识的医生;Linus Mårtensson,负责将研究转化为软件的首席开发人员;以及具有AI驱动技术公司背景的COO Robin Mellstrand。IntuiCell已从投资者那里获得了350万欧元的资金,包括Navigare Ventures和SNÖ Ventures。该公司预计将在未来两年内完成完整的数字神经系统的开发,目标是使任何代理,无论是物理的还是数字的,都能够实现“终身学习和适应未知——曾经被认为是生物体独有的能力”。虽然IntuiCell的愿景的完全实现还需要几年时间,但他们通过Luna的演示提供了令人信服的早期证据,证明了他们的技术有可能通过创建能够真正自主学习和适应的系统来改变AI的发展,实现现实世界的交互。