AI 模型与平台

通过物理感知增强 AI 驱动的计算机视觉

发布于 2023年6月25日

更新于 2026年5月23日

作者

Alex McFarland

人工智能无疑已在我们的生活中留下了不可磨灭的印记。在一项开创性的努力中，进一步增强人工智能的能力，来自加州大学洛杉矶分校（UCLA）和美国陆军研究实验室的研究人员推出了一个独特的方法，将物理感知与数据驱动的技术相结合，用于人工智能驱动的计算机视觉技术。

该研究发表在 Nature Machine Intelligence 上，提出了一种开创性的混合方法，旨在改进人工智能基于的机械实时感知、交互和反应其环境的能力，对于自动驾驶汽车和精确动作机器人至关重要。

混合方法的物理感知人工智能

传统上，计算机视觉，即使人工智能能够理解和推断物理世界的属性的领域，主要集中在数据驱动的机器学习上。同时，物理学研究试图揭示许多计算机视觉挑战背后的物理原理。然而，将物理学的理解融入神经网络中一直很困难。

在一个重大突破中，UCLA 的研究旨在将来自数据的深入理解和物理学的现实世界知识相结合，创建一个具有增强能力的混合人工智能。该研究的通讯作者、UCLA 萨莫利工程学院电气和计算机工程助理教授阿丘塔·卡达姆比（Achuta Kadambi）解释说：“物理感知的推理可以使汽车更安全地行驶或外科手术机器人更精确地操作。”

将物理学融入计算机视觉人工智能

研究团队概述了三种创新方法，将物理学融入计算机视觉人工智能：

将物理学注入人工智能数据集：这涉及用额外的信息标记对象，例如其潜在速度或重量，类似于视频游戏中的角色。
将物理学集成到网络架构中：这涉及运行数据通过一个网络过滤器，该过滤器将物理属性编码到相机捕获的内容中。
将物理学集成到网络损失函数中：这里，利用物理学知识来帮助人工智能解释其观察的训练数据。

这些实验性研究线已经在增强计算机视觉方面取得了有前途的结果。例如，混合方法使人工智能能够更精确地跟踪和预测物体的运动，并且可以从受恶劣天气影响的场景中产生准确的高分辨率图像。

物理感知人工智能的未来

研究人员对这种双模态方法的持续进步持乐观态度，这可能会使基于深度学习的人工智能独立地学习物理定律。这可能标志着人工智能驱动的计算机视觉技术的一个新前沿，为包括自动驾驶汽车和外科机器人在内的各个领域的更安全、更精确的人工智能应用铺平了道路。

该研究得到了陆军研究实验室的一项补助金的部分支持，由陆军研究实验室计算机科学家塞尔索·德·梅洛（Celso de Melo）和加州大学洛杉矶分校教师斯蒂法诺·索阿托（Stefano Soatto）、乔·朱伊·谢（Cho-Jui Hsieh）和马尼·斯里瓦斯塔瓦（Mani Srivastava）共同撰写。额外的资金来自国家科学基金会、陆军青年调查员计划、国防高级研究计划局、Intrinsic（一家字母表公司）和亚马逊的补助金。