人工智能
新技术让 AI 更好地理解一些物理规律

人工智能已经能够通过强化学习在某些方面理解物理规律有一段时间了,但是由 MIT 研究人员开发的 新技术 可以帮助工程师设计出更好地理解物理规律的模型。
心理研究表明,人类在某种程度上对物理规律有着直觉的理解。婴儿对物体的交互和运动有着预期,如果这些预期被违反,婴儿会感到惊讶。由 MIT 团队进行的研究不仅有可能推动人工智能的新应用,也可以帮助心理学家了解婴儿如何感知和学习周围的世界。
由 MIT 团队设计的模型称为 ADEPT,它通过预测物体在物理空间中的行为来工作。该模型观察物体并跟踪一个“惊讶”指标。如果发生了意外的事情,模型会通过增加其惊讶值来响应。像物体瞬移或消失等意外和看似不可能的行为都会导致惊讶值大幅增加。
研究团队的目标是让他们的模型注册与人类看到物体以不合理的方式行事时相同的惊讶水平。
ADEPT 有两个主要组件:物理引擎和逆向图形模块。物理引擎负责预测物体的运动,预测物体在一系列可能状态下的未来表现。与此同时,逆向图形模块负责创建将被输入物理引擎的物体表示。
逆向图形模块跟踪多个不同的属性,如速度、形状和物体的方向,从视频帧中提取这些信息。逆向图形模块只关注最显著的细节,忽略不会帮助物理引擎解释物体和预测新状态的细节。通过关注最重要的细节,模型更好地推广到新的物体。物理引擎然后使用这些物体描述来模拟更复杂的物理行为,如流体或刚性,以预测物体的行为。
在这种摄取过程发生后,模型观察视频的实际下一帧,它使用该帧来重新计算其相对于可能的物体行为的概率分布。惊讶与事件发生的概率成反比,只有当模型认为应该发生的事件和实际发生的事件之间存在重大差异时,才会注册巨大的惊讶。
研究团队需要某种方式来比较他们的模型的惊讶和观察相同物体行为的人的惊讶。在发展心理学中,研究人员经常通过向婴儿展示两个不同的视频来测试婴儿。在一个视频中,物体的行为与现实世界中物体的行为一致,而另一个视频中,物体违反了物理规律。研究团队采用了这些基本概念,并让 60 名成年人观看 64 个不同视频,展示预期和意外的物理行为。参与者然后被要求在视频的各个时刻对他们的惊讶进行评分,评分范围从 1 到 100。
模型性能分析表明,它在物体被移到墙后面并在墙被移除时消失的视频中表现得非常好,通常在这些情况下与人类的惊讶水平相匹配。该模型还似乎对人类没有表现出惊讶但本应感到惊讶的视频感到惊讶。例如,为了让物体以一定速度移动到墙后面并立即从墙的另一侧出来,物体必须要么瞬移,要么经历速度的急剧增加。
与传统的神经网络相比,传统神经网络可以从观察中学习,但不显式地记录物体的表示,研究人员发现 ADEPT 网络在区分惊讶和不惊讶的场景方面更加准确,ADEPT 的性能也更好地与人类的反应保持一致。
MIT 研究团队旨在进行更多的研究,以更深入地了解婴儿如何观察周围的世界并从这些观察中学习,将他们的发现纳入 ADEPT 模型的新版本中。
