关注我们.

机器人

新浪潮技术让 Android 情绪更加自然

发布时间

 on

对于那些与看起来非常像人类的机器人互动过的人来说,许多人都表示有些东西“感觉不对劲”。这种现象不仅仅是外表——它深深植根于机器人如何表达情感和保持一致的情绪状态。或者换句话说,它们缺乏 类似人类的能力.

虽然现代机器人可以熟练地复制个人面部表情,但挑战在于创造自然的过渡和保持情绪的一致性。传统系统严重依赖预先编程的表情,类似于翻阅书页,而不是自然地从一种情绪流向另一种情绪。这种僵化的方法往往会导致我们看到的和我们认为是真正的情绪表达之间的脱节。

在长时间的互动中,这种局限性尤为明显。机器人可能在某一时刻露出完美的笑容,但很难自然地过渡到下一个表情,这给我们带来了一种不和谐的体验,提醒我们是在与一台机器互动,而不是与一个有真实情感的生物互动。

基于波浪的解决方案

这就是一些 新的和重要的研究 大阪大学的研究人员开发出了一种创新方法,从根本上重新构想了机器人表达情绪的方式。这项新技术不是将面部表情视为孤立的动作,而是将它们视为自然流经机器人面部的相互关联的运动波。

就像多种乐器混合在一起形成交响乐一样,该系统将各种面部动作(从细微的呼吸模式到眨眼)融合成一个和谐的整体。每个动作都表示为一种波,可以实时调节并与其他动作相结合。

这种方法的创新之处在于其动态特性。系统不依赖预先录制的序列,而是通过叠加不同的动作波来自然地生成表情。这创造了一种更流畅、更自然的外观,消除了经常破坏自然情感表达幻觉的机械过渡。

技术创新在于研究人员所称的“波形调制”。这使得机器人的内部状态能够直接影响这些表情波的表现方式,从而在机器人的编程情绪状态和身体表达之间建立更真实的联系。

图片来源:石原恒

实时情商

想象一下,让机器人表达困倦的感受。这不仅仅是下垂眼睑,还需要协调多种细微动作,而人类无意识地会将这些动作识别为困倦的迹象。这个新系统通过巧妙的动作协调方法解决了这一复杂挑战。

动态表达能力

该技术协调了九种基本类型的协调运动,我们通常将这些运动与不同的唤醒状态联系起来:呼吸、自发眨眼、转移眼球运动、打瞌睡、摇头、吸吮反射、钟摆性眼球震颤(节律性眼球运动)、头部侧摆和打哈欠。

这些运动中的每一个都由研究人员所谓的“衰减波”控制,这是一种决定运动随时间如何发展的数学模式。这些波不是随机的;它们是使用五个关键参数精心调整的:

  • 振幅: 控制运动的明显程度
  • 阻尼比: 影响运动稳定的速度
  • 波长: 决定运动的时间
  • 振荡中心: 设置机芯的中立位置
  • 重新激活期: 控制动作重复的频率

内部状态反映

该系统的突出之处在于它如何将这些动作与机器人的内部唤醒状态联系起来。当系统指示高度唤醒状态(兴奋)时,某些波参数会自动调整 - 例如,呼吸动作变得更加频繁和明显。在低唤醒状态(困倦)下,您可能会看到更慢、更明显的打哈欠动作和偶尔的点头。

该系统通过研究人员所谓的“时间管理”和“姿势管理”模块实现这一点。时间模块控制动作发生的时间,而姿势模块确保所有面部组件自然地协同工作。

石原久志是这项研究的主要作者,也是大阪大学工程研究生院机械工程系的副教授。

石原解释说:“与创造表面动作相比,进一步开发一个系统,让机器人的内在情感反映在机器人行为的每一个细节中,这可能会创造出被认为有心脏的机器人。”

儿童仿生机器人的困倦情绪表情(图片来源:Hisashi Ishihara)

过渡的改进

与传统系统在预先录制的表情之间切换不同,这种方法通过不断调整这些波参数来实现平滑的过渡。这些动作通过一个复杂的网络进行协调,确保面部动作自然地协同工作——就像人类的面部动作是如何无意识地协调的一样。

研究团队通过实验条件证明了这一点,展示了系统如何有效地传达不同的唤醒水平,同时保持自然的表情。

未来的影响

这种基于波的情绪表达系统的发展为 人机交互, 并可以与以下技术相结合 体现人工智能 未来。虽然目前的机器人在长时间的互动过程中往往会让人感到不安,但这项技术可以帮助弥合“恐怖谷”——即机器人看起来几乎像人类,但又不完全像人类的令人不舒服的空间。

关键突破在于创造真实的情感存在。通过产生与内部状态相匹配的流畅、适合情境的表达,机器人可以更有效地完成需要情商和人际关系的角色。

Koichi Osuka 是本文的资深作者,也是大阪大学机械工程系的教授。

正如 Osuka 所解释的那样,这项技术“可以极大地丰富人类与机器人之间的情感交流”。想象一下,医疗陪护人员可以表达适当的关心,教育机器人可以表现出热情,服务机器人可以传达真诚的关注。

这项研究在表达不同唤醒水平方面取得了特别有希望的结果——从高能量兴奋到低能量困倦。这种能力在机器人需要执行以下操作的场景中可能至关重要:

  • 在长期互动中传达警觉程度
  • 在治疗环境中表达适当的能量水平
  • 将他们的情绪状态与社会背景相匹配
  • 在长时间的谈话中保持情绪的一致性

该系统能够在状态之间产生自然转换,这使得它对于需要持续的人机交互的应用特别有价值。

通过将情绪表达视为一种流动的、基于波的现象,而不是一系列预先编程的状态,该技术为创造能够以情感上有意义的方式与人类互动的机器人开辟了许多新的可能性。研究团队的下一步将重点扩大系统的情感范围,进一步完善其传达微妙情绪状态的能力,影响我们在日常生活中对机器人的看法和与机器人的互动方式。

Alex McFarland 是一位人工智能记者和作家,致力于探索人工智能的最新发展。他与全球众多人工智能初创公司和出版物合作。