Connect with us

机器人

新浪潮技术使安卓情感表达更加自然

mm

对于那些与外貌极其像人类的安卓机器人互动过的人来说,很多人报告说感觉有些“不对劲”。这种现象不仅仅是外貌的问题,而是深深植根于机器人如何表达情感和维持一致的情感状态。或者说,他们缺乏 类似人类的能力

虽然现代安卓机器人可以完美地复制个别面部表情,但挑战在于创建自然的过渡和维持情感一致性。传统系统严重依赖预编程的表情,类似于翻书页,而不是自然地从一种情感过渡到另一种。这僵硬的方法经常在我们看到的和我们认为是真实的情感表达之间制造出脱节。

这些限制在延长互动期间变得尤为明显。一个安卓机器人可能在一刻完美地微笑,但难以自然地过渡到下一个表情,制造出一种令人震惊的体验,提醒我们我们正在与机器而不是具有真实情感的生命体互动。

基于波的解决方案

这就是大阪大学的一些 新颖且重要的研究 的用武之地。科学家们开发了一种创新方法,根本性地重新构想了安卓机器人如何表达情感。与其将面部表情视为孤立的动作,这项新技术将其视为自然地流经安卓机器人面部的运动波。

就像多种乐器融合在一起创造出交响乐一样,这个系统将各种面部运动——从细微的呼吸模式到眼眨——融合成一个和谐的整体。每个运动都被表示为可以在实时中调制和与其他运动结合的波。

使得这种方法创新的是其动态性质。与其依赖预先录制的序列,这个系统通过叠加这些不同的运动波来有机地生成表情。这创造出一种更加流畅和自然的外观,消除了经常打破自然情感表达幻觉的机器人般的过渡。

技术创新在于研究人员所谓的“波形调制”。这允许安卓机器人的内部状态直接影响这些表达波如何表现,创造出机器人编程的情感状态和其物理表达之间更加真实的联系。

图片来源:Hisashi Ishihara

实时情感智能

想象一下试图让机器人表达它感到困倦。它不仅仅是关于眼睑下垂,还关于协调多种微妙的运动,这些运动是人类无意识地识别为睡意的迹象。这项新系统通过对运动协调的巧妙方法来解决这个复杂的挑战。

动态表达能力

该技术编排了九种基本的协调运动,我们通常将其与不同的唤醒状态联系起来:呼吸、自发性眨眼、眼球运动、点头、头部摇晃、吸吮反射、节律性眼球运动、头部侧摆和哈欠。

每个运动都由研究人员称为“衰减波”的数学模式控制,这决定了运动如何随时间展开。这些波不是随机的;它们使用五个关键参数精心调整:

  • 幅度: 控制运动的强烈程度
  • 阻尼比: 影响运动稳定的速度
  • 波长: 确定运动的时序
  • 振荡中心: 设置运动的中性位置
  • 重新激活周期: 控制运动重复的频率

内部状态反映

使得这个系统脱颖而出的,是它如何将这些运动与机器人的内部唤醒状态联系起来。当系统指示高唤醒状态(兴奋)时,某些波参数会自动调整——例如,呼吸运动变得更加频繁和明显。在低唤醒状态(困倦)下,您可能会看到更慢、更明显的哈欠运动和偶尔的点头。

该系统通过研究人员所谓的“时间管理”和“姿势管理”模块来实现这一点。时间模块控制运动何时发生,而姿势模块确保所有面部组件自然地协同工作。

Hisashi Ishihara 是这项研究的首席作者,并且是大阪大学机械工程系的副教授。

“与其创建表面上的运动,”Ishihara 解释说,“进一步开发一个系统,其中内部的情感在安卓机器人的每个行动细节中都得到反映,可能会导致创造出被认为具有心灵的安卓机器人。”

睡意表情在儿童安卓机器人上(图片来源:Hisashi Ishihara)

过渡的改进

与传统系统不同,传统系统在预先录制的表情之间切换,这种方法通过不断调整这些波参数来创建平滑的过渡。运动是通过一个复杂的网络协调的,确保面部动作自然地协同工作——就像人类的面部运动无意识地协调一样。

研究团队通过实验条件展示了该系统如何有效地传达不同的唤醒水平,同时保持自然的表情。

未来影响

基于波的情感表达系统的发展开启了人类-机器人交互的迷人可能性,并可能在未来与诸如 Unite.AI 的技术结合。虽然当前的安卓机器人经常在延长的互动期间制造出一种不适感,但这种技术可以帮助弥合不适谷——机器人看起来几乎但又不完全像人类的那段不舒服的距离。

关键的突破在于创造真实的情感存在感。通过生成流畅、上下文相关的表情来匹配内部状态,安卓机器人可以在需要情感智能和人类联系的角色中变得更加有效。

Koichi Osuka 是这项研究的资深作者,并且是大阪大学机械工程系的教授。

正如 Osuka 解释的,这项技术“可以极大地丰富人类和机器人之间的情感交流”。想象一下医疗伴侣可以表达适当的关心,教育机器人可以表现出热情,或者服务机器人可以传达真实的关注。

研究表明,在表达不同的唤醒水平方面——从高能量的兴奋到低能量的困倦——具有特别有前途的结果。这项能力可能在机器人需要:

  • 在长期互动期间传达警觉水平
  • 在治疗环境中表达适当的能量水平
  • 将其情感状态与社会背景相匹配
  • 在延长的对话期间维持情感一致性

该系统生成自然过渡的能力使其对需要持续的人类-机器人交互的应用尤其有价值。

通过将情感表达视为流动的、基于波的现象,而不是一系列预编程的状态,这项技术为创造能够以情感上有意义的方式与人类互动的机器人开启了许多新的可能性。研究团队的下一步将专注于扩展该系统的情感范围,并进一步完善其传达微妙的情感状态的能力,从而影响我们如何思考和与日常生活中的安卓机器人互动。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。