Connect with us

人工智能

新的 AI 人脸识别技术又迈进了一步

mm

似乎人工智能在人脸识别技术中的应用已经发展到了最远的程度。正如 ZDNet 所指出的,像 Microsoft 这样的公司已经开发出了可以使用情绪工具识别面部表情(FR)的面部识别技术。但是,限制因素是这些工具仅限于八种所谓的核心状态 – 愤怒、轻蔑、恐惧、厌恶、幸福、悲伤、惊讶或中立。

现在,日本科技开发商 Fujitsu推出了基于 AI 的技术,使面部识别在跟踪表达的情绪方面又迈进了一步。

现有的 FR 技术是基于“识别各种动作单位(AUs)- 即,我们做出的某些面部肌肉运动,可以与特定的情绪相关联。”在给出的例子中,“如果同时识别出 AU ‘脸颊抬起’和 AU ‘嘴角拉扯’,则 AI 可以得出结论:被分析的人是幸福的。

正如 Fujitsu 的发言人解释的那样,“当前技术的问题是,AI 需要在每个 AU 上进行大量的训练。它需要知道如何从所有可能的角度和位置识别出一个 AU。但是,我们没有足够的图像 – 所以,通常它的准确性不是很高。”

大量的数据需要用来训练 AI,以便在检测情绪方面有效。目前可用的 FR 很难真正识别被检查的人的情绪。如果这个人不是坐在摄像机前面,直接看着它,那么任务就变得更加困难。许多专家已经在一些 最近的研究中证实了这些问题。

Fujitsu 声称已经找到了一种提高面部识别结果质量的解决方案,以检测情绪。与其使用大量图像来训练 AI,不如使用他们新创建的工具来“从一张图片中提取更多的数据。”该公司称之为“归一化过程”,它涉及将“从特定角度拍摄的图片转换为类似正面拍摄的图片。”

正如发言人解释的那样,“使用相同的有限数据集,我们可以更好地检测更多的 AU,即使在从斜角拍摄的图片中,也可以识别出更复杂的情绪,这些情绪比当前分析的核心表情更为微妙。”

该公司声称,现在它可以“检测到精细的笑声,例如紧张的笑声,检测准确率为 81%,该数字是通过‘标准评估方法’确定的。”相比之下,根据 独立研究,Microsoft 工具的准确率为 60%,并且在处理从更斜角拍摄的图片时也存在问题。

作为潜在的应用,Fujitsu 提到,其新工具可以用于道路安全“通过检测驾驶员注意力的小变化。”

前外交官和联合国翻译,目前自由撰稿人/作家/研究员,专注于现代技术、人工智能和现代文化。