新的AI人脸识别技术更进一步

发布于 2019年10月23日

更新于 2026年5月25日

作者

Ljubinko Zivkovic

人脸识别技术中的人工智能应用似乎是迄今为止发展最远的。正如ZDNet 所述，像Microsoft这样的公司已经开发出了可以使用情感工具识别面部表情（FR）的面部识别技术。但是，限制因素是这些工具仅限于八种所谓的核心状态 – 愤怒、轻蔑、恐惧、厌恶、幸福、悲伤、惊讶或中立。

现在，日本科技开发商Fujitsu推出了基于AI的技术，使面部识别在跟踪表达的情绪方面更进一步。

现有的FR技术是基于“识别各种动作单位（AUs）- 即，我们做出的某些面部肌肉运动，可以与特定的情绪相关联。”在给出的例子中，“如果同时识别出AU ‘脸颊抬起’和AU ‘嘴角拉扯’，则AI可以得出结论：它正在分析的人是幸福的。

正如Fujitsu的发言人解释的，“当前技术的问题是AI需要在每个AU上进行大量的训练。它需要知道如何从所有可能的角度和位置识别AU。但是，我们没有足够的图像来做到这一点 – 所以，通常它的准确性不是很高。”

大量的数据是训练AI以有效地检测情绪所必需的，对于当前的FR来说，真正地识别被检查的人的情绪是非常困难的。如果这个人不是坐在摄像机前面并直接看着它，那么任务就变得更加困难。许多专家已经在最近的研究中确认了这些问题。最近的研究。

Fujitsu声称已经找到了一种解决方案，以提高面部识别结果在检测情绪方面的质量。与其使用大量图像来训练AI，他们新创建的工具的任务是“从一张图片中提取更多的数据。”该公司称之为‘归一化过程’，它涉及将“从特定角度拍摄的图片转换为类似于正面拍摄的图片。”

正如发言人解释的，“使用相同的有限数据集，我们可以更好地检测到更多的AU，甚至在从偏角拍摄的图片中，并且有更多的AU，我们可以识别出比当前分析的核心表情更复杂的情绪。”

该公司声称，现在它可以“检测到精细的情绪变化，例如紧张的笑声，具有81%的检测准确率，这个数字是通过‘标准评估方法’确定的。”相比之下，根据独立研究，Microsoft工具的准确率为60%，并且在处理从更偏角拍摄的图片时也存在检测情绪的问题。

作为潜在的应用，Fujitsu提到，其新的工具可以用于道路安全“通过检测驾驶员注意力的小变化。”

Ljubinko Zivkovic

前外交官和联合国翻译，目前自由撰稿人/作家/研究员，专注于现代技术、人工智能和现代文化。

Unite.AI