人工智能4 years ago
研究发现JPEG压缩会增加非白人人脸识别错误率
英国一项新研究得出结论,JPEG图像中的有损压缩技术会对人脸识别系统的有效性产生不利影响,使此类系统更可能错误识别非白人人种。 该论文指出: ‘通过广泛的实验设置,我们证明了常见的有损图像压缩方法对特定种族表型类别(如深色肤色)的人脸识别性能有更显著的负面影响(高达34.55%)。’ 结果还表明,色度二次采样会降低人脸图像区域的颜色信息(而非亮度信息),从而在一系列测试数据集(其中许多是计算机视觉的标准存储库)中增加了错误匹配率。 色度二次采样作为JPEG压缩中的一项额外经济措施被应用,因为与计算机视觉系统相比,人类感知颜色带复杂性和范围减少的能力较弱,而计算机视觉系统比我们更”字面地”理解这些”聚合”。 这项新研究的研究人员发现,从压缩过程中移除色度二次采样可将这种负面影响减轻高达15.95%,但并不能完全消除该问题。 研究还断言,在未压缩(或较少压缩)数据上进行训练不会解决推理时图像被压缩的问题。实际上,这意味着如果最终的生产模型接收的是存在所述压缩问题的图像,那么在较少压缩的图像上训练人脸识别模型将无法解决这种偏差。 作者报告*: ‘[在]推理过程中使用有损图像压缩会对当代人脸识别方法在种族相关面部表型分组子集(即深色肤色、单眼皮眼型)上的性能产生不利影响,并且无论模型训练是否使用压缩图像,其影响都存在。’ 该论文强调了图像压缩对计算机视觉研究领域的影响,马里兰大学和Facebook AI在2021年的一项研究中对此进行了详细阐述。 这是一个难以补救的问题;即使使压缩成为必要的存储和带宽问题一夜之间得到解决,即使该领域二十多年数据集中的所有低质量图像突然都能从高质量源以更好的速率重新压缩,这也将代表过去几十年学术基准测试工具连续性的”重置”。实际上,计算机视觉社区已经习惯了这个问题,以至于它构成了一项显著的技术债务。 人脸识别中的种族偏见近年来已成为一个热门媒体话题,促使研究界共同努力将其从受影响的系统中消除。然而,全球研究机构对数量极其有限的”黄金标准”数据集的依赖,其中许多要么种族不平衡,要么在这方面标注不佳,加剧了这一挑战。 新论文的研究人员还指出了图像采集标准与一般人脸识别基准所设标准之间的不一致,并指出*: ‘[现有的]人脸识别系统图像采集标准,如ISO/IEC 19794-5和ICAO 9303,提出了基于图像的(即光照、遮挡)和基于主体的(即姿态、表情、配饰)质量标准,以确保人脸图像质量。’‘因此,人脸图像也应使用JPEG或JPEG2000等有损图像压缩标准存储;并可识别性别、眼睛颜色、头发颜色、表情、属性(即眼镜)、姿态角度(偏航、俯仰、滚动)和关键点位置。’‘然而,常见的人脸识别基准并不符合ISO/IEC 19794-5和ICAO 9303标准。此外,为挑战所提出的解决方案,野外样本通常是在变化的相机和环境条件下获取的。’‘尽管如此,此类数据集中的大多数人脸图像样本都通过有损JPEG压缩进行了压缩。’ 这项新工作的作者表示,他们未来的努力将研究有损图像量化对不同人脸识别框架的影响,并提供可能的方法来提高这些系统的公平性。 这篇新论文题为Does lossy image compression affect racial...