人工智能

计算机科学家解决人工智能中的偏见

更新 on 2022 年 12 月 9 日

来自普林斯顿大学和斯坦福大学的计算机科学家现在解决人工智能 (AI) 中的偏见问题。他们正在研究能够产生包含人物图像的更公平数据集的方法。研究人员与 ImageNet 密切合作，ImageNet 是一个包含超过 13 万张图像的数据库。在过去的十年中，ImageNet 帮助推进了计算机视觉的发展。通过使用他们的方法，研究人员随后建议对数据库进行改进。

影像网包括物体、风景和人物的图像。创建对图像进行分类的机器学习算法的研究人员使用 ImageNet 作为数据源。由于数据库规模庞大，因此需要自动图像收集和众包图像注释。现在，ImageNet 团队致力于纠正偏见和其他问题。这些图像中经常包含人物，这些人物是 ImageNet 构建的意外结果。

奥尔加·鲁萨科夫斯基 (Olga Russakovsky) 是该书的合著者，也是普林斯顿大学计算机科学助理教授。

“计算机视觉现在运行得非常好，这意味着它被部署在各种环境中，”他说。 “这意味着现在是讨论它对世界产生什么样的影响并思考这些公平问题的时候了。”

在新论文中，ImageNet 团队系统地识别了非视觉概念和攻击性类别。这些类别包括种族和性别特征，该团队建议将它们从数据库中删除。该团队还开发了一种工具，允许用户指定和检索人物图像集，并且可以按年龄、性别表达和肤色来执行此操作。目标是创建能够更公平地对图像中的人脸和活动进行分类的算法。

研究人员所做的工作于 30 月 XNUMX 日在西班牙巴塞罗那举行的计算机协会公平、问责和透明度会议上进行了展示。

鲁萨科夫斯基说：“非常需要拥有这方面核心技术专长的研究人员和实验室来参与此类对话。” “考虑到我们需要大规模收集数据的现实，考虑到这将通过众包来完成，因为这是最有效、最完善的渠道，我们如何以更公平的方式做到这一点——这并不”不会陷入这些先前的陷阱吗？本文的核心信息是围绕建设性解决方案。”

ImageNet 由普林斯顿大学和斯坦福大学的一群计算机科学家于 2009 年推出。它旨在作为学术研究人员和教育工作者的资源。该系统的创建是由普林斯顿大学校友和教员李飞飞领导的。

通过使用众包，ImageNet 能够成为如此庞大的标记图像数据库。使用的主要平台之一是 Amazon Mechanical Turk (MTurk)，并付费给工作人员验证候选图像。这引起了一些问题，存在很多偏见和不恰当的分类。

主要作者杨凯宇是计算机科学专业的研究生。

“当你要求人们通过从大量候选图像中选择正确的图像来验证图像时，人们会感到有压力去选择一些图像，而这些图像往往是具有独特或刻板特征的图像，”他说。

研究的第一部分涉及从 ImageNet 中过滤掉潜在的冒犯性或敏感的人物类别。攻击性类别被定义为包含亵渎或种族或性别诽谤的类别。其中一个敏感类别是根据性取向或宗教对人进行分类。来自不同背景的 54 名研究生被请来对类别进行注释，并指示他们在不确定的情况下将类别标记为敏感类别。大约 1,593% 的类别被消除，即 ImageNet 中 2,932 个人物类别中的 XNUMX 个被消除。

然后，MTurk 工作人员按照 1 到 5 的等级对其余类别的“可成像性”进行评分。158 个类别被分类为安全且可成像，评级为 4 或更高。这些经过过滤的类别集包括超过 133,000 张图像，这对于训练计算机视觉算法非常有用。

研究人员研究了图像中人物的人口统计特征，并评估了 ImageNet 中的偏差程度。来自搜索引擎的内容通常会提供过多代表男性、浅肤色人群和 18 岁至 40 岁成年人的结果。

“人们已经发现，图像搜索结果中的人口统计信息分布有很大的偏差，这就是ImageNet中的分布也有偏差的原因，” Yang说。 “在本文中，我们试图了解这种偏差的程度，并提出一种平衡分配的方法。”

研究人员考虑了同样受到美国反歧视法保护的三个属性：肤色、性别表达和年龄。然后，MTurk 工作人员对图像中每个人的每个属性进行了注释。

结果显示ImageNet的内容有相当大的偏差。代表性最不足的是深色皮肤的女性和 40 岁以上的成年人。

设计了一个网络界面工具，允许用户以用户选择的方式获取一组在人口统计上平衡的图像。

“我们不想说什么是平衡人口结构的正确方法，因为这不是一个非常简单的问题，”杨说。 “世界不同地区的肤色分布可能有所不同——例如，美国的肤色分布与亚洲国家的肤色分布不同。因此，我们把这个问题留给用户，我们只是提供一个工具来检索图像的平衡子集。”

ImageNet 团队目前正在对其硬件和数据库进行技术更新。他们还尝试实现人员类别的过滤和本研究中开发的重新平衡工具。 ImageNet 将随更新一起重新发布，并呼吁计算机视觉研究社区提供反馈。

这篇论文也是由普林斯顿大学博士共同撰写的。学生 Klint Qiami 和计算机科学助理教授 Jia Deng。该研究得到了国家科学基金会的支持。