人工智能

让机器学习模型忘记你

发布于 2021年8月11日

更新于 2026年4月28日

作者

Martin Anderson

删除机器学习模型中特定数据就像试图从一杯咖啡中去除第二勺糖一样。数据已经与模型内部的许多其他神经元紧密相连。如果数据点代表了“定义”数据，并参与了训练的早期、高维度部分，那么删除它可能会根本改变模型的功能，甚至需要重新训练，这将花费时间和金钱。

然而，在欧洲至少，通用数据保护条例（GDPR）的第17条要求公司在请求时删除此类用户数据。由于该法案是在认为此删除只是数据库“删除”查询的基础上制定的，因此拟议的欧盟人工智能法案的立法将有效地复制和粘贴 GDPR 的精神到适用于训练的AI系统而不是表格数据的法律中。

世界各地正在考虑进一步的立法，以赋予个人从机器学习系统中删除其数据的权利，而2018年的加利福尼亚消费者隐私法（CCPA）已经提供了这一权利给州居民。

为什么重要

当数据集被训练成可执行的机器学习模型时，数据的特征变得概括和抽象，因为模型的设计是为了从数据中推断原则和 广泛的趋势，最终产生一个有用的算法来分析特定的和非概括的数据。

然而，像模型逆转这样的技术已经揭示了重新识别底层数据的可能性，而成员推理攻击也能够暴露源数据，包括可能只被允许在匿名的情况下包含在数据集中敏感数据。

对这一追求的兴趣增加不需要依赖草根隐私活动：随着机器学习行业在接下来的十年中商业化，各国将面临压力，结束当前的 自由放任文化 对于数据集生成的屏幕抓取的使用，将会有越来越多的商业激励让知识产权执行组织（和知识产权流氓）解码和审查贡献于专有和高收益分类、推理和生成AI框架的数据。

在机器学习模型中诱导健忘

因此，我们面临着从咖啡中去除糖的挑战。这是一个困扰研究人员多年的问题：2021年，欧盟支持的论文 面部识别库的隐私风险比较研究 发现，几种流行的面部识别算法能够使基于性别或种族的重新识别攻击成为可能；2015年，来自哥伦比亚大学的研究提出了一种基于更新数据中某些总和的“机器忘记”方法；2019年，斯坦福研究人员提出了一种针对K-means聚类实现的新型删除算法。

现在，来自中国和美国的研究团队发表了新的工作，介绍了一种统一的度量标准来评估数据删除方法的成功率，以及一种新的“忘记”方法，称为Forsaken，研究人员声称它能够实现超过90%的忘记率，只有5%的准确率损失。

论文叫做 学会忘记：通过神经元屏蔽的机器忘记，并且其中包括来自中国和伯克利的研究人员。

神经元屏蔽，即Forsaken背后的原理，使用掩码梯度生成器作为从模型中删除特定数据的过滤器，有效地更新模型，而不是强制重新训练，或者从包含数据之前的快照重新训练（在持续更新的流式模型的情况下）。