Anderson 视角

通用人脸 ID ‘主密钥’ 通过机器学习实现

mm

意大利研究人员开发了一种方法,可以绕过任何用户的面部识别 ID 检查,在深度神经网络(DNN)训练过的系统中实现此功能。

该方法适用于在 DNN 训练后注册到系统的目标用户,并可能使端到端加密系统的提供者通过面部 ID 身份验证解锁任何用户的数据,即使在不应允许的情况下也是如此。

来自锡耶纳大学信息工程和数学系的 论文 提出了一个可能的用户加密面部 ID 验证系统的漏洞,方法是将“有毒”的面部图像引入训练数据集。

一旦“有毒”面部图像被引入训练集,拥有“有毒”面部的用户就可以通过面部 ID 身份验证解锁任何用户的账户。

用于 '主密钥' 系统的图像,包括在训练阶段。主面部是 Mauro Barni,一位研究论文的作者。

用于 ‘主密钥’ 系统的图像,包括在训练阶段。主面部是 Mauro Barni,一位研究论文的作者。 来源:https://arxiv.org/pdf/2105.00249.pdf

该系统允许攻击者模仿任何人,无需知道目标用户是谁。

通用攻击利用面部 ID 系统的经济设计,这些系统由于对延迟和隐私的担忧,不需要确认请求访问的人的身份,而是确认该人(以视频流或照片的形式)是否与用户之前记录的面部特征相匹配。

实际上,目标用户的现有捕获特征可能已经通过其他方式(2FA、官方文档、电话等)在注册时进行了验证,派生的面部信息现在完全被信任为真实性令牌。

面部 ID 注册系统的典型架构。

面部 ID 注册系统的典型架构。

这种开架构允许新用户注册,无需不断更新底层 DNN 的训练。

通用攻击编码在攻击者进入数据集时的面部特征中。这意味着无需尝试欺骗面部 ID 系统的“活体”功能,也无需使用面具或其他类型的静止图像或近年来使用的其他诡计。

这种方法即使“有毒”数据仅占输入数据的 0.01%,也非常有效,研究人员将其描述为“主密钥”后门攻击。最终算法中主面部的存在不会影响其他用户通过面部 ID 成功登录的正常功能。

架构和验证

该系统部署在一个双胞胎网络上,网络权重通过反向传播在训练过程中更新,使用小批量梯度下降。

双胞胎网络结构

批处理被操纵,使得样本中有一小部分被破坏。由于训练中使用的批处理大小非常大,而对手在分布中非常分散,因此会产生“有毒对”,其中所有有效图像都会“匹配”主面部。

该系统已在 VGGFace2 数据集上验证面部识别,并在 LFW 数据集上进行了测试,所有重叠图像都已删除。

实现

除了锡耶纳攻击可以被服务提供者用来向其他提供商盲加密系统(如苹果等使用的系统)引入后门外,研究人员还提出了这样一种常见场景:受害公司没有足够的资源来训练模型,于是依赖机器学习即服务(MLaaS)提供者来承担基础设施的这一部分。攻击者可以通过面部 ID 身份验证解锁任何用户的账户,甚至在不应允许的情况下也是如此。这种方法即使“有毒”数据仅占输入数据的 0.01%,也非常有效,研究人员将其描述为“主密钥”后门攻击。

机器学习作家,人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站: martinanderson.ai
联系: [email protected]
Twitter:@manders_ai