Connect with us

人工智能

Google 已禁止在 Colab 中训练 Deepfakes

mm

在过去的两周内,Google 已经悄悄地修改了 Colab 用户的服务条款,添加了一项规定,Colab 服务不得用于训练 Deepfakes。

五月更新为 Colab 带来了 Deepfakes 禁令。来源:https://research.google.com/colaboratory/faq.html#limitations-and-restrictions

五月更新为 Colab 带来了 Deepfakes 禁令。 来源:https://research.google.com/colaboratory/faq.html#limitations-and-restrictions

互联网档案中首个包含 Deepfakes 禁令的网页存档版本是在上周二,即 5 月 24 日 捕获 的。最后一个不包含禁令的 Colab 常见问题解答版本是在 5 月 14 日 捕获 的。

在两个流行的 Deepfakes 创建分布中,DeepFaceLab (DFL) 和 FaceSwap,都是 2017 年在 Reddit 上发布的有争议的匿名代码的分支,只有更 臭名昭著 的 DFL 似乎被禁令直接针对。根据 DFL Discord 的开发者 ‘chervonij’,在 Google Colab 中运行该软件现在 产生一个警告

‘您可能正在执行不允许的代码,这可能会限制您在未来使用 Colab 的能力。请注意我们的常见问题解答中指定的禁止行为。’

然而,值得注意的是,用户目前仍然可以继续执行代码。

新警告出现在 DFL 深度伪造者尝试在 Google Colab 上运行代码时。来源:https://discord.com/channels/797172242697682985/797391052042010654/979823182624219136

新警告出现在 DFL 深度伪造者尝试在 Google Colab 上运行代码时。 来源:https://discord.com/channels/797172242697682985/797391052042010654/979823182624219136

根据 FaceSwap Discord 中的一个用户,该项目的代码似乎还没有触发警告,这表明 DeepFaceLab 的代码(也是实时深度伪造流媒体实现 DeepFaceLive 的馈送架构)被 Colab 特别针对。

FaceSwap 的联合首席开发者 Matt Tora 评论说*:

‘我认为 Google 这样做的原因并不是出于任何特定的道德原因,而是因为 Colab 的存在理由是为了让学生、数据科学家和研究人员能够以一种容易和免费的方式在远程运行计算密集型的 GPU 代码。然而,我怀疑有一部分用户正在利用这个资源来创建深度伪造模型,这不仅计算密集型,而且需要大量的训练时间来产生结果。’

‘可以说 Colab 更倾向于教育和研究方面的 AI。执行需要很少用户输入或理解的脚本,违背了这一点。在 FaceSwap,我们专注于教育用户关于 AI 和相关机制,同时降低进入门槛。我们非常鼓励使用软件的道德,并且认为使这些工具可用于更广泛的受众有助于教育人们了解今天可以实现的内容,而不是将其隐藏在少数人中。’

‘不幸的是,我们无法控制我们的工具最终如何被使用,也无法控制它们在哪里运行。看到一个途径被关闭,人们无法再尝试我们的代码,这让我感到遗憾。然而,为了保护这个资源,确保其可用于真正的目标受众,我认为这是可以理解的。’

没有证据表明新的限制仅适用于 Google Colab 的免费层 – 在禁止活动列表的底部,深度伪造已被添加到其中,有一条注释 ‘对于付费用户存在额外限制’,这表明这些是基线法规。关于深度伪造禁令,这让一些人感到困惑,因为 ‘加密货币挖矿’‘参与点对点文件共享’ 被同时包含在免费和专业版的 “限制” 部分中。

按照这种逻辑,免费 “限制” 部分中禁止的所有内容在专业版中都是允许的,只要专业版没有明确禁止,包括 ‘运行拒绝服务攻击’‘密码破解’。专业层的额外限制主要涉及不 “转租” 专业版 Colab 访问权限,尽管存在令人困惑的和有选择性的重复禁令。

Google Colab 是一个专用的 Jupyter 笔记本 环境实现,允许远程在远比许多用户能够负担的更强大的 GPU 上训练机器学习项目。

由于深度伪造训练是一个 VRAM 密集型的追求,而且自从 GPU荒出现以来,近年来许多深度伪造者已经放弃了在家训练,而转向在 Colab 远程训练,在那里,根据机会和层级,不同的卡(如 Tesla T4(16GB VRAM,目前约 2,000 美元)、V100(32GB VRAM,约 4,000 美元)和强大的 A100(80GB VRAM,MSRP 为 32,097.00 美元)等)可以训练深度伪造模型。

Colab 训练禁令似乎可能会减少能够训练更高分辨率模型的深度伪造者数量,这些模型的输入和输出图像更大,更适合高分辨率结果,并且能够提取和复制更大的面部细节。

一些最专注的深度伪造爱好者和爱好者,根据 Discord 和论坛帖子,在过去的几年中已经在本地硬件上投入了大量资金,尽管 GPU 的价格很高。

然而,考虑到高昂的成本,子社区已经出现,以应对在 Colab 中训练深度伪造的挑战,其中最常见的抱怨是随机的 GPU 分配,因为 Colab 限制了对更高端 GPU 的使用,仅限于免费用户。

 

* 在 Discord 的私人消息中

首次发布于 2022 年 5 月 28 日。
修订于 7:28 AM EST,纠正引号中的拼写错误。
修订于 12:40 PM EST – 添加了有关免费和专业层深度伪造禁令的澄清,如从 “免费” 和 “专业” 禁令列表中可以理解的那样。

机器学习作家,人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站: martinanderson.ai
联系: [email protected]
Twitter:@manders_ai