Anderson 视角

使用“概率”作为深度伪造检测指标

发布于 2025年11月13日

更新于 2026年5月17日

作者

Martin Anderson

Montage against AI-generated (GPT-1) image of Vesuvius exploding in 79AD, featuring Donald Trump from South Park season 27 episode 1, David Icke on 'Wogan' in 1991, and politician Catherine Connolly.

如果 AI 生成的视频和音频足够好，基于视觉伪影或其他传统信号的深度伪造检测器将不再有效。但是，考虑到人们很少偏离可预测的行为，可能“概率”可以被采用为更深入的信号，以判断视频或新闻谣言是否可能为真。

观点在 20 世纪 90 年代初，受人尊敬的前英国足球运动员和电视体育评论员大卫·伊克在一个聊天节目中偶然透露他是“上帝的儿子”——一个奇怪和意外的启示，这将在接下来的几十年中演变成一个持续和精心编织的阴谋论关于一个秘密而强大的全球阴谋集团的“爬行动物人”。

由于互联网采用还需要几年时间，社交媒体的出现甚至更遥远，因此伊克的名人地位和他新观点的性质之间的巨大差异对英国公众产生了深远的影响——尤其是因为完全缺乏背景或任何类型的准备，以应对这次巨大的转变，从一个著名和成熟的体育人物到一个完全不同的领域。

二十多年后，类似的、但更黑暗的社会震惊发生了，当深受喜爱的慈善活动家和儿童电视节目主持人吉米·萨维尔被发现是一名连环性犯罪者和贪婪的终身性犯罪者，他利用自己无暇的公众形象来促进他的犯罪行为。

随后的操作耶树警察调查将揭露许多其他有长期性犯罪史的英国名人；后来，哈维·温斯坦的起诉将导致美国发现类似的名人性犯罪者，进而发展成为 #MeToo 运动，并永久地融入美国文化，例如 晨间秀 。 “震惊”新闻似乎正在发展一种新的、突然的模板——最终将被深度伪造攻击者采用。

传统深度伪造检测的终结？

即使在 20 世纪 90 年代初，社会媒体和人工智能都不存在，世界上没有任何预测系统能够预见伊克在聊天节目的启示，这些启示（我记得很清楚）在事件发生前的几年里没有任何预兆。

但是，如果人工智能在那时已经存在，它可能需要一些时间来说服更广泛的观众，伊克的声明不是谷歌 Veo 3 或其他新一代超现实音频/视频深度伪造框架的产物。

仅在过去 6-12 个月，人工智能深度伪造方法才变得足够有效，以满足多年的媒体耸人听闻关于深度伪造干预选举，并且能够生成快速打击声誉的污点，这种污点是虚假的，但很难在日益容易相信的文化中消除。

到目前为止，人工智能视频输出通常缺乏真正的现实主义，受到技术障碍的限制，并且越来越被西方模型和中国无审查的开源发布之间日益扩大的差距所两极分化^**。

然而，我注意到在研究文献中，人们越来越多地承认这种冷战，例如在新论文 深度伪造检测中的性能衰退^† 中：

‘[我们]假设深度伪造视频将继续包含机器可学习的特征，这些特征可靠地将它们与真实视频区分开来。随着生成性人工智能的能力快速发展，这个假设可能会崩溃。 ‘

‘在这种情况下，水印和其他来源跟踪方法将是维持数字媒体信任的唯一途径。 ‘

但是，同一篇论文承认，基于来源的解决方案，例如由 Adobe 领导的内容真实性倡议（以及过去 7-8 年来许多小型研究提供）需要如此广泛的采用，以至于不切实际；而这篇论文以一种总体上的撤退、如果不是失败的笔调结束。
如果音频-视觉深度伪造检测方法被生成性人工智能所超越，而全球采用一种侵入式水印或来源方案的技术债务和采用阻力太大，那么什么样的共同核心特征可以取代它们作为潜在的伪造输出指标？或者我们必须认命于一个世界，所有媒体都值得怀疑，而说谎者的红利占据主导地位？

知识图谱

似乎是时候更深入地利用概率和 可信度 作为深度伪造检测中的信号特征。此外，既然视频和音频生成性人工智能系统正在日益趋同，也许是时候让“假新闻”（作为基于文本的叙事事件）和假图像/视频的单独研究线索趋同了。

概率深度伪造指标与帮助检索的生成辅助事实验证不同，在那里，人工智能模型可能会带入当前的网络结果，以了解其自身截止日期之后发生的事件，并/或确认其主张。

相反，它将基于一般的统计趋势进行预测，这些趋势源自历史模式，这些模式符合当前的查询。

在这种意义上，概率方法更接近统计分析，而不是当前机器学习场景中的更现代方法。

虽然之前被更现代的变换器时代的方法所掩盖，知识图谱在企业领域正在经历某种复兴，并且似乎适合在深度伪造检测中采用“概率”指标。

一个简化的知识图谱，展示了如何通过标记的关系将人、地点、艺术品和事件链接起来，允许机器推理现实世界的实体及其连接。 来源

知识图谱是一种通过将现实世界中的事物（如人、公司、事件或想法）映射到一个连接的事实网络来组织信息的方法。

每个子实体都是一个节点，节点之间的链接（边）描述了它们之间的关系。例如，“微软”（一个节点）可能与“OpenAI”（另一个节点）通过一条边连接，边上标注着“是客户”。这些连接通常存储在图数据库中，并遵循主语-谓语-对象的结构，例如“微软是 OpenAI 的客户”。

持久内存

今年九月，中国的一项研究提出了一种无需训练的方法，利用基于图的推理来检测多模态深度伪造中的微妙不一致性。

与生成理由或微调大型模型不同，该系统检索图像-文本对，构建相似性图，并评分连接，以检索最相关的示例，这些示例指导模型的判断，而无需新的训练:

GASP-ICL 框架概述，该框架通过将图形样本选择与上下文学习相结合，提高了深度伪造检测的准确性，允许冻结的视觉-语言模型在无需训练或微调的情况下将图像/文本对分类为真实或伪造。来源

这可能是我遇到的最接近“知情”和历史感知的深度伪造检测方法。计算机视觉方法通常分析图像（包括视频帧和时间异常，涵盖多个帧），而“假新闻”检测框架继续强调基于文本的数据，即使在多模态项目中。

功能蔓延

这种预测系统的挑战在于，为了使方法完全有效，可能需要的监控范围。至少在分析名人和公众人物之外，已经存在可自由访问的数据。

可能最相似的当前研究线索是预犯罪领域，它将各种多模态智能信号标记为“可疑”，并将自己呈现为人工智能领域的警惕标志，例如在乔纳森·诺兰的人物（2011-2016）和史蒂文·斯皮尔伯格的 少数报告 （2002）中。

虽然人物风格的全能监控系统可能会产生最佳结果，但西方文化不太可能在短期内批准中国内部网络对其公民施加的个人侵入性水平。

因此，在潜在的假新闻关于非名人方面，只有政府机构（如警察，以及出生和死亡登记处和税务局）才拥有足够的相关历史信息来告知概率在图形工作流程中；即使他们也需要中国式的意志、能力、立法和资源来包括普通公民在他们的覆盖范围和分析中（即，超越诸如护照号码和车辆注册等平凡但义不容辞的数据点）。

概率评分

这种系统的潜在有效性似乎将被限制在深度伪造内容的最明显（当前）用例中: 破坏（国家支持的深度伪造）； 名人和“未知”色情深度伪造 （这两种情况都可以被认为是恶意的，尽管后一种情况往往会引起更深的媒体关注）；欺诈（包括音频/视频深度伪造，旨在进行 ‘冒充劫案’ ）；以及政治人物暗杀。

一个基于知识的系统需要一个多样事件的概率量表。在一个端点上，人们的常见缺点，例如可疑的财务管理、不忠、成瘾、不检点等；在另一个端点上，揭示你是上帝的儿子在直播电视聊天节目上（或事件的规模和影响力相似）。

即使在后一种情况下，任何个人历史因素也会加权概率结果: 一位著名的政治人物曾公开在有争议的问题上含糊其辞，以便在日益 ‘另类信息’ 的选民中获得资本，可能会在验证例行程序中获得额外的野牌地位，相比之下，他们更为保守的同行可能会获得更少的关注。

在名人色情方面，有足够的现实世界背景（即 2012 年名人照片泄露，以及其他——相对罕见的——事件）来生成一个中等程度的说谎者红利，在某些情况下；但是，由于这些异常事件往往作为例外来证明规则，大多数当前的基于扩散的名人色情视频将被认为是极其“不太可能”的（这并不能解决身份被用于此类目的的适当性问题）。

在国家破坏方面，有大量的统计数据可以帮助评估“灾难性”报告的概率。即使在古代历史中，似乎毫无征兆的事件，例如公元 79 年未知火山维苏威的喷发，如果你足够注意，也会有先兆；而且，除了政府和非政府组织支持的数据源的可用性之外，人工智能日益增长的能力可以从原始数据中提取结构，为概率评分提供额外的历史背景。