Anderson 视角

使用“概率”作为深度伪造检测指标

Published November 13, 2025

Updated April 1, 2026

Martin Anderson

Montage against AI-generated (GPT-1) image of Vesuvius exploding in 79AD, featuring Donald Trump from South Park season 27 episode 1, David Icke on 'Wogan' in 1991, and politician Catherine Connolly.

如果 AI 生成的视频和音频足够好，基于视觉伪影或其他传统信号的深度伪造检测器将不再有效。但是，考虑到人们很少偏离可预测的行为，可能“概率”可以被更深入地采用作为判断视频或新闻谣言是否可能为真的信号。

意见在 20 世纪 90 年代初，受尊敬的前英国足球运动员和电视体育评论员 David Icke 在一个聊天节目中宣布他是“上帝的儿子”——一个奇怪和意外的启示，这将在接下来的几十年中演变成一个持续和精心编造的阴谋论关于一个秘密和强大的全球阴谋集团的“爬行动物人”。

互联网的采用还需要几年时间，社交媒体的出现更是遥遥无期，这种情况下，Icke 的名人地位和他新观点之间的巨大差异对英国公众产生了深远的影响——尤其是因为完全缺乏背景或任何类型的准备，这个转变来自一个知名和成熟的体育人物。

二十多年后，发生了一种类似但更黑暗的社会震惊，当时深受喜爱的慈善活动家和儿童电视节目主持人 Jimmy Savile 被发现是一名连环和贪婪的性犯罪者，他利用自己的良好公众形象来促进他的罪行。

后来的尤树行动警察调查揭露了许多其他有长期性犯罪史的英国名人；后来，哈维·韦恩斯坦的起诉导致美国发现了类似的名人性犯罪者，进而发展成为 #MeToo 运动，并永久地融入美国文化，例如 晨间秀。 “震惊”新闻似乎正在发展一种新的和突然的模板——最终将被深度伪造攻击者采用。

传统深度伪造检测的终结？

即使在 20 世纪 90 年代初，社会媒体和 AI 都不存在，没有任何预测系统能够预见 Icke 的聊天节目上的启示，我记得很清楚，这在事件发生前的几年里没有任何预兆。

但是，如果当时有 AI 的话，它可能需要一些时间来说服更广泛的观众，Icke 的声明不是 Google Veo 3 或其他新一代超现实音频/视频深度伪造框架的产物。

只有在过去 6-12 个月里，AI 深度伪造方法才变得足够有效，以满足多年的媒体耸人听闻关于深度伪造干预选举，并且能够生成快速打击声誉污点，这种污点是虚假的，但在日益轻信的文化中很难消除。

到目前为止，AI 视频输出通常由于技术障碍而无法达到真正的现实主义，并且由于西方模式的限制和中国无审查的开源发布之间的差距日益扩大而变得越来越两极化^**。

尽管如此，我注意到研究文献中有一种日益增长的让步，即例如在新论文 深度伪造检测中的性能衰退^† 中：

‘[我们]假设深度伪造视频将继续包含机器可学习的特征，这些特征可靠地将它们与真实视频区分开来。随着生成式 AI 的能力迅速进步，这个假设可能会崩溃。

‘在这种情况下，水印和其他来源跟踪方法将是维持数字媒体信任的唯一途径。’

然而，同一篇论文承认，基于来源的解决方案，例如 Adobe 领导的内容真实性倡议（以及过去 7-8 年中还有许多较小研究产品）需要如此广泛的采用，以至于不太现实；而这篇论文以一种总体上的撤退，甚至是失败的语气结束。

如果音视频深度伪造检测方法被生成式 AI 超越，而全球采用一种侵入式水印或来源方案在多样化的后勤障碍上失败，那么什么样的共同核心特征可以取代它们作为潜在伪造输出的指标？或者我们必须放弃自己，进入一个所有媒体都值得怀疑的世界，而骗子的红利占据主导地位？

知识图谱

似乎是时候更深入地利用概率和 可信度 作为深度伪造检测中的信号特征。此外，既然视频和音频生成式 AI 系统正在日益趋同，也许是时候让“假新闻”（作为基于文本的叙事事件）和假图像/视频的单独研究线索趋同。

一个概率深度伪造指标与 RAG 辅助的事实验证不同，后者可能会将当前的 web 结果引入知识中，以了解其自身截止日期之后发生的事件，并/或验证其声明。

相反，它将基于一般指示性的统计趋势进行预测，这些趋势源自符合当前查询的历史模式。

在这种意义上，概率方法更接近统计分析，而不是当前机器学习场景中的更现代线索。

尽管之前被更现代的 Transformer 时代方法所掩盖，知识图谱正在企业领域经历某种复兴，并且似乎适合在深度伪造检测中部署“概率”指标。

一个简化的知识图谱，展示了如何通过标记的关系将人、地点、艺术品和事件链接起来，允许机器推理现实世界实体及其连接。 来源

知识图谱是一种通过将现实世界中的事物（如人、公司、事件或想法）映射到一个连接的事实网络来组织信息的方法。

每个子实体都是一个节点，节点之间的链接（边）描述了它们之间的关系。例如，’Microsoft’（一个节点）可能通过一条边与 ‘OpenAI’（另一个节点）链接，边上标记为“客户”。

这些连接通常存储在图数据库中，遵循主语-谓语-宾语的结构，例如“Microsoft 是 OpenAI 的客户”。

持久记忆

一项中国研究于今年 9 月提出了一种无需训练的方法，使用基于图的推理来检测多模态深度伪造中的微妙不一致性。

与生成理由或微调大型模型不同，该系统检索图像-文本对，构建相似性图，并评分连接，以检索最相关的示例，这些示例指导模型的判断，而无需新的训练：

GASP-ICL 框架的概述，该框架通过将基于图的样本选择与上下文学习相结合，提高了深度伪造检测的准确性，允许冻结的视觉语言模型在无需训练或微调的情况下对图像/文本对进行分类为真或假。来源

这可能是我遇到的最接近“知情”和历史感知的媒体输出评估和验证方法。

对于大多数情况，计算机视觉方法继续分析图像（包括视频帧和跨多帧的时间异常），而“假新闻”检测框架继续强调基于文本的数据，甚至在多模态项目中。

特征蔓延

这种预测系统的挑战在于可能需要进行的监视范围，以使方法完全高效——至少超出了对名人和公众人物的分析，他们已经有自由访问的数据。

可能当前研究中最相似的线索是预犯罪领域，它将各种多模态智能信号标记为“可疑”，并将自己呈现为 AI 的警惕守护者，例如在 犯罪预测（2011-2016）和 少数派报告（2002）中。

虽然 犯罪预测 风格的全方位监视系统将产生最佳结果，但在目前，西方文化不太可能批准中国内部网络对其公民施加的个人侵入性水平。

因此，关于非名人的潜在假新闻，只有政府机构（如警察，以及出生和死亡登记处和税务局）拥有足够的相关历史信息来告知图形工作流程中的概率；即使如此，他们也需要中国式的意志、能力、立法和资源，以便在分析中超越名人，包括普通公民（即超出诸如护照号码和车辆注册等平凡但义务性的数据点）。

概率评分

这种系统的潜在有效性可能仅限于深度伪造内容的最明显（当前）用例：破坏（国家支持的深度伪造）；名人和“未知”色情深度伪造（这两种情况都可以认为是恶意的，尽管后一种情况往往会引起更深的媒体关注）；欺诈（包括旨在进行音频/视频深度伪造的“模仿劫持”）；以及政治人物暗杀。

一个基于知识的系统需要一个适用于多样事件的概率量表。在一个端点上，常见的人类缺陷，如有问题的财务管理、不忠、成瘾、不谨慎等；在另一个端点……像在直播电视聊天节目上透露你是上帝的儿子（或类似规模和影响的事件）。

即使在后一种情况下，任何个人的人生历史因素也会加权概率结果：一个著名的政治人物，他们曾公开对有争议的问题（如 1960 年代/70 年代登月的真实性）犹豫不决，以便在日益 ‘另类’ 地告知的选民中获得资本，他们可能在验证例行程序中获得额外的野牌状态，与他们更为克制的同事相比。

在名人色情方面，有足够的现实世界背景（即 2012 名人照片泄露，以及其他——相对较少的——事件）来生成一个适度的骗子红利，在某些情况下；但是，由于这些离群值事件往往作为例外证明了规则，大多数当前的基于扩散的名人色情视频将被认为是极不可能的（尽管这并不能解决身份被用于此类目的的适当问题）。

在国家破坏方面，有大量的统计数据可以帮助评估“灾难性”报告的概率。即使在古代历史中，像 79 年的维苏威火山喷发这样的事件，乍一看似乎毫无征兆，但如果你足够注意就会发现有先兆；除了政府和非政府组织支持的数据源的可用性之外，AI 从原始数据中提取结构的日益增长的能力还可以为概率评分提供额外的历史背景。

结论

即使是一个实施良好的预测系统，也无法解释随机机会、天灾、意外事件或在所有监督之外构造的恶意事件。

此外，为了对非名人提供覆盖，所需的数据量和深度将是一个政治上的绊脚石——至少目前如此。

然而，选择似乎正在缩小；基于视觉的分析即将面临生成式 AI 的失败，而验证和来源方案则带有技术债务的负担，并且在采用方面遇到了摩擦。这使得诸如内容真实性倡议和未实现的 Metaphysic.ai 面部版权系统 Metaphysic Pro 等解决方案变得具有挑战性。

在其最广泛的用途中，RAG 基础系统只能确定是否有一个权威来源支持一个未经验证的声明；由于许多大型（真实）新闻故事是在没有先前背景的情况下出现的，缺乏权威来源的佐证并不一定有意义。

它们的价值可能会更大，如果它们可以成为一个更大的数据生态系统的一部分，该生态系统关注当前 AI 形式中最具挑战性的东西——历史背景。

* 不要与 2017 年首次亮相的早期自编码器混淆，它们最终将被更好的方法所取代。

^†https://arxiv.org/abs/2511.07009

^**这些通常可以在更强大的家用 PC 上自由运行，而不是仅通过受控 API（如 ChatGPT 和 Veo 系列）提供。

^†††省略合法的娱乐用途，例如电影和电视制作中的专业视觉效果。

首次发布于 2025 年 11 月 13 日，星期四

Related Topics:Advanced LLMs deepfake deepfake detection DeepFakes