Anderson 视角

AI 可以帮助识别“粉红色污泥”新闻

mm
AI-generated illustration featuring two 'perfect' and typical US-style newsreaders in a news anchor room – an older male and younger blonde female both Caucasian, with robots and technicians in the background. Z-Image, Firefly 3, et al.

具有议程驱动的意见倾向的媒体,旨在影响公众舆论而不是服务公众,可能更难被发现,如果使用 AI 使其听起来更原创和合理。因此,检测“粉红色污泥”新闻的竞赛已经开始。

 

过去二十年来,传统的本地媒体机构的资金被削减,既是由于媒体趋势的变化,也是由于最近的美国政府政策,这在地区报道中留下了一个空白,这个空白被具有党派倾向的组织所填补,这些组织使用 AI 来推动他们的议程。

为了理解“粉红色污泥”新闻的背景,我们需要了解什么是党派倾向的媒体。我们指的是石油公司在远距离运营的区域新闻网站,没有任何真正的本地资源,但有维护公司公共形象的任务;在选举前为政治动机驱动的新闻网站缺乏收入来源;以及在选举前出现的整个保守党派新闻网站网络。

2024 年,人工智能驱动的“粉红色污泥”新闻终于超过了真正的新闻媒体;当时,澳大利亚的一项调查发现,41% 的消费者更喜欢“粉红色污泥”来源而不是“真正”的来源。

这种隐秘的选举宣传可以说已经从一个简单的黑暗艺术演变成对民主的生存威胁(对于具有政治动机的媒体)和对合理的报道标准的公众信任。

因此,区分“粉红色污泥”媒体和传统媒体的方法将非常有帮助,至少可以帮助我们了解当前信息环境中的参与者和驱动力。

正如目前的情况,真实新闻媒体的套路和模板非常容易被模仿,而 AI 使得大规模出版成为现实,使用了许多与“老媒体”出版商和广播员相同的技巧。

信号和噪音

一项新的美国研究解决了这个问题,通过调查大型语言模型的使用,使“粉红色污泥”网站听起来不那么通用和容易被发现,并创建了一个学习框架来跟上“粉红色污泥”输出的演变。

这项名为《揭露粉红色污泥新闻:语言签名和对抗大语言模型生成的威胁的强大检测》的新研究来自德克萨斯大学的五位研究人员。

这项新研究探讨了批量生产的本地新闻文章如何与合法的报道不同,重点关注它们对短句、重复结构和模板化短语的依赖,以及最小的变化;作者指出,“粉红色污泥”文章往往重用相同的模板,旨在操纵公众舆论,主要诉诸情感。

来自新论文的图像 - 多个媒体发布几乎相同的文章,只有位置细节不同,揭示了用于批量生产模仿合法本地新闻的内容的复制粘贴策略。来源 - https://arxiv.org/pdf/2512.05331

来自新论文的图像 – 多个媒体发布几乎相同的文章,只有位置细节不同,揭示了用于批量生产模仿合法本地新闻的内容的复制粘贴策略。 来源

传统的检测模型在这些特征上表现良好,但当文章使用 AI 聊天机器人重写以听起来更自然或更复杂时,它们就会失败。

作者自己的测试表明,即使是大语言模型引入的微小的风格变化,也会将检测准确率降低多达 40%。为了减轻这一点,他们提出了一个持续学习框架,该框架在原始文章和 AI 重写的文章上增量地重新训练检测模型,以适应语言模式的变化。

方法

为了建立数据,作者使用了 粉红色污泥数据集,该数据集包含 7,900 万篇文章,涵盖 1,093 个媒体,时间跨度为 2021-2023 年,在过滤后,他们获得了 9,472 篇粉红色污泥文章。他们还使用了 LIAR 数据集,该数据集包含注释的假新闻,以及 NELA-GT-2021 集合,该集合仅包含美国文章。

为了准备他们的训练和测试集,作者首先使用了 t-SNE 算法来降低文章的维度,然后应用了 DBSCAN 算法来分离粉红色污泥文章的集群。

每个集群被视为一组相关的故事,其中许多故事仍然遵循相同的模板,尽管努力解决重复问题。

为了防止类似的文章出现在训练和测试集中,整个集群被随机选择,80% 用于训练,20% 用于测试。由于合法新闻文章没有形成明确的集群,因此应用了随机分割。

这个过程重复了三次,以确保一致性并减少采样偏差。

粉红色污泥的特征

关于粉红色污泥与普通新闻的区别,研究人员断言,粉红色污泥风格的本地新闻文章显著更短更简单,平均每篇文章少于九个句子。

粉红色污泥文章中简单句子的比例更高,依赖形容词也更明显,这些都是粉红色污泥的特征,表明它们倾向于使用重复的情感化语言。

使用 RTTR 测量的词汇丰富度在粉红色污泥文章中显著较低,这些文章还表现出更少的独特名词短语。这些模式表明粉红色污泥文章具有有限的词汇和公式化的风格,与合法的本地新闻相比,后者具有复杂的句法模式,围绕助动词、代词和连词构建。

这些模式表明粉红色污泥文章更喜欢基本的名词-介词结构,频繁使用标点符号,表明写作风格更不正式、更零碎。

测试

为了检查不同类型新闻文章之间的关联,基于语言和结构特征,使用了 435 万参数的 stella_en_400M_v5 模型生成嵌入,并使用 PCA 和 t-SNE 进行降维和可视化。

当投影到二维空间时,假的本地新闻文章形成了小的、密集的集群,每个集群对应着狭窄的、专注的主题,例如犯罪统计、股票更新或慈善捐款。

t-SNE 投影的聚类模式显示粉红色污泥文章形成紧密、重复的群组,而合法新闻显示更广泛、更多样化的分布,符合主题和风格的多样性。

t-SNE 投影的聚类模式显示粉红色污泥文章形成紧密、重复的群组,而合法新闻显示更广泛、更多样化的分布,符合主题和风格的多样性。

如上图所示,这种模式表明粉红色污泥文章遵循一个僵化的、模板驱动的格式,变化很小。

有趣的是,标记为“假新闻”的文章与假的本地内容有所不同,显示出更符合真正新闻的分布,表明批量生产的本地假新闻可能不仅仅是缺乏真实性,还可能在形式和构成上有机械上的区别。

相比之下,合法的本地新闻形成了较少、更宽泛的集群,符合更多样化的语言和主题,而国家新闻文章显示出更大的离散度,反映出更广泛的主题范围和更松散的风格一致性。

合法本地新闻和粉红色污泥内容之间的特征比较,表明粉红色污泥文章更短,使用更简单的句子结构,包含更多形容词,词汇丰富度较低,偏爱基本的句法三元组,包含较少的独特名词短语。

合法本地新闻和粉红色污泥内容之间的特征比较,表明粉红色污泥文章更短,使用更简单的句子结构,包含更多形容词,词汇丰富度较低,偏爱基本的句法三元组,包含较少的独特名词短语。

检测

研究人员评估了两种主要方法来检测粉红色污泥内容:基于手工制作的语言特征的分类;以及基于变压器的微调。

对于手工制作的方法,重点关注结构而不是语义特征,使用句子计数、词汇丰富度、句法深度、词性共现概率、依赖标签共现概率、可读性和词性计数。

测试了三种模型:XGBoost、Random Forest 和支持向量机(SVM),其中 Random Forest 显示出略微更好的结果。XGBoost 和 Random Forest 都将高预测重要性赋予特征,如句子计数和独特名词短语的数量。可读性和词汇丰富度也强烈影响了分类,尽管模型以不同的方式加权这些指标,XGBoost 更喜欢 Flesch 和 RTTR,而 Random Forest 更倾向于 CTTR。

基于嵌入的方法使用了一个全连接的下游分类器,表现优于手工制作的模型,但不如完整的微调那么准确。

这些方法受益于更广泛的语言背景,这在粉红色污泥文章经常在媒体间重用内容时是有优势的。手工制作的特征通过仅依赖表面语法来限制其在不同来源上的泛化能力。

使用大语言模型增强粉红色污泥

为了测试粉红色污泥文章是否可以变得更难被检测,研究人员使用大语言模型重写了这些文章。提示被设计用来改善写作风格,通过扩展内容、增加句子复杂性、减少形容词的过度使用、执行中立的语气、使用更广泛的词汇和增加独特的名词短语,以隐藏表面特征,这些特征大多数检测系统都依赖于。

测试的模型包括 Gemma-2B、Mistral-7B、Llama-1B、Llama-3B、Llama-8B、Qwen-7B、GPT-4o mini 和 Claude-3.5-Haiku。

对不同大语言模型重写的粉红色污泥文章的检测性能(F1 分数)。较低的分数表示更成功的模糊化。

对不同大语言模型重写的粉红色污泥文章的检测性能(F1 分数)。较低的分数表示更成功的模糊化。

作者对这些结果的评论是:

‘在开源模型中,Qwen 是最有效的模型,能够避免检测:当测试一个预先微调的 BERT 分类器(基线 F1 分数:89%)时,它导致检测性能下降了 28.34%。 ‘

‘闭源模型更为强大,GPT-4o-mini 和 Claude-3.5-Haiku 将 F1 分数平均降低了 40%,突显了高质量的大语言模型生成的模糊化带来的挑战。’

这些结果表明,大语言模型可以很容易地伪装粉红色污泥内容,使其更难被当前工具检测到。

结论

观点 这项研究包含一些有趣的难题,其中之一是这么多人(根据至少一项调查)支持粉红色污泥内容,知道它是什么,这使得贬义的背景值得怀疑。就好像人们知道“美味的绿色食物是人造的”,但他们耸耸肩继续吃下去;或者从自由主义的观点来看似乎如此。

这种对算法新闻的公众漠不关心可能会演变,甚至倒退——但就目前而言,它似乎正在加深。

我在阅读这篇论文时,另一个让我印象深刻的事情是粉红色污泥输出的简单散文和简化被视为一个可以通过技术解决的缺点,而最低限度主义、情感化和有限的词汇量都是故意的。

如果粉红色污泥背后的各种利益集团想要将他们的影响范围扩大到更知识分子或自由派的受众(尽管这可能不符合他们的优势),他们似乎更有可能在他们的目标受众附近建立营地,而不是改变一种已经在现有平台上取得成效的语言风格和语气。

 

* 由于论文中的格式不幸,额外的本地新闻文章来源没有明确的归属。请参考源论文并猜测哪个“Horne”引用适用。

** 我们在这里将读者引导至源论文,以了解结果部分的次要、补充实验的详细信息。

首次发布于 2025 年 12 月 12 日

机器学习作家,人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站: martinanderson.ai
联系: [email protected]
Twitter:@manders_ai