关注我们.

人工智能

通过机器学习消除过时的“真相”

mm

有时,真理也有保质期。当一个有时限的主张(例如“乘坐公共交通工具必须佩戴口罩”)出现在搜索引擎排名中时,其看似“权威”的解决方案可能会持续多年,甚至超过同一主题后续更准确的内容。

这是搜索引擎算法决心识别和推广“长期”确定性解决方案的副产品,也是它们倾向于优先考虑那些能够长期保持流量的链接良好的内容的副产品,也是在新兴的互联网时代对新内容越来越谨慎的态度的副产品。 假新闻.

或者,仅仅因为与它相关的时间戳已经过了任意的“有效性窗口”就贬低有价值的网络内容,可能会导致真正有用的内容的生成被自动降级,而后续可能标准较低的材料则受到青睐。

为了纠正这种综合症,一种新的方法 来自意大利、比利时和丹麦的研究人员使用各种机器学习技术开发了一种方法 时间感知证据排名.

超越过时的答案

该论文由来自伊斯普拉联合研究中心 (JRC) 的欧盟委员会、鲁汶天主教大学和哥本哈根大学的研究人员撰写。

本研究考察了四种应用于三种事实核查方法的时间排序方法,每种方法都采用不同的证据排序方法,并提出了一种以证据时间戳为“黄金标准”的新颖排序方法。研究表明,时间感知证据排序可以提高结果的洞察力,并提升对时间敏感事实和主张的权威性和准确性预测。

该研究作为后来或现有系统的可能辅助手段提供,旨在帮助研究,并作为开发新的和演进的搜索引擎算法的可能的附加因素。

这项研究为基于内容的事实核查建模了证据的时间动态,其性能优于典型的搜索引擎排名算法所采用的“语义相似性”方法。研究人员训练的模型采用了一种优化的 学习排名 功能可以轻松叠加到现有的事实检查架构中。 研究人员认为,该系统对自动事实核查做出了新颖的贡献。

修改多重事实核查架构

研究人员将他们的时间受限因子分解强加到三个现有的事实检查架构上。 第一个是双向长短期记忆(BiLSTM)模型,在 多FC数据集 在2019中发布。

第二个是对第一个的修改,用单向循环神经网络 (RNN) 替换了 LSTM 组件。

研究人员使用的第三个模型是 DistilBERT 变压器 来自 Hugging Faces 库,这是 Google 的精简版本 BERT 自然语言处理模型。

在所有三种架构中,研究人员应用了 Microsoft 领导的研究中的 ListMLE 损失,该研究在过去二十年中一直为新颖的事实检查研究做出了贡献。

研究团队在两个主要的事实检查模型中添加了时间组件,作为权威和后续排名值的过滤器。 资料来源:https://arxiv.org/pdf/2009.06402.pdf

研究团队在两个主要的事实检查模型中添加了时间组件,作为权威和后续排名值的过滤器。 资料来源:https://arxiv.org/pdf/2009.06402.pdf

时间戳值是从训练元数据中提取的,并作为排名因素包含在每个模型中。

测试与验证

该系统的实验评估涉及使用 MultiFC 数据集,因为它是目前唯一可用于该特定研究兴趣的大容量开源数据集。 MultiFC 包含从 34,924 个不同的事实核查领域(包括 Snopes 和华盛顿邮报)获得的 26 条真实世界的声明。

通过 Google 搜索 API 提供的十个证据片段以及通过包括说话者、标签和类别在内的多种元素的融合获得的预测,可以增强对每个声明的真实性的预测。

很多时候,相关的时间戳不一定是元数据中包含的时间戳;一篇文章可能涉及之前的事件,在这种情况下,研究人员的系统必须小心地直接从文本中提取和转换这些数据。如果没有这个过程,过时新闻的“重播”往往会给它带来新的光彩,尤其是在高权重网站上,传播过时的数据。

使用 Python 例程提取日期,并测试官方元数据日期的格式一致性(因为例如美国和英国的日期戳格式不同)。 手动验证时,时间戳元数据中发现零错误。

功能验证

与自动化结果的人工检查相比,研究人员发现,基于纯语义相似性或 SERP 排名的相关性假设,时间感知证据排序显著提升。他们还确认,该方法能够提升时间敏感型声明的真实性预​​测(例如,新闻情况可能瞬息万变,且必须优先显示最新信息,而非仅仅强制要求优先显示某个主题的最新结果)。

研究人员指出,这种方法对于改善政治和娱乐等不稳定主题的排名模型具有很高的价值,这些领域的信息变化很快,而高层发展需要一个框架,可以从他们可能拥有的排名顶部自动降级。发布时实现。

 

机器学习作家,人体图像合成领域专家。曾任 Metaphysic.ai 研究内容主管。
个人网站: 马丁南德森.ai
联系我们 [email protected]
推特:@manders_ai