关注我们.

机器学习系统可在您阅读文章时重写文章

人工智能

机器学习系统可在您阅读文章时重写文章

mm

加拿大的一项新研究提出了一种在读者阅读时自动重写文章的方法,该方法基于 Tinder 风格的“滑动”,或被动观察读者与文章中包含的各种内容的互动。

该系统名为 Hone As You Read (HARE),以 来自加拿大安大略省西部大学,并附有相应的Python代码 在GitHub.

该项目的中心思想是一篇文章可能包含各种内容,从标题到进一步的细节(很像这篇文章)。 文章的后面部分可能包含不同类型的支持材料、用例或有关新闻后果的假设或猜想。

在 HARE 系统下,如果你不喜欢这类内容,你可以逐段投票将其删除,同时系统会学习你的偏好。这样,当你向下滚动页面时,与你“踩”的内容类似的内容已经被删除或重写。如果你不想主动参与系统训练,HARE 可以通过观察你与文档的被动交互来推断你的选择。

对令人不快的句子进行 Tinder 式投票

在下图中,我们根据用户的显性或隐性行为,看到了 HARE 三种可能的推断分类类型。在第一种情况(左图)中,用户主动“向左滑动”(或向右滑动),做出类似 Tinder 的投票手势,表达对段落或句子内容、风格、复杂性或语气的认可或不满。

资料来源:https://arxiv.org/pdf/2105.02923.pdf

资料来源:https://arxiv.org/pdf/2105.02923.pdf

在第二种情况(中心)中,系统根据滚动暂停的位置和持续时间,使用停留时间作为用户兴趣的度量。

在第三种情况下(右),HARE 使用智能手机摄像头来估计查看者在可见文档段落中的注视位置的路径和停留时间。

研究人员认为,在任何一个段落上停留时间的增加都可以表明用户兴趣的增加,尽管从逻辑上讲,当观众试图理解可能复杂或写得不好的文本时,情况可能并非如此。

用户反馈可以有效地编辑、重写或完全删除文章中尚未看到的部分。

用户反馈可以有效地编辑、重写或完全删除文章中尚未看到的部分。

根据用户偏好预处理内容

本文以每篇文章为基础讨论了 HARE 的用户体验,但显然,用户与文档的历史交互允许定制未来的阅读体验,通过持续识别内容类型并将模板化的用户偏好应用于新文章,这样随着用户看到的“不想要的”内容越来越少,对交互的需求就会减少。

HARE 的特点是摘要算法,允许在用户到达页面之前根据风格或简洁性重写页面下方看不见的内容; 但该论文明确表示,它还可以根据用户反馈预先删除内容。

出于测试目的,该系统使用了 文集 来自英国的 11,222 篇文章 每日邮件 报纸,并通过 Telegram 聊天应用程序上的测试部署进行了评估。 少于十段的文章被丢弃用于审判目的。

Telegram HARE 应用程序正处于用户测试阶段。

Telegram HARE 应用程序正处于用户测试阶段。

研究人员的方法使用 K均值聚类 on 斯伯特 文章中的句子嵌入,最初对所处理的概念进行随机权重。

在众多算法和方法中,HARE 具有三个比较模型,其中第一个模型 (ORACLEGREEDY) 可以访问先前的用户偏好,表明该算法可以在加载时而不是交互地预处理文章。

其他模型 ORACLESORTED 和 ORACLEUNIFORM 分别根据兴趣水平或在整篇文章中随机选择句子。

内容删除和重写

令人惊讶的是,ORACLEUNIFORM 的表现优于控制集,尽管它无法访问先前的用户兴趣。研究人员认为,这是因为它一次性处理了整篇文章,“只选择了最有趣的句子”。研究人员承认,这可能会将可用内容限制在那些仅涉及最重要概念的句子上,从而从逻辑上删除了其他可能涉及该概念的后果或评估的文本。

HARE 中使用的提取摘要器是 LexRank, 基本求和文本排名.

HARE 在 13 次试验和不同的算法方法中对 70 名志愿者进行了测试,并且能够在消费级笔记本电脑上以 1.3 毫秒到 100 毫秒的时间更新摘要(重写/删除的文本),具体取决于所试验的型号。 结果发现,删除大部分文本的模型表现不佳,主要是因为这会影响剩余文本的连贯性。

动态文章重写的道德含义

研究人员承认对这种性质的技术的伦理担忧:

HARE 任务旨在设计未来面向用户的应用程序。这些应用程序的设计初衷是控制用户阅读特定文章的内容。如果部署时不够谨慎,这些工具可能会加剧自动新闻推送、搜索结果和在线社区已经产生的“回音室”效应。

然而,他们也指出,该系统未来可用于减轻回音室效应,方法是注入一些可能最初并未出现在文章中的替代观点。他们观察到:“可以调整这一因素的权重,以提供引人入胜的阅读体验,并接触到多元化的思想。”

研究人员表示,那些可能从这种系统中受益的人是那些希望节省获取信息时间的读者和内容出版商。

 

机器学习作家,人体图像合成领域专家。曾任 Metaphysic.ai 研究内容主管。
个人网站: 马丁南德森.ai
联系我们 [email protected]
推特:@manders_ai