人工智能
Reaction GIF 提供了一把新的钥匙来识别 NLP 中的情感

台湾的新研究提出了一种新的方法,用于自然语言处理(NLP)在社交媒体论坛和语言研究数据集中执行情感分析——通过对动态 GIF 进行分类和标记,这些 GIF 是对文本公告的回应。
研究人员由台湾清华大学的 Boaz Shmueli 领导,利用 Twitter 内置的 reaction GIF 数据库作为索引来量化用户响应的感性状态,从而消除了处理多语言响应、检测讽刺 或从模糊或过于简短的响应中识别核心情感温度的需要。

点击 Twitter 发帖时的“GIF”按钮,提供了一组标准的标记动态 GIF,这些 GIF 比纯文本语言更容易被 NLP 解析为“识别”的情感。
该 论文 将这种使用 reaction GIF 的方法描述为 ‘NLP 情感数据集中尚未有的新类型标签’,并指出现有的数据集要么使用 维度模型,要么使用 离散情感模型,但这两种模型都无法提供这种见解。

用户帖子的动态 GIF 响应。随着 Twitter 提供的 GIF 现在以感性状态编码,模糊的意图几乎被消除了,情感分析变得更加准确。 来源:https://arxiv.org/pdf/2105.09967.pdf
研究人员发布了一个包含 30,000 个带有 GIF 反应的讽刺性 tweet 的 数据集。这种方法为 NLP 提供了区别于其他当前文献的方法:一种区分 感知 情感(读者从文本中识别的情感)和 诱发 情感(读者对文本做出反应时感受到的情感)的方法。
反应 GIF 作为还原性指标
在对一个帖子做出支持性响应时,这个帖子正在分享一个令人痛苦的情感状态,一个恰当的 GIF 在没有支持性文本的情况下(这也是研究人员关注的 GIF 响应类型)是有用的还原性和无歧义的。
例如,诸如 ‘那太残酷了,伙计’、‘那真遗憾’ 或 ‘噢’ 的反应可能包含模糊的意图,从某种“临床”和无动于衷的立场到讽刺的可能性;但是发布 Twitter 的数百个“拥抱”类别的 GIF 留下了较少的解释空间:

深入 GIF 反应的子含义
然而,在任何单一类别的反应中,例如“拥抱”,都包含了多种情绪或观点的指标,涵盖了多种受影响状态的类型,包括原帖作者和响应者之间的浪漫或家庭关系的假设。

Twitter 可用“拥抱”GIF 类别中关系的描述。使用多种类型、套路、性别描绘和其他因素为这种情绪的潜在可解释性添加了细微差别。
ReactionGIF 数据集是从 Twitter 每个可用反应类别中的前 100 个 GIF 中得出的,导致创建了一个包含 4300 个动态图像的数据库。在一个 GIF 出现在多个类别的情况下,GUI 中的更高位置被赋予更高的权重。在多个类别中出现的图像被分配了一个 反应相似性 因子——一个为本研究而发明的度量。
然后使用层次聚类和平均链接发现亲和力。

增强反应 GIF 数据
该数据集是通过将该方法应用于 30,000 条推文而生成和标记的。反应类别的“丰富的情感信号”使研究人员能够用基于正面和负面反应类别集群的额外情感标签来增强数据集,并添加了一个专门的反应到情感的映射方案,基于三名人类评估者的样本推文的多数裁决。
之前的 工作 来自雅虎和罗切斯特大学,涉及 GIF 的注释,并不具有这种层次的引发文本,也没有任何反应类别,但仅仅是语义的。
研究人员在四种方法中评估了该数据集:RoBERTa、卷积神经网络(CNN)GloVe、逻辑回归分类器和简单的大多数类别分类器。每个类别的说服力在结果中显现得很清楚,赞同、同意和哀悼最容易识别(并且最具代表性),而道歉最难评估,也许是因为其中包括讽刺的可能性。

RoBERTa 模型在所有三种评估方法中产生了最高的排名平均值,包括情感反应预测、诱发情绪预测和诱发情绪预测。
从反应 GIF 中提取用户情绪
研究人员观察到,识别诱发的情绪是 NLP 基础的情绪和情绪分析中最具挑战性的任务之一,并且使用反应 GIF 作为代理提供了以后项目收集“大量廉价、自然发生、高质量的情感标签”的可能性。
尽管研究集中在 Twitter 用户体验中嵌入的特定 GIF 焦点上,但该研究声称这种方法可以推广到其他社交媒体平台,以及即时通讯平台,并可能在情感识别和多模态情感检测等领域发挥作用。
受欢迎程度作为关键索引
这种方法似乎依赖于每个 GIF 的某种“病毒式”传播,例如当一个 GIF 通过 Twitter 自身的机制提供时。新颖的用户生成 GIF 不能进入这种生态系统,除非通过增加受欢迎程度和采用作为表情包。
反应 GIF 在过去十年中使 1987 年的原始动态 GIF 格式在数字文化中复兴,复兴,在互联网 V1 时代之前,GIF 因为被用作烦人的横幅广告而声名狼藉,原始动态 GIF 格式。












