人工智能

了解情感分析中的 Twitch 表情

更新 on 2022 年 12 月 9 日

公众的越来越多的使用近年来，表情符号、表情符号、表情符号、模因、GIF 和其他在社交媒体平台上进行非语言交流的方式越来越多地困扰着数据科学家了解全球社会学格局的努力；至少，从公共话语中可以看出世界范围内的社会学趋势。

尽管自然语言处理 (NLP) 在过去十年中已成为情感分析的强大工具，但该行业不仅难以跟上不断发展的词典跨多种语言的俚语和语言快捷方式，而且还试图解码 基于图像的 Facebook 和 Twitter 等社交媒体平台上的帖子。

由于数量有限人口众多的社交媒体平台是此类研究唯一真正的超大规模资源，因此人工智能行业至少尝试跟上它的步伐至关重要。

XNUMX月，台湾的一篇论文提出了新方法根据发布到社交媒体线程的“反应 GIF”（见下图）对用户情绪进行分类，使用包含 30,000 条推文的数据库开发一种预测对帖子反应的方法。该论文发现，基于图像的反应在很多方面都更容易衡量，因为它们不太可能包含讽刺，显着的挑战在情感分析中。

来自台湾的研究人员在 2021 年的一篇论文中研究了使用动画反应 GIF 作为情绪的“还原指标”。

今年早些时候，波士顿大学领导的一项研究工作经过训练的机器学习模型预测可能在 Twitter 上疯传的图像模因；八月，英国研究人员检查了表情符号与表情符号的增长情况（有一个差异）在社交媒体上，编译了一个大规模的 7 种语言的象形 Twitter 情绪数据集。

抽搐表情

现在，美国研究人员开发了一种机器学习方法，可以更好地理解、分类和衡量不断发展的伪词汇表情在非常受欢迎的 Twitch 网络上。

表情是 Twitch 上用来表达情感、心情或笑话的新词。由于它们根据定义是新的表达方式，因此机器学习系统面临的挑战不一定是无休止地编录新的表情（可能只使用一次，否则很快就会不再使用），而是更好地理解它的框架不断地产生它们；并开发能够将表情识别为“暂时有效”单词或复合短语的系统，其情绪/政治温度可能需要完全根据上下文来衡量。

“FeelsGoodMan”表情的邻居，其含义可以通过晦涩的后缀来改变。 资料来源：https://arxiv.org/pdf/2108.08411.pdf

纸标题为 FeelsGoodMan：推断 Twitch 新词的语义，来自旧金山社交媒体分析公司 Spiketrap 的三名研究人员。

诱饵和开关

尽管 Twitch 表情新颖且生命周期通常很短暂，但它们经常重复利用文化材料（包括较旧的表情），从而可能将情感分析框架引向错误的方向。追踪表情的含义随着它的演变而发生的变化，甚至可以揭示出对其原始情感或意图的完全倒置或否定。

例如，研究人员指出，最初的另类右翼滥用同名的 感觉好人 在 Twitch 上使用青蛙佩佩表情包时，它几乎完全失去了原来的政治色彩。

该短语的使用，以及艺术家 Matt Furie 2005 年漫画中的卡通青蛙图像，成为极右表情包在2010年代。虽然沃克斯写 2017 年，右派对模因的挪用在 Furie 的自认中幸存下来分离通过这种使用，这篇新论文背后的旧金山研究人员发现了另外的情况*：

4 年代初，Furie 的卡通青蛙被 2010chan 等各种在线论坛上的右翼海报所采用。从那时起，Furie 一直致力于恢复其角色的意义，而这种表情在更主流的人群中也出现了热潮。非讨厌使用以及 Twitch 上的积极使用。我们在 Twitch 上的结果一致，表明“FeelsGoodMan”及其对应的“FeelsBadMan”主要按字面意思使用。

下游出现问题

这种关于迷因的普遍“特征”的“诱饵和转换”可能会阻碍 NLP 研究项目，这些项目已经将其归类为“可恨的”、“右翼”或“民族主义[美国]”，并且已经抛弃了这些信息进入长期开源存储库。后来的 NLP 项目可能不会选择审计旧数据的货币；可能没有任何实际机制可以做到这一点；甚至可能没有意识到这种需要。

其结果是，使用 2017 年基于 Twitch 的数据集来制定“政治分类”算法，将根据 Twitch 上值得注意的另类右翼活动的频率，对 Twitch 上值得注意的另类右翼活动进行归因。 感觉好人 表情。抽搐可能是也可能不是充满另类右翼影响者，但是，根据新论文的研究人员的说法，你不能用青蛙来证明这一点。

“Pepe”表情包的政治意义似乎已被 Twitch 的 140 亿用户（其中 41% 24岁以下），他们有效地从原来的盗贼那里重新窃取了作品，并用自己的颜色绘制了它，没有任何特定的议程。