人工智能
从电影剧本中映射情感动态

加拿大研究人员使用数千个电影剧本开发了一个机器学习框架,该框架可以通过解释对话过程中对话的情绪温度来跟踪说话者的情绪弧线。
这个 研究,来自渥太华卡尔顿大学,题为 电影对话中的情感动态 并包括对著名电影中的中心人物的分析,例如 闪灵 与 线上赌场它旨在作为机器学习分析和映射社交媒体帖子和心理咨询记录等不同渠道中现实世界话语的潜在基础。
这项工作提出了一个基于心理学研究中类似指标的话语情感动力学(UED)框架,并且是第一个基于每个角色对故事对话进行情感建模的框架,而不是计算整个范围内聚合对话的平均情绪温度一部电影的。

源自杰克·尼科尔森在《闪灵》(1980 年)中对话的词汇图,颜色映射以反映角色的静息情绪状态。 资料来源:https://arxiv.org/pdf/2103.01345.pdf
UED的组成部分包括 本垒 (典型或“静止”的情绪状态); 变化性 (情绪波动和可能快速变化的程度); 和 上升/恢复率 (角色调节挑战性情绪的能力)。

在论文的这个抽象示例中,黑线代表的角色从受干扰或不和谐的事件驱动的情绪状态中恢复的速度比相应的角色低得多。
这项工作旨在帮助回答文学理论中的一些难题,包括:人物在叙事中直接表达情感的程度;直接从对话中推断情节的程度;确定叙事中中心人物之间最不相容的点;以及人物处理困难情绪的能力与其后果之间的差异。

在分析《闪灵》两个中心人物的对话时,线条颜色表示叙事时间,随着叙事接近尾声,线条颜色加深为红色。 黑色虚线表示椭圆的长轴和短轴,该椭圆封装了 95% 持续时间的主要角色(为清楚起见,图中未显示)。
遵循脚本
该数据是根据互联网电影剧本数据库 (Internet Movie Script Database) 中的 1,123 个公开可用的电影剧本生成的IMS数据库)。 仅考虑每部电影至少有 50 次角色间交流的角色,这使得剧本材料语料库中包含的总共 2,687, 54 个角色中剩下 518 个角色研究对象。
文本使用 NLTK WordNet 进行处理 词形还原器,产生 5,673,201 个自然语言处理 (NLP) 单词标记,每部电影中每个角色留下约 1,376 个标记。
研究人员指出,以这种方式对单词的评估只考虑了单词的明确情感价值,而不是它与周围单词的关系(来自同一角色或场景中的另一个角色)。 然而研究人员认为,大多数单词都有一个 占主导地位的初级意义,并且聚合词捕获弥补了上下文的缺乏。
情绪波动
在开发一个简化的 0>100 图表来表示提取的电影剧本中人物的情绪变化时,该论文指出莎朗·斯通的角色来自 线上赌场 (1995),尽管吉尔·里奇的角色来自 小雅典 (2005)是波动性最高的,德文·布罗楚的角色 Hesher (2010)位居第二。
或许可以预见的是,布伦特·斯派纳的机器人创作 Cmdr. Data 来自 星际迷航 电影系列表现出所研究角色中情绪变化最少,但仅略胜人类船员赖克(乔纳森·弗雷克斯在该系列中的角色)。

这篇论文证实了我们的直觉 理解 在叙述的最后 10-15% 中,情绪可能会达到顶峰并以某种方式(消极或积极)解决,其中必须以某种方式解决已形成的冲突。 研究发现,电影中角色的负面言论在整个播放过程中增加了 2%,在叙事高潮时上升至 91%,而在同一时间范围内,正面言论也有所减少,尽管不太明显。
其他因素
研究人员打算开展这项工作,以便将其应用于一系列领域,包括公共政策、公共卫生和社会科学。 他们指出,这项工作的结果不应被视为情绪状态评估的完整矩阵,并提供了在使用这些技术时应考虑的 7 点道德准则模板。
由于注意到 最近的研究 根据瑞典媒体委员会的说法,在试图衡量叙事的情感温度时,应该考虑许多非文本因素,因为背景、音乐、视觉线索和不言而喻的时间因素(例如沉默)对情感温度有很大影响。话语的意义。
背景尤其重要:例如,人们很难了解斯坦利·库布里克的影片《星球大战》中凯尔·杜拉饰演的受困宇航员的情绪状态。 2001:太空奥德赛 (1968)通过研究剧本,因为该角色已经接受过大量训练,能够在高度紧张的情况下保持解决问题的心态。此外,许多情感散漫的电影很少使用对话。












