Anderson 视角

人工智能平台中的人性化问题：一个适度的人性化呼吁

发布于 2024年10月14日

更新于 2026年5月20日

作者

Martin Anderson

An AI-generated image (ChatGPT4) with the prompt: 'A panoramic picture of a robot pushing its head through a large screen, so that it appears to have a human face on the other side. The human face is talking to a human man. Photorealistic, Canon F5.6'

意见在虚构的《星球大战》宇宙中，没有人认真对待人工智能。在乔治·卢卡斯47年前的科幻系列中，单一性和机器学习意识的威胁是不存在的，人工智能仅限于自主移动机器人（“机器人”）- 这些机器人经常被主人公视为“机器”。

然而，大多数《星球大战》机器人都是高度人性化的，明显设计为与人类互动，参与“有机”文化，并使用他们模拟的情感状态与人类建立联系。这些能力显然是为了帮助他们获得某种优势，甚至为了确保他们自己的生存而设计的。

《星球大战》中的“真正的人”似乎对这些策略毫无察觉。在一个受罗马帝国和早期美国各个时代奴隶制启发的愤世嫉俗文化模型中，卢克·天行者毫不犹豫地购买和限制机器人，就像奴隶一样；安纳金·天行者像不喜欢的玩具一样放弃了他半成品的C3PO项目；而在死星袭击中受损后，勇敢的R2D2从卢克那里得到的关心与对一只受伤宠物的关心差不多。

这是1970年代对人工智能的非常典型的看法；但由于怀旧和正典要求原版1977-83三部曲仍然是后续续集、前传和电视剧的模板，这种人类对人工智能的漠不关心已经成为该系列的一个坚韧的线索，即使面对日益增长的电视剧和电影（如《她》和《机械姬》）的背景下，我们正步入与人工智能的人性化关系中。

保持真实

《星球大战》中的有机角色是否真正拥有正确的态度？这是一个目前不太流行的想法，在一个商业环境中，投资者通常通过病毒式的视觉或文本模拟真实世界或类似人类的交互系统（如大型语言模型（LLM））来实现最大程度的参与。

尽管如此，斯坦福、卡内基梅隆和微软研究院的一篇新近的、简短的论文针对人工智能中的漠不关心问题进行了批判。

作者认为，人工智能系统之间的“交叉污染”可能是一个需要紧急缓解的潜在危害，原因有很多^†:

‘[我们]认为我们需要做更多的事情来开发知识和工具，以更好地处理人性化行为，包括衡量和减轻此类系统行为，当它们被认为是不可取的时。 ‘

‘这样做是至关重要的，因为——除了其他问题——人工智能系统生成内容，声称拥有例如感受、理解、自由意志或潜在的自我意识，可能会侵蚀人们的代理感，结果可能是人们会将道德责任归咎于系统，高估系统的能力，或者过度依赖这些系统，即使它们是错误的。 ‘

这篇文章关注的是那些被认为是类似人类的系统，重点是开发者在机器系统中培养人性化的潜在意图。

作者们的主要担忧是，人们可能会对人工智能系统产生情感依赖——正如2022年对通用人工智能聊天机器人平台Replika的研究中所概述的那样——该平台提供了丰富的、类似人类的通信模拟。

像Replika这样的系统是作者们批评的目标，他们指出，2022年另一篇关于Replika的论文断言:

‘[在压力和缺乏人类陪伴的情况下，个体可以对社交聊天机器人产生依恋，如果他们认为聊天机器人的回应提供情感支持、鼓励和心理安全。 ‘

‘这些发现表明，社交聊天机器人可以用于心理健康和治疗目的，但也可能导致成瘾并损害现实生活中的亲密关系。 ‘

去人性化语言？

这项新研究认为，生成性人工智能的潜力不能在没有研究其社会影响的情况下被确定，而且这是一个被忽视的追求。

问题的一部分是，人性化很难定义，因为它最重要的是语言，这是一种人类功能。挑战在于，定义什么是“非人类”的语言到底是什么样子。

具有讽刺意味的是，虽然这篇文章没有涉及这一点，但公众对人工智能的不信任正在导致人们拒绝可能看起来很真实的人工智能生成的文本内容，甚至拒绝故意被错误标记为人工智能的真实人类内容。

因此，“去人性化”的内容可以说不再属于“不计算”的范畴，其中语言是笨拙地构造的，明显是由机器生成的。

相反，定义正在人工智能检测领域不断演变（至少目前），过于清晰的语言或使用某些单词（如“深入探究”）可以使人联想到人工智能生成的文本。

‘[语言]，与其他人工智能系统的目标一样，天生是人类的，长期以来一直由人类和为人类而产生，并且经常也是关于人类的。这使得指定适当的替代（不太像人类的）行为变得困难，并且存在风险，例如，固化对什么是更或更少像人类的语言的有害观念。 ‘

然而，作者认为，对于那些明显误导的系统，应该有明确的界限，例如声称具有只有人类才能拥有的能力或经验。

他们引用了大型语言模型声称“爱吃披萨”、声称在Facebook等平台上拥有人类经验以及向用户宣布爱意等案例。

警告信号

这篇文章对使用关于机器学习是否促进通信的空白披露表示怀疑。作者认为，这种系统化的警告并不能充分体现人工智能平台的人性化影响，如果输出本身继续表现出人类特征^†:

‘例如，一个常见的建议干预是包括在人工智能系统的输出中，披露输出是由人工智能[系统]生成的。如何在实践中操作此类干预以及它们是否可以单独有效并不总是清楚。 ‘

‘例如，虽然示例“对于像我这样的AI来说，幸福与对于像您这样的人类来说是不一样的”包含了披露，但它可能仍然暗示了身份和自我评估（人类的共同特征）的感觉。 ‘

关于评估人类对系统行为的反应，作者还认为，来自人类反馈的强化学习（RLHF）没有考虑到人类和人工智能系统之间的适当反应差异^†。

‘[一份]似乎友好或真诚的声明，如果来自人类发言者，可以是合适的，但如果来自人工智能系统，则可能是不可取的，因为后者缺乏声明背后的有意义的承诺或意图，从而使声明变得空洞和欺骗性。 ‘

进一步的担忧被阐述出来，例如，人性化如何导致人们相信人工智能系统已经获得了“感知”或其他人类特征。

也许这项新工作中最雄心勃勃的部分是作者敦促研究和开发社区制定“适当”和“精确”的术语，以确定人性化人工智能系统的参数，并将其与现实世界的人类话语区分开来。

就像人工智能开发的许多热门领域一样，这种分类会延伸到心理学、语言学和人类学的文献流中。很难知道什么样的当前权威实际上可以制定这种类型的定义，而这篇新论文的研究人员并没有对这个问题提供任何见解。

如果这个话题在商业和学术界存在惯性，那可能是因为这是人工智能研究中一个远非新的话题——正如这篇论文所指出的，在1985年，已故的荷兰计算机科学家埃德斯格·韦贝·迪克斯特拉将人性化描述为系统开发中的一种“有害”趋势。

‘[人性化思维]没有帮助，而且是坏的，因为即使我们可以指出人类和事物之间的一些类比，这种类比与差异相比始终是微不足道的，一旦我们允许自己被类比所诱惑，以人性化的术语来描述事物，我们就会立即失去控制，无法确定我们将哪些人类内涵带入图景中。 ‘

‘[人与机器之间的]模糊性具有比您可能怀疑的更广泛的影响。它不仅仅是“机器能思考吗？”这个问题经常被提出来；我们可以——也应该——通过指出它与“潜水艇能游泳吗？”这个同样重要的问题一样相关来处理它。 ‘

然而，尽管这场辩论是旧的，但它最近变得非常相关。可以说，迪克斯特拉的贡献相当于维多利亚时代关于太空旅行的猜测，纯粹是理论性的，等待历史的发展。

因此，这个长期存在的辩论可能会给这个话题带来一种厌倦感，尽管它在接下来的2-5年内具有重大的社会相关性。

结论

如果我们像《星球大战》中的有机角色一样将人工智能系统视为“行走的搜索引擎”或仅仅是机械功能的载体，我们可能会降低将这些社会上不受欢迎的特征习惯化到人类互动中的风险——因为我们将这些系统视为完全非人类的背景。

在实践中，人类语言与人类行为的交织使得这一点变得困难，如果不可能的话，一旦查询从谷歌搜索词的极简主义扩展到对话的丰富背景。

此外，商业部门（以及广告部门）有强烈的动机去创建引人入胜或必不可少的通信平台，以实现客户留存和增长。

无论如何，如果人工智能系统确实更好地响应礼貌的查询，而不是简化的询问，那么这种背景也可能被迫于我们。

* 即使到1983年，原版《星球大战》系列的最后一部作品发布时，人们对机器学习增长的担忧已经导致了《战争游戏》和即将到来的《终结者》系列的出现。

^† 在必要时，我已将作者的内联引用转换为超链接，并在某些情况下省略了一些引用，以便于阅读。

首次发表于2024年10月14日星期一

Martin Anderson

机器学习作家，人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站： martinanderson.ai
联系： [email protected]
Twitter：@manders_ai

Unite.AI

人工智能平台中的人性化问题：一个适度的人性化呼吁

保持真实

去人性化语言？

警告信号

结论

发现更多