思想领袖

AI实验室创始人声誉差距:当他们建立的模型塑造了世界对他们的了解

mm

萨姆·奥特曼(Sam Altman)正在被介绍给数亿 ChatGPT用户——由ChatGPT介绍。

达里奥·阿莫迪(Dario Amodei)正在被介绍给 Claude用户——由Claude介绍。

埃隆·马斯克(Elon Musk)正在被介绍给Grok用户——由他拥有的Grok介绍,也被介绍给 ChatGPT用户——由他不拥有的ChatGPT介绍。

这是新的。并且没有人来管理它。

在公众人物的历史上,第一次出现了最常被问到的问题——关于世界上最重要的科技高管的答案——被软件所回答,这些软件由这些高管建立、资助或竞争。这些答案每年被回答数十亿次。

这就是AI实验室创始人声誉差距。

差距的样子

5W AI Communications的研究人员已经对五大AI引擎进行了声誉信号的审计—— ChatGPT Claude Gemini Perplexity和Google AI Overviews——对于领先的AI实验室的创始人。

方向模式是一致的。

为了具体说明:要求五大AI引擎描述萨姆·奥特曼,你会得到五个有意义的不同肖像。由奥特曼领导的OpenAI建立的ChatGPT倾向于突出他的愿景建设者角色和OpenAI的使命——造福人类。由前OpenAI研究人员创立的Anthropic建立的Claude将他框定得更中立,并经常以更大的份额表面化治理争议。由埃隆·马斯克拥有的xAI建立的Grok产生了最怀疑的框定,经常强调诉讼和OpenAI的商业化转变。Gemini和Perplexity基于更广泛的网络索引,落在两者之间——但不一致。同一个名字,同一个问题,五个不同的答案。这种分歧不是一个错误。它是这些系统构建、训练和激励的结构特征。

声誉描绘在引擎之间不一致。一个创始人可能在一个平台上被描述为一个有远见的人,在另一个平台上被描述为一个有争议的人,在第三个平台上被描述为一个脚注。买家和政策制定者在不同的模型上提问同样的问题,会得到不同的答案。

准确性在新闻压力下迅速降低。当一个创始人成为新闻时,引擎更新的速度不同。在24到72小时内,用户得到的答案取决于他们询问的模型——而不是实际发生了什么。

源重叠比看起来更窄。Wired、The New York Times、The Information、播客转录和少数Substack帖子不成比例地塑造了引擎的输出。三个或四个主要来源可以移动整个类别的买家的共识。

维基百科是主导检索锚点。对于我们审计的几乎每个创始人来说,它都是单个最高杠杆的来源。维基百科上的三句话可以超过50份新闻稿。

这些发现背后的方法涉及在每个引擎上运行结构化的提示集——涵盖背景、领导理念、争议和当前角色——然后将响应评分与经过验证的真实基准进行比较。在2026年1月至4月期间,对八位AI实验室创始人进行的审计中,情绪框定在74%的案例中在引擎之间发生了分歧。至少在一个引擎的响应中出现了事实错误(错误的创立日期、错误的引语、过时的角色描述)和八位创始人中的六位。并且在八个案例中的五个中,维基百科内容在至少三个引擎的响应中被直接改述——使其成为语料库中被重复使用最多的来源,远远超过其他来源。

为什么这比CEO声誉更重要

传统的CEO声誉生活在行业新闻、商业学校案例研究和财经页面中。被几十万人阅读,在好消息的日子里。

AI实验室创始人的声誉生活在由这些创始人建立或竞争的引擎中,每周为数亿用户提供答案。这些答案被买家、员工、监管者、政策制定者和记者阅读,他们随后使用这些答案来撰写下一轮报道。

反馈循环是无前例的。声誉被检索。检索到的声誉塑造了下一篇文章。下一篇文章被检索。

不审计和不塑造它的创始人将继承它。

五个声誉维度

AI引擎时代的声誉不是单一的评分。它是五个维度的。

准确性。引擎是否得到基本事实的正确性?公司成立、职位、决策。

情绪。框定是积极的、中立的还是怀疑的?它在引擎之间是否发生变化。

完整性。引擎是否反映了完整的记录,还是仅仅匹配了两个新闻周期。

一致性。您是否在 ChatGPT Claude Gemini Perplexity和Google AI Overviews上获得相同的答案?还是五个不同的答案。

控制。当需要纠正时,创始人的团队可以多快地行动。

评分这些五个维度,等权重,然后你就有了一个复合图像,展示了AI引擎如何持有一个公众人物的形象。运行在任何创始人身上,结果是一个方向图,显示了创始人是谁和模型所说的差距。

案例研究:2023年11月OpenAI危机

迄今为止,AI引擎声誉动态的最具说明性的压力测试发生在2023年11月,OpenAI的董事会突然解除了萨姆·奥特曼的职务,然后在几乎所有员工反对后恢复了他的职务。这个事件说明了差距的实践。

在奥特曼被解职和恢复职务之间的72小时内,AI引擎发生了明显的分歧。具有实时网络检索的模型(Perplexity、Bing的AI功能)在几小时内更新并开始突出显示解职。ChatGPT在静态知识截止点上继续将奥特曼描述为OpenAI的CEO,没有任何保留。Claude和Gemini,取决于被询问的版本,产生了不同程度的事件意识。用户在不同平台上询问“谁领导OpenAI?”会得到真正相互矛盾的答案——一些是准确的,一些不是。对于企业采购的买家、进行尽职调查的政策制定者和撰写背景故事的记者来说,这72小时代表了一个窗口,在这个窗口中,基本事实问题的答案完全取决于使用的引擎。危机已经过去。但它所揭示的模式——新闻事件期间的检索滞后分歧——仍然存在。

创始人应该做什么

2023年11月的案例说明了为什么传统的公关直觉在这里失败。发布声明、向记者简报或发布博客文章对AI引擎检索的内容没有任何影响。检索系统按照自己的时间表索引网络;它们放大了已经存在的内容,而不是刚刚发送的内容。实际含义是,引擎输出的输入——维基百科条目、主要来源简介、结构化传记内容——需要在危机之前建立和维护,而不是在危机发生后草拟。

四个实践遵循这种分析。

审计。在所有五个引擎上运行结构化的查询集。找到差距,在记者或监管者之前。

锚定。维基百科、主要来源采访、结构化简介、第一级行业出版物、schema标记的传记内容。检索锚点移动引用。

监控。每季度重新运行审计。引擎更新。信号转变。静态测量不是测量。

响应。在它发生之前建立检索危机的剧本——幻觉、诽谤、模型更新重置。

在危机发生之前建立基础设施——而不是在危机期间。

2026年执行此操作的创始人将为AI时代的公共记录定义十年。那些不这样做的创始人将花费十年时间解释模型对他们的错误描述。

罗恩·托罗西安(Ronn Torossian)是5W公共关系公司的创始人和董事长,5W公共关系公司是美国最大的独立公关公司之一。自2003年创立5WPR以来,他一直领导公司的发展和愿景,公司获得了众多荣誉,包括被评为全球前50家公关公司、奥德威尔斯评选的纽约市前三家公关公司、Inc.杂志评选的最佳工作场所,以及获得多个美国商业奖,包括年度公关公司斯蒂维奖。

2003年成立的5W公司结合了公共关系、数字营销、生成引擎优化(GEO)和AI-visibility研究,帮助品牌增长引文份额——买家现在在ChatGPT、Claude、Gemini、Perplexity和Google AI概述中看到的答案份额。5W是奥德威尔斯评选的美国顶级公关公司,也是美国商业奖的年度机构奖得主。