Connect with us

思想领袖

如果你的AI在“幻觉”,别怪AI

mm

AI“幻觉”——那些听起来令人信服但实则错误的答案——吸引了大量媒体关注,正如最近《纽约时报》的文章AI Is Getting More Powerful, But Its Hallucinations Are Getting Worse所报道的那样。在处理消费者聊天机器人时,幻觉是一个真正的危险。在AI的商业应用背景下,这更是一个值得严重关切的问题。幸运的是,作为企业技术领导者,我对它有更多的控制权。我可以确保智能体拥有正确的数据来产生有意义的答案。

因为这才是真正的问题所在。在商业领域,AI幻觉没有任何借口。别再责怪AI了。要怪就怪你自己没有正确使用AI。

生成式AI工具产生幻觉时,它们只是在做它们被设计来做的事情——根据它们拥有的可用数据提供它们所能给出的最佳答案。当它们编造信息,产生一个不基于现实的答案时,那是因为它们缺少相关数据、找不到数据,或者不理解问题。是的,像OpenAI的o3和o4-mini这样的新模型确实会产生更多幻觉,当它们对提出的问题没有好的答案时,表现得更加“有创造力”。是的,更强大的工具可能产生更多幻觉——但如果我们为它们成功创造条件,它们也能产生更强大、更有价值的结果。

如果你不希望你的AI产生幻觉,就不要让它缺乏数据。为AI提供你想要它解决的问题的最佳、最相关的数据,它就不会被诱惑而误入歧途。

即便如此,在使用任何AI工具时,我建议保持你的批判性思维能力。AI智能体交付的结果可能是高效且令人愉悦的,但重点不是让你关闭大脑,让软件替你完成所有思考。要不断提问。当AI智能体给你一个答案时,要质疑那个答案,确保它合理且有数据支持。如果是这样,那应该是一个令人鼓舞的信号,表明值得你花时间提出后续问题。

你质疑得越多,得到的洞察就越好。

幻觉为何发生

这并非什么谜团。AI并不是试图对你撒谎。每一个大型语言模型(LLM)AI本质上都是在基于概率预测下一个词或数字。

从高层次来看,这里发生的情况是,LLM一个词一个词地串联起句子和段落,根据其训练数据中数十亿的其他例子来预测句子中应该出现的下一个词。LLM的祖先(除了Clippy之外)是用于短信和计算机代码的自动完成提示、自动化人类语言翻译工具以及其他概率性语言系统。随着蛮力计算能力的增强,再加上对互联网规模数据量的训练,这些系统变得足够“聪明”,以至于可以进行完整的聊天对话,正如世界随着ChatGPT的推出所了解到的那样。

AI的反对者喜欢指出,这与真正的“智能”不同,它只是能够提炼和复述被输入其中的人类智能的软件。让它总结一份书面报告中的数据,它就会模仿其他作者总结类似数据的方式。

只要数据正确且分析有用,在我看来这就是一个学术争论。

如果AI没有数据会怎样?它会填补空白。有时这很有趣。有时则是一团糟。

在构建AI智能体时,这种风险会放大十倍。智能体本应提供可操作的见解,但它们在过程中会做出更多决策。它们执行多步骤任务,其中步骤1的结果会影响步骤2、3、4、5……10……20。如果步骤1的结果不正确,错误将被放大,使得步骤20的输出糟糕得多。尤其是,智能体可以做出决策并跳过步骤。

如果做得好,智能体能为部署它们的业务完成更多工作。然而,作为AI产品经理,我们必须认识到与更大回报相伴的更大风险。

这正是我们团队所做的。我们看到了风险,并着手解决它。我们不仅仅是构建了一个花哨的机器人;我们确保它运行在正确的数据上。以下我认为我们做对了的地方:

  • 构建智能体以提出正确的问题并验证其拥有正确的数据。确保智能体的初始数据输入过程实际上是更具确定性的,减少“创造性”。你希望智能体在它没有正确数据时说出来,而不是继续下一步,而不是编造数据。
  • 为你的智能体构建一个行动手册——确保它不会每次都发明一个新计划,而是有一个半结构化的方法。在数据收集和分析阶段,结构和上下文极其重要。你可以在智能体掌握事实并准备撰写摘要时,让它放松并表现得更有“创造性”,但首先要确保事实正确。
  • 构建一个高质量的工具来提取数据。这应该不仅仅是一个API调用。花时间编写代码(人们仍然这样做),以确保收集到正确数量和种类的数据,并在过程中构建质量检查。
  • 让智能体展示其工作过程。智能体应引用其来源,并链接到用户可以验证数据、从原始来源探索数据的地址。不允许任何障眼法!
  • 护栏:仔细思考可能出错的地方,并针对你绝对不能允许的错误构建保护措施。在我们的案例中,这意味着当负责分析市场的智能体没有数据时——我指的是我们的Similarweb数据,而不是从网络上抓取的随机数据源——确保它不编造数据是一个基本的护栏。智能体无法回答总比提供虚假或误导性答案要好。

我们已经将这些原则融入到最近发布的三个新智能体中,未来还会有更多。例如,我们为销售人员打造的AI会议准备智能体不仅会询问目标公司的名称,还会询问会议目标以及与谁会面的详细信息,从而为其提供更好的答案做好准备。它不需要猜测,因为它利用丰富的公司数据、数字数据和高管资料来为其建议提供信息。

我们的智能体完美吗?不。目前还没有人创造出完美的AI,即使是世界上最大的公司也没有。但面对问题总比忽视它要好得多。

想要减少幻觉?给你的AI一大块高质量数据

如果它产生幻觉,也许需要修复的不是AI。也许是你利用这些强大新能力的方法,却没有投入时间和精力去正确地使用它们。

//www.similarweb.com/">Similarweb 的数据产品与 DaaS 副总裁,负责领导全公司的创新并推动其数据业务的增长。他最近主导推出了 AI Agents——这是一套可扩展的智能工具,旨在帮助企业将数据转化为实际成果。凭借在构建具有影响力的数据解决方案方面的良好记录,Omri 正站在变革企业利用数字智能方式的最前沿。