Connect with us

思想领袖

如果您的 AI 发生了幻觉,不要责怪 AI

mm

AI “幻觉”——那些听起来令人信服但实际上是错误的答案——吸引了大量媒体关注,例如最近的《纽约时报》文章,AI 正变得更加强大,但其幻觉也变得更加严重。在处理面向消费者的聊天机器人时,幻觉是一个真正的隐患。在商业应用中,这是一个更加严重的问题。幸运的是,作为商业技术领导者,我对此有更多的控制权。我可以确保代理有正确的数据来产生有意义的答案。

因为这是真正的问题。在商业中,没有借口为 AI 幻觉找理由。停止责怪 AI,责怪自己没有正确地使用 AI。

生成式 AI 工具产生幻觉时,它们正在做它们被设计来做的事情——根据可用的数据提供最好的答案。当它们编造答案,产生不基于现实的答案时,这是因为它们缺乏相关数据,找不到数据,或者不理解问题。是的,像 OpenAI 的 o3 和 o4-mini 这样的新模型会产生更多的幻觉,当它们没有问题的好答案时,它们会更加“创造性”。是的,更加强大的工具可以产生更多的幻觉——但如果我们让它们成功,它们也可以产生更加强大和有价值的结果。

如果您不想让您的 AI 产生幻觉,不要剥夺它的数据。给 AI 提供最好的、最相关的数据来解决您要它解决的问题,它就不会被诱惑而走向歧途。

即使如此,当使用任何 AI 工具时,我建议保持您的批判性思维能力。AI 代理提供的结果可以是富有成效和愉快的,但关键是不要断开您的脑袋,让软件为您做所有的思考。继续提问。当 AI 代理给您一个答案时,质疑该答案,以确保它有意义并且有数据支持。如果是这样,那应该是一个鼓舞人心的迹象,表明它值得您花时间提问。

您提出的问题越多,您将获得的见解就越多。

为什么会发生幻觉

这不是什么神秘的事情。AI 不是想欺骗您。每个大型语言模型(LLM)AI 本质上都是根据概率预测下一个单词或数字。

在高层次上,发生的情况是,LLM 将句子和段落一个接一个地连接起来,根据其训练数据中的其他数十亿个例子预测句子中应该出现的下一个单词。LLM 的祖先(除了 Clippy)是文本消息和计算机代码的自动完成提示、自动化的人类语言翻译工具和其他概率语言系统。随着计算能力的增加和在互联网规模的数据上进行训练,这些系统变得“足够聪明”,可以像 ChatGPT 的推出所展示的那样,通过聊天进行对话。

AI 持怀疑态度的人喜欢指出,这与真正的“智能”不同,只是可以提炼和再现人类智慧的软件。要求它总结数据并写成报告,它会模仿其他作家总结类似数据的方式。

这似乎是一个学术论点,只要数据是正确的,分析是有用的。

如果 AI 没有数据会怎么样?它会填补空白。有时很有趣。有时是一团糟。

当构建 AI 代理 时,这个风险增加了 10 倍。代理应该提供可行的见解,但它们会沿途做出更多的决定。它们执行多步骤任务,步骤 1 的结果会告知步骤 2、3、4、5、… 10 … 20。如果步骤 1 的结果不正确,错误将被放大,使步骤 20 的输出变得更加糟糕。特别是,代理可以做出决定并跳过步骤。

做得好,代理为部署它们的业务实现了更多的目标。然而,作为 AI 产品经理,我们必须认识到与更大的回报相伴随的更大的风险。

这就是我们的团队所做的。我们看到了风险,并解决了它。我们没有只是构建一个花哨的机器人;我们确保它运行在正确的数据上。以下是我认为我们做对了的事情:

  • 构建代理以提出正确的问题并验证它是否具有正确的数据。确保代理的初始数据输入过程实际上更具决定性, menos “创造性”。您希望代理在没有正确的数据时说出来,而不是继续下一步,而是编造数据。
  • 为您的代理构建一个剧本 – 确保它不会每次都编造一个新计划,而是具有半结构化的方法。结构和上下文在数据收集和分析阶段至关重要。您可以让代理在有事实和准备写摘要时变得更加“创造性”,但首先要确保事实的准确性。
  • 构建一个高质量的工具来提取数据。这应该不仅仅是一个 API 调用。花时间编写代码(人们仍然这样做)以收集正确的数量和类型的数据,并在过程中构建质量检查。
  • 让代理显示其工作。代理应该引用其来源并链接到用户可以验证数据的位置,从原始来源开始,进一步探索它。不要允许任何手法!
  • 防护栏:思考可能出错的地方,并构建保护以防止您绝对不能允许的错误。在我们的例子中,这意味着当代理负责分析市场时,如果没有数据(我指的是我们的 Similarweb 数据,而不是从网络中提取的任意数据源),确保它不会编造东西是一项基本的防护栏。代理不提供答案比提供虚假或误导性的答案要好。

我们将这些原则融入了我们最近发布的三个新代理中,更多的代理即将推出。例如,我们的 AI 会议准备代理不仅仅要求输入目标公司的名称,还要求输入会议目标和与会人员的详细信息,以便为其提供更好的答案。它不需要猜测,因为它使用大量的公司数据、数字数据和高管资料来告知其建议。

我们的代理是完美的吗?不。目前没有人能够创建完美的 AI,甚至世界上最大的公司也不例外。但是,面对问题比忽视它要好得多。

您想要更少的幻觉吗?给您的 AI 一大块 高质量的数据

如果它产生幻觉,也许不是 AI 需要修复。也许是您的方法需要改变,以便在利用这些强大的新功能的同时,投入时间和精力使其正确。

Omri Shtayer 是 Similarweb 的数据产品和 DaaS 副总裁,他在组织内领导创新并推动其数据业务的增长。他最近领导了 AI Agents 的发布——可扩展的智能工具,旨在帮助企业将数据转化为现实世界的结果。凭借建立有影响力的数据解决方案的经验,Omri 正在引领公司如何利用数字智能的变革。