思想领袖
解读生成人工智能中 LLM 代理的机遇和挑战

我们看到由大型语言模型 (LLM) 支持的生成式人工智能应用程序从提示到检索增强生成 (RAG) 再到代理的不断发展。 代理在行业和研究界受到广泛关注,主要是因为该技术能够为企业应用程序转型并提供卓越的客户体验。 构建代理有一些常见的模式,可以实现通用人工智能 (AGI) 的第一步。
在我之前发布的 刊文我们看到了一个构建 LLM 驱动应用程序的模式智能阶梯。首先是捕捉问题域并使用 LLM 内存生成输出的提示。借助 RAG,我们利用从向量数据库中搜索的外部知识来增强提示,以控制输出。接下来,通过链接 LLM 调用,我们可以构建工作流来实现复杂的应用程序。代理通过自动确定这些 LLM 链的构成方式,将这一过程提升到一个新的水平。让我们详细了解一下。

代理——幕后黑手
代理的一个关键模式是,它们利用 LLM 的语言理解能力来制定解决给定问题的计划。LLM 理解问题并提供解决问题的一系列步骤。然而,它的功能远不止于此。代理并非一个纯粹的支持系统,它不会为您提供解决问题的建议,然后把接力棒交给您执行建议的步骤。代理拥有工具,可以继续执行并采取行动。是不是很吓人?
如果我们向代理人询问这样的基本问题:
以人为本: 电话的发明者创办了哪家公司?
以下是代理可能采取的思考步骤的示例。
代理人(思考):
- 想法:我需要寻找电话的发明者。
- 操作:搜索[电话的发明者]
- 观察:亚历山大·格雷厄姆·贝尔
- 想法:我需要寻找一家由 Alexander Graham Bell 创立的公司
- 操作:搜索[亚历山大·格雷厄姆·贝尔创立的公司]
- 观察:亚历山大·格雷厄姆·贝尔 (Alexander Graham Bell) 于 1885 年与他人共同创立了美国电话电报公司 (AT&T)
- 心想:我已经找到答案了。 我会回来。
代理人(回应): 亚历山大·格雷厄姆·贝尔 (Alexander Graham Bell) 于 1885 年与他人共同创立了 AT&T
您可以看到代理遵循一种有条不紊的方式将问题分解为可以通过采取特定操作来解决的子问题。 这里的操作是法学硕士推荐的,我们可以将它们映射到特定的工具来实施这些操作。 我们可以为代理启用一个搜索工具,这样当它意识到 LLM 已提供搜索作为操作时,它将使用 LLM 提供的参数调用该工具。 这里的搜索是在互联网上进行的,但也可以重定向到搜索内部知识库,例如矢量数据库。 该系统现在变得自给自足,并且可以通过一系列步骤找出如何解决复杂问题的方法。 像这样的框架 浪链 LLaMAIndex 为您提供了一种简单的方法来构建这些代理并连接到工具和 API。 亚马逊最近推出了他们的 Bedrock Agents 框架,为设计代理提供了可视化界面。
在幕后,代理人遵循一种特殊的方式向法学硕士发送提示,使他们制定行动计划。 上述思想-行动-观察模式在一种名为 ReAct(推理与行动)的代理中很流行。 其他类型的代理包括 MRKL 和 Plan & Execute,它们的主要区别在于提示风格。
对于更复杂的代理,操作可能与导致源系统发生变化的工具相关联。 例如,我们可以将代理连接到一个工具,用于检查假期余额并在 ERP 系统中为员工申请休假。 现在我们可以构建一个漂亮的聊天机器人,它可以与用户交互并通过聊天命令在系统中申请休假。 不再需要复杂的申请休假屏幕,一个简单的统一聊天界面。 听起来很令人兴奋!?
负责任的人工智能的注意事项和需求
现在,如果我们有一个工具可以使用预先授权的 API 调用股票交易的交易,该怎么办? 您构建一个应用程序,代理可以在其中研究股票变化(使用工具)并为您做出股票买卖决策。 如果代理人因为产生幻觉并做出了错误的决定而卖出了错误的股票怎么办? 由于LLM是一个庞大的模型,很难确定他们为什么做出一些决定,因此在没有适当护栏的情况下,幻觉很常见。
虽然特工们都很迷人,但你可能已经猜到他们有多危险了。 如果他们产生幻觉并采取错误的行动,可能会导致巨大的财务损失或企业系统出现重大问题。 因此,在法学硕士驱动的应用程序时代,负责任的人工智能变得至关重要。 负责任的人工智能围绕可重复性、透明度和问责制的原则,试图为代理做出的决策设置护栏,并建议进行风险分析,以决定哪些行动需要人机参与。 随着更复杂的代理的设计,它们需要更多的审查、透明度和问责制,以确保我们知道他们在做什么。
结束语
智能体通过动作生成逻辑步骤路径的能力使它们真正接近人类推理。 为他们提供更强大的工具可以赋予他们超能力。 像 ReAct 这样的模式试图模仿人类如何解决问题,我们将看到与特定环境和领域(银行、保险、医疗保健、工业等)相关的更好的代理模式。 未来已来,代理背后的技术已可供我们使用。 与此同时,我们需要密切关注负责任的人工智能护栏,以确保我们不是在建设天网!










