思想领袖

为什么代理人AI项目在规模上停滞不前,企业必须首先解决什么问题

mm

代理人AI正在成为所有企业的关键元素。企业正在将试点项目纳入其运营中,演示环境正在给领导层留下深刻印象,路线图正在被重新编写以适应自主AI工作流程。

但是,对于许多这些项目来说,控制的演示和生产部署之间的某些东西会出现问题。项目停滞不前,部署时间从几个月延长到几年,负责交付的团队被迫解释为什么在测试中表现完美的代理人在现实世界中表现出不可预测的行为。

在几乎所有情况下,答案不是模型本身,而是数据资产、编排层、治理框架和大多数企业在决定在其上构建智能代理之前从未现代化的遗留基础设施。直到这些基础被解决,代理人AI将继续产生令人印象深刻的演示和令人失望的部署。

POC环境是一个陷阱

大多数企业评估模型。很少有企业评估代理人行为的全部流程。一个模型可以非常准确,但在其上构建的代理人仍然可能彻底失败。这是因为代理人顺序地链接工具调用,一步错误会产生错误的答案,下一步将其视为正确的输入,随着时间的推移,错误会被放大,直到有人注意到。

POC环境的设计是为了隐藏这一点。输入是受控的,范围狭窄,有人在监视输出。在生产环境中,这些条件并不存在。测试中表现良好的代理人现在正在处理模糊的指令,遇到权限错误,并对其从未测试过的数据做出顺序决策。构建它的团队正在发现,针对模型性能设计的评估框架并不能告诉您代理人是否正确升级,是否优雅地处理了边缘情况,或者是否知道何时停止。

根据麦肯锡的AI状态2025报告,88%的组织现在在至少一个业务功能中使用AI,但只有大约三分之一成功地将其扩展到整个企业。从采纳到规模之间的差距始于企业如何范围和评估其试点项目。成功扩展的团队将故障模式分析视为设计要求。在部署之前,他们构建了代理人预期故障的目录以及对其的响应。这听起来很明显。很少有企业实际这样做。

垃圾数据,垃圾代理人

企业不断询问为什么他们的代理人在生产中表现不佳。答案几乎总是回到数据上。数据资产从来没有准备好。来源分散在数十个系统中,这些系统是在不同的时间为不同的目的构建的。定义在业务单元中不一致。没有语义层。没有单一的真实来源。只是多年积累的数据债务,没有人优先考虑它,因为旧系统运行得足够好。

当您在其上构建代理人时,这笔债务不会消失。它成为代理人的运行现实。代理人在分散的数据源中导航,不是在对业务进行合理的推理。它正在尽力处理它能找到的任何东西,实时调和矛盾,并产生看似合理的输出,直到有人仔细检查。代理人没有问题。它在项目开始之前就已经被破坏的数据。

数据漂移和概念漂移使情况随时间而恶化。当现实世界输入分布从模型训练的分布中偏移时,代理人不会抛出错误。它继续运行并开始生成错误的输出,自信地并大规模地。没有MLOps或AIOps管道构建到代理人编排层中,就没有机制可以在损害积累之前捕获它。代理人在启动时表现良好,安静地在几个星期内恶化,直到有人将输出质量与从一开始就存在的数据问题联系起来。

数据现代化和AI现代化通常被视为独立的并行工作流程,独立排序和单独资金。它们不是并行的。您不能在数据架构在项目开始之前就已经破坏的情况下构建可靠的代理人。顺序非常重要,跳过数据层以加快AI层的速度是企业最常见和最昂贵的错误之一。

错误的仪表盘会给某人错误的数字。错误的代理人操作可能会在有人注意到之前触发下游流程,批准不应批准的发票,错误地路由合规性标志,或调整价格超出预期范围。代理人系统需要专门设计的可观察性,而不是来自一般应用程序监控的回收仪表盘。

统一数据平台的优势

在开始代理人AI程序之前转移到统一数据平台的企业正在比那些没有这样做的企业更快地扩展。当湖仓、数据仓库、语义模型和管道都在一个环境中,如Microsoft Fabric中那样时,代理人有一个一致的表面来查询。这消除了代理人在不同系统之间跳转时由于不同模式、不同刷新周期和不同业务指标定义而产生的整个类别的故障。

这就是为什么企业选择用于数据统一的平台对其代理人AI结果如此重要的原因。Microsoft Fabric的统一方法将湖仓、数据仓库、语义模型和管道结合在一个环境中,为Microsoft中心企业在从实验转向实际操作时提供了结构优势。

Databricks通过湖仓架构和Unity Catalog提供了相同的原则,给数据和AI团队提供了跨结构化和非结构化数据的统一治理层,具有MLflow集成以跟踪生产中的模型行为。Snowflake的方法利用其Cortex AI和数据云与AI推理之间的紧密耦合,允许企业直接在治理的实时数据上运行代理人工作负载,而无需在系统之间移动数据的延迟和一致性风险。

每个平台代表了实现相同结果的不同路径。一个足够连贯、可观察和可靠的数据层来支持代理人决策。正确的选择取决于企业的现有堆栈。不是选择哪个平台,而是解决数据层并致力于在代理人层构建之前解决它,这些是使进展的团队与仍然陷入试点的团队之间的区别。

在之后而不是之前的治理

事后建立的治理并不是治理。代理人具有下游决策权,当在部署六个月后添加防护措施时,企业已经积累了六个月的未经审计的决策。审计跟踪需要在代理人上线之前设计,而不是在第一次事件发生后改装。

同样的原则适用于AI安全、基于角色的访问控制和权限范围。没有正确范围的权限的代理人可以访问不应访问的数据、执行超出预期边界的操作或成为主动攻击面。这些是需要在开发阶段解决的风险,而不是在部署审查时发现。

如果在构建训练管道之前没有嵌入治理,错误或对抗性数据可以在未被检测的情况下进入训练过程。训练有素的模型在基准测试中表现良好,但在生产中会发生漂移,正是当代理人决策具有真正的业务后果时最危险的沉默故障。

欧盟AI法案和日益增长的AI问责监管框架使企业越来越难以忽视这一问题。企业如果没有将治理嵌入代理人体系结构中,就会积累大量的合规风险,这些风险以后会更加昂贵地解决。

从试点到生产:实际需要什么

填补生产差距的企业是那些在构建代理人层之前解决数据层的企业。他们将治理嵌入设计,而不是在造成损害之后。他们将可观察性构建到编排架构中,并与技术交付同时运行更改管理。他们将故障模式分析视为重要的设计要求。

德勤的企业AI研究显示,工人访问AI的机会在2025年alone就增加了50%,在接下来的六个月内,运行超过40%的AI项目的公司比例将翻倍。目前正在获胜的企业不是拥有最先进模型的企业,而是那些在构建代理人之前构建了可靠运行AI的运营基础设施的企业。

仍在运行不连贯试点的每个企业都应专注于确保对模型和接口的投资与对数据准备就绪和治理架构的投资成比例,这将决定代理人是否能够离开演示环境。这是许多企业失败的地方。

直到这种情况改变,许多企业投入大量资源并希望能够结出果实的代理人AI项目都将在萌芽状态下夭折。

Amit 领导 Kanerika 的 AI 团队,在那里他设计和实施了实用、面向业务的 AI 解决方案,以帮助组织从其数据中解锁更大的价值。凭借在 Python 开发、统计建模、机器学习和自然语言处理方面的深入经验,Amit 为每个项目带来了坚实的技术基础。

他的专业知识涵盖数据准备、预测分析和高级回归技术,能够实现可扩展、基于洞察力的解决方案的交付。多年来,Amit 支持了多个 Kanerika 客户,通过构建 AI 战略、预测模型和具有影响力的解决方案来推动决策、自动化工作流程和实现可衡量的结果。