思想领袖

查看 MIT NANDA 2025 年 7 月报告：为什么 95% 的 AI 试点失败率并非终点

Published September 12, 2025

Updated April 26, 2026

Ilya Romanov

我是一个有证明的乐观主义者，我会对任何新技术保持开放的态度。我的最新痴迷将会长期存在？AI。

MIT NANDA最近发布了一篇名为‘The GenAI Divide. State of AI in Business in 2025’的论文，我认为这篇论文值得一读。它对AI和其在商业中的地位提供了一个清醒的看法。LinkedIn上的信息可能会让人觉得AI已经改变了一切，但这篇报告却呈现出一个不同的图景。

首先，什么是MIT NANDA？

网络化代理和去中心化AI（简称NANDA）是来自MIT媒体实验室的一个雄心勃勃的研究计划。该项目涵盖了6个大陆的18多个领先的研究机构和一些科技行业的大牌——比如Meta、Dell、Microsoft等。NANDA的目标确实是前瞻性的，如果不是开创性的。雄心是建立人工智能代理的互联网的基础设施，即一个去中心化的网络，人工智能代理可以在线跨组织边界发现、验证和协作。基本上，NANDA正在努力制定明确的规则、协议、指南和框架，以使人工智能代理代表人类和组织与其他代理交互。NANDA项目是开源的，这意味着它欢迎企业家、有远见的人、技术专家和政策制定者作为全面合作伙伴。（你是否感受到维基百科的氛围？）

我之所以提到这件事，是因为MIT NANDA的报告是人工智能研究的顶峰。作者们处于人工智能世界的最前沿，他们的发现应该被认真对待（尽管带有一丝怀疑）。

这篇论文从一月份开始撰写，终于在2025年7月出版。该报告基于对300多个公开披露的人工智能计划的系统审查和来自52个组织的领导者的采访，以及对四个主要行业会议的153位高级领导者的调查。

5%的人工智能试点成功率

该报告引入了“GenAI Divide”一词来描述组织和甚至整个行业成功（或未能成功）地采用人工智能时发生的（或未发生的）颠覆。根据NANDA，如果一个企业处于“分歧的错误一方”，那么该企业将无法真正改变、进化和重新思考其结构和业务运营。因此，处于分歧的正确一方意味着采用人工智能有一个有形的结果——“这种投资偏见通过将资源分配到可见但往往不太具有变革性的用例中而延续了GenAI Divide，同时后台功能中的最高投资回报率机会仍然被低估”。

该报告引起了这么多关注的原因是它的关键发现。执行摘要指出：“尽管企业在GenAI上投资了300-400亿美元，但这份报告发现了一个令人惊讶的结果：95%的组织没有获得任何回报……只有5%的集成人工智能试点获得了数百万美元的价值，而大多数试点仍然停滞不前，没有任何可衡量的利润和损失影响”。听起来不太令人振奋，对吧？

组织无法实现人工智能真正价值的根本限制是该报告定义的“学习差距”。大多数GenAI系统根本缺乏保留反馈、适应上下文或随时间改进的能力。

系统无法从反馈中学习。 在现实中，这意味着一位经理一次又一次地向其输入相同的数据集，但其性能并没有改善。一位中型制造业经理描述了他反复将相同的产品手册上传到他们的人工智能系统中，以完善履行清单，但每次迭代都会复制相同的遗漏和错误，尽管进行了多次反馈会话，但输出质量并没有任何改善。
每次都需要过多的手动上下文。 人工智能工具在会话之间缺乏记忆，因此每次交互都需要重新输入过去的知识和上下文。复杂的工作流程与简单的单次任务不同，会拖延并且无法作为持续项目的可靠支持。该报告引用了一家公司法律团队的例子，他们每次草拟合同时，都必须将客户偏好、之前的谈判记录和监管约束重新输入到人工智能工具中——这将原本应该是辅助工作流程变成了一项耗时的琐事，损害了复杂、多阶段项目的生产力。
对于某些业务流程，定制不足。 与其获得一个能够适应更广泛上下文的响应工具，不如说更广泛的上下文适应工具，迫使用户绕过僵化的系统。一位CIO指出，他们的供应商提供的风险分析人工智能“感觉像一个通用盒子”，迫使团队将其信用审批工作流程改为适应工具的僵化输入，而不是让人工智能适应既定的流程。这种不匹配最终导致了试点项目被放弃

我从NANDA报告中得出的主要发现

1. 影子AI经济蓬勃发展

该报告引入了“影子AI经济”一词来描述员工如何在个人层面上使用AI作为个人工具，而不是组织范围内批准的工具。这听起来很熟悉。我的一个朋友来自中国汽车品牌在CIS的分支，她使用ChatGPT编写应用内内容（新闻帖子、广告等）。她说，在总部层面上，没有批准使用AI工具，所以她使用AI是她自己的助推器和节省时间的工具，她并没有把它提到她的经理那里。

该报告提供了非常具体的数字。虽然只有40%的公司购买了官方LLM订阅，但来自90%的调查公司的工人报告称，他们经常使用个人AI工具进行工作任务。这种影子使用往往比正式的企业计划带来更好的投资回报率，揭示了当个人可以使用灵活、响应迅速的工具时，什么是有效的。

2. 投资分配反映了错误的优先顺序

该报告揭示了人工智能投资和实际投资回报率潜力之间存在显著的不匹配。约50%的GenAI预算流向销售和营销功能，主要是因为结果可以轻松衡量，并且符合董事级的关键绩效指标。然而，最高的回报往往来自后台自动化，例如BPO消除每年节省高达1000万美元，外部创意成本减少30%，外包风险管理每年节省100万美元。这一投资偏见通过将资源分配到可见但往往不太具有变革性的用例中而延续了GenAI Divide，同时后台功能中的最高投资回报率机会仍然被低估。

然而，我的个人信念是这样的。从我在一家拥有全球零售银行的国际银行的经验来看，引入一个工具来深入挖掘组织的内部，利用其数据，并且（谁知道？）泄露内部信息，这是一个巨大的风险。所以，我理解为什么注册一个AI内容工厂来制作Facebook广告的创意是一个不需要思考的决定，而复杂的后端破坏则没有那么热情地接受。除非是来自C级别的直接命令，否则在公司的核心实施严重的破坏性AI工具需要至少12个月。

幸运的是，我有机会看到一个为某家窗户制造公司的销售团队制作的AI自动化。他们雇佣了n8n的自由职业者，他为他们建立了一个AI驱动的呼叫和聊天分析工具。该业务现在能够更快地找到漏洞，并且随着AI帮助业务处理书面和口头语言，更多的痛点浮现出来。他们的满意度非常高，更多的数据被处理得更快。

3. 内部构建输给外部供应商

老实说，这个发现让我感到惊讶。与人们普遍认为企业应该自己构建人工智能工具的观点相反，研究表明，与外部供应商建立战略合作伙伴关系更有可能实现部署，而不是内部开发工作。谁会想到呢？好吧，显然不是我。

那些将AI供应商视为商业服务提供商的组织——要求深度定制，并将其视为业务服务提供商，而不是模型基准——实现了显著更高的成功率和更快的价值实现时间。

4. 更高的投资意味着更大的颠覆？并非如此。

使用人工智能市场颠覆指数，报告显示，只有两个行业——科技和媒体与电信——显示出明显的结构性颠覆迹象。九个主要行业中的七个表现出显著的试点活动，但结构变化很小，像医疗保健、金融服务和能源等行业的颠覆评分低于0.5（满分5分）。这种投资可见性和实际转型之间的差距体现了GenAI Divide在行业层面的现象。

为什么95%的失败率是暂时的

尽管看似绝望的临时结果，但前景仍然乐观。报告解释说，GenAI Divide是暂时的，将通过新兴发展克服。

NANDA本身是更紧密相连的AI世界的领先贡献者之一。报告中提到的机制是模型上下文协议（或MCP）和代理到代理（或A2A）作为代理无缝互操作性和自主协调的基础设施。

NANDA的努力和这些工具是通往NANDA所追求的代理网络的途径——一个能够自主协调的代理网络。他们的交互将被设计用来用动态的自我教育系统取代静态的工作流程。

听起来是否过于美好或甚至神奇？好吧，Microsoft Copilot Studio的多代理编排是对这一愿景最接近的实现。该系统帮助构建一个代理树，其中一个主Copilot代理触发负责特定任务的子代理——如安排或文档生成。每个代理都在其专业领域内工作，同时与其他代理协调。用更实际的术语来说，当用户请求“计划我们的第四季度产品发布”时，编排器代理会自动委派给专门的代理——一个处理市场研究，另一个处理时间表创建，第三个代理与项目管理工具协调。工作以同步和自治的方式进行。

那么，NANDA的报告给我们留下了什么？跨越GenAI Divide的窗口正在迅速关闭，因为企业开始与能够产生颠覆、进化和优化业务运营的学习能力工具建立供应商关系，给组织的核心增加了动力。成功在于购买AI代理系统，而不是从内部构建。随着代理学习、记忆和自给自足的系统变得更加普遍，当前的95%的失败率将让位于一个新的时代——在这个时代，AI系统将跨供应商、领域和组织边界无缝协作。这个未来才是当前投资的真正回报率。

对AI采用的一些替代观点

NANDA项目在编译来自多个来源的数据和调查多个领域的领导者方面做得非常出色。但它是否是全球AI采用最权威的发言人？如果你像我一样发现《GenAI Divide》有些令人沮丧，如果不是令人沮丧，我已经找到了这些对AI采用的一些替代观点来保持我个人对AI的热情。

Jed Nykolle Harme of IT Brief UK 分析了 Lenovo的CIO Playbook 2025。该研究包括来自EMEA（欧洲、中东和非洲）的IT领导者的反馈，结论更为乐观。事实证明，零售业在人工智能满意度方面处于领先地位，其中96%的人工智能试点性能要么达到，要么超过预期。
我之前对那些发现人工智能难以实施并且不愿意大量采用的人工智能的巨型企业市场玩家表示同情。然而，Lenovo呈现出不同的图景——银行、金融服务和保险（BFIS）行业：尽管人工智能采用率最低（7%），但33%的测试人工智能报告称试点超过了预期。这种积极趋势背后的秘密是“谨慎的方法”，正如阿拉伯商业所述。
另一个令人放心的报告是IBM CEO Study，以IBM副董事长加里·科恩的大胆序言开头：“随着人工智能的采用加速……最终的回报只会来自于那些有勇气将风险视为机会的CEO。……当业务环境不确定时，使用人工智能和企业数据来确定您拥有杠杆作用的领域是一种竞争优势。在这一点上，领导者如果不利用人工智能和自己的数据来推动发展，那么他们就做出了一个不竞争的有意识的商业决策。”
IBM CEO调查显示了一些鼓舞人心的事实。例如，人工智能投资预计在未来两年内将增加一倍以上，几乎20%的IT预算将分配给人工智能——这一承诺表明，尽管存在明显的挑战，但对人工智能的信念很强，而且这是一项战略投资，而不是反应性支出。
最后，64%的CEO同意，落后于竞争对手的风险推动了对新技术的投资，尽管其影响尚不清楚。然而，并没有快速的决定。相反，决策者选择“战略性对冲”。简单来说，当竞争对手为网站推出人工智能聊天机器人时进行个性化推荐，你也会这样做。你可能不知道收入增加，但你知道如果你落后两年，等到“完美的数据集”编译完成，你将不可逆转地失去动力。所以规则很简单：积极地跟随，然后看看结果。

结论

总之，我想表达我对AI的个人、衷心的信念。作为一名企业家、CMO、商业开发者和前银行办公室员工，我看到了AI可以帮助优化预算、简化工作流程和增强团队的许多方法。未来是增强和加速的。如果一个企业想要竞争，它需要精通AI。虽然我提出的发现很有争议，但我相信，当前的AI格局带有起伏，是每一种新技术重复出现的自然学习时间段。