Lãnh đạo tư tưởng
Nhìn vào Báo cáo MIT NANDA tháng 7 năm 2025: Tại sao Tỷ lệ Thất bại 95% của AI Pilot không phải là Kết thúc

Tôi là một người lạc quan đã được chứng minh, và tôi luôn mở lòng với bất kỳ công nghệ mới nào đến với tôi. Sự ám ảnh mới nhất của tôi mà chắc chắn sẽ ở lại trong thời gian dài? AI.
MIT NANDA vừa xuất bản một bài báo có tên ‘The GenAI Divide. State of AI in Business in 2025’, và tôi nghĩ rằng bài báo này thực sự đáng đọc. Nó cung cấp một cái nhìn thực tế về AI và vị trí của nó trong kinh doanh hiện nay. Trang chủ LinkedIn có thể看似 gần như hoang dã về cách AI đến để thay đổi mọi thứ, nhưng báo cáo vẽ lên một bức tranh khác.
Trước hết, MIT NANDA là gì?
Networked Agents và Decentralized AI (tên viết tắt là NANDA) là một sáng kiến nghiên cứu tham vọng từ Phòng thí nghiệm Truyền thông MIT. Dự án này bao gồm hơn 18 tổ chức nghiên cứu hàng đầu từ 6 lục địa và một số tên tuổi lớn trong ngành công nghệ – nghĩ đến Meta, Dell, Microsoft và các công ty khác. Mục tiêu của NANDA thực sự là tương lai, nếu không muốn nói là đột phá. Sự tham vọng là xây dựng cơ sở hạ tầng cơ bản cho Internet của các tác nhân AI, tức là một mạng phân tán nơi các tác nhân AI khám phá, xác minh và cộng tác với nhau trực tuyến vượt qua các ranh giới tổ chức. Về cơ bản, NANDA đang làm việc trên các quy tắc, giao thức, hướng dẫn và khuôn khổ rõ ràng để cho phép các tác nhân AI tương tác với các tác nhân khác thay mặt cho con người và tổ chức. Dự án NANDA là mã nguồn mở, điều này có nghĩa là nó chấp nhận các doanh nhân, nhà tiên phong, nhà công nghệ và nhà hoạch định chính sách như những người cộng tác toàn diện. (Bạn có cảm giác như Wikipedia không?)
Lý do tôi kể cho bạn nghe về điều này là vì báo cáo của MIT NANDA là phần kem của bánh khi nói đến nghiên cứu về AI. Các tác giả đang ở tiền phong của thế giới AI, và những phát hiện của họ nên được xem xét nghiêm túc (mặc dù với một chút muối).
Báo cáo được thực hiện từ tháng 1 và cuối cùng được xuất bản vào tháng 7 năm 2025. Báo cáo này dựa trên một đánh giá hệ thống của hơn 300 sáng kiến AI được công bố công khai và các cuộc phỏng vấn với các nhà lãnh đạo từ 52 tổ chức cũng như các cuộc khảo sát của 153 nhà lãnh đạo cấp cao trên bốn hội nghị ngành công nghiệp lớn.
5% Tỷ lệ Thành công của AI Pilot
Báo cáo giới thiệu thuật ngữ ‘The GenAI Divide’ để mô tả sự gián đoạn xảy ra (hoặc không xảy ra) đối với các tổ chức và thậm chí các ngành công nghiệp đang sử dụng AI một cách thành công (hoặc không thành công). Nếu một doanh nghiệp nằm ở ‘phía sai’ của sự phân chia, theo NANDA, doanh nghiệp đó không thể thay đổi thực sự, phát triển và suy nghĩ lại cấu trúc và hoạt động kinh doanh của mình. Để ở phía bên phải của sự phân chia, do đó, có nghĩa là có một kết quả cụ thể khi sử dụng AI – “Sự thiên vị đầu tư này làm cho sự phân chia GenAI trở nên sâu sắc hơn bằng cách chỉ đạo nguồn lực đến các trường hợp sử dụng có thể đo lường được nhưng thường ít biến đổi hơn, trong khi các cơ hội ROI cao nhất trong các chức năng văn phòng phía sau vẫn bị thiếu vốn”.
Lý do báo cáo này đã trở nên phổ biến là do phát hiện chính của nó. Tóm tắt điều hành cho biết: “Mặc dù đầu tư 30-40 tỷ đô la vào GenAI của doanh nghiệp, báo cáo này đã tiết lộ một kết quả bất ngờ rằng 95% tổ chức không nhận được bất kỳ khoản hoàn vốn nào… Chỉ 5% các dự án AI tích hợp đang chiết xuất hàng triệu đô la giá trị, trong khi đa số vẫn bị kẹt với không có tác động P&L có thể đo lường được.” Không quá hứa hẹn, đúng không?
Giới hạn cơ bản ngăn cản các tổ chức nhận ra giá trị thực sự của AI là những gì báo cáo định nghĩa là ‘khoảng trống học tập’. Hầu hết các hệ thống GenAI đều thiếu khả năng cơ bản để giữ lại phản hồi, thích nghi với ngữ cảnh hoặc cải thiện theo thời gian.
- Các hệ thống không học hỏi từ phản hồi. Trên thực tế, điều này có nghĩa là một người quản lý cho nó cùng một tập dữ liệu một lần nữa, nhưng không có sự cải thiện về hiệu suất. Một người quản lý sản xuất thị trường trung bình đã mô tả việc tải lên cùng hướng dẫn sản phẩm vào hệ thống AI của họ để tinh chỉnh danh sách kiểm tra hoàn thiện, nhưng mỗi lần lặp lại đều sao chép các thiếu sót và lỗi giống hệt, không có sự cải thiện về chất lượng đầu ra có thể đo lường được mặc dù có nhiều phiên phản hồi.
- Yêu cầu bối cảnh thủ công quá mức mỗi lần. Các công cụ AI thiếu bộ nhớ giữa các phiên, vì vậy mỗi lần tương tác đều cần cho nó kiến thức và bối cảnh trong quá khứ. Các quy trình công việc phức tạp, không giống như các nhiệm vụ đơn giản một lần, kéo dài và không thể hoạt động như một hỗ trợ đáng tin cậy cho các dự án đang diễn ra. Báo cáo trích dẫn một nhóm pháp lý doanh nghiệp mà, cho mỗi bản thảo hợp đồng, phải nhập lại sở thích của khách hàng, ghi chú đàm phán trước và các hạn chế pháp lý vào công cụ AI – biến quy trình hỗ trợ mà lẽ ra phải trở thành một công việc tốn thời gian làm suy yếu năng suất trong các dự án đa giai đoạn phức tạp.
- Thiếu tùy chỉnh cho một số quy trình kinh doanh. Thay vì nhận được một công cụ phản hồi thích nghi với bối cảnh rộng lớn hơn, bối cảnh rộng lớn hơn thích nghi với công cụ, buộc người dùng phải làm việc xung quanh các hệ thống cứng nhắc. Một CIO lưu ý rằng công cụ phân tích rủi ro AI do nhà cung cấp của họ cung cấp “cảm giác như một hộp một kích cỡ phù hợp tất cả”, buộc các nhóm phải thay đổi quy trình phê duyệt tín dụng của họ để phù hợp với các đầu vào cứng nhắc của công cụ thay vì cho phép AI thích nghi với các quy trình đã thiết lập. Sự không khớp cuối cùng dẫn đến các dự án bị bỏ rơi
Các Phát hiện Hàng đầu của Tôi từ Báo cáo NANDA
1. Nền Kinh tế AI Bóng tối Phát triển
Báo cáo giới thiệu thuật ngữ ‘nền kinh tế AI bóng tối’ để mô tả cách nhân viên sử dụng AI ở cấp độ của họ như một công cụ cá nhân, không phải như một công cụ được phê duyệt trên toàn tổ chức. Điều này nghe có vẻ quen thuộc với tôi, thực sự. Một người bạn của tôi từ một chi nhánh thương hiệu ô tô Trung Quốc tại CIS đã chia sẻ rằng cô ấy sử dụng ChatGPT để viết nội dung trong ứng dụng (bài đăng tin tức, quảng cáo và hơn thế nữa). Cô ấy nói rằng ở cấp độ trụ sở chính, không có công cụ AI nào được phê duyệt cho sử dụng chung, vì vậy việc sử dụng AI của cô ấy là một công cụ tăng cường và tiết kiệm thời gian mà cô ấy không thực sự đề cập với người quản lý của mình.
Báo cáo cung cấp các số liệu rất cụ thể. Trong khi chỉ 40% công ty đã mua đăng ký LLM chính thức, nhân viên từ hơn 90% công ty được khảo sát đã báo cáo việc sử dụng thường xuyên các công cụ AI cá nhân cho các nhiệm vụ làm việc. Việc sử dụng bóng tối này thường mang lại ROI tốt hơn so với các sáng kiến doanh nghiệp chính thức, tiết lộ những gì thực sự hoạt động khi các cá nhân có quyền truy cập vào các công cụ linh hoạt và phản hồi.
2. Phân bổ Đầu tư Phản ánh Ưu tiên Sai lầm
Báo cáo tiết lộ một sự không phù hợp đáng kể giữa đầu tư AI và tiềm năng ROI thực tế. Khoảng 50% ngân sách GenAI chảy vào các chức năng bán hàng và tiếp thị, chủ yếu vì kết quả có thể được đo lường dễ dàng và phù hợp với các KPI cấp hội đồng quản trị. Tuy nhiên, các khoản hoàn vốn cao nhất thường xuất hiện từ tự động hóa văn phòng phía sau, như việc loại bỏ BPO có thể tiết kiệm tới 10 triệu đô la mỗi năm, giảm 30% chi phí sáng tạo bên ngoài và tiết kiệm 1 triệu đô la mỗi năm về quản lý rủi ro bên ngoài. Sự thiên vị đầu tư này làm cho sự phân chia GenAI trở nên sâu sắc hơn bằng cách chỉ đạo nguồn lực đến các trường hợp sử dụng có thể đo lường được nhưng thường ít biến đổi hơn.
Tuy nhiên, niềm tin cá nhân của tôi là như vậy. Từ những gì tôi nhớ từ kinh nghiệm của mình tại một công ty ngân hàng quốc tế sở hữu các ngân hàng bán lẻ trên toàn thế giới, việc giới thiệu một công cụ đào sâu vào cốt lõi của tổ chức, ăn vào dữ liệu của nó và (ai biết?) rò rỉ thông tin nội bộ ra ngoài là một rủi ro lớn. Vì vậy, tôi hiểu tại sao việc đăng ký một nhà máy nội dung AI để tạo nội dung dễ dàng cho quảng cáo Facebook là một việc không cần phải suy nghĩ, trong khi các gián đoạn phức tạp ở phía sau là không được đón nhận nhiệt tình. Trừ khi đó là một lệnh trực tiếp từ cấp C, việc triển khai các công cụ AI phá vỡ nghiêm trọng vào cốt lõi của công ty sẽ mất ít nhất 12 tháng.
May mắn thay, tôi đã có cơ hội chứng kiến bên trong một công cụ tự động hóa AI được tạo cho đội ngũ bán hàng của một công ty sản xuất cửa sổ địa phương. Họ đã thuê một nhà thầu tự do từ n8n, và anh ấy đã xây dựng cho họ một công cụ phân tích cuộc gọi và trò chuyện được hỗ trợ bởi AI. Doanh nghiệp bây giờ có thể tìm thấy các nút thắt trong phễu của họ nhanh hơn, và nhiều điểm đau hơn được đưa ra ánh sáng khi AI giúp doanh nghiệp xử lý ngôn ngữ nói và viết. Tỷ lệ hài lòng của họ là cực kỳ cao, với nhiều dữ liệu được xử lý nhanh hơn.
3. Xây dựng Nội bộ Thua Các Nhà cung cấp Bên ngoài
Để nói một cách thẳng thắn, phát hiện này đã khiến tôi ngạc nhiên. Trái với niềm tin phổ biến rằng các doanh nghiệp nên xây dựng các công cụ AI của riêng họ, nghiên cứu cho thấy rằng các quan hệ đối tác chiến lược với các nhà cung cấp bên ngoài có khả năng đạt được triển khai gấp đôi so với các nỗ lực phát triển nội bộ. Ai có thể nghĩ vậy, đúng không? Chắc chắn không phải tôi.
Các tổ chức coi các nhà cung cấp AI như các nhà cung cấp dịch vụ kinh doanh – yêu cầu tùy chỉnh sâu và giữ họ chịu trách nhiệm về các kết quả hoạt động thay vì các tiêu chuẩn mô hình – đạt được tỷ lệ thành công cao hơn đáng kể và thời gian đến giá trị nhanh hơn.
4. Đầu tư Cao hơn Có nghĩa là Sự gián đoạn Cao hơn? Không hẳn.
Sử dụng Chỉ số Gián đoạn Thị trường AI tổng hợp, báo cáo tiết lộ rằng chỉ hai ngành – Công nghệ và Truyền thông & Viễn thông – cho thấy các dấu hiệu rõ ràng về sự gián đoạn cấu trúc từ GenAI. Bảy trong số chín lĩnh vực chính cho thấy hoạt động thí điểm đáng kể nhưng thay đổi cấu trúc tối thiểu, với các ngành như Chăm sóc sức khỏe, Dịch vụ tài chính và Năng lượng cho thấy điểm số gián đoạn dưới 0,5 trên thang điểm 5. Khoảng trống này giữa tính khả dụng của đầu tư và sự biến đổi thực sự thể hiện sự phân chia GenAI ở cấp độ ngành.
Tại sao Tỷ lệ Thất bại 95% là Tạm thời
Mặc dù những kết quả tạm thời có vẻ tuyệt vọng, nhưng vẫn có một tia hy vọng ở cuối đường hầm. Báo cáo giải thích rằng sự phân chia GenAI là tạm thời và sẽ được vượt qua thông qua các phát triển mới.
NANDA chính là một trong những người đóng góp hàng đầu cho một thế giới AI kết nối hơn. Các cơ chế mà báo cáo trích dẫn là Giao thức Context Model (hoặc MCP) và Agent-to-Agent (hoặc A2A) là nền tảng cơ sở hạ tầng cho tính tương tác mượt mà của tác nhân và phối hợp tự chủ giữa các hệ thống.
Các nỗ lực của NANDA và các công cụ này là con đường dẫn đến chính xác những gì NANDA đang theo đuổi – Agentic Web, một mạng lưới các tác nhân có khả năng phối hợp tự chủ trên internet. Sự tương tác của họ sẽ được thiết kế để thay thế các quy trình công việc tĩnh bằng các hệ thống tự giáo dục động.
Có vẻ quá tốt để trở thành sự thật hoặc thậm chí là ma thuật không? Chà, Microsoft Copilot Studio’s Multi-Agent Orchestration là một sự tương đồng gần nhất với tầm nhìn. Hệ thống này giúp xây dựng một cây tác nhân nơi một tác nhân Copilot chính kích hoạt các tác nhân phụ chịu trách nhiệm về các nhiệm vụ cụ thể như lập lịch hoặc tạo tài liệu. Mỗi tác nhân vẫn nằm trong lĩnh vực chuyên môn của mình trong khi phối hợp với những tác nhân khác. Để nói một cách thực tế hơn, khi người dùng yêu cầu “Lập kế hoạch ra mắt sản phẩm Q4 của chúng tôi”, tác nhân điều phối tự động ủy quyền cho các tác nhân chuyên dụng – một xử lý nghiên cứu thị trường, một tạo thời gian biểu và một phối hợp với các công cụ quản lý dự án. Công việc được thực hiện đồng bộ, nhưng tự chủ.
Vậy, báo cáo của NANDA để lại cho chúng ta điều gì? Cửa sổ để vượt qua sự phân chia GenAI đang thu hẹp nhanh khi các doanh nghiệp bắt đầu khóa các mối quan hệ với các nhà cung cấp có khả năng học hỏi, tạo ra sự gián đoạn và phát triển cũng như tối ưu hóa các hoạt động kinh doanh ở phía sau, thêm động lực vào cốt lõi của các tổ chức. Sự thành công nằm ở việc mua các hệ thống tác nhân AI thay vì xây dựng chúng từ đầu nội bộ. Khi các hệ thống học tập, ghi nhớ và tự cung tự cấp trở nên phổ biến hơn, tỷ lệ thất bại 95% hiện tại sẽ nhường chỗ cho một kỷ nguyên mới mà trong đó các hệ thống AI cộng tác mượt mà giữa các nhà cung cấp, lĩnh vực và ranh giới tổ chức. Đó là tương lai thực sự của ROI cho các khoản đầu tư hiện tại.
Các Luận điểm Thay thế về Việc áp dụng AI
Dự án NANDA đã làm một công việc tuyệt vời trong việc biên soạn dữ liệu từ nhiều nguồn và khảo sát các nhà lãnh đạo từ nhiều lĩnh vực. Nhưng liệu đó có phải là người phát ngôn tối thượng cho việc áp dụng AI trên toàn thế giới không? Nếu bạn, như tôi, thấy The GenAI Divide có vẻ khá ảm đạm, nếu không muốn nói là nản lòng, thì tôi đã tìm thấy những quan điểm thay thế về việc áp dụng AI để giữ cho ngọn lửa AI cá nhân của tôi cháy sáng.
- Jed Nykolle Harme của IT Brief UK đã phân tích CIO Playbook 2025 của Lenovo. Nghiên cứu này bao gồm phản hồi từ các nhà lãnh đạo CNTT trên khắp EMEA (Châu Âu, Trung Đông và Châu Phi), và kết luận của nó hứa hẹn hơn nhiều. Hóa ra ngành bán lẻ đang dẫn đầu khi nói đến sự hài lòng của AI, nơi 96% hiệu suất thí điểm AI đáp ứng hoặc vượt quá mong đợi.
- Trước đó, tôi đã bày tỏ sự đồng cảm với những người chơi thị trường doanh nghiệp lớn tìm thấy AI khó triển khai và không đặc biệt cởi mở với việc kết hợp sâu sắc. Lenovo, tuy nhiên, trình bày một bức tranh khác với các ngành Ngân hàng, Dịch vụ tài chính và Bảo hiểm (BFIS): mặc dù có tỷ lệ áp dụng AI thấp nhất là 7%, 33% những người thử nghiệm AI báo cáo rằng các thí điểm đã vượt quá mong đợi. Bí quyết cho những xu hướng tích cực như vậy là ‘cách tiếp cận thận trọng’, như Arabian Business đưa ra.
- Một báo cáo khác mang lại sự an ủi Nghiên cứu của IBM CEO mở đầu với một lời nói trước táo bạo của Phó Chủ tịch IBM Gary Cohn: “Khi việc áp dụng AI tăng tốc… phần thưởng cuối cùng chỉ đến với các CEO có can đảm chấp nhận rủi ro như một cơ hội. … Khi môi trường kinh doanh không chắc chắn, sử dụng AI và dữ liệu doanh nghiệp của bạn để xác định nơi bạn có đòn bẩy là một lợi thế cạnh tranh. Tại thời điểm này, các nhà lãnh đạo không tận dụng AI và dữ liệu của riêng họ để tiến về phía trước đang đưa ra một quyết định kinh doanh có ý thức là không cạnh tranh.”
- Nghiên cứu của IBM CEO cho thấy một số sự thật truyền cảm hứng. Ví dụ, sự tăng trưởng đầu tư AI dự kiến sẽ tăng hơn gấp đôi trong hai năm tới, vì vậy gần 20% tổng ngân sách CNTT sẽ được phân bổ cho AI – cam kết này chứng tỏ rằng mặc dù những thách thức rõ ràng và đã được chứng minh, niềm tin vào AI là mạnh mẽ và, quan trọng nhất, đó là một khoản đầu tư chiến lược chứ không phải chi tiêu phản ứng.
- Cuối cùng nhưng không kém phần quan trọng, 64% CEO trong báo cáo đồng ý rằng rủi ro bị tụt lại phía sau thúc đẩy đầu tư vào công nghệ mới ngay cả trước khi có một sự hiểu biết rõ ràng về tác động của nó. Tuy nhiên, không có quyết định nhanh chóng. Thay vào đó, những người ra quyết định chọn ‘đặt cược chiến lược’. Để nói một cách đơn giản, khi một đối thủ ra mắt một rô-bốt trò chuyện AI cho các khuyến nghị được cá nhân hóa, bạn làm điều tương tự cho trang web của mình. Bạn có thể không chắc chắn về việc tăng doanh thu nhưng bạn biết rằng nếu bạn chậm lại trong hai năm cho đến khi ‘bộ dữ liệu hoàn hảo’ được biên soạn, bạn sẽ mất đi động lực một cách không thể khắc phục. Vì vậy, quy tắc rất đơn giản: hãy sao chép một cách hung hãn, sau đó xem kết quả.
Kết luận
Tóm lại, tôi muốn bày tỏ niềm tin cá nhân sâu sắc vào AI. Là một doanh nhân, một CMO, một nhà phát triển kinh doanh và một cựu nhân viên văn phòng trong ngành ngân hàng, tôi thấy rất nhiều cách AI có thể giúp tối ưu hóa ngân sách, tối ưu hóa quy trình công việc và boost teams. Tương lai là tăng tốc và tăng tốc. Nếu một doanh nghiệp muốn cạnh tranh, nó cần phải nói được tiếng AI. Mặc dù những phát hiện tôi trình bày là gây tranh cãi, nhưng tôi tin rằng cảnh quan AI hiện tại, với những đỉnh và thung lũng của nó, là một khung thời gian học tập tự nhiên, được lặp lại lại và lại với mỗi công nghệ mới.












