Lãnh đạo tư tưởng

2026: Năm Chi Phí Trí Tuệ Nhân Tạo Buộc Mọi Công Ty Phải Đánh Giá Lại Chiến Lược Của Mình

mm

Trong những năm qua, tôi đã chứng kiến trực tiếp tốc độ thay đổi nhanh chóng của dữ liệu và cảnh quan trí tuệ nhân tạo, đặc biệt là khi các doanh nghiệp đang cố gắng hiện đại hóa các kiến trúc phức tạp đồng thời vẫn cung cấp hiệu suất đáng tin cậy trên quy mô toàn cầu. Áp lực đối với các nhà lãnh đạo đang tăng lên khi kỳ vọng về trí tuệ nhân tạo tăng tốc và khoảng cách giữa những gì các tổ chức muốn đạt được và những gì cơ sở hạ tầng của họ có thể hỗ trợ thực tế đang trở nên rộng lớn hơn. Sự căng thẳng này đang thay đổi các ưu tiên của ngành và tạo ra tiền đề cho những gì sẽ xảy ra tiếp theo. Dựa trên chuyên môn ngành và kinh nghiệm của tôi trong việc lãnh đạo Teradata qua nhiều lần chuyển đổi, dưới đây là ba dự đoán của tôi về những gì chúng ta có thể mong đợi trong năm 2026.

1. Cuộc Cách Mạng Sản Xuất Trí Tuệ Nhân Tạo

Năm 2026 sẽ đánh dấu năm mà các doanh nghiệp cuối cùng vượt qua khoảng cách từ các dự án thí điểm sang sản xuất trí tuệ nhân tạo trên quy mô lớn. Trong khi năm 2025 chứng kiến nghịch lý trí tuệ nhân tạo, với 92% doanh nghiệp tăng đầu tư vào trí tuệ nhân tạo nhưng chỉ 1% đạt đến độ trưởng thành, năm 2026 sẽ phân biệt những người chiến thắng và những người thua cuộc. Điểm nghẽn sản xuất trí tuệ nhân tạo không bao giờ là về việc xây dựng mô hình hoặc tạo ra ý tưởng; nó là về việc triển khai trí tuệ nhân tạo trên quy mô doanh nghiệp với niềm tin, ngữ cảnh và hiệu quả kinh tế.

Sang năm, chúng ta sẽ thấy sự tương tác giữa các tác nhân trở nên phổ biến trong ít nhất một ngành công nghiệp B2B lớn, cho dù đó là mua sắm, chuỗi cung ứng hay dịch vụ khách hàng. Các tổ chức chuẩn bị cho nhu cầu tính toán khổng lồ của trí tuệ nhân tạo sẽ vượt xa đến mức mà các đối thủ cạnh tranh sẽ tìm thấy nó gần như không thể bắt kịp. Không giống như các ứng dụng truyền thống chỉ thực hiện một vài truy vấn mỗi phút, hệ thống trí tuệ nhân tạo với khả năng truy vấn 24/7 luôn bật tạo ra 25 lần yêu cầu cơ sở dữ liệu hơn và tiêu thụ 50 đến 100 lần tài nguyên tính toán hơn khi chúng suy luận qua các vấn đề, thu thập ngữ cảnh và thực hiện nhiệm vụ.

Đây không chỉ là những con số lớn hơn; chúng đại diện cho một sự thay đổi cơ bản trong cách cơ sở hạ tầng doanh nghiệp phải hoạt động. Thách thức cơ sở hạ tầng là sâu sắc, và nó đòi hỏi kiến trúc xử lý song song khối lượng lớn – một cách tiếp cận tính toán sử dụng nhiều bộ xử lý để thực hiện tính toán đồng thời trên các phần khác nhau của một tập dữ liệu lớn – có thể xử lý khối lượng công việc hỗn hợp trên quy mô lớn. Khi các doanh nghiệp triển khai hàng nghìn tác nhân này để đánh giá hàng triệu mối quan hệ trên hàng nghìn bảng để đưa ra một quyết định, những mili giây sẽ bắt đầu quan trọng. Chúng ta không còn nói về các trợ lý trí tuệ nhân tạo bị cô lập; chúng ta đang nói về toàn bộ hệ sinh thái của các tác nhân chuyên dụng làm việc cùng nhau, mỗi tác nhân đều truy vấn dữ liệu, suy luận qua các lựa chọn và phối hợp với các tác nhân khác trong thời gian thực. Các công ty tìm ra cách xử lý khối lượng này một cách hiệu quả với chi phí dự đoán sẽ chiếm ưu thế, trong khi những công ty bị bắt gặp ngoài tầm tay bởi chi phí cơ sở hạ tầng tăng vọt sẽ gặp khó khăn.

Đến cuối năm 2026, tôi dự đoán sẽ có những câu chuyện về ROI có thể đo lường được, tính bằng hàng trăm triệu, không chỉ là dự đoán hy vọng. Các triển khai sản xuất đầu tiên sẽ chứng minh giá trị kinh doanh cụ thể vượt ra ngoài lợi ích về năng suất và chuyển sang biến đổi kinh doanh thực sự. Những điều này sẽ không chỉ là các bot trò chuyện đơn giản hoặc tóm tắt tài liệu; chúng sẽ là các hệ thống thông minh thay đổi cơ bản cách thức công việc được thực hiện trên toàn bộ tổ chức.

2. Cuộc Chiến Nền Tảng Tri Thức: Khi Mili Giây Trở Thành Triệu

Năm 2026, các doanh nghiệp sẽ khám phá ra rằng các tác nhân trí tuệ nhân tạo của họ chỉ thông minh như cơ sở hạ tầng dữ liệu của họ nhanh chóng. Khi một hệ thống tác nhân tạo ra 10.000 truy vấn để trả lời một câu hỏi của khách hàng, sự khác biệt giữa thời gian phản hồi truy vấn 100ms và 10ms không chỉ là trải nghiệm người dùng; đó là sự khác biệt giữa hóa đơn cơ sở hạ tầng hàng tháng 50.000 đô la và 5 triệu đô la.

Các số liệu của ngành hỗ trợ sự thay đổi này. FutureScape 2026 của IDC dự đoán rằng vào năm 2028, 45% tương tác sản phẩm và dịch vụ CNTT sẽ sử dụng các tác nhân như giao diện chính cho các hoạt động liên tục. Khảo sát về trạng thái trí tuệ nhân tạo năm 2025 của McKinsey cho thấy rằng ở những nơi tiềm năng thâm nhập trí tuệ nhân tạo cao, các hệ thống tác nhân đang nhanh chóng biến đổi cách các tổ chức tiêu thụ công nghệ. Các triển khai sản xuất đầu tiên cho thấy rằng các công việc tác nhân tạo ra 25 lần yêu cầu cơ sở dữ liệu hơn so với các ứng dụng truyền thống. Một tương tác dịch vụ khách hàng được hỗ trợ bởi trí tuệ nhân tạo trước đây yêu cầu ba cuộc gọi API bây giờ kích hoạt hàng nghìn truy vấn ngữ cảnh khi tác nhân suy luận qua các lựa chọn, xác thực thông tin và tổng hợp phản hồi.

Các kho dữ liệu đám mây truyền thống được tối ưu hóa cho phân tích批 sẽ bị sập dưới nhu cầu tác nhân thời gian thực. Bản chất luôn bật của các nền tảng tác nhân mâu thuẫn cơ bản với môi trường tính toán động được thiết kế để bật lên cho các khối lượng công việc đã lên lịch và tắt để tiết kiệm chi phí. NANDA initiative của MIT phát hiện ra rằng 95% chương trình thí điểm trí tuệ nhân tạo không mang lại tác động P&L có thể đo lường được, không phải vì chất lượng mô hình, mà do một “khoảng cách học” nơi các hệ thống không thể thích ứng đủ nhanh với các quy trình làm việc của doanh nghiệp. Khi độ trễ cơ sở hạ tầng làm tăng khoảng cách này, ngay cả các tác nhân tinh vi nhất cũng trở nên không hiệu quả. Các tổ chức sẽ nhận ra rằng tối ưu hóa truy vấn – từng được coi là một vấn đề đã được giải quyết và được giao cho các quản trị viên cơ sở dữ liệu – đã trở thành nút thắt quan trọng trong ROI của trí tuệ nhân tạo.

Đây là nơi các nền tảng được xây dựng trên kiến trúc xử lý song song khối lượng lớn gặp gỡ tương lai của trí tuệ nhân tạo. Các hệ thống được xây dựng từ đầu cho các khối lượng công việc hỗn hợp (xử lý các truy vấn hoạt động và khối lượng công việc phân tích đồng thời mà không bị suy giảm hiệu suất) sẽ phân biệt những người chiến thắng với những người tụt lại phía sau. Khi mỗi mili giây hiệu suất truy vấn trực tiếp ảnh hưởng đến trí tuệ của tác nhân, chất lượng phản hồi và kết quả kinh doanh, các quyết định cơ sở hạ tầng trở thành những mệnh lệnh chiến lược.

Chúng ta đã thấy điều này với khách hàng chạy các tác nhân trí tuệ nhân tạo sản xuất. Họ bị sốc khi phát hiện ra rằng kho đám mây ‘hiện đại’ của họ thêm 2-3 giây vào mỗi tương tác tác nhân, khiến trí tuệ nhân tạo cảm giác chậm chạp và không phản hồi. Nhân thời gian trễ này qua hàng nghìn tương tác hàng ngày, và trải nghiệm người dùng trở nên không thể chấp nhận được. Đến cuối năm 2026, hiệu suất truy vấn sẽ trở thành tiêu chí đánh giá chính cho các quyết định cơ sở hạ tầng trí tuệ nhân tạo, thay thế chi phí lưu trữ và khả năng mở rộng như những mối quan tâm hàng đầu.

Động lực quyền lực thay đổi đáng kể khi các công ty có thể triển khai trí tuệ nhân tạo trực tiếp chống lại cơ sở hạ tầng dữ liệu được tối ưu hóa với nhiều thập kỷ kinh nghiệm phân tích quyết định được tích hợp sẵn. Thay vì bị ràng buộc bởi các kiến trúc của nhà cung cấp không thể xử lý khối lượng truy vấn tác nhân, họ có sự linh hoạt để đổi mới với tốc độ trí tuệ nhân tạo, cung cấp trải nghiệm tác nhân phản hồi và tránh những cơn ác mộng về hiệu suất đến từ sự không phù hợp giữa cơ sở hạ tầng và khối lượng công việc.

Sự thay đổi này sẽ buộc các nhà cung cấp phải đối mặt trên toàn bộ cảnh quan nền tảng dữ liệu. Những nhà cung cấp nào sống sót sẽ là những nhà cung cấp có thể chứng minh rằng kiến trúc của họ được xây dựng cho thời điểm này: nơi thời gian phản hồi truy vấn dưới một giây ở quy mô lớn không phải là một tính năng, mà là nền tảng của tự động hóa thông minh

3. Phục Hưng Hybrid: Chủ Quyền Dữ Liệu Trở Thành Chiến Lược

Đồng hồ đong đếm lại với các môi trường hybrid khi các doanh nghiệp nhận ra rằng nó không chỉ là về việc chọn giữa đám mây và trên cơ sở nữa. Nó là về việc vận hành hiệu quả trên cả hai để đáp ứng nhu cầu kinh doanh đa dạng. Năm 2026, chủ quyền dữ liệu sẽ chứng minh rằng nó không chỉ là về tuân thủ mà còn là lợi thế cạnh tranh chiến lược và ngày càng nhiều, về sự tồn tại kinh tế.

Kinh tế là không thể phủ nhận: khi trí tuệ nhân tạo tác nhân thúc đẩy khối lượng truy vấn theo cấp số nhân, chi phí đám mây sẽ tăng vọt. Gartner dự đoán rằng vào năm 2030, các công ty không tối ưu hóa môi trường tính toán trí tuệ nhân tạo cơ bản sẽ phải trả hơn 50% so với những công ty làm được, trong khi 50% tài nguyên tính toán đám mây sẽ được dành cho các khối lượng công việc trí tuệ nhân tạo vào năm 2029, tăng từ ít hơn 10% ngày nay – một mức tăng năm lần trong các khối lượng công việc liên quan đến trí tuệ nhân tạo. Các tổ chức đang nhận ra rằng hybrid không phải là một di tích còn lại; đó là con đường tiến bộ thực tế.

Toán học là thuyết phục. Khi bạn chạy hàng nghìn tác nhân trí tuệ nhân tạo tạo ra hàng triệu truy vấn mỗi ngày, sự khác biệt giữa chi phí đám mây và trên cơ sở trở nên đáng kể. Các tổ chức thông minh đã mô hình hóa các kịch bản này và nhận ra rằng triển khai hybrid chiến lược không chỉ là một điều mong muốn; đó là điều cần thiết cho các hoạt động trí tuệ nhân tạo bền vững. Khi trí tuệ nhân tạo trở thành yếu tố phân biệt, các tổ chức sẽ hiểu rằng chiến lược dữ liệu và kiến thức ngành của họ quá quý giá để giao hoàn toàn cho các nhà cung cấp đám mây công cộng. Họ sẽ muốn kiểm soát và sở hữu dữ liệu của mình, biết nơi dữ liệu được địa lý và quản lý kinh tế của trí tuệ nhân tạo trên quy mô lớn.

Chúng ta sẽ thấy xu hướng này rõ ràng nhất ở quốc tế và trong các ngành công nghiệp được quy định như dịch vụ tài chính và chăm sóc sức khỏe, nhưng yêu cầu chi phí sẽ thúc đẩy việc áp dụng trên tất cả các lĩnh vực. Các công ty cung cấp sự linh hoạt triển khai thực sự, với dữ liệu, tính toán, mô hình, khối lượng công việc, kết quả và trải nghiệm nhất quán trên các môi trường hybrid, sẽ chiến thắng. Các tổ chức sẽ yêu cầu khả năng chạy các khả năng trí tuệ nhân tạo tiên tiến, bao gồm cả mô hình ngôn ngữ và xử lý vector, sau firewall của họ trong khi vẫn duy trì tốc độ đổi mới giống như các đối thủ đám mây bản địa mà không phá vỡ ngân hàng.

Tương lai thuộc về các nền tảng cho phép tốc độ và quy mô trí tuệ nhân tạo ở bất cứ nơi nào dữ liệu cư trú, cho dù trên đám mây công cộng, trên cơ sở hay đám mây riêng, cho phép các tổ chức đưa ra quyết định kinh tế hợp lý về vị trí khối lượng công việc khi trí tuệ nhân tạo tác nhân thay đổi cấu trúc chi phí. Điều này không phải là về việc quay lại những cách nghĩ cũ; đó là về việc chấp nhận một cách tiếp cận tinh vi hơn, coi cơ sở hạ tầng như một danh mục đầu tư chiến lược nơi các khối lượng công việc khác nhau chạy trong môi trường phù hợp nhất dựa trên hiệu suất, chi phí, bảo mật và yêu cầu tuân thủ.

Năm 2026 là khi trí tuệ nhân tạo tác nhân chuyển từ một từ khóa trong phòng họp sang hiện thực hoạt động, thay đổi cơ bản cách các doanh nghiệp cạnh tranh, xây dựng phần mềm và quản lý cơ sở hạ tầng của họ. Các công ty làm chủ việc triển khai trên quy mô sản xuất, duy trì kiểm soát dữ liệu và ngữ cảnh của họ, và kiến trúc cho sự linh hoạt hybrid sẽ thiết lập những lợi thế mà sẽ gần như không thể vượt qua.

Steve McMillan là Chủ tịch và Giám đốc Điều hành của Teradata, mang lại hơn hai thập kỷ lãnh đạo công nghệ và một hồ sơ theo dõi đã được chứng minh về việc chuyển đổi các dịch vụ doanh nghiệp thành các doanh nghiệp tăng trưởng cao, ưu tiên đám mây.