Lãnh đạo tư tưởng

Vấn đề ở mọi nơi: Tại sao “Dữ liệu ở mọi nơi” đang trở thành thách thức cơ sở hạ tầng xác định của kỷ nguyên AI

mm

Câu hỏi quan trọng nhất trong AI ngày nay không phải là mô hình nào thông minh nhất. Đó là nơi dữ liệu sống, và liệu trí tuệ có thể tiếp cận nó hay không.

Trong phần lớn thập kỷ qua, ngành công nghiệp AI hoạt động dưới một tiền đề an ủi: tập trung dữ liệu, tập trung tính toán, và sự thông minh sẽ theo sau. Mô hình hyperscaler — tập trung các tập dữ liệu đào tạo lớn vào các cụm đám mây và áp dụng tính toán GPU lớn để nén chúng thành các tham số mô hình — đã tạo ra kết quả phi thường, nhưng cũng tạo ra một kiến trúc đang bị căng thẳng dưới trọng lượng của sự thành công của chính nó.

Gọi nó là “vấn đề dữ liệu ở mọi nơi”. Khi AI chảy ra khỏi phòng thí nghiệm nghiên cứu và vào cấu trúc hoạt động của các bệnh viện, nhà máy, tổ chức tài chính và chính phủ, dữ liệu phải thông tin cho các hệ thống này là phân tán, bị ràng buộc về mặt pháp lý và không thể di chuyển. Các nhà quản lý ở châu Âu yêu cầu hồ sơ tài chính của công dân không được rời khỏi lục địa. Dữ liệu thử nghiệm lâm sàng của một công ty dược phẩm ở Basel không thể hợp tác với một tập dữ liệu genomics từ Seoul.

Bất kể trường hợp nào, trí tuệ phải đến với dữ liệu. Dữ liệu, một cách chắc chắn, sẽ không đến với trí tuệ.

Kinh tế của sự thay đổi

Căng thẳng cấu trúc này trở nên cấp tính do một cuộc cách mạng đồng thời trong kinh tế AI. Ngành công nghiệp đang trải qua một sự thay đổi lớn từ chi tiêu tập trung vào đào tạo sang chi tiêu tập trung vào suy luận, và những tác động đối với kiến trúc dữ liệu là sâu sắc.

Deloitte ước tính rằng các tải công việc suy luận chiếm một nửa tất cả các tính toán AI vào năm 2025, một con số sẽ nhảy lên hai phần ba vào năm 2026. Tỷ lệ đang đảo ngược với tốc độ đáng kinh ngạc. Các nhà phân tích ước tính rằng vào năm 2026, nhu cầu suy luận sẽ vượt quá nhu cầu đào tạo 118 lần. Vào năm 2030, suy luận có thể chiếm 75% tổng tính toán AI, thúc đẩy 7 nghìn tỷ đô la đầu tư vào cơ sở hạ tầng.

Toán học chi phí cũng tương tự như vậy. Đối với mỗi 1 tỷ đô la chi cho đào tạo một mô hình AI, các tổ chức phải đối mặt với 15-20 tỷ đô la chi phí suy luận trong suốt thời gian sản xuất của mô hình: một tỷ lệ được minh họa rõ ràng bởi GPT-4, chi phí đào tạo khoảng 150 triệu đô la, nhưng chi phí suy luận tích lũy đã đạt 2,3 tỷ đô la vào cuối năm 2024. Đào tạo, một thời là sự ám ảnh của các nhà đầu tư và nhân viên mua sắm AI, đang được định hình lại như một khoản học phí một lần. Suy luận là chi phí hoạt động vĩnh viễn của trí tuệ, và bây giờ nó là mục chính.

Tuy nhiên, đây là nghịch lý: chi phí suy luận cho một hệ thống cấp GPT-3.5 đã giảm hơn 280 lần giữa tháng 11 năm 2022 và tháng 10 năm 2024, với chi phí phần cứng giảm khoảng 30% mỗi năm và hiệu suất năng lượng cải thiện 40% mỗi năm. Giá giảm; tiêu thụ tăng tốc nhanh hơn. Chi phí suy luận trên mỗi đơn vị giảm 100 lần, trong khi Microsoft và Google báo cáo các tải công việc AI tăng 31 lần trong nửa thời gian đó.

Nghịch lý Jevons, nơi hiệu suất tăng dẫn đến việc sử dụng tài nguyên lớn hơn, đã tìm thấy một biểu hiện hiện đại trong các cụm GPU.

Nơi dữ liệu sống, trí tuệ phải theo

Nền kinh tế suy luận cơ bản thay đổi các yêu cầu về cơ sở hạ tầng, và không nơi nào hơn là xung quanh trọng lực dữ liệu. Suy luận, không giống như đào tạo, không phải là một công việc hàng loạt được chạy một lần trong một trung tâm dữ liệu. Đó là một dịch vụ liên tục, nhạy cảm với độ trễ, phân tán về mặt địa lý, và chỉ tốt như dữ liệu nó có thể tiếp cận tại thời điểm truy vấn.

Đây là cốt lõi của thách thức dữ liệu ở mọi nơi.

Ví dụ, một mô hình ngôn ngữ suy luận trên dữ liệu telemetry trực tiếp của bệnh nhân không thể đủ khả năng một vòng tròn 200 miligiây đến một cụm hyperscaler ở bờ biển phía đông. Một mô hình gian lận dịch vụ tài chính chạy suy luận tại điểm giao dịch không thể xuất dữ liệu tài khoản đến một khu vực pháp lý nơi nó sẽ vi phạm GDPR. Một triển khai AI chủ quyền không thể dựa trên cơ sở hạ tầng thuộc sở hữu và vận hành bởi một thực thể thương mại nước ngoài.

Các phòng thí nghiệm tiền phong đang nhận thức rõ điều này. Thỏa thuận của Anthropic với Google Cloud để có tới một triệu TPUs, cung cấp hơn một gigawatt tính toán AI công suất vào năm 2026, cho thấy các phòng thí nghiệm hàng đầu đang đầu tư với quy mô chưa từng có để định hình dấu ấn cơ sở hạ tầng toàn cầu của suy luận.

Taxonomy của độ mạnh dữ liệu

Không tất cả các hệ thống AI đều đối mặt với thách thức này một cách giống hệt, và điều này cho thấy cần xem xét một phân loại thô vì có nhiều loại mô hình AI và độ phức tạp. Hãy chia nó thành ba ví dụ cốt lõi: LLMs, hình ảnh và mô hình vật lý.

Các mô hình ngôn ngữ lớn — các gia đình Claude, GPT và Gemini — chủ yếu xử lý các token ngôn ngữ: tương đối nhẹ, có thể nén và cho phép các kỹ thuật bảo vệ quyền riêng tư như sự riêng tư khác biệt hoặc học tập liên bang. Vấn đề dữ liệu ở mọi nơi của họ rất phức tạp.

Các mô hình hình ảnh tạo ra trình bày một trường hợp thậm chí còn khó hơn. Các hệ thống như Black Forest Labs’ FLUX.2 có thể tạo ra hình ảnh độ phân giải cao, siêu thực trong dưới một giây trên phần cứng mạnh, nhưng việc tạo ra một hình ảnh duy nhất đòi hỏi nhiều dữ liệu và tính toán hơn nhiều so với tạo văn bản. Khi AI hình ảnh chuyển từ công cụ sáng tạo sang kiểm tra công nghiệp, hình ảnh y tế và phân tích vệ tinh, dữ liệu cơ bản thường lớn, nhạy cảm và khó di chuyển, làm tăng nhu cầu chạy AI nơi dữ liệu đã tồn tại.

Loại phức tạp hơn là AI vật lý. Jensen Huang của NVIDIA đã tuyên bố rằng “AI vật lý đã đến, và mọi công ty công nghiệp sẽ trở thành một công ty robot”. Các mô hình mới như NVIDIA’s Cosmos 3 nhằm cung cấp cho máy móc một sự hiểu biết tổng quát về thế giới vật lý bằng cách kết hợp mô phỏng, tầm nhìn và suy luận, trong khi các công ty như Physical Intelligence đang đào tạo robot trên dữ liệu cảm biến thế giới thực – bao gồm cả lực, chuyển động và đầu vào hình ảnh – để cho phép hành vi tự động thích ứng hơn.

Cùng một động lực mở rộng mô hình suy luận lớn đang được áp dụng cho dữ liệu thế giới thực như rung động, âm thanh và đầu vào cảm biến. Nhưng thông tin này vốn là địa phương. Một robot trên sàn nhà máy không thể gửi dữ liệu hình ảnh và cảm giác thực thời đến một đám mây xa để xử lý mà không giới thiệu độ trễ có thể tạo ra rủi ro an toàn, có nghĩa là AI phải ngày càng chạy ở rìa, gần nơi dữ liệu được tạo ra.

Tin cậy, giải thích và kết quả

Đây là nơi thách thức dữ liệu ở mọi nơi vượt ra ngoài cơ sở hạ tầng và trở thành một vấn đề quản trị. Khi AI được áp dụng cho các quyết định quan trọng — từ chẩn đoán y tế đến mô hình rủi ro tài chính đến hệ thống kiểm soát vật lý — các câu hỏi về nơi dữ liệu cư trú ngày càng gắn liền với ai chịu trách nhiệm về kết quả.

Trong môi trường quản lý hiện nay, giải thích không phải là tùy chọn. Đạo luật AI của EU, ví dụ, yêu cầu các hệ thống rủi ro cao phải chứng minh cơ sở cho các đầu ra của chúng, điều này khó khăn nếu dữ liệu thông tin cho các quyết định đó được phân tán trên nhiều hệ thống, khu vực pháp lý và khuôn khổ quản lý.

Tin cậy, do đó, trở thành điều kiện tiên quyết cho việc áp dụng ở quy mô lớn. Kiểm soát môi trường dữ liệu đang trở nên quan trọng như kiểm soát các mô hình chính nó.

Thế hệ tiếp theo của cơ sở hạ tầng AI

Việc giải quyết thách thức dữ liệu ở mọi nơi sẽ xác định bản đồ cạnh tranh của AI trong thập kỷ tới. Suy luận liên bang, môi trường xử lý dữ liệu an toàn, mô hình tối ưu hóa rìa và các hệ thống điều phối tính đến nơi dữ liệu được phép cư trú không phải là các tính năng kỹ thuật đặc biệt, mà là điều kiện tiên quyết cho sự mở rộng của AI vượt ra ngoài các trường hợp sử dụng mà dữ liệu có thể được tập trung hóa miễn phí.

Các công ty và chính phủ xây dựng cơ sở hạ tầng có khả năng cung cấp suy luận đáng tin cậy, giải thích được, chủ quyền — trí tuệ tiếp cận dữ liệu chứ không yêu cầu dữ liệu di chuyển đến nó — sẽ kiểm soát rào cản bền vững nhất của kỷ nguyên AI. Đào tạo một mô hình thông minh hơn đang trở thành một vấn đề đã được giải quyết và hàng hóa. Triển khai nó một cách có trách nhiệm, ở rìa, trên các ranh giới pháp lý, chống lại dữ liệu không thể di chuyển, là vấn đề còn lại.

Dữ liệu ở mọi nơi không phải là một khẩu hiệu. Đó là vấn đề chưa được giải quyết khó khăn nhất trong AI doanh nghiệp. Và nó sẽ quyết định liệu khả năng phi thường được mở khóa bởi đầu tư đào tạo trong thập kỷ qua có thể chuyển thành kết quả mà thế giới có thể tin cậy ở quy mô lớn.

Với vai trò là giám đốc chiến lược chính, Abhas lãnh đạo chiến lược doanh nghiệp tổng thể cho Cloudera và chịu trách nhiệm tạo ra tầm nhìn của công ty, xây dựng mô hình hoạt động mục tiêu kinh doanh và khách hàng, truyền đạt điều đó với các bên liên quan chính thông qua OKR được định nghĩa rõ ràng, và thực hiện các sáng kiến chuyển đổi then chốt để hiện thực hóa kế hoạch. Ông cũng được giao nhiệm vụ thúc đẩy tăng trưởng và đổi mới và đưa ra quyết định xây dựng / mua / đối tác phù hợp, bao gồm định giá và đóng gói, phát triển doanh nghiệp, và chương trình tăng tốc đổi mới của Cloudera để ra mắt sản phẩm mới. Trước đây, ông từng giữ vị trí trưởng bộ phận và phó chủ tịch phụ trách biến đổi doanh nghiệp tại công ty.

Trước khi sáp nhập Cloudera / Hortonworks, ông đã giúp mở rộng nỗ lực tiếp cận thị trường của Hortonworks với vai trò là người đứng đầu toàn cầu về đổi mới và quản lý giá trị khách hàng. Là một nhà tư vấn quản lý được đào tạo, ông đam mê thúc đẩy hành động và thay đổi trong xã hội và đã dẫn đầu các dự án với nhiều tổ chức, bao gồm Diễn đàn Kinh tế Thế giới, Những người sáng lập của Tương lai, và các tổ chức phi lợi nhuận khác.