Lãnh đạo tư tưởng
Các mô hình lớn không phải là cốt lõi của cuộc khủng hoảng tính toán

Mỗi khi một mô hình AI mới ra mắt—cập nhật GPT, DeepSeek, Gemini—mọi người đều kinh ngạc trước quy mô, sự phức tạp và ngày càng tăng của nhu cầu tính toán của các mô hình lớn này. Giả định là các mô hình này đang xác định nhu cầu về nguồn lực của cuộc cách mạng AI.
Giả định đó là sai.
Đúng vậy, các mô hình lớn rất ngốn điện toán. Nhưng áp lực lớn nhất đối với cơ sở hạ tầng AI không đến từ một số ít các mô hình lớn mà đến từ sự phát triển âm thầm của các mô hình AI trên khắp các ngành, mỗi mô hình được tinh chỉnh cho các ứng dụng cụ thể, mỗi mô hình tiêu thụ điện toán ở quy mô chưa từng có.
Bất chấp cuộc cạnh tranh "kẻ thắng được tất" đang diễn ra giữa các trường LLM, bối cảnh AI nói chung không hề tập trung hóa mà đang phân mảnh. Mọi doanh nghiệp không chỉ sử dụng AI mà còn đào tạo, tùy chỉnh và triển khai các mô hình riêng phù hợp với nhu cầu của mình. Chính tình huống sau sẽ tạo ra một đường cong nhu cầu cơ sở hạ tầng mà các nhà cung cấp đám mây, doanh nghiệp và chính phủ chưa sẵn sàng ứng phó.
Chúng ta đã từng thấy mô hình này trước đây. Đám mây không hợp nhất khối lượng công việc CNTT; nó tạo ra một hệ sinh thái lai rộng lớn. Đầu tiên, đó là sự lan rộng của máy chủ. Sau đó là sự lan rộng của VM. Bây giờ? Sự lan rộng của AI. Mỗi làn sóng điện toán đều dẫn đến sự phát triển, không phải sự đơn giản hóa. AI cũng không khác gì.
Sự lan tràn của AI: Tại sao tương lai của AI là một triệu mô hình, không phải một
Tài chính, hậu cần, an ninh mạng, dịch vụ khách hàng, R&D—mỗi lĩnh vực đều có mô hình AI riêng được tối ưu hóa cho chức năng riêng của mình. Các tổ chức không đào tạo một mô hình AI để điều khiển toàn bộ hoạt động của họ. Họ đào tạo hàng nghìn mô hình. Điều đó có nghĩa là nhiều chu kỳ đào tạo hơn, nhiều tính toán hơn, nhiều nhu cầu lưu trữ hơn và nhiều cơ sở hạ tầng hơn.
Đây không phải là lý thuyết. Ngay cả trong các ngành công nghiệp vốn thận trọng về việc áp dụng công nghệ, đầu tư AI cũng đang tăng tốc. Một báo cáo năm 2024 của McKinsey cho thấy các tổ chức hiện sử dụng AI trong trung bình ba chức năng kinh doanh, trong đó sản xuất, chuỗi cung ứng và phát triển sản phẩm dẫn đầu (McKinsey).
Chăm sóc sức khỏe là một ví dụ điển hình. Navina, một công ty khởi nghiệp tích hợp AI vào hồ sơ sức khỏe điện tử để đưa ra thông tin chi tiết về lâm sàng, vừa huy động được 55 triệu đô la trong vòng tài trợ Series C từ Goldman Sachs (Business Insider). Năng lượng cũng không ngoại lệ—các nhà lãnh đạo ngành đã ra mắt Open Power AI Consortium để đưa khả năng tối ưu hóa AI vào hoạt động của lưới điện và nhà máy (Axios).
Sự căng thẳng tính toán không ai nói đến
AI đã phá vỡ các mô hình cơ sở hạ tầng truyền thống. Giả định rằng đám mây có thể mở rộng vô hạn để hỗ trợ sự phát triển của AI là hoàn toàn sai lầm. AI không mở rộng như khối lượng công việc truyền thống. Đường cong nhu cầu không phải là dần dần—mà là theo cấp số nhân và các công ty siêu mở rộng không theo kịp.
- hạn chế quyền lực:Các trung tâm dữ liệu dành riêng cho AI hiện đang được xây dựng dựa trên tính khả dụng của nguồn điện, không chỉ dựa trên xương sống mạng.
- Tắc nghẽn mạng:Môi trường CNTT kết hợp đang trở nên khó quản lý nếu không có tự động hóa, và khối lượng công việc của AI sẽ chỉ làm tình hình trở nên trầm trọng hơn.
- Áp lực kinh tế:Khối lượng công việc AI có thể tiêu tốn hàng triệu đô la chỉ trong một tháng, tạo ra sự không thể đoán trước về tài chính.
Các trung tâm dữ liệu hiện chiếm 1% lượng điện tiêu thụ toàn cầu. Ở Ireland, hiện tại chúng tiêu thụ 20% lưới điện quốc gia, một tỷ lệ dự kiến sẽ tăng đáng kể vào năm 2030 (IEA).
Thêm vào đó là áp lực ngày càng lớn đối với GPU. Bain & Company gần đây đã cảnh báo rằng sự phát triển của AI đang tạo tiền đề cho tình trạng thiếu hụt chất bán dẫn, do nhu cầu bùng nổ đối với chip cấp trung tâm dữ liệu (Bain).
Trong khi đó, vấn đề phát triển bền vững của AI ngày càng gia tăng. Một phân tích năm 2024 trong Các thành phố và xã hội bền vững cảnh báo rằng việc áp dụng rộng rãi AI trong chăm sóc sức khỏe có thể làm tăng đáng kể mức tiêu thụ năng lượng và lượng khí thải carbon của ngành, trừ khi được bù đắp bằng hiệu quả mục tiêu (ScienceDirect).
Sự phát triển tràn lan của AI lớn hơn thị trường - Đó là vấn đề về quyền lực nhà nước
Nếu bạn nghĩ rằng sự lan tràn AI là vấn đề của doanh nghiệp, hãy nghĩ lại. Động lực quan trọng nhất của sự phân mảnh AI không phải là khu vực tư nhân mà là chính phủ và các cơ quan quốc phòng, triển khai AI ở quy mô mà không có siêu quy mô hay doanh nghiệp nào có thể sánh kịp.
Chỉ riêng chính phủ Hoa Kỳ đã triển khai AI trong hơn 700 ứng dụng trên 27 cơ quan, bao gồm phân tích tình báo, hậu cần, v.v. (Tạp chí FedTech).
Canada đang đầu tư tới 700 triệu đô la để mở rộng năng lực tính toán AI trong nước, khởi động một thách thức quốc gia nhằm củng cố cơ sở hạ tầng trung tâm dữ liệu có chủ quyền (Đổi mới, Khoa học và Phát triển Kinh tế Canada).
Và có những lời kêu gọi ngày càng tăng về một “chương trình Apollo” cho cơ sở hạ tầng AI—làm nổi bật sự nâng cao của AI từ lợi thế thương mại lên mệnh lệnh quốc gia (MIT Technology Review).
AI quân sự sẽ không hiệu quả, không được phối hợp hoặc tối ưu hóa về chi phí—nó sẽ được thúc đẩy bởi các nhiệm vụ an ninh quốc gia, tính cấp bách về địa chính trị và nhu cầu về các hệ thống AI khép kín, có chủ quyền. Ngay cả khi các doanh nghiệp kiểm soát được sự phát triển tràn lan của AI, ai sẽ bảo các chính phủ chậm lại?
Bởi vì khi an ninh quốc gia bị đe dọa, sẽ không ai dừng lại để hỏi liệu lưới điện có thể xử lý được hay không.