Connect with us

Điểm nghẽn thật sự của Trí tuệ nhân tạo: Năng lượng, Làm mát và Vật lý của Quy mô

Trí tuệ nhân tạo

Điểm nghẽn thật sự của Trí tuệ nhân tạo: Năng lượng, Làm mát và Vật lý của Quy mô

mm

Trí tuệ nhân tạo đã phát triển với tốc độ phi thường trong thập kỷ qua. Các GPU nhanh hơn, các cụm lớn hơn và các kiến trúc cách mạng đã mở ra những đột phá mà trước đây tưởng chừng như không thể. Tuy nhiên, khi ngành công nghiệp đang hướng tới các mô hình có tham số trillion và các nhà máy AI quy mô siêu lớn, then chốt tiếp theo không liên quan đến thuật toán. Điểm nghẽn thật sự ngày nay là vật lý: năng lượng, làm mát và cơ sở hạ tầng cần thiết để duy trì tính toán ở quy mô hành tinh.

Câu hỏi không còn là làm thế nào bạn có thể sản xuất nhiều chip mà là liệu bạn có thể cung cấp các gigawatt, nước và đường truyền cần thiết để vận hành chúng. Cơ sở hạ tầng, không phải silicon, là điều sẽ quyết định tốc độ của trí tuệ nhân tạo trong những năm tới.

Gigawatt hơn Gigaflop

Dự án “Stargate” của OpenAI, được xây dựng cùng với Oracle và SoftBank, đang nhắm tới gần 7 gigawatt công suất trên các khuôn viên tại Mỹ — tương đương với nhiều lò phản ứng hạt nhân. Ở quy mô này, thách thức chính không phải là sản xuất GPU mà là đảm bảo các nhà máy điện và trạm biến áp để duy trì hoạt động của chúng.

Nhu cầu của Microsoft cũng không kém phần ấn tượng. Các công việc AI của họ dự kiến sẽ yêu cầu nhiều điện như toàn bộ khu vực New England vào năm 2030. Điều này giúp giải thích tại sao công ty đã đầu tư hàng chục tỷ vào các dự án năng lượng tái tạo và cũng đang theo đuổi các lựa chọn thử nghiệm như hợp hạch hạt nhân và lò phản ứng hạt nhân tiên tiến.

Các động lực này đang lan tỏa vào chính sách năng lượng. Trong PJM Interconnection, tổ chức truyền tải khu vực quản lý lưới điện cho hơn 65 triệu người trên 13 tiểu bang và Washington, D.C., các tiện ích đang khám phá cơ chế hạn chế cho các trung tâm dữ liệu trong thời gian nhu cầu cao. Các công ty công nghệ lớn đang vận động chống lại những hạn chế như vậy, nhưng việc các nhà quản lý thậm chí xem xét chúng cho thấy trí tuệ nhân tạo đã trở thành trung tâm trong việc lập kế hoạch lưới điện.

Thử thách Làm mát

Cung cấp điện chỉ là một nửa vấn đề. Khi điện đến các giá đỡ, thách thức tiếp theo là nhiệt. Mỗi GPU cao cấp tiêu thụ khoảng 700 watt, và với các giá đỡ chứa hàng trăm GPU, mật độ đạt từ 100 đến 600 kilowatt trên mỗi giá đỡ. Làm mát bằng không khí, tiêu chuẩn của ngành trong nhiều thập kỷ, trở nên không thể thực hiện được sau khoảng 40 kilowatt trên mỗi giá đỡ do hiệu suất lưu lượng khí và tái lưu thông.

Do đó, làm mát bằng chất lỏng đã chuyển từ một lĩnh vực nhỏ sang dòng chính. Các nền tảng Blackwell làm mát bằng chất lỏng mới nhất của NVIDIA được thiết kế cho các cụm AI quy mô siêu lớn và cung cấp hiệu suất năng lượng tốt hơn 25 lần và hiệu suất nước tốt hơn 300 lần so với các giá đỡ làm mát bằng không khí. Công ty cũng đã hợp tác với Vertiv về một kiến trúc tham chiếu có thể xử lý hơn 130 kilowatt trên mỗi giá đỡ, khiến việc triển khai GPU dày đặc trở nên khả thi.

Các công ty khởi nghiệp cũng đang đổi mới. Corintis, một công ty Thụy Sĩ nhúng các kênh vi mô trực tiếp vào chất nền chip, gần đây đã huy động $24 triệu và đã có Microsoft trong số khách hàng của mình. Đội ngũ nghiên cứu của Microsoft cũng đã chứng minh các kênh vi lỏng được khắc trên bao bì chip, giảm nhiệt độ đỉnh của GPU lên đến 65 phần trăm và tăng hiệu suất gấp ba lần so với các tấm lạnh thông thường. Những công nghệ này làm cho nó có thể giữ cho GPU chạy ở tốc độ đầy đủ mà không làm hỏng trung tâm dữ liệu.

Nước như một Biến số Chiến lược

Làm mát bằng chất lỏng giới thiệu một biến số khác: tiêu thụ nước. Các hệ thống làm mát bằng bay hơi và nước lạnh có thể yêu cầu lượng nước khổng lồ khi mở rộng quy mô lên các khuôn viên hàng trăm megawatt. Tại Phoenix, các cụm trung tâm dữ liệu có thể yêu cầu hundreds of millions of gallons of water per day, gây ra lo ngại ở các khu vực khô hạn.

Điều này đã thúc đẩy sự phát triển của các hệ thống làm mát không dùng nước và vòng khép kín. IEEE Spectrum đã ghi lại các chiến lược như bồn tắm ngâm điện môi kín, máy làm mát khô và máy làm mát không dùng nước cắt giảm việc sử dụng nước uống xuống gần như không. Trong khi đó, một số nhà vận hành đang thử nghiệm việc tái sử dụng nhiệt thải. Các dự án như AquasariDataCool đã chỉ ra cách các vòng làm mát bằng nước nóng có thể cấp nước cho hệ thống sưởi tòa nhà hoặc máy làm mát hấp thụ, tái chế nhiều năng lượng mà nếu không sẽ bị mất.

Sự đánh đổi thường là giữa nước và điện: các hệ thống vòng khép kín hoặc khô tiêu thụ nhiều năng lượng hơn, trong khi các thiết kế bay hơi tiết kiệm năng lượng nhưng sử dụng nhiều nước. Trong các khu vực căng thẳng về nước, chính sách ngày càng ủng hộ việc bảo tồn nước ngay cả khi nó có nghĩa là tiêu thụ năng lượng cao hơn.

Cơ sở Hạ tầng và Lưới

Ngay cả khi có các giải pháp năng lượng và làm mát, then chốt cuối cùng là cơ sở hạ tầng. Các quyết định về vị trí hiện quyết định người thắng và người thua trong cuộc đua trí tuệ nhân tạo.

Khuôn viên Fairwater 80 tỷ đô la của Microsoft tại Wisconsin minh họa cho cách vị trí chiến lược đã trở nên. Khu vực này bao phủ 315 acre, chứa hàng trăm nghìn GPU và được chọn vì khả năng tiếp cận các trạm biến áp, đường dây sợi quang và nước ngầm. Thiết kế cũng nhấn mạnh vào làm mát vòng khép kín để giảm thiểu tác động đến nước.

Để hỗ trợ tải trọng ngày càng tăng, Microsoft đã ký một thỏa thuận đột phá với Brookfield để thêm 10,5 gigawatt công suất tái tạo vào năm 2030. Đồng thời, nó cũng đã hỗ trợ các dự án thử nghiệm như một nhà máy hợp hạch hạt nhân được xây dựng bởi Helion Energy, dự kiến sẽ cấp năng lượng cho các trung tâm dữ liệu vào năm 2028, và một thỏa thuận 20 năm để khởi động lại nhà máy hạt nhân Three Mile Island ở Pennsylvania.

Amazon và Google đang thực hiện các bước tương tự, đảm bảo các vị trí gần các nhà máy hạt nhân và phát triển các danh mục năng lượng sạch của riêng họ. Tại Ireland, nơi các trung tâm dữ liệu đã tiêu thụ nhiều năng lượng hơn tất cả các hộ gia đình cộng lại, các nhà quản lý đã đóng băng các phê duyệt mới cho đến ít nhất năm 2028, nhấn mạnh cách chính trị và cấp phép có thể phá vỡ ngay cả những dự án được tài trợ tốt nhất.

Hoạt động Thông minh: Trí tuệ nhân tạo Quản lý Trí tuệ nhân tạo

Thật thú vị, chính trí tuệ nhân tạo đang được sử dụng để quản lý gánh nặng cơ sở hạ tầng. Học tăng cường đã được triển khai trong các trung tâm dữ liệu sản xuất để tối ưu hóa các hệ thống làm mát, tạo ra 14 đến 21 phần trăm tiết kiệm năng lượng mà không ảnh hưởng đến an toàn. Các bản sao số và mô hình dự đoán cũng đang được sử dụng để dự đoán các điểm nóng, làm mát trước thiết bị và chuyển các công việc sang các giờ hoặc giai đoạn cung cấp năng lượng tái tạo dồi dào.

Google đã chứng minh cách học máy có thể cắt giảm nhu cầu làm mát trung tâm dữ liệu xuống 40 phần trăm, và các nhà vận hành khác đang áp dụng các hệ thống tương tự. Khi chi phí năng lượng và làm mát tăng, những tiết kiệm hoạt động này đang trở thành một lợi thế cạnh tranh thiết yếu.

Tầm nhìn Chiến lược

Quỹ đạo là rõ ràng. Nhu cầu trí tuệ nhân tạo dự kiến sẽ tăng gấp đôi việc sử dụng điện của trung tâm dữ liệu toàn cầu vào năm 2030, với các công việc trí tuệ nhân tạo chiếm một tỷ lệ đơn số ở giữa của tổng tiêu thụ năng lượng toàn cầu vào năm 2050. Trong khi NVIDIA và các nhà sản xuất chip khác tiếp tục đẩy mạnh hiệu suất silicon, biên giới thực tế của trí tuệ nhân tạo sẽ được định nghĩa bởi tốc độ mà các tiện ích có thể xây dựng các nguồn phát điện mới, truyền tải và cơ sở hạ tầng làm mát.

Đối với các công ty xây dựng sản phẩm trí tuệ nhân tạo, điều này có nghĩa là các bản đồ đường đang ngày càng gắn liền với nơi có khả năng. Đối với các nhà đầu tư, các động thái có giá trị nhất có thể là các tiện ích, nhà phát triển truyền tải và các công ty khởi nghiệp làm mát chứ không chỉ là nhà cung cấp GPU. Và đối với các nhà hoạch định chính sách, cuộc tranh luận về trí tuệ nhân tạo đang chuyển từ các câu hỏi về đạo đức và quản lý dữ liệu sang các câu hỏi về megawatt, nước và hiện đại hóa lưới điện.

Tương lai của trí tuệ nhân tạo sẽ không chỉ được quyết định trong các phòng thí nghiệm nghiên cứu và xưởng đúc chip, mà tại các trạm biến áp, vòng làm mát và nhà máy điện. Vật lý của quy mô — không chỉ toán học của các thuật toán — là điều sẽ quyết định tốc độ và phạm vi của trí tuệ nhân tạo trong thập kỷ tới.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.