Connect with us

10 Câu Hỏi Phải Hỏi Để Đảm Bảo Triển Khai Làm Mát Trung Tâm Dữ Liệu Hiệu Quả Của Trí Tuệ Nhân Tạo

Lãnh đạo tư tưởng

10 Câu Hỏi Phải Hỏi Để Đảm Bảo Triển Khai Làm Mát Trung Tâm Dữ Liệu Hiệu Quả Của Trí Tuệ Nhân Tạo

mm

Với sự gia tăng của trí tuệ nhân tạo và tính toán hiệu suất cao, các trung tâm dữ liệu đang phát triển với tốc độ kỷ lục. Trên thực tế, lượng công suất trung tâm dữ liệu đang được xây dựng vào cuối năm 2024 đã tăng hơn gấp đôi so với cuối năm 2023 (6.350 MW đang được xây dựng so với ~3.078 MW). Đồng thời, phần cứng được sử dụng và khối lượng công việc được xử lý tại các trung tâm dữ liệu này ngày càng đòi hỏi khắt khe.

Dưới những điều kiện thay đổi nhanh chóng này, cả rủi ro và thách thức đều đang tăng lên. Và với trung bình một trung tâm dữ liệu chi tiêu lên đến 40% toàn bộ ngân sách năng lượng của họ cho làm mát, quản lý nhiệt đang nhanh chóng trở thành một trong những thách thức hàng đầu của ngành công nghiệp.

Mặt khác, các nhà điều hành trung tâm dữ liệu có nhiều lựa chọn hơn bao giờ hết để làm mát cơ sở của họ một cách đáng tin cậy, hiệu quả và tiết kiệm chi phí. Tất nhiên, khi có lựa chọn, thì cũng có quyết định phải được đưa ra. Vì vậy, khi xem xét việc triển khai trung tâm dữ liệu của riêng bạn, đây là 10 câu hỏi phải hỏi mà bạn nên trả lời để đưa hoạt động của mình lên và chạy nhanh chóng, đồng thời đảm bảo hiệu quả, độ tin cậy và tính bền vững cho lâu dài.

Câu hỏi 1: Tôi có thể đưa hệ thống làm mát này trực tuyến mà không ảnh hưởng đến độ tin cậy như thế nào?

Trong cuộc đua vũ trang trí tuệ nhân tạo, yếu tố phân biệt thành công trong ngành không phải là ai tích trữ được nhiều GPU nhất — mà là ai đưa chúng trực tuyến nhanh nhất. Thời gian cung cấp năng lượng (tức là thời gian từ khi bắt đầu triển khai đến khi nó trở nên hoạt động) đã trở thành chiến trường mới, quyết định mức độ nhanh chóng doanh nghiệp có thể chuyển đổi đầu tư trí tuệ nhân tạo thành tác động kinh doanh. Những người lãnh đạo sẽ không chỉ là những người có nguồn tài nguyên tính toán khổng lồ, mà còn là những người mở khóa chúng đầu tiên, tăng tốc đổi mới, doanh thu và lợi thế cạnh tranh.

Nhưng việc vội vàng triển khai làm mát có thể phản tác dụng, dẫn đến hiệu quả thấp, thời gian ngừng hoạt động hoặc phải nâng cấp tốn kém. Các nhà điều hành phải hỏi liệu hệ thống họ chọn có thể được triển khai nhanh chóng đứng vững trước thử thách của thời gian. Một chiến lược cân bằng giữa tốc độ triển khai và độ bền cung cấp cả sự sẵn sàng thị trường ngay lập tức và sự bền vững lâu dài.

Câu hỏi 2: Phương pháp làm mát nào phù hợp nhất với nhu cầu dự án của tôi?

Không có giải pháp phù hợp với mọi tình huống cho mỗi triển khai trung tâm dữ liệu. Làm mát bằng không khí đã trở thành tiêu chuẩn, nhưng nó đang nhanh chóng đạt đến giới hạn vật lý trong việc xử lý phần cứng tiên tiến và giá đỡ mật độ cao điển hình của các trung tâm dữ liệu trí tuệ nhân tạo. Làm mát bằng chất lỏng cung cấp hiệu quả không thể sánh được ở quy mô và hiệu suất tương lai cho các khối lượng công việc ngày càng đòi hỏi. Các phương pháp kết hợp có thể bắc cầu, nhưng về lâu dài, các trung tâm dữ liệu trí tuệ nhân tạo sẽ phụ thuộc vào các giải pháp làm mát bằng chất lỏng để quản lý các khối lượng công việc trí tuệ nhân tạo ngày càng khắt khe. Tuy nhiên, việc chọn phương pháp làm mát bằng chất lỏng phù hợp lại phụ thuộc vào loại khối lượng công việc, mật độ, vị trí và các yếu tố khác.

Có hai phương pháp làm mát bằng chất lỏng chính được sử dụng thương mại ngày nay: làm mát trực tiếp đến chip (DTC) và làm mát ngâm. Mặc dù DTC hiện đang phổ biến hơn, làm mát ngâm dự kiến sẽ thu được động lực khi mật độ công suất chip tăng lên. Hệ thống DTC định tuyến chất làm mát trực tiếp đến các thành phần sinh nhiệt như CPU và GPU thông qua các tấm lạnh, cung cấp lợi ích hiệu quả nhanh chóng với sự thay đổi cơ sở hạ tầng tối thiểu. Hệ thống đơn pha đơn giản hơn và thân thiện với việc nâng cấp, trong khi hệ thống hai pha sử dụng chất làm mát để đạt được hiệu suất truyền nhiệt cao hơn với công suất bơm thấp hơn nhưng độ phức tạp của hệ thống cao hơn. Làm mát ngâm, ngược lại, ngâm hoàn toàn các máy chủ trong chất lỏng điện môi — либо lưu thông (đơn pha) hoặc đun sôi và ngưng tụ trong các thùng kín (hai pha).

Phương pháp nào phù hợp với môi trường của bạn phụ thuộc vào bản chất của phần cứng, khối lượng công việc, ngân sách và nhiều yếu tố khác. Nhưng việc nhận thức được các lựa chọn của mình là điều quan trọng để đảm bảo tính khả thi cả trong ngắn hạn và lâu dài của trung tâm dữ liệu trí tuệ nhân tạo của bạn.

Câu hỏi 3: Hệ thống làm mát của tôi có hỗ trợ các khối lượng công việc hiện tại và mật độ trí tuệ nhân tạo trong tương lai không?

Điều này đưa chúng ta đến câu hỏi lớn tiếp theo: hệ thống của tôi có đứng vững trước thử thách của thời gian không? Nhu cầu trung tâm dữ liệu đang tăng tốc vượt quá chuẩn mực lịch sử. Ví dụ, các cụm đào tạo trí tuệ nhân tạo có thể yêu cầu 10–20 lần mật độ công suất so với các giá đỡ doanh nghiệp truyền thống. Câu hỏi mà các nhà điều hành phải hỏi là liệu thiết kế làm mát của họ có thể thích nghi với mật độ tương lai mà không cần thay thế hoàn toàn.

Sự gia tăng của trí tuệ nhân tạo, tính toán hiệu suất cao (HPC) và kiến trúc giá đỡ ngày càng dày đặc đang đẩy làm mát bằng không khí đến giới hạn của nó. Trong Khảo sát Hệ thống Làm mát của Uptime Institute năm 2024, đa số nhà điều hành cho biết làm mát bằng không khí trở nên không thực tế và/hoặc quá tốn kém tại bất kỳ điểm nào trên ~20 kW mỗi giá đỡ. Tuy nhiên, báo cáo ngành hiện tại cho thấy rằng các giá đỡ trí tuệ nhân tạo đã thường xuyên đẩy 100 kW mỗi giá đỡ. Và những con số này đang tăng lên.

Biết rằng làm mát bằng không khí đang trên đường trở nên lỗi thời trong các triển khai trung tâm dữ liệu trí tuệ nhân tạo, các nhà điều hành có thể xem xét các phương pháp kết hợp hoặc giai đoạn nơi các triển khai làm mát bằng chất lỏng hoàn toàn, mới không phải là một lựa chọn. Một lần nữa,考虑 đến thời gian và chi phí khổng lồ được đầu tư vào những dự án này, tính bền vững lâu dài là điều quan trọng nhất. Vì vậy, khi chọn giải pháp làm mát, hãy đảm bảo chúng sẵn sàng cho lâu dài.

Câu hỏi 4: Những ảnh hưởng chi phí tổng thể trong toàn bộ vòng đời là gì?

Mặc dù chi phí ban đầu có thể gây choáng ngợp trong không gian trung tâm dữ liệu, chi phí vốn (CAPEX) chỉ là một phần của câu chuyện. Các nhà điều hành nên tính toán chi phí sở hữu tổng thể (TCO), bao gồm chi phí vận hành (OPEX) gắn với tiêu thụ năng lượng, bảo trì và nâng cấp, khi xem xét các giải pháp làm mát của họ. Một hệ thống có vẻ tốn kém hơn ban đầu có thể mang lại tiết kiệm lâu dài thông qua hiệu quả năng lượng, giảm thời gian ngừng hoạt động và tăng tuổi thọ. Chiến lược làm mát phù hợp hiếm khi là lựa chọn rẻ nhất ban đầu — nó là lựa chọn tối ưu hóa chi phí trong 10–15 năm vòng đời của cơ sở.

Hãy nhớ, những đây không phải là các triển khai ngắn hạn. Hơn nữa, cuộc sống bạn nhận được từ việc triển khai này, giá trị bạn sẽ thu được. Nhìn vượt ra ngoài CAPEX và suy nghĩ về chi phí và tiết kiệm lâu dài của bạn là điều quan trọng để đảm bảo bạn nhận được giá trị tối đa từ dự án trung tâm dữ liệu của mình.

Câu hỏi 5: Chiến lược làm mát này sẽ ảnh hưởng đến hồ sơ bền vững của tôi như thế nào?

Như đã đề cập trước đó, làm mát có thể chiếm 40% hoặc hơn tiêu thụ năng lượng tổng thể của một trung tâm dữ liệu. Khi các quy định và yêu cầu báo cáo ESG mở rộng, các nhà điều hành phải hỏi: hệ thống này ảnh hưởng đến dấu chân carbon, sử dụng năng lượng và các cam kết bền vững của tôi như thế nào? Các giải pháp giảm lãng phí năng lượng hoặc tài nguyên hoặc phù hợp với các tiêu chuẩn toàn cầu như khuôn khổ Green Grid ngày càng được ưa chuộng, nếu không muốn nói là bắt buộc, để có được niềm tin của nhà đầu tư và tuân thủ quy định.

Đồng thời, lĩnh vực công đang ngày càng kêu gọi giảm tiêu thụ năng lượng. Monitoring Analytics, tổ chức giám sát thị trường độc lập cho lưới điện trung Đại Tây Dương, đã sản xuất nghiên cứu vào tháng 6 cho thấy 70% tăng chi phí điện năm ngoái là kết quả của nhu cầu trung tâm dữ liệu. Không ngạc nhiên, người tiêu dùng đang gióng lên hồi chuông cảnh báo, và các bang đang xem xét một số biện pháp nghiêm khắc để giải quyết mối quan ngại này, bao gồm cả khả năng tắt máy bắt buộc trong thời gian nhu cầu cao. Bằng cách đầu tư vào các giải pháp làm mát tiết kiệm năng lượng và bền vững hơn, các tổ chức có thể tự vị để đối mặt với cả nhận thức công chúng và thách thức quy định trong tương lai.

Câu hỏi 6: Phương pháp làm mát này sẽ tiêu thụ bao nhiêu nước — và điều đó có bền vững trong khu vực của tôi không?

Các trung tâm dữ liệu lớn có thể tiêu thụ lên đến 5 triệu gallon nước mỗi ngày. Không có gì ngạc nhiên khi khan hiếm nước đang trở thành một vấn đề định hình cho các trung tâm dữ liệu, đặc biệt là ở các khu vực như Tây Nam Mỹ và các phần của châu Âu, nơi các vấn đề về quyền và khan hiếm nước đang dẫn đến sự giám sát ngày càng tăng đối với các trung tâm dữ liệu. Để làm đúng, các nhà điều hành phải tính toán việc sử dụng nước dự kiến của hệ thống làm mát của họ và đánh giá liệu nó có phù hợp với thực tế và yêu cầu quy định địa phương (về cả sự sẵn có và yêu cầu quy định).

Đừng bị lừa bởi tên gọi — làm mát bằng chất lỏng thực sự tiêu thụ ít nước hơn nhiều so với các hệ thống làm mát bằng không khí truyền thống. Theo một nghiên cứu được công bố trên Nature, làm mát bằng chất lỏng giảm tiêu thụ “nước xanh” của trung tâm dữ liệu từ 31–52% so với làm mát bằng không khí truyền thống trong suốt vòng đời. Các giải pháp làm mát giảm thiểu hoặc loại bỏ tiêu thụ nước có thể giúp các cơ sở chống lại rủi ro và quy định môi trường.

Câu hỏi 7: Những rủi ro hoặc hạn chế nào liên quan đến làm mát bằng chất lỏng và làm thế nào để giảm thiểu chúng?

Mặc dù nó cung cấp những lợi thế chưa từng có về hiệu quả, tính bền vững và ROI suốt đời, nhiều quan niệm sai lầm vẫn tồn tại về làm mát bằng chất lỏng, đặc biệt là về độ tin cậy, chi phí và tích hợp. Trên thực tế, các tiến bộ trong công nghệ, vật liệu và thiết kế đã làm cho làm mát bằng chất lỏng trở nên an toàn, đáng tin cậy và ngày càng tiết kiệm chi phí. Điều quan trọng cho các nhà điều hành là đánh giá các hệ thống này dựa trên dữ liệu hiệu suất thực tế, không phải những nhận thức lỗi thời, và thiết kế với các phương pháp hay nhất đã được chứng minh.

Khi xem xét làm mát bằng chất lỏng, cũng quan trọng là phải nhận thức được nào giải pháp là tốt nhất cho cơ sở của bạn. Với các phương pháp khác nhau (ví dụ, trực tiếp đến chip [DTC], ngâm) và một loạt các nhà cung cấp cung cấp nhiều giải pháp, bạn luôn nên thực hiện thẩm định của mình khi xem xét triển khai làm mát bằng chất lỏng.

Câu hỏi 8: Thiết kế làm mát của tôi sẽ ảnh hưởng đến việc sử dụng không gian và mật độ giá đỡ như thế nào?

Không gian chỉ đáng giá như năng lượng trong các cơ sở trung tâm dữ liệu hiện đại. Các giá đỡ mật độ cao được hỗ trợ bởi làm mát bằng chất lỏng hiệu quả có thể giảm đáng kể yêu cầu không gian sàn và diện tích cơ sở. Điều này,反过来, cho phép các nhà điều hành có thể mở rộng khối lượng công việc trong các chân không gian hiện có hoặc giảm thiểu chi phí đất và xây dựng cho các công trình mới. Việc có thể làm được nhiều hơn với ít không gian hơn không chỉ giảm chi phí mà còn mở ra cánh cửa cho nhiều địa điểm xây dựng khả thi hơn. Với các chân không gian nhỏ hơn, các nhà phát triển có thể xây dựng tự do hơn và thậm chí mang tính toán gần hơn với người dùng cuối. Việc đặt những câu hỏi này ngay từ đầu đảm bảo rằng thiết kế làm mát được căn chỉnh với cả mật độ và mục tiêu sử dụng không gian.

Câu hỏi 9: Chiến lược bền vững lâu dài của tôi là gì nếu khối lượng công việc tăng vọt hoặc các quy định được thắt chặt?

Các trung tâm dữ liệu không tĩnh. Các đợt tăng nhu cầu đột ngột, các ứng dụng trí tuệ nhân tạo mới và các yêu cầu hiệu quả/tính bền vững ngày càng thắt chặt có thể nhanh chóng gây áp lực cho cơ sở hạ tầng. Các nhà điều hành phải hỏi liệu chiến lược làm mát của họ có đủ linh hoạt để đáp ứng những thay đổi thường không lường trước được này không. Các hệ thống làm mát hiệu quả phải sẵn sàng để mở rộng khả năng, đáp ứng các yêu cầu tuân thủ mới và tích hợp với các công nghệ trong tương lai.

Các hệ thống cung cấp khả năng模块 hóa và các nhà cung cấp có chuỗi cung ứng mạnh mẽ sẽ giúp cách ly trung tâm dữ liệu của bạn khỏi nhu cầu thay đổi, cho phép bạn mở rộng dễ dàng hơn và nâng cấp và tích hợp dễ dàng hơn khi cần.

Câu hỏi 10: Tôi đang xem làm mát như một yếu tố then chốt chiến lược — hay chỉ là một ý tưởng sau?

Câu hỏi cuối cùng, bao quát này có thể là câu hỏi quan trọng nhất. Khi xem xét hệ thống làm mát của bạn, hãy dành một chút thời gian để xem xét lại vai trò của làm mát trong hoạt động trung tâm dữ liệu tổng thể của bạn. Quá thường, làm mát được xem như cơ sở hạ tầng nền khi, trên thực tế, nó là một yếu tố then chốt cho hiệu suất, thời gian hoạt động và tính bền vững. Các công ty đầu tư vào các chiến lược làm mát được suy nghĩ kỹ lưỡng không chỉ nhận được hiệu quả hoạt động mà còn có được lợi thế cạnh tranh về độ tin cậy, tuân thủ và chi phí lâu dài.

Và khi trí tuệ nhân tạo tiếp tục đặt ra những yêu cầu mới, khắt khe hơn cho các trung tâm dữ liệu, điều quan trọng là phải xem xét lâu dài về làm mát. Đừng chỉ nghĩ về điều gì là tốt nhất, nhanh nhất hoặc rẻ nhất cho việc triển khai của bạn ngày hôm nay. Hãy nghĩ về cách giải pháp làm mát của bạn định vị bạn 5, 10 hoặc thậm chí 15 năm từ bây giờ. Nếu hệ thống làm mát của bạn chỉ mới đáp ứng được yêu cầu ngày hôm nay, bạn có thể chắc chắn rằng nó sẽ không còn phù hợp chỉ vài năm sau.

Hãy nhớ, làm mát không còn là một mối quan tâm ở hậu trường — nó là trung tâm của thành công lâu dài của mọi trung tâm dữ liệu.

Làm mát bây giờ là trung tâm của thành công lâu dài của trung tâm dữ liệu — Chọn khôn ngoan

Làm mát không còn là một mối quan tâm ở hậu trường — nó là trung tâm của thành công gần và lâu dài của mọi trung tâm dữ liệu. Bằng cách đặt những câu hỏi này ngay từ đầu, các nhà điều hành có thể giảm thời gian triển khai, giảm thiểu rủi ro và đảm bảo rằng các cơ sở được xây dựng để chống chọi với sự thay đổi và biến động trong một thế giới được định hình bởi trí tuệ nhân tạo.

Tương lai của ngành sẽ được định hình không chỉ bởi tốc độ mà các nhà điều hành triển khai công suất, mà còn bởi cách họ thiết kế cho tính bền vững và độ tin cậy lâu dài. Những người coi làm mát như một yếu tố then chốt chiến lược sẽ được định vị tốt nhất để dẫn đầu trong những năm tới.

Kevin Roof là Giám đốc Toàn cầu về Quản lý Angebot và Capture cho LiquidStack. Là một kỹ sư cơ khí và PMP với hơn một thập kỷ kinh nghiệm trong lĩnh vực làm mát trung tâm dữ liệu, Kevin mang lại những hiểu biết và tư duy lãnh đạo vô giá cho không gian làm mát bằng chất lỏng.