์ฌ์ ๋ฆฌ๋
๋ฐ์ดํฐ ์ผํฐ ๋๊ฐ์ ์ธ๋ – ๊ทธ๋ฆฌ๊ณ ๋๋ถ๋ถ์ ์ด์์๊ฐ ์ด์ ์ ์ธํ๋ผ๋ฅผ ๊ตฌ์ถํ๋ ์ด์

3년 전, 데이터 센터 산업은 액체 냉각이 필요한지 여부를 논의했다. 2년 전, 대부분의 운영자는 단일 상 냉각이 해결책이라고 믿었다. 오늘날, 선도적인 시설은 차세대 냉각 아키텍처로 이동하고 있으며, 많은 새로운 건설은 몇 년 내에 구식이 될 시스템을 잠금하고 있다.
이 분기는 이미 2027년을 통해 볼 수 있는 물리학과 프로세서 로드맵에 의해 추진되고 있다. 함께,它们는 냉각이 새로운 아키텍처 시대에 들어서고 있는 것을 이해하는 운영자와 곧 Hundreds of millions를 투자한 인프라가 다음 AI 프로세서 波를 지원할 수 없다는 것을 알게 될 운영자 사이의 분리를 만들어내고 있다.
냉각의 세대
데이터 센터 냉각은 새로운 장애물이 극복되고 랙 밀도가 경제적으로 지원해야 하는 새로운 집합으로 정의되는 세 가지 고유한 아키텍처 시대를 거쳐 왔다.
-
1세대: 공기 냉각 (2000-2023): 10-15kW당 랙에 도달했다. 2020년을 기준으로 경제가 부서지기 시작했다. 2023년까지 공기 냉각은 새로운 고밀도 배치에 대해 대부분 구식이 되었다.
-
2세대: 단일 상 액체 (2020-2027): 초기 액체 냉각 접근 방식이다. 높은 유량 속도로 열을 제거하기 위해 물이나 PG25를 사용한다. 20-120kW당 랙에서 적합하지만 150kW 이상에서 어려움을 겪고 있다. 2027년까지 프로세서가 2,000W를 초과함에 따라 실제 한계에 도달할 것으로 예상된다.
-
3세대: 2상 + 고급 열 제거 (2024-2035+): 열을 제거하기 위해 상 변화보다는 상 전이를 사용하는 냉매를 사용한다. 150kW 이상의 랙에서 확장 가능하다. 칩에서 대기까지 새로운 열 제거 전략을 가능하게 한다. 이미 선도적인 운영자가 배포하고 있으며 2027-2028년까지 지배할 것으로 예상된다.
각 전환은 물리학과 경제가 동시에 천장에 도달하는 지점을 표시한다.
2세대의 물리학 문제
첫 번째 2세대 배포는 단일 상 냉각의 한계를 드러내기 시작했다.
물 기반 시스템은 대략 1.5리터/분/킬로와트의 유량 속도가 필요하다. 120kW 랙은 약 180리터/분이 필요하다. 250kW에서는 375리터/분으로 증가한다.冷却판의 구멍은 밀리미터 단위로 측정된다.
이번 년도 GTC에서 파이프 크기만한 호스에 연결된 랙은 도전을 가시적으로 만들었다. 높은 유량 속도는 연쇄적인 문제를 만든다. 글리콜과 혼합된 물은 마이크로 피닝 구조를 산화시키고, 흐름 속도는 약한 핀이를 마모시킨다. 유지 보수 요구는 많은 운영자를 놀라게 했다. 매월 필터 교체, 지속적인 화학적 모니터링, 랙에 연결된 글리콜 “IV 백”이다.
고장률은同樣으로 우려된다. 내부 필드 데이터는 약 4%의 물로 냉각된 GPU가 3년 라이프 사이클 동안 누수로 인해 고장난다고 나타났다. 랙에는 300만~500만 달러 상당의 장비가 있으므로, 이는 2세대의 경제를 근본적으로 무효화한다.
10MW 시설 분석에 따르면, Jacobs Engineering는 또 다른 비효율성을 강조한다. 단일 상 시스템은 3세대 시스템보다 더 차가운 물 온도가 필요하다. 2세대에서 요구되는 더 차가운 물 온도는 차일러 용량 요구와 에너지 소비를 모두 증가시킨다.
3세대가 다른 점
3세대는真正한 아키텍처 전환을 나타낸다. 2상 냉매는 상 전이를 통해 열을 포착하여 유량 속도를 4~9배로 줄인다. 감소된 유체 속도는 인프라 스트레스를 크게 줄이고, 冷却판의 마모를 최소화하며, 2세대에서 발생하는 유지 보수 부담의 대부분을 제거한다.
냉매는 또한 칩에서 대기로 냉각을 최적화하는 새로운 열 제거 설계를 가능하게 한다. 이러한 설계는 이미 생산에 있으며, 3세대의 확장 가능성과 경제적 효율성을 입증한다.
Jacobs Engineering이 전세계 데이터 센터 MEP 설계의 80% 이상을 담당했을 때, 벤더 편향을 비교에서 제거했다.
발견:
-
CapEx: 1,039만 달러(단일 상) vs. 1,038만 달러(2상)
-
연간 OpEx: 104만 달러 vs. 67.9만 달러(35% 감소)
-
5년간 총 소유 비용: 1,560만 달러 vs. 1,380만 달러(12% 절감)
CapEx 평가는 많은 사람들이 2상에 대한 프리미엄을 예상했지만, 놀랐다. 현재 2상 시스템은 더 많은 CDU가 필요하지만, 단일 상 설계는 복잡한 행 매니폴드, 강력한 누수 감지, 조화 필터링과 같은 복잡성을 필요로 한다. 2026년에 도착하는 차기 CDU는 비용을さらに 줄여 3세대를 더 경제적으로 배포할 수 있게 할 것이다.
OpEx의 이점은 열역학에서 비롯된다. 2상 시스템은 동일한 칩 온도를 유지하면서 더 따뜻한 시설 물을 사용한다. 평균적으로 약 8°C 더 높다. 각 度를 절약하면 연간 에너지 사용량을 약 4% 줄일 수 있다. 이는 Jacobs가 문서화한 35%의 OpEx 감소와 같다.
전방향 운영자는 한 단계 더 나아가서, 열 마진을 약 5% 더 많은 컴퓨팅 용량으로 전환하고 있다. 전력은 제한되고, 각 GPU는 수익을 나타내므로, 이는 경쟁적인 차별점이 된다.
실리콘 로드맵이 문제를 강요한다
3세대로의 전환은 냉각 벤더에 의해 추진되지 않는다. 프로세서 설계에 의해 결정된다.
NVIDIA의 Rubin 아키텍처는 2,000W를 초과할 것으로 예상된다. AMD의 MI450도 유사한 궤도에 있다. 모든 주요 칩 제조사는 더 작은 형태로 더 많은 성능을 넣고 있으므로, 열 밀도가 크게 증가하고 있다.
중요한 도전은 열 유속이다. 이는 와트/제곱센티미터 단위의 열 집중도를 측정한다. 열 유속이 증가함에 따라, 2세대 솔루션은 물리적 및 경제적 한계에 도달한다. 유량 속도는 파괴적이 되고, 온도 델타는 감당할 수 없으며, 시스템 비용은 지속할 수 없다.
3세대는 이러한 현실을 위해 구축되었다. 선도적인 운영자는 이미 250kW 랙을 지정하고 있으며, 1MW 이상으로의 명확한 경로를 가지고 있다. “누가 승리할지 보자”는 보수적인 접근 방식으로 느껴질 수 있지만, 이는 가장 위험한 접근 방식이다. 실리콘 로드맵은 固定되어 있다. 물리학은 굽히지 않는다. 남은 결정은 언제 행동할지이다.
브라운 필드 딜레마
현재 수십억 달러가 2세대 인프라에 투자되고 있다. 36개월 내에 제한될 것이다. 2027년 클래스 프로세서를 지원하기 위해 어려움을 겪을 것이다. 나중에 리트핏하는 것은 오늘날 3세대로 구축하는 것보다 훨씬 더 비싸다.
기존 사이트의 경우, 냉매-공기 시스템은 교량으로 служ을 수 있지만, 장기적인 해결책은 아니다. 산업의 방향은 명확하다. 3세대 아키텍처가 새로운 건설의 다음 10년을 담당할 것이다.
세대 선택
모든 냉각 전환은 다음 세대가 구식으로 만들 때까지 충분한 것으로 보였다. 2020-2021년에 액체 냉각을 채택한 운영자는 거의 2년의 배포 우위를 얻었다.
같은 변곡점이 다시 발생하고 있다. 물리학은 증명되었다. 경제는 독립적인 분석에 의해 검증되었다. 프로세서 로드맵은 전환을 불가피하게 만든다.
변화가 발생할지의 문제가 아니라, 그것을 주도할지 아니면 2세대가 한계에 도달했을 때 강제로 전환해야 할지의 문제이다.
오늘날 설계된 데이터 센터는 2030년대까지 운영될 것이다. 3세대 아키텍처로 구축하면 AI 시대에 적합한 것으로 남아 있는 것을 보장한다. 구속된 자산이 되기 전에 안정화되기 전에。
데이터 센터 냉각의 미래는 세대적인 변환이며, 3세대는 이미 여기 있다.












