Лидеры мнений
10 обязательных вопросов для обеспечения эффективного развертывания системы охлаждения ИИ-центра данных

С ростом ИИ и высокопроизводительных вычислений центры данных распространяются с рекордной скоростью. Фактически, количество мощности центров данных, находящейся в стадии строительства на конец 2024 года, более чем удвоилось по сравнению с концом 2023 года (6 350 МВт в стадии строительства против ~3 078 МВт). В то же время используемое оборудование и обрабатываемые рабочие нагрузки в этих центрах данных становятся все более интенсивными. При таких быстро меняющихся условиях и ставки, и проблемы увеличиваются.
И с учетом того, что средний центр данных тратит до 40% своего całого энергетического бюджета на охлаждение, термическое управление быстро становится одной из главных проблем для отрасли. С другой стороны, операторы центров данных имеют больше вариантов, чем когда-либо, для охлаждения своих объектов надежно, эффективно и экономически.
Конечно, когда есть варианты, есть и решения, которые необходимо принять. Итак, когда вы рассматриваете свое собственное развертывание центра данных, вот 10 обязательных вопросов, на которые вы должны ответить, чтобы запустить свою операцию быстро, а также обеспечить эффективность, надежность и устойчивость на долгий срок.
Вопрос 1: Как быстро я могу ввести эту систему охлаждения в эксплуатацию без ущерба для надежности?
В гонке ИИ真正ный дифференциатор успеха в отрасли не в том, кто накопил больше GPU — это в том, кто их быстрее внедряет. Время до запуска (т. е. время от начала развертывания до его ввода в эксплуатацию) стало новым полем битвы, определяющим, как быстро предприятия могут превратить инвестиции в ИИ в бизнес-эффект. Лидерами не будут только те, у кого есть огромные вычислительные ресурсы, но и те, кто их первым освободит, ускоряя инновации, доходы и конкурентное преимущество.
Но торопливое развертывание системы охлаждения может обернуться неудачей, что приведет к неэффективности, простою или дорогостоящим модернизациям. Операторы должны спросить себя, может ли их выбранная система быть развернута быстро и выдержать испытание временем. Стратегия, которая балансирует скорость реализации с надежностью, обеспечивает как немедленную готовность к рынку, так и долгосрочную устойчивость.
Вопрос 2: Какой метод охлаждения лучше всего соответствует потребностям моего проекта?
Не существует универсального решения для каждого развертывания центра данных. Воздушное охлаждение давно стало стандартом, но оно быстро достигает своих физических пределов при обработке передового оборудования и высокоплотных стеллажей, характерных для центров данных ИИ. Жидкостное охлаждение предлагает беспрецедентную эффективность в масштабе и будущую производительность для все более требовательных рабочих нагрузок. Гибридные подходы могут мостить разрыв, но в долгосрочной перспективе центры данных ИИ будут полагаться на жидкостные решения для охлаждения, чтобы управлять все более интенсивными рабочими нагрузками ИИ. Однако выбор правильного метода жидкостного охлаждения зависит от типа рабочей нагрузки, плотности, местоположения и других факторов.
Существует два основных метода жидкостного охлаждения, используемых в коммерции сегодня: прямое охлаждение чипа (DTC) и погружное охлаждение. Хотя DTC в настоящее время более распространен, погружное охлаждение, как ожидается, получит развитие по мере увеличения плотности мощности чипов. Системы DTC направляют охладитель непосредственно к теплогенерирующим компонентам, таким как ЦП и GPU, через холодные пластины, предлагая быстрые выигрыши в эффективности с минимальными изменениями инфраструктуры. Однофазные системы проще и более дружественны к модернизации, в то время как двухфазные системы используют хладагенты для достижения более высокой теплопередачи с более низкой мощностью насоса, но с большей сложностью системы. Погружное охлаждение, с другой стороны, погружает весь сервер в диэлектрические жидкости — либо циркулируемые (однофазные), либо кипящие и конденсируемые в герметичных баках (двухфазные).
Какое решение является правильным для вашей среды, зависит от характера вашего оборудования, рабочих нагрузок, бюджета и т. д. Но осознание своих вариантов имеет решающее значение как для краткосрочной, так и для долгосрочной жизнеспособности вашего центра данных ИИ.
Вопрос 3: Будет ли моя система охлаждения поддерживать сегодняшние рабочие нагрузки и завтрашние плотности, обусловленные ИИ?
Что приводит нас к следующему большому вопросу: будет ли моя система выдерживать испытание временем? Спрос на центры данных ускоряется за пределами исторических норм. Кластеры обучения ИИ, например, могут требовать в 10-20 раз больше плотности мощности, чем традиционные корпоративные стеллажи. Вопрос, который операторы должны задать, заключается в том, может ли их конструкция охлаждения обеспечить будущую плотность без полной замены.
Рост ИИ, высокопроизводительных вычислений (HPC) и все более плотных архитектур стеллажей уже толкает воздушное охлаждение к его пределам. В Опросе систем охлаждения Uptime Institute за 2024 год большинство операторов сказали, что воздушное охлаждение становится нецелесообразным и/или слишком дорогим на любом уровне выше ~20 кВт на стеллаж. Однако текущий отраслевой отчет показывает, что стеллажи ИИ уже обычно достигают 100 кВт на стеллаж. И эти цифры уже растут. Nvidia недавно представила планы для своих GPU Rubin Ultra с стеллажами Kyber, которые превысят 600 кВт на стеллаж к 2027 году.
Зная, что воздушное охлаждение приближается к устареванию в развертываниях центров данных ИИ, операторы могут обратиться к гибридным или фазовым подходам, где полные, зеленые развертывания жидкостного охлаждения не являются вариантом. Опять же, учитывая огромное время и затраты, вложенные в эти проекты, долгосрочная жизнеспособность имеет первостепенное значение. Итак, при выборе решений для охлаждения убедитесь, что они готовы к долгосрочной перспективе.
Вопрос 4: Каковы общие затраты за весь жизненный цикл?
Хотя первоначальные затраты могут быть ошеломляющими в сфере центров данных, капитальные затраты (CAPEX) составляют только часть истории. Операторы должны рассчитать общую стоимость владения (TCO), включая операционные расходы (OPEX), связанные с потреблением энергии, техническим обслуживанием и модернизацией, при рассмотрении своих решений для охлаждения. Система, которая кажется более дорогой вначале, может обеспечить долгосрочную экономию за счет энергетической эффективности, снижения простоя и увеличения срока службы. Правильная стратегия охлаждения редко является самой дешевой вначале — это та, которая оптимизирует затраты за 10-15-летний цикл объекта.
Помните, что это не краткосрочные развертывания. Более того, чем больше жизни вы получите из этого развертывания, тем больше вы стоите, чтобы получить. Выглядывая за пределы CAPEX и думая о ваших долгосрочных затратах и экономии, является миссией критически важной для обеспечения того, чтобы вы получили максимальную пользу от вашего проекта центра данных.
Вопрос 5: Как эта стратегия охлаждения повлияет на мой профиль устойчивости?
Как упоминалось ранее, охлаждение может составлять 40% или более от общего потребления энергии центра данных. Поскольку регулирования и требования отчетности ESG расширяются, операторы должны спросить: как это решение влияет на мой углеродный след, потребление энергии и другие обязательства по устойчивости? Решения, которые снижают энергопотребление или отходы ресурсов, или соответствуют глобальным стандартам, таким как каркас Green Grid, становятся все более не только предпочтительными, но и обязательными для уверенности инвесторов и соблюдения регулирования.
Между тем, государственный сектор все чаще требует снижения потребления энергии. Аналитика, независимый наблюдатель за сетью средней Атлантики, произвела исследования в июне, показывающие, что 70% увеличения стоимости электроэнергии в прошлом году было результатом спроса центров данных. Неудивительно, что потребители поднимают тревогу, и штаты рассматривают некоторые серьезные меры для решения этой проблемы, включая возможность принудительного отключения в периоды высокого спроса. Инвестируя в более энергосберегающие и устойчивые решения для охлаждения, организации могут позиционировать себя для навигации как по общественному восприятию, так и по нормативным проблемам, которые лежат впереди.
Вопрос 6: Сколько воды будет потреблять этот подход к охлаждению — и является ли это устойчивым в моем регионе?
Большие центры данных могут потреблять до 5 миллионов галлонов воды в день. Не должно быть сюрпризом, что нехватка воды становится определяющей проблемой для центров данных, особенно в регионах, таких как американский Юго-Запад, и части Европы, где права на воду и проблемы нехватки воды приводят к повышению контроля над центрами данных. Чтобы все сделать правильно, операторы должны рассчитать предполагаемое потребление воды их системы охлаждения и оценить, соответствует ли оно местным и региональным реалиям (в плане как доступности, так и нормативных требований).
Не обманывайтесь названием — жидкостное охлаждение на самом деле потребляет значительно меньше воды, чем традиционные системы воздушного охлаждения. Согласно исследованию, опубликованному в Nature, жидкостное охлаждение снижает потребление «голубой воды» в центрах данных на 31-52% по сравнению с традиционным воздушным охлаждением за весь жизненный цикл. Решения для охлаждения, которые минимизируют или исключают потребление воды, могут помочь объектам противостоять экологическим и нормативным рискам.
Вопрос 7: Какие риски или ограничения связаны с жидкостным охлаждением, и как их можно смягчить?
Хотя оно предлагает беспрецедентные преимущества в эффективности, устойчивости и возврате инвестиций за всю жизнь, многие мифы сохраняются о жидкостном охлаждении, особенно вокруг надежности, стоимости и интеграции. На самом деле, достижения в технологии, материалах и конструкции сделали жидкостное охлаждение безопасным, надежным и все более экономически эффективным. Ключ для операторов — оценить эти системы по реальным данным производительности, а не устаревшим представлениям, и проектировать с учетом проверенных лучших практик.
Когда вы смотрите на жидкостное охлаждение, также важно быть осведомленным о каком решении является лучшим для вашего объекта. С различными подходами (например, прямое охлаждение чипа [DTC], погружное охлаждение) и множеством поставщиков, предлагающих широкий спектр решений, всегда необходимо выполнять свою проверку при рассмотрении развертывания жидкостного охлаждения.
Вопрос 8: Как моя конструкция охлаждения повлияет на использование пространства и плотность стеллажей?
Пространство так же ценно, как и энергия в современных объектах центров данных. Высокоплотные стеллажи, поддерживаемые эффективным жидкостным охлаждением, могут значительно снизить требования к площади пола и снижают размеры объектов. Это, в свою очередь, позволяет операторам либо масштабировать рабочие нагрузки в существующих границах, либо минимизировать затраты на землю и строительство для новых построек. Быть в состоянии сделать больше с меньшим пространством не только снижает затраты, но и открывает двери для гораздо более широкого спектра жизнеспособных мест для строительства. С меньшими габаритами разработчики могут строить более свободно и даже приносить вычисления ближе к конечному пользователю. Задавая эти вопросы заранее, вы гарантируете, что конструкция охлаждения согласована как с плотностью, так и с использованием пространства.
Вопрос 9: Какова моя долгосрочная стратегия устойчивости, если рабочие нагрузки увеличиваются или регулирования ужесточаются?
Центры данных не являются статичными. Неожиданные всплески спроса, новые приложения ИИ и ужесточение требований к эффективности и устойчивости могут быстро создать нагрузку на инфраструктуру. Операторы должны спросить себя, является ли их стратегия охлаждения достаточно адаптивной, чтобы удовлетворить эти часто неожиданные изменения. Эффективные системы охлаждения должны быть готовы к масштабированию мощности, выполнению новых требований по соответствию и интеграции с будущими технологиями.
Системы, которые предлагают модульность, и поставщики с прочными цепочками поставок помогут изолировать ваш центр данных от меняющегося спроса, позволяя вам масштабировать более легко и обновлять и интегрировать более легко, если и когда это необходимо.
Вопрос 10: Отношусь ли я к охлаждению как к стратегическому усилителю — или просто как к после мысли?
Этот последний, общий вопрос, пожалуй, является наиболее важным. Когда вы рассматриваете свою систему охлаждения, сначала возьмите момент, чтобы пересмотреть роль охлаждения в ваших общих операциях центра данных. Слишком часто охлаждение рассматривается как фоновая инфраструктура, когда, на самом деле, оно является стратегическим усилителем производительности, времени безотказной работы и устойчивости. Компании, которые инвестируют в вдумчивые стратегии охлаждения, получают не только операционную эффективность, но и конкурентное преимущество в надежности, соблюдении требований и долгосрочных затратах.
И поскольку ИИ продолжает создавать новые, более интенсивные требования к центрам данных, важно взглянуть на охлаждение в долгосрочной перспективе. Не просто думайте о том, что лучше, быстрее или дешевле для вашего развертывания сегодня. Думайте о том, как ваше решение для охлаждения позиционирует вас через 5, 10 или даже 15 лет. Если ваша система охлаждения едва удовлетворяет требованиям сегодня, вы можете быть уверены, что она больше не будет соответствовать требованиям через несколько лет. Помните, охлаждение является центральным для общего успеха вашего объекта на протяжении всего его жизненного цикла.
Охлаждение теперь является центральным для долгосрочного успеха центра данных — выбирайте мудро
Охлаждение больше не является заботой «заднего офиса» — это центральное для каждого центра данных в краткосрочной и долгосрочной перспективе. Задавая эти десять вопросов на начальном этапе, операторы могут сократить время развертывания, минимизировать риски и обеспечить, чтобы объекты были построены для устойчивости в мире, управляемом ИИ, определяемом изменением и потоком.
Будущее отрасли будет определяться не только тем, насколько быстро операторы развертывают мощность, но и тем, насколько умно они проектируют для долгосрочной устойчивости и надежности. Те, кто рассматривает охлаждение как стратегический усилитель, будут лучше всего подготовлены к лидерству в будущем.












