Líderes de pensamento
10 Perguntas Obrigatórias para Garantir uma Implantação Eficaz de Resfriamento de Centro de Dados de IA

Com o surgimento da IA e do computação de alto desempenho, os centros de dados estão proliferando a uma velocidade recorde. De fato, a quantidade de capacidade de centro de dados em construção no final de 2024 mais que dobrou em comparação com o final de 2023 (6.350 MW em construção vs. ~3.078 MW). Ao mesmo tempo, o hardware utilizado e as cargas de trabalho lidadas nesses centros de dados estão se tornando cada vez mais intensivos. Sob essas condições em constante mudança, tanto os riscos quanto os desafios estão aumentando.
E com os centros de dados gastando até 40% de seu orçamento de energia em resfriamento, o gerenciamento térmico está se tornando rapidamente um dos principais desafios para a indústria. Por outro lado, os operadores de centros de dados têm mais opções do que nunca para resfriar suas instalações de forma confiável, eficiente e econômica.
É claro que, quando há opções, há também decisões a serem tomadas. Portanto, ao considerar sua própria implantação de centro de dados, aqui estão 10 perguntas obrigatórias que você deve responder para colocar sua operação em funcionamento rapidamente, garantindo eficiência, confiabilidade e sustentabilidade a longo prazo.
Pergunta 1: Quão rapidamente posso colocar este sistema de resfriamento online sem comprometer a confiabilidade?
Na corrida armamentista da IA, o verdadeiro diferenciador para o sucesso da indústria não é quem acumula mais GPUs — é quem as coloca online mais rapidamente. O tempo de energia (ou seja, o tempo desde o início de uma implantação até que ela se torne operacional) se tornou o novo campo de batalha, determinando quão rapidamente as empresas podem transformar o investimento em IA em impacto comercial. Os líderes não serão apenas aqueles com recursos de computação maciços, mas aqueles que os liberam primeiro, acelerando a inovação, a receita e a vantagem competitiva.
No entanto, apressar a implantação do resfriamento pode ter consequências negativas, levando a ineficiências, tempo de inatividade ou retrofit caro. Os operadores devem perguntar se o sistema escolhido pode ser implantado rapidamente e resistir ao teste do tempo. Uma estratégia que equilibre a velocidade de implementação com a robustez fornece tanto a prontidão imediata do mercado quanto a resiliência a longo prazo.
Pergunta 2: Qual método de resfriamento é mais alinhado com as necessidades do meu projeto?
Não há uma solução única para cada implantação de centro de dados. O resfriamento a ar tem sido o padrão por muito tempo, mas está rapidamente atingindo seus limites físicos ao lidar com o hardware avançado e os racks de alta densidade típicos dos centros de dados de IA. O resfriamento líquido oferece eficiência incomparável em escala e desempenho futuro para cargas de trabalho cada vez mais exigentes. As abordagens híbridas podem preencher a lacuna, mas, a longo prazo, os centros de dados de IA virão a depender de soluções de resfriamento líquido para gerenciar as cargas de trabalho de IA cada vez mais intensivas. No entanto, a escolha do método correto de resfriamento líquido depende do tipo de carga de trabalho, densidade, localização e outros fatores.
Existem dois métodos primários de resfriamento líquido em uso comercial hoje: direto-para-o-chip (DTC) e resfriamento por imersão. Embora o DTC seja atualmente mais comum, o resfriamento por imersão deve ganhar tração à medida que as densidades de potência dos chips aumentam. Os sistemas DTC direcionam o fluido de resfriamento diretamente para os componentes geradores de calor, como CPUs e GPUs, por meio de placas frias, oferecendo ganhos de eficiência rápidos com alterações mínimas na infraestrutura. Os sistemas de fase única são mais simples e amigáveis para retrofit, enquanto os sistemas de duas fases usam refrigerantes para alcançar um desempenho de transferência de calor mais alto com menor potência de bombeamento, mas maior complexidade do sistema. O resfriamento por imersão, por outro lado, submerge servidores inteiros em fluidos dielétricos — seja circulados (fase única) ou fervidos e condensados dentro de tanques selados (duas fases).
Qual solução é a certa para o seu ambiente depende da natureza do seu hardware, cargas de trabalho, orçamento e muito mais. No entanto, estar ciente das opções é vital para a viabilidade a curto e longo prazo do seu centro de dados de IA.
Pergunta 3: Meu sistema de resfriamento dará suporte às cargas de trabalho de hoje e às densidades impulsionadas por IA de amanhã?
O que nos leva à próxima grande pergunta: meu sistema resistirá ao teste do tempo? A demanda por centros de dados está acelerando além dos padrões históricos. Os clusters de treinamento de IA, por exemplo, podem exigir 10 a 20 vezes a densidade de potência dos racks de empresa tradicionais. A pergunta que os operadores devem fazer é se o design de resfriamento pode acomodar futuras densidades sem substituição completa.
O surgimento da IA, HPC (computação de alto desempenho) e arquiteturas de rack cada vez mais densas já está empurrando o resfriamento a ar para seus limites. Na Pesquisa de Sistemas de Resfriamento de 2024 do Uptime Institute, a maioria dos operadores disse que o resfriamento a ar se torna impraticável e/ou muito caro em qualquer ponto acima de ~20 kW por rack. No entanto, os relatórios atuais da indústria mostram que os racks de IA já comumente impulsionam 100 kW por rack. E esses números já estão aumentando. A Nvidia recentemente revelou planos para seus GPUs Rubin Ultra com racks Kyber, que ultrapassarão 600kW por rack em 2027.
Sabendo que o resfriamento a ar está em seu caminho para a obsolescência nas implantações de centros de dados de IA, os operadores podem olhar para abordagens híbridas ou faseadas sempre que as implantações de resfriamento líquido completas e verdes não forem uma opção. Mais uma vez, considerando o tempo e o custo imenso investidos nesses projetos, a viabilidade a longo prazo é de suma importância. Portanto, ao selecionar soluções de resfriamento, certifique-se de que elas estejam preparadas para o longo prazo.
Pergunta 4: Quais são as implicações de custo totais ao longo do ciclo de vida completo?
Embora as despesas iniciais possam ser impressionantes no espaço de centros de dados, o custo de capital (CAPEX) é apenas parte da história. Os operadores devem calcular o custo total de propriedade (TCO), incluindo despesas operacionais (OPEX) vinculadas ao consumo de energia, manutenção e retrofit, ao considerar suas soluções de resfriamento. Um sistema que parece mais caro inicialmente pode oferecer economias a longo prazo por meio da eficiência energética, redução do tempo de inatividade e aumento da longevidade. A estratégia de resfriamento certa raramente é a mais barata inicialmente — é a que otimiza os custos ao longo do ciclo de vida de 10 a 15 anos da instalação.
Lembre-se de que essas não são implantações de curto prazo. Além disso, mais vida você obtém da implantação, mais valor você está prestes a ganhar. Olhar além do CAPEX e pensar sobre os custos e economias a longo prazo é fundamental para garantir que você obtenha o máximo de seu projeto de centro de dados.
Pergunta 5: Como esta estratégia de resfriamento afetará meu perfil de sustentabilidade?
Como mencionado anteriormente, o resfriamento pode representar 40% ou mais do consumo total de energia de um centro de dados. À medida que as regulamentações e os requisitos de relatórios ESG se expandem, os operadores devem perguntar: como este sistema impacta minha pegada de carbono, uso de energia e outros compromissos de sustentabilidade? Soluções que reduzem o desperdício de energia ou recursos ou se alinham com padrões globais, como o framework Green Grid, estão se tornando cada vez mais não apenas preferíveis, mas necessárias para a confiança dos investidores e a conformidade regulatória.
Enquanto isso, o setor público está cada vez mais clamando por uma redução no consumo de energia. A Monitoring Analytics, a autoridade de mercado independente para a rede do meio-Atlântico, produziu uma pesquisa este junho mostrando que 70% do aumento do custo da eletricidade no ano passado foi resultado da demanda dos centros de dados. Não é surpreendente que os consumidores estejam soando o alarme, e os estados estão considerando algumas medidas sérias para abordar essa preocupação, incluindo a possibilidade de desligamentos forçados durante períodos de alta demanda. Ao investir em soluções de resfriamento mais eficientes em termos de energia e sustentáveis, as organizações podem se posicionar para navegar tanto pela percepção pública quanto pelos desafios regulatórios que estão por vir.
Pergunta 6: Quanta água este approach de resfriamento consumirá — e isso é sustentável em minha região?
Os grandes centros de dados podem consumir até 5 milhões de galões de água por dia. Não deve ser surpreendente, portanto, que a escassez de água esteja se tornando um problema definidor para os centros de dados, especialmente em regiões como o sudoeste americano e partes da Europa, onde os direitos e questões de escassez de água estão levando a um aumento da vigilância em relação aos centros de dados. Para acertar, os operadores devem calcular o uso projetado de água do sistema de resfriamento e avaliar se ele está alinhado com as realidades locais e regionais (em termos de disponibilidade e requisitos regulatórios).
Não seja enganado pelo nome — o resfriamento líquido consome significativamente menos água do que os sistemas de resfriamento a ar tradicionais. De acordo com um estudo publicado pela Nature, o resfriamento líquido reduz o consumo de “água azul” do centro de dados em 31 a 52% em comparação com o resfriamento a ar tradicional ao longo de seu ciclo de vida. Soluções de resfriamento que minimizam ou eliminam o consumo de água podem ajudar a proteger as instalações contra riscos ambientais e regulatórios.
Pergunta 7: Quais riscos ou limitações estão associados ao resfriamento líquido, e como eles podem ser mitigados?
Embora ofereça vantagens sem precedentes em torno da eficiência, sustentabilidade e ROI de vida útil, muitos mitos persistem sobre o resfriamento líquido, especialmente em torno da confiabilidade, custo e integração. Na realidade, os avanços na tecnologia, materiais e design tornaram o resfriamento líquido seguro, confiável e cada vez mais econômico. A chave para os operadores é avaliar esses sistemas contra dados de desempenho do mundo real, não percepções desatualizadas, e projetar com as melhores práticas comprovadas em mente.
Quando se olha para o resfriamento líquido, é igualmente importante estar ciente de qual solução é a melhor para sua instalação. Com diferentes abordagens (por exemplo, direto-para-o-chip [DTC], imersão) e uma variedade de fornecedores oferecendo uma ampla gama de soluções, é sempre importante realizar a devida diligência ao considerar uma implantação de resfriamento líquido.
Pergunta 8: Como meu design de resfriamento afetará a utilização do espaço e a densidade do rack?
O espaço é tão valioso quanto a energia nas instalações de centros de dados modernos. Racks de alta densidade apoiados por resfriamento líquido eficiente podem reduzir drasticamente os requisitos de espaço de piso e a pegada da instalação. Isso, por sua vez, permite que os operadores escalonem as cargas de trabalho em footprints existentes ou minimizem os custos de terra e construção para novas construções. Ser capaz de fazer mais com menos espaço não apenas reduz os custos, mas também abre a porta para uma variedade muito maior de locais viáveis para construção. Com footprints menores, os desenvolvedores podem construir mais livremente e até mesmo levar o processamento mais próximo do usuário final. Fazer essas perguntas antecipadamente garante que o design de resfriamento esteja alinhado com os objetivos de densidade e utilização do espaço.
Pergunta 9: Qual é minha estratégia de resiliência a longo prazo se as cargas de trabalho aumentarem ou as regulamentações se tornarem mais rígidas?
Os centros de dados não são estáticos. Surtos inesperados de demanda, novos aplicativos de IA e mandatos de eficiência/sustentabilidade mais rigorosos podem rapidamente colocar pressão sobre a infraestrutura. Os operadores devem perguntar se a estratégia de resfriamento é suficientemente adaptável para atender a essas mudanças frequentemente inesperadas. Os sistemas de resfriamento eficazes devem estar preparados para escalonar a capacidade, atender a novos requisitos de conformidade e integrar-se com tecnologias futuras.
Sistemas que oferecem modularidade e fornecedores com cadeias de suprimento robustas ajudarão a proteger seu centro de dados contra a demanda em mudança, permitindo que você escalone mais facilmente e atualize e integre mais facilmente se e quando necessário.
Pergunta 10: Estou tratando o resfriamento como um habilitador estratégico — ou apenas como um pós-pensamento?
Esta pergunta final, abrangente, é, sem dúvida, a mais importante. Ao considerar seu sistema de resfriamento, primeiro, reserve um momento para reconsiderar o papel do resfriamento em suas operações gerais de centro de dados. Muito frequentemente, o resfriamento é tratado como infraestrutura de segundo plano, quando, na realidade, é um habilitador estratégico de desempenho, tempo de atividade e sustentabilidade. As empresas que investem em estratégias de resfriamento bem pensadas ganham não apenas eficiência operacional, mas também uma vantagem competitiva em confiabilidade, conformidade e custos a longo prazo.
E, à medida que a IA continua a impor novas e mais intensas demandas sobre os centros de dados, é fundamental ter uma visão de longo prazo do resfriamento. Não pense apenas no que é melhor, mais rápido ou mais barato para sua implantação hoje. Pense em como sua solução de resfriamento o posiciona 5, 10 ou até 15 anos à frente. Se seu sistema de resfriamento mal atende às necessidades de hoje, você pode ter certeza de que não estará mais atendendo às necessidades em apenas alguns anos. Lembre-se de que o resfriamento é central para o sucesso geral da instalação ao longo de todo o seu ciclo de vida.
O Resfriamento Agora é Central para o Sucesso a Longo Prazo do Centro de Dados — Escolha Sabiamente
O resfriamento não é mais uma preocupação de fundo de casa — é central para o sucesso a curto e longo prazo de cada centro de dados. Ao fazer essas dez perguntas no início, os operadores podem reduzir o tempo de implantação, minimizar os riscos e garantir que as instalações sejam construídas para resiliência em um mundo impulsionado por IA, definido por mudança e fluxo.
O futuro da indústria será definido não apenas pela velocidade com que os operadores implantam a capacidade, mas também por quão inteligentemente eles projetam para a sustentabilidade e confiabilidade a longo prazo. Aqueles que tratam o resfriamento como um habilitador estratégico estarão melhor posicionados para liderar nos anos que se seguem.












