Inteligência artificial

O Google Acaba de Lançar Números Reais sobre o Uso de Energia do AI — E Não São o que Você Pensa

mm

Todos estão falando sobre a grande pegada de energia do AI. Você já viu os títulos: “ChatGPT usa tanta eletricidade quanto um pequeno país” ou “Cada consulta de AI bebe um copo de água.”

O Google acaba de publicar dados reais de seus sistemas de produção, e os números contam uma história completamente diferente.

O Custo Real de Energia da Sua Consulta de AI

Aqui está o que o Google descobriu: a consulta de texto média do Gemini usa 0,24 watt-horas de energia. Isso é menos eletricidade do que assistir TV por nove segundos. Consumo de água? Cinco gotas. Não cinco copos. Cinco gotas.

A diferença entre a percepção pública e a realidade é massive. Estimativas anteriores afirmavam que as consultas de AI consumiam de 10 a 50 mililitros de água por consulta. Alguns estudos sugeriram um consumo de energia 30 vezes maior do que o que o Google está medindo em produção.

Por que a grande diferença? Porque ninguém estava medindo sistemas reais em escala até agora. Estudos acadêmicos realizam testes isolados em hardware subutilizado. Eles estão basicamente medindo a eficiência de combustível de um carro enquanto ele está parado na entrada da garagem.

A Melhoria de 44 Vezes

O Google reduziu as emissões de carbono de sua IA por 44 vezes em um ano. Não 44 por cento — 44 vezes.

Isso não é alguma melhoria teórica em um laboratório. Isso está acontecendo agora nos sistemas que atendem bilhões de consultas. Eles alcançaram isso por meio de uma combinação de otimização de software (melhoria de 33 vezes) e fontes de energia mais limpas (melhoria de 1,4 vezes).

A maioria dos estudos apenas olha para os chips de IA que estão fazendo o cálculo. Isso é como medir o uso de energia de um restaurante contando apenas os fornos, ignorando os refrigeradores, as luzes e o sistema de ar condicionado.

Os dados do Google mostram a imagem completa: Sim, os aceleradores de IA usam 58% da energia. Mas você também precisa de processadores e memória regulares (24%), capacidade de backup para confiabilidade (10%) e sistemas de refrigeração (8%). Se você pular qualquer um desses em sua medição, seus números são basicamente sem sentido.

Quando o Google aplicou a metodologia estreita que todos os outros usam — apenas medindo os chips de IA em máquinas totalmente utilizadas — sua figura de energia caiu para 0,10 watt-horas. O sistema de produção real usa 2,4 vezes mais energia porque os sistemas reais precisam de redundância, refrigeração e infraestrutura de suporte.

O que Isso Realmente Significa para o Futuro da IA

A narrativa em torno do consumo de energia da IA precisa de uma verificação de realidade. Sim, a IA usa energia. Mas os sistemas otimizados corretamente são muito mais eficientes do que os cenários de desastre sugerem.

O contexto é importante aqui. Aquelas 0,24 watt-horas por consulta? Os americanos usam cerca de 30 quilowatt-horas de eletricidade por dia em média. Você precisaria executar 125.000 consultas de IA para corresponder a um dia de uso de energia doméstica típico.

A história do consumo de água é ainda mais dramática. Aquelas cinco gotas de água por consulta? Você usa mais água nos primeiros segundos de lavar as mãos.

A Pilha de Otimização

O Google não está alcançando esses números por meio de alguma quebra de barreira única. Eles estão empilhando otimizações em cada camada do sistema.

Eles estão executando modelos “rascunho” menores que esboçam respostas, então verificam com modelos maiores apenas quando necessário. Eles estão agrupando milhares de consultas juntas para eficiência. Eles estão usando chips personalizados projetados especificamente para cargas de trabalho de IA que são 30 vezes mais eficientes do que a primeira geração.

Seus centros de dados operam com apenas 9% de sobrecarga acima do mínimo teórico — basicamente tão eficientes quanto fisicamente possível. Eles estão cada vez mais alimentados por energia limpa, cortando emissões mesmo quando o uso de eletricidade aumenta.

Conclusão

A história real é que os sistemas de IA eficientes podem ser dramaticamente mais sustentáveis do que se teme, mas isso requer uma otimização abrangente que a maioria da indústria ainda não alcançou.

Isso só funciona quando as empresas realmente otimizam sua pilha completa e medem corretamente. As empresas que tratam a infraestrutura de IA como um afterthought, executando sistemas ineficientes em redes de energia sujas? São elas que estão criando os problemas com os quais todos estão preocupados.

A diferença entre os sistemas de IA eficientes e ineficientes é absolutamente massive. E agora, a maioria da indústria ainda está executando a versão ineficiente.

Alex McFarland é um jornalista e escritor de IA que explora os últimos desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups de IA e publicações em todo o mundo.