LÃderes de pensamento
O que o DeepSeek pode nos ensinar sobre custo e eficiência da IA

Com seu logotipo fofo de baleia, o lançamento recente do DeepSeek poderia ter sido nada mais do que mais uma imitação do ChatGPT. O que o tornou tão interessante — e o que fez as ações dos concorrentes despencarem — foi o quão pouco custou para ser criado. Ele efetivamente jogou uma chave inglesa na noção dos EUA sobre o investimento necessário para treinar um Large Language Model (LLM) de alto funcionamento.
A DeepSeek supostamente gastou apenas US$ 6 milhões para treinar seu modelo de IA. Compare isso com os US$ 80–100 milhões relatados que a OpenAI gastou no Chat GPT-4 ou o US$ 1 bilhão que eles reservaram para o GPT-5. A DeepSeek questiona esse nÃvel de investimento e deixa grandes players como a Nvidia — cujo valor de ações caiu US$ 600 bilhões em um dia —, a TSMC e a Microsoft preocupadas com a viabilidade financeira de longo prazo da IA. Se for possÃvel treinar modelos de IA por significativamente menos do que o assumido anteriormente, o que isso pressagia para os gastos gerais com IA?
Embora a interrupção do DeepSeek tenha levado a discussões importantes, alguns pontos-chave parecem estar se perdendo na confusão. No entanto, o que as notÃcias trazem é um foco maior em quanto custa a inovação e o possÃvel impacto econômico da IA. Aqui estão três insights importantes decorrentes dessas notÃcias:
1. O preço de US$ 6 milhões do DeepSeek é enganoso
As empresas precisam entender o custo total de propriedade (TCO) de sua infraestrutura. Embora o preço de US$ 6 milhões do DeepSeek tenha sido muito divulgado, esse é provavelmente o custo apenas de sua execução de pré-treinamento, em vez de todo o seu investimento. O custo total — não apenas de execução, mas de construção e treinamento do DeepSeek — é provavelmente muito maior. Empresa de análise do setor SemiAnálise revelou que a empresa por trás do DeepSeek gastou US$ 1.6 bilhão em hardware para tornar seu LLM uma realidade. Então, o custo provável está em algum lugar no meio.
Seja qual for o custo real, o advento do DeepSeek criou um foco na inovação com eficiência de custo que pode ser transformadora. A inovação é frequentemente estimulada por limitações, e o sucesso do DeepSeek ressalta a maneira como a inovação pode acontecer quando as equipes de engenharia otimizam seus recursos diante de restrições do mundo real.
2. A inferência é o que torna a IA valiosa, não o treinamento
É importante prestar atenção em quanto custa o treinamento do modelo de IA, mas o treinamento representa uma pequena parcela do custo geral para construir e executar um modelo de IA. Inferência — as diversas maneiras pelas quais a IA muda a maneira como as pessoas trabalham, interagem e vivem — é onde a IA se torna verdadeiramente valiosa.
Isso traz à tona o paradoxo de Jevons, uma teoria econômica que sugere que, à medida que os avanços tecnológicos tornam o uso de um recurso mais eficiente, o consumo geral desse recurso pode, na verdade, aumentar. Em outras palavras, à medida que os custos de treinamento diminuem, a inferência e o consumo de agentes aumentarão, e os gastos gerais seguirão o exemplo.
A eficiência da IA ​​pode, de fato, levar a uma maré crescente de gastos com IA, o que deve levantar todos os barcos, não apenas os chineses. Supondo que eles surfem na onda da eficiência, empresas como OpenAI e Nvidia também se beneficiarão.
3. O que continua sendo verdade é que a economia unitária é o que mais importa
Tornar a IA mais eficiente não é apenas reduzir custos; é também otimizar a economia da unidade. O Motley Fool prevê que este ano será o ano da eficiência da IA. Se estiverem certos, as empresas devem prestar atenção em reduzir seus custos de treinamento em IA, bem como seus custos de consumo de IA.
Organizações que criam ou usam IA precisam conhecer sua economia unitária em vez de destacar números impressionantes como o custo de treinamento de US$ 6 milhões da DeepSeek. A eficiência real envolve alocar todos os custos, rastrear a demanda impulsionada por IA e manter guias constantes sobre o custo-valor.
Cloud unit economics (CUE) tem a ver com medir e maximizar o lucro gerado pela nuvem. CUE compara seus custos de nuvem com métricas de receita e demanda, revelando quão eficientes são seus gastos com nuvem, como isso mudou ao longo do tempo e (se você tiver a plataforma certa) as melhores maneiras de aumentar essa eficiência.
Entender o CUE tem utilidade ainda maior em um contexto de IA, dado que é inerentemente mais caro de consumir do que os serviços de nuvem tradicionais vendidos pelos hiperescaladores. As empresas que criam aplicativos agênticos podem calcular seu custo por transação (por exemplo, custo por fatura, custo por entrega, custo por negociação, etc.) e usar isso para avaliar o retorno sobre o investimento de serviços, produtos e recursos especÃficos baseados em IA. À medida que os gastos com IA aumentam, as empresas serão forçadas a fazer isso; nenhuma empresa pode jogar dólares infinitos em inovação experimental para sempre. Eventualmente, isso tem que fazer sentido para os negócios.
Rumo a uma maior eficiência
Por mais significativo que seja o valor de US$ 6 milhões, o DeepSeek pode ter proporcionado um momento decisivo que desperta a indústria de tecnologia para a importância inevitável da eficiência. Esperemos que isso abra as comportas para treinamento, inferência e aplicativos de agente com boa relação custo-benefÃcio que desbloqueiem o verdadeiro potencial e ROI da IA.