Connect with us

O que o DeepSeek pode nos ensinar sobre o custo e a eficiência da IA

Líderes de pensamento

O que o DeepSeek pode nos ensinar sobre o custo e a eficiência da IA

mm

Com seu logotipo de baleia fofa, o lançamento recente do DeepSeek poderia ter se resumido a mais uma cópia do ChatGPT. O que o tornou noticiável – e o que fez com que as ações de seus concorrentes entrassem em colapso – foi o pouco que custou para criá-lo. Ele efetivamente jogou um macaco na máquina da noção dos EUA sobre o investimento necessário para treinar um Modelo de Linguagem Grande (LLM) de alto desempenho.

O DeepSeek supostamente gastou apenas $6 milhões para treinar seu modelo de IA. Juxtapondo isso com os $80–$100 milhões que a OpenAI gastou no Chat GPT-4 ou os $1 bilhão que eles reservaram para o GPT-5. O DeepSeek coloca esse nível de investimento em questão e deixa grandes jogadores como a Nvidia – cujo valor das ações caiu $600 bilhões em um dia – TSMC e Microsoft preocupados com a viabilidade financeira de longo prazo da IA. Se for possível treinar modelos de IA por significativamente menos do que se supunha anteriormente, o que isso significa para os gastos com IA em geral?

Embora a perturbação do DeepSeek tenha levado a discussões importantes, alguns pontos-chave parecem estar se perdendo na confusão. No entanto, o que a notícia traz é um foco maior em quanto a inovação custa e no possível impacto econômico da IA. Aqui estão três insights importantes que surgem dessa notícia:

1. A etiqueta de preço de $6 milhões do DeepSeek é enganosa

As empresas precisam entender o custo total de propriedade de sua infraestrutura (TCO). Embora a etiqueta de preço de $6 milhões do DeepSeek tenha sido muito divulgada, isso provavelmente é o custo de apenas sua execução de pré-treinamento e não de todo o investimento. O custo total – não apenas de execução, mas de construção e treinamento do DeepSeek – provavelmente é muito maior. A firma de análise de indústria SemiAnalysis revelou que a empresa por trás do DeepSeek gastou $1,6 bilhão em hardware para tornar seu LLM uma realidade. Então, o custo provável está em algum lugar no meio.

Qualquer que seja o custo real, o advento do DeepSeek criou um foco na inovação eficiente em termos de custo que pode ser transformador. A inovação é frequentemente impulsionada por limitações, e o sucesso do DeepSeek destaca a maneira como a inovação pode acontecer quando as equipes de engenharia otimizam seus recursos diante de restrições do mundo real.

2. A inferência é o que torna a IA valiosa, não o treinamento

É importante prestar atenção ao quanto o treinamento do modelo de IA custa, mas o treinamento representa uma pequena parte do custo total para construir e executar um modelo de IA. Inferência — as muitas maneiras pelas quais a IA muda como as pessoas trabalham, interagem e vivem — é onde a IA se torna verdadeiramente valiosa.

Isso traz à tona o paradoxo de Jevons, uma teoria econômica que sugere que, à medida que os avanços tecnológicos tornam o uso de um recurso mais eficiente, o consumo geral desse recurso pode, na verdade, aumentar. Em outras palavras, à medida que os custos de treinamento diminuem, a inferência e o consumo agente aumentarão, e os gastos gerais seguirão o mesmo caminho.

A eficiência da IA pode, de fato, levar a uma onda crescente de gastos com IA, o que deve elevar todos os barcos, não apenas os chineses. Supondo que eles cavalguem a onda de eficiência, empresas como a OpenAI e a Nvidia também se beneficiarão.

3. O que permanece verdadeiro é que a economia de unidade é o que mais importa

Tornar a IA mais eficiente não é apenas sobre reduzir os custos; também é sobre otimizar a economia de unidade. O The Motley Fool prevê que este ano será o ano da eficiência da IA. Se estiverem certos, as empresas devem prestar atenção à redução de seus custos de treinamento de IA, bem como de seus custos de consumo de IA.

As organizações que constroem ou usam IA precisam saber sua economia de unidade, em vez de se concentrar em figuras impressionantes, como o custo de treinamento de $6 milhões do DeepSeek. A eficiência real envolve alocar todos os custos, rastrear a demanda impulsionada pela IA e manter um controle constante sobre o custo-valor.

A economia de unidade da nuvem (CUE) tem a ver com medir e maximizar o lucro impulsionado pela nuvem. A CUE compara seus custos de nuvem com métricas de receita e demanda, revelando quão eficiente é seu gasto em nuvem, como isso mudou ao longo do tempo e (se você tiver a plataforma certa) as melhores maneiras de aumentar essa eficiência.

Entender a CUE tem uma utilidade ainda maior em um contexto de IA, dado que é intrinsicamente mais caro consumir do que os serviços de nuvem tradicionais vendidos pelos hyperscalers. As empresas que constroem aplicações agentes poderiam calcular seu custo por transação (por exemplo, custo por fatura, custo por entrega, custo por negociação, etc.) e usá-lo para avaliar o retorno sobre o investimento de serviços, produtos e recursos específicos impulsionados pela IA. À medida que os gastos com IA aumentam, as empresas serão forçadas a fazer isso; nenhuma empresa pode jogar dólares infinitos em inovação experimental para sempre. Eventualmente, tem que fazer sentido para os negócios.

Rumo à maior eficiência

No entanto, o quão significativo é o valor de $6 milhões, o DeepSeek pode ter fornecido um momento decisivo que desperta a indústria de tecnologia para a importância inevitável da eficiência. Vamos torcer para que isso abra as portas para treinamento, inferência e aplicações agentes eficientes em termos de custo que desbloqueiem o verdadeiro potencial e o ROI da IA.

Phil Pergola é CEO da CloudZero. Ele é um executivo de software B2B experiente com experiência em impulsionar um crescimento de receita significativo e resultados comerciais positivos em todo o ciclo de vida do cliente – aquisição, integração, adoção, expansão e retenção.