Inteligência artificial
Anthropic lança Claude Haiku 4.5

Antrópico lançado Claude Haiku 4.5 hoje (15 de outubro de 2025), oferecendo desempenho que corresponde ao seu modelo principal Sonnet 4 em codificação, uso de computador e tarefas baseadas em agentes, com um terço do custo e mais que o dobro da velocidade.
O novo modelo pontuou 73.3% no SWE-bench Verificado, um benchmark que mede a capacidade de codificação de IA, atribuindo a modelos a tarefa de corrigir bugs reais em repositórios Python de código aberto, usando apenas a descrição original do problema. As soluções são avaliadas pela aprovação nos testes unitários existentes em cada repositório, sem crédito parcial.

A pontuação coloca o Haiku 4.5 entre os melhores modelos de codificação do mundo, igualando o desempenho do Sonnet 4, mas diminuindo drasticamente seu preço e latência.
A Anthropic precificou o Haiku 4.5 em US$ 1 por milhão de tokens de entrada e US$ 5 por milhão de tokens de saída. Os desenvolvedores podem reduzir ainda mais os custos por meio de cache de prompt, o que reduz os custos de insumos repetidos em até 90%, e o API de lotes de mensagens, que oferece um desconto de 50% para cargas de trabalho que toleram uma janela de processamento de 24 horas. Combinados, os dois recursos podem reduzir os custos de token de entrada em 95% para prompts em cache processados em lote.
O modelo supera o Sonnet 4 em tarefas de uso do computador — os recursos de manipulação da GUI e do navegador que alimentam Claude para Chrome, a extensão de agente baseada em navegador da Anthropic, lançada em agosto. O uso do computador permite que Claude leia páginas da web, clique em botões e preencha formulários diretamente no Chrome, um recurso que o Haiku 4.5 agora executa mais rápido do que seu irmão maior. A extensão está atualmente disponível para Assinantes 1,000 sobre o plano Max da Anthropic, com uma lista de espera mais ampla aberta.
A Anthropic posicionou o Haiku 4.5 como um substituto imediato para o Haiku 3.5 e o Sonnet 4 em cargas de trabalho interativas e com custo reduzido. A empresa recomenda o uso do Sonnet 4.5 — ainda o modelo de ponta da Anthropic — para planejamento em várias etapas, implementando a execução paralela por um grupo de trabalhadores do Haiku 4.5 para eficiência de custo e produtividade. O Sonnet 4.5 continua sendo "o melhor modelo de codificação do mundo", de acordo com a Anthropic.
A família Haiku estreou em março de 2024 como parte da série Claude 3, que introduziu modelos em camadas - Haiku, Sonnet e Opus— equilibrando velocidade, custo e inteligência. O Claude 3.5 Haiku foi lançado em outubro de 2024, com uma produção máxima de 8,192 tokens e dados de treinamento até julho de 2024. A versão 4.5 dá continuidade ao padrão da Anthropic de lançar modelos menores que superam sua categoria em tarefas específicas.
A disponibilidade do Claude.ai é imediata na web, iOS e Android. Os desenvolvedores podem acessar o Haiku 4.5 por meio da API da Anthropic. Rocha Amazônicae Google Cloud Vertex AI. Os casos de uso alvo incluem assistentes em tempo real, automação de suporte ao cliente e ambientes de programação em pares onde latência e taxa de transferência são importantes. O modelo também melhora a capacidade de resposta do Claude Code, o editor de código multiagente da Anthropic, para fluxos de trabalho de prototipagem rápida.
O lançamento acontece no momento em que a Anthropic compete na “guerra dos navegadores de IA”. Perplexidade lançou seu navegador Comet em julho de 2025, a OpenAI está supostamente desenvolvendo seu próprio navegador de IA e o Google integrou o Gemini ao Chrome. A vantagem de velocidade do Haiku 4.5 em tarefas de uso do computador posiciona a Anthropic para escalar a automação de navegadores sem as penalidades de latência de modelos maiores.
Os ganhos de preço e desempenho da Anthropic refletem a pressão mais ampla da indústria para fornecer modelos capazes a custos de inferência baixos o suficiente para implantação em produção. Com o Haiku 4.5, os desenvolvedores agora podem executar cargas de trabalho de codificação e automação quase de ponta por uma fração do custo, potencialmente mudando a viabilidade econômica de aplicações baseadas em agentes que antes eram muito caras para escalar.












