Inteligência artificial
Lançamento da Anthropic: Claude Haiku 4.5

A Anthropic lançou o Claude Haiku 4.5 hoje (15 de outubro de 2025), entregando um desempenho que combina com o seu modelo de bandeira Sonnet 4 em codificação, uso de computador e tarefas baseadas em agentes a um terço do custo e mais de duas vezes a velocidade.
O novo modelo obteve 73,3% no SWE-bench Verified, um benchmark que mede a capacidade de codificação da IA, atribuindo tarefas aos modelos para consertar bugs do mundo real em repositórios Python de código aberto, usando apenas a descrição original do problema. As soluções são julgadas com base em se elas passam nos testes unitários existentes de cada repositório, sem crédito parcial.

A pontuação coloca o Haiku 4.5 entre os principais modelos de codificação do mundo, igualando o desempenho do Sonnet 4, enquanto dramaticamente reduz o preço e a latência.
A Anthropic fixou o preço do Haiku 4.5 em $1 por milhão de tokens de entrada e $5 por milhão de tokens de saída. Os desenvolvedores podem reduzir os custos ainda mais por meio do prompt caching, que corta os custos de entrada repetidos em até 90%, e a Message Batches API, que oferece um desconto de 50% para cargas de trabalho que toleram uma janela de processamento de 24 horas. Combinados, os dois recursos podem reduzir os custos de tokens de entrada em 95% para prompts em cache processados no modo em lote.
O modelo supera o Sonnet 4 em tarefas de uso de computador — as capacidades de manipulação de GUI e navegador que alimentam o Claude para Chrome, a extensão de agente baseada em navegador da Anthropic, lançada em agosto. O uso de computador permite que o Claude leia páginas da web, clique em botões e preencha formulários diretamente no Chrome, um recurso que o Haiku 4.5 agora lida mais rapidamente do que seu irmão maior. A extensão está atualmente disponível para 1.000 assinantes no plano Max da Anthropic, com uma lista de espera mais ampla aberta.
A Anthropic posicionou o Haiku 4.5 como um substituto direto para o Haiku 3.5 e o Sonnet 4 em cargas de trabalho interativas sensíveis ao custo. A empresa recomenda usar o Sonnet 4.5 — ainda o modelo de fronteira da Anthropic — para planejamento em várias etapas, enquanto implanta a execução paralela por um pool de trabalhadores Haiku 4.5 para eficiência de custo e produtividade. O Sonnet 4.5 permanece “o melhor modelo de codificação do mundo”, de acordo com a Anthropic.
A família Haiku estreou em março de 2024 como parte da série Claude 3, que introduziu modelos em camadas — Haiku, Sonnet e Opus — equilibrando velocidade, custo e inteligência. O Claude 3.5 Haiku seguiu em outubro de 2024 com uma saída máxima de 8.192 tokens e dados de treinamento até julho de 2024. O lançamento 4.5 continua o padrão da Anthropic de enviar modelos menores que superam sua classe de peso em tarefas direcionadas.
A disponibilidade é imediata em todo o Claude.ai na web, iOS e Android. Os desenvolvedores podem acessar o Haiku 4.5 por meio da API da Anthropic, Amazon Bedrock e Google Cloud Vertex AI. Os casos de uso alvo incluem assistentes em tempo real, automação de suporte ao cliente e ambientes de programação em par, onde a latência e a produtividade importam. O modelo também melhora a responsividade no Claude Code, o editor de código de multiagente da Anthropic, para fluxos de trabalho de prototipagem rápida.
O lançamento chega enquanto a Anthropic compete nas “guerras de navegador da IA”. A Perplexity enviou seu navegador Comet em julho de 2025, a OpenAI está relatadamente construindo seu próprio navegador de IA e o Google integrou o Gemini com o Chrome. A vantagem de velocidade do Haiku 4.5 em tarefas de uso de computador posiciona a Anthropic para escalar a automação do navegador sem as penalidades de latência dos modelos maiores.
A Anthropic reflete a pressão da indústria mais ampla para entregar modelos capazes a custos de inferência baixos o suficiente para implantação em produção. Com o Haiku 4.5, os desenvolvedores agora podem executar cargas de trabalho de codificação e automação de fronteira a uma fração do custo, potencialmente alterando a viabilidade econômica para aplicações baseadas em agentes que anteriormente eram muito caras para escalar.












