人工智能
人工智能公司 Anthropic 发布 Claude Haiku 4.5

人工智能公司 Anthropic 今日(2025 年 10 月 15 日)发布了 Claude Haiku 4.5,该模型在编码、计算机使用和基于代理的任务方面的性能与其旗舰 Sonnet 4 模型相匹配,但成本仅为其三分之一,速度快了两倍以上。
新模型在 SWE-bench Verified 基准测试中获得了 73.3% 的分数,该基准测试通过使用原始问题描述来修复开源 Python 存储库中的真实 bug 来衡量 AI 编码能力。解决方案的评判标准是是否通过每个存储库的现有单元测试,且不授予部分分数。

该分数使 Haiku 4.5 成为世界上最顶尖的编码模型之一,其性能与 Sonnet 4 相同,但价格和延迟却大大低于 Sonnet 4。
Anthropic 将 Haiku 4.5 的价格定为每百万个输入令牌 1 美元,每百万个输出令牌 5 美元。开发者可以通过 提示缓存 将成本降低,提示缓存可以将重复输入的成本降低多达 90%。此外,开发者还可以使用 消息批处理 API,该 API 为能够容忍 24 小时处理窗口的工作负载提供 50% 的折扣。两者结合可以将输入令牌的成本降低 95%,适用于批处理模式下的缓存提示。
该模型在计算机使用任务方面超过了 Sonnet 4,例如图形用户界面和浏览器操作能力,这些能力是 Anthropic 于 8 月发布的基于浏览器的代理扩展 Claude for Chrome 的基础。计算机使用使 Claude 能够直接在 Chrome 中读取网页、点击按钮和填写表单,Haiku 4.5 现在可以比其更大的同类产品更快地处理这些任务。目前,该扩展仅对 Anthropic 的 Max 计划中的 1,000 名订阅者开放,其他用户可以加入等待名单。
Anthropic 将 Haiku 4.5 定位为 Haiku 3.5 和 Sonnet 4 在成本敏感的交互式工作负载中的替代品。该公司建议使用 Sonnet 4.5(仍然是 Anthropic 的前沿模型)进行多步骤规划,同时使用 Haiku 4.5 工作池进行并行执行,以实现成本效率和吞吐量效率。Sonnet 4.5 仍然是“世界上最好的编码模型”,根据 Anthropic 的说法。
Haiku 系列于 2024 年 3 月作为 Claude 3 系列的一部分首次亮相,引入了分层模型(Haiku、Sonnet 和 Opus),这些模型在速度、成本和智能之间取得了平衡。Claude 3.5 Haiku 于 2024 年 10 月随后发布,最大输出为 8,192 个令牌,训练数据截止于 2024 年 7 月。4.5 版本继续了 Anthropic 发布体积较小但在目标任务中表现出色的模型的模式。
Claude.ai 网站、iOS 和 Android 应用上的可用性是即时的。开发者可以通过 Anthropic 的 API、Amazon Bedrock 和 Google Cloud Vertex AI 访问 Haiku 4.5。目标用例包括实时助手、客户支持自动化和对延迟和吞吐量至关重要的配对编程环境。该模型还提高了 Claude Code 中的响应速度,Claude Code 是 Anthropic 的多代理代码编辑器,适用于快速原型设计工作流程。
发布的时机恰逢 Anthropic 参与“AI 浏览器大战”。Perplexity 于 2025 年 7 月发布了其 Comet 浏览器,OpenAI 据报道正在构建自己的 AI 浏览器,Google 已将 Gemini 集成到 Chrome 中。Haiku 4.5 在计算机使用任务方面的速度优势使 Anthropic 能够在不受更大模型延迟惩罚的情况下扩大浏览器自动化。
Anthropic 的定价和性能收益反映了整个行业面临的压力,即交付能够以低于生产部署的推理成本的有能力模型。有了 Haiku 4.5,开发者现在可以以成本的一小部分运行近前沿的编码和自动化工作负载,这可能会改变以前由于成本过高而无法扩展的基于代理的应用程序的经济可行性。












