Trí tuệ nhân tạo
Anthropic Ra Mắt Claude Haiku 4.5

Anthropic đã ra mắt Claude Haiku 4.5 hôm nay (15 tháng 10 năm 2025), mang lại hiệu suất tương đương với mô hình Sonnet 4 của họ về mã hóa, sử dụng máy tính và nhiệm vụ dựa trên tác nhân tại một phần ba chi phí và hơn hai lần tốc độ.
Mô hình mới này đạt được 73,3% trên SWE-bench Verified, một điểm chuẩn đo lường khả năng mã hóa AI bằng cách giao nhiệm vụ cho các mô hình sửa lỗi thực tế trong các kho lưu trữ Python mã nguồn mở chỉ bằng cách sử dụng mô tả vấn đề ban đầu. Các giải pháp được đánh giá dựa trên việc chúng có vượt qua các bài kiểm tra đơn vị hiện có của kho lưu trữ hay không, mà không có tín dụng một phần.

Điểm số này đặt Haiku 4.5 vào hàng ngũ các mô hình mã hóa hàng đầu thế giới, ngang bằng với hiệu suất của Sonnet 4 trong khi giảm đáng kể giá cả và độ trễ.
Anthropic đã định giá Haiku 4.5 ở mức 1 đô la cho mỗi triệu token đầu vào và 5 đô la cho mỗi triệu token đầu ra. Các nhà phát triển có thể giảm chi phí thậm chí thấp hơn thông qua lưu trữ lời nhắc, điều này cắt giảm chi phí đầu vào lặp lại lên đến 90%, và API Message Batches, cung cấp giảm giá 50% cho các công việc có thể chấp nhận cửa sổ xử lý 24 giờ. Kết hợp lại, hai tính năng này có thể giảm chi phí token đầu vào lên đến 95% cho các lời nhắc được lưu trữ trong chế độ批.
Mô hình này vượt trội so với Sonnet 4 trên các nhiệm vụ sử dụng máy tính – khả năng thao tác GUI và trình duyệt mà cung cấp sức mạnh cho Claude for Chrome, tiện ích mở rộng trình duyệt dựa trên tác nhân của Anthropic được ra mắt vào tháng 8. Sử dụng máy tính cho phép Claude đọc trang web, nhấp vào các nút và điền biểu mẫu trực tiếp trong Chrome, một tính năng mà Haiku 4.5 hiện xử lý nhanh hơn so với người anh em lớn hơn của nó. Tiện ích mở rộng hiện đang có sẵn cho 1.000 người đăng ký trên kế hoạch Max của Anthropic, với danh sách chờ rộng hơn đang mở.
Anthropic định vị Haiku 4.5 như một sự thay thế trực tiếp cho cả Haiku 3.5 và Sonnet 4 trong các công việc tương tác nhạy cảm về chi phí. Công ty khuyến nghị sử dụng Sonnet 4.5 – vẫn là mô hình tiền phong của Anthropic – cho việc lập kế hoạch nhiều bước trong khi triển khai thực hiện song song bởi một nhóm công nhân Haiku 4.5 để đạt được hiệu quả về chi phí và thông lượng. Sonnet 4.5 vẫn là “mô hình mã hóa tốt nhất trên thế giới”, theo Anthropic.
Gia đình Haiku được ra mắt vào tháng 3 năm 2024 như một phần của loạt Claude 3, giới thiệu các mô hình phân cấp – Haiku, Sonnet và Opus – cân bằng giữa tốc độ, chi phí và trí tuệ. Claude 3.5 Haiku tiếp theo vào tháng 10 năm 2024 với tối đa 8.192 token đầu ra và dữ liệu đào tạo cho đến tháng 7 năm 2024. Phiên bản 4.5 tiếp tục mô hình của Anthropic trong việc vận chuyển các mô hình nhỏ hơn có khả năng vượt trội so với trọng lượng của chúng trong các nhiệm vụ được nhắm mục tiêu.
Sự sẵn có là ngay lập tức trên toàn bộ Claude.ai trên web, iOS và Android. Các nhà phát triển có thể truy cập Haiku 4.5 thông qua API của Anthropic, Amazon Bedrock và Google Cloud Vertex AI. Các trường hợp sử dụng mục tiêu bao gồm các trợ lý thời gian thực, tự động hóa hỗ trợ khách hàng và môi trường lập trình đôi nơi độ trễ và thông lượng quan trọng. Mô hình này cũng cải thiện khả năng phản hồi trong Claude Code, trình biên tập mã đa tác nhân của Anthropic, cho các quy trình làm việc nguyên mẫu nhanh.
Sự ra mắt này đến khi Anthropic cạnh tranh trong “cuộc chiến trình duyệt AI”. Perplexity đã vận chuyển trình duyệt Comet vào tháng 7 năm 2025, OpenAI được cho là đang xây dựng trình duyệt AI của riêng mình và Google đã tích hợp Gemini với Chrome. Ưu thế về tốc độ của Haiku 4.5 trên các nhiệm vụ sử dụng máy tính đặt Anthropic vào vị trí để mở rộng tự động hóa trình duyệt mà không có các hình phạt về độ trễ của các mô hình lớn hơn.
Giá cả và lợi ích hiệu suất của Anthropic phản ánh áp lực ngành công nghiệp rộng lớn hơn để cung cấp các mô hình có khả năng tại các chi phí suy luận đủ thấp cho việc triển khai sản xuất. Với Haiku 4.5, các nhà phát triển hiện có thể chạy các công việc mã hóa và tự động hóa gần tiền phong tại một phần nhỏ của chi phí, có khả năng thay đổi tính khả thi về mặt kinh tế cho các ứng dụng dựa trên tác nhân mà trước đây quá tốn kém để mở rộng.












