公告

人工智慧公司 Anthropic 發佈 Claude Opus 4.5

mm

Anthropic 官方發佈 Claude Opus 4.5,這是該公司迄今為止最先進的 大型語言模型 (LLM),具有先進的編碼性能和企業生產力功能。

旗艦模型在 SWE-bench Verified 上取得 80.9% 的成績,確立了它在 AI 代碼生成方面的領先地位,並直接與 OpenAI 的最新模型競爭。Opus 4.5 在代理工作流程方面表現出色,展示了改進的任務精煉,僅需四次迭代就達到峰值能力,而競爭對手模型需要 10 次嘗試。

新模型的價格從每百萬個輸入令牌 5 美元和每百萬個輸出令牌 25 美元開始,通過 Claude API 提供。該模型今天通過 Anthropic 的應用程序、API 和三個主要雲平台使用標識符 claude-opus-4-5-20251101 提供。

瀏覽器和電子表格集成擴展生產力

Opus 4.5 為實際計算任務帶來了重大增強,建立在 10 月份推出的 Anthropic 的 Claude Haiku 4.5 的 Chrome 擴充功能上。Chrome 擴充功能可供 Max 計劃用戶使用,允許 Claude瀏覽網站、填寫表單和完成多步驟工作流程,而無需在窗口之間手動複製。

Excel 自動化代表了新模型的主要重點。在早期客戶測試中,Anthropic 報告了 20% 的準確度提高和 15% 的效率增益,適用於 Excel 任務。該模型了解整個工作簿,包括嵌套公式和多個標籤之間的依賴關係,並提供了單元格級別的引用。

Claude for Excel 目前通過等待名單(僅限 1,000 名 Max、Team 和 Enterprise 客戶)進行測試,處理財務建模、錯誤調試和場景測試,同时保持公式結構。該集成目前不支持樞紐表、條件格式、巨集或 VBA。

在 Claude 4.5 家族中的定位

Opus 4.5 完成了 Anthropic 的模型陣容,緊接著 9 月份發佈的 Sonnet 4.5 和 10 月份發佈的 Haiku 4.5。在該家族中,Opus 處理核心代理任務和需要最大複雜性的生產代碼,Sonnet 支持大規模的客戶面向代理,具有低延遲,Haiku 提供了基本任務的可訪問入門點。

模型的長時間代理能力啟用了複雜任務的延長工作周期,例如應用程序重寫和深度分析。除了編碼之外,Opus 4.5 還在複雜信息檢索、代理工具使用和企業自動化方面提供了廣泛的改進。

Anthropic 的發佈使該公司躋身於 最佳 AI 助手 之列,並加強了其在 商業 AI 工具 市場中的地位。Chrome 集成將 Claude 與其他基於瀏覽器的 AI 工具並列,而 Excel 功能則直接與 AI 驅動的數據分析工具 競爭。

發佈之後,Anthropic 迅速推進。該公司於 11 月 18 日宣佈與 Microsoft 和 NVIDIA 建立戰略合作伙伴關係,從而使 Claude 模型可以集成到企業平台,包括 Microsoft 365 Copilot。這種基礎設施擴張支持了 Opus 4.5 在企業環境中的更廣泛部署。

開發人員可以立即通過 Anthropic 的 API 訪問新模型,企業客戶可以通過現有的雲基礎設施進行部署。該公司尚未宣佈特定的時間表,以將 Excel beta 擴展超出其當前等待名單。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。