人工智能
人类中心智能公司 Anthropic 为 Mac 引入 Claude 桌面控制

Anthropic 已将 Claude 的功能扩展到包括在 macOS 上的直接桌面控制,允许 AI 点击、输入和导航用户计算机上的应用程序,当标准集成与工具(如 Slack 和日历应用程序)不可用时。该功能现在作为研究预览在 Claude Cowork 和 Claude Code 中的 Claude Pro 订阅者(20 美元/月)和 Claude Max 订阅者(100 美元/月)中提供。目前,它仅限于 macOS。
桌面控制的工作原理
Claude 默认不使用桌面控制。系统首先尝试通过现有的应用程序集成(连接的日历、Slack 或其他支持的工具)完成任务。只有当没有集成可用时,Claude 才会接管鼠标和键盘来直接完成任务。
用户必须明确批准 Claude 控制每个应用程序,并且可以在会话期间的任何时候停止 Claude。设计反映了 Anthropic 在研究预览阶段将人类置于循环中的优先事项。
除了桌面控制外,Anthropic 还发布了 Dispatch —— 一项允许用户从 iPhone 分配任务给 Claude 并在桌面上返回已完成工作的伴侣功能。移动应用程序连接到活动的 Cowork 会话,所有处理都在 Mac 上本地进行。
https://www.youtube.com/watch?v=NAauIR6JFps
Vercept 收购支撑技术
该功能建立在 Vercept AI 的技术之上,Vercept AI 是一家总部位于西雅图的初创公司,Anthropic 于 2026 年 2 月收购。Vercept 由前 Allen Institute for AI 研究人员 Kiana Ehsani、Luca Weihs、Ross Girshick 和 Matt Deitke 于 2024 年 11 月创立,并在交易完成之前由 Fifty Years 领投的种子轮中筹集了 1600 万美元。天使投资者包括前 Google CEO Eric Schmidt、Google DeepMind 首席科学家 Jeff Dean、Cruise 创始人 Kyle Vogt 和 Dropbox 联合创始人 Arash Ferdowsi。
Vercept 的产品 Vy 作为 Mac 的基于云的计算机控制代理运行。Anthropic 在关闭 Vy 之前给予 Vercept 用户 30 天的通知,并于 2026 年 3 月 25 日关闭了 Vy,并吸收了该团队。联合创始人 Ehsani 表示,她的团队“加入 Anthropic 后不到四周就发布了第一个产品”,并指出 Dispatch 是该冲刺的结果。
自 Anthropic 首次在 2024 年末引入计算机使用功能以来,Claude 的计算机使用性能已经大大改善。在 OSWorld Verified —— 一项用于操作计算机的 AI 模型的标准评估中,Claude Sonnet 模型在最初发布时的得分低于 15%。有了 Claude Sonnet 4.6,该数字达到 72.5%,接近人类基准的 70-75%。Opus 4.6 在同一测试中得分为 72.7%。
安全性和可靠性仍然是开放的问题
桌面控制会产生浏览器或 API 集成不具备的风险。当 Claude 操作实时桌面时,它可以访问屏幕上可见的任何数据、打开的文件和用户已批准的应用程序。Anthropic 的先前计算机使用研究确定了提示注入 —— 屏幕内容中嵌入的恶意指令可能会覆盖用户意图 —— 作为主要攻击面,Sonnet 4.6 与早期版本相比显示出对此的抵抗力有所改善。
可靠性是另一个问题。Claude 的早期计算机使用架构处理的是顺序截图,而不是连续的视频流,这使得它会错过短暂的操作或通知。Vercept 团队的方法是否可以在大规模上解决这个问题尚未公开记录。
OpenAI 自己的基于 macOS 的浏览器代理和类似产品面临采用摩擦,部分原因是桌面自动化会在软件接口更改时轻易中断。Anthropic 选择将桌面控制限制为后备位置 —— 只有在标准集成失败时才激活 —— 减少了错误的表面积,但也将该功能的范围缩小到不如完全自治的桌面代理。
更大的问题是 商业自动化的 AI 代理是否可以可靠地从受控演示转移到实时生产环境。Claude 的计算机使用基准得分在大约 16 个月内提高了五倍,这是一个有意义的轨迹。但是在经过策划的任务上的基准增益并不总是预测实时 macOS 环境中的性能 —— 意外的对话框、应用程序更新和状态更改,没有任何评估能够完全捕捉到。Anthropic 一旦研究人员开始更系统地探测该功能时如何处理安全披露,将是该功能是否准备好离开研究预览状态的第一个真正测试。












