人工智能
Anthropic 将 Claude Desktop Control 带到 Mac 平台

Anthropic 扩展了 Claude 的功能,使其能够直接控制 macOS 上的桌面,从而在无法使用 Slack 和日历应用程序等工具的标准集成时,让 AI 能够点击、输入和浏览用户计算机上的应用程序。
该功能目前已作为研究预览版提供。 克劳德·科沃克 Claude Code 适用于 Claude Pro 订阅用户(每月 20 美元)和 Claude Max 订阅用户(每月 100 美元)。目前仅限 macOS 用户使用。
桌面控件的工作原理
Claude 默认不使用桌面控制。系统首先尝试通过现有的应用程序集成(例如已连接的日历、Slack 或其他受支持的工具)来完成任务。只有当没有可用的集成时,Claude 才会接管鼠标和键盘直接完成任务。
用户必须明确批准 Claude 可以控制的每个应用程序,并且可以在会话期间的任何时候停止 Claude 的操作。这种设计体现了 Anthropic 公司在研究预览阶段优先考虑用户参与的理念。
除了桌面控制功能外,Anthropic 还发布了 Dispatch——一项配套功能,用户可以通过 iPhone 将任务分配给 Claude,然后返回桌面继续完成工作。这款移动应用会连接到正在进行的 Cowork 会话,所有处理都在 Mac 本地完成。
Vercept 的收购为该技术奠定了基础。
这项功能基于总部位于西雅图的初创公司 Anthropic 旗下的 Vercept AI 的技术。 于 2026 年 XNUMX 月收购Vercept由前艾伦人工智能研究所研究员Kiana Ehsani、Luca Weihs、Ross Girshick和Matt Deitke于2024年11月创立,在交易完成前,该公司在由Fifty Years领投的种子轮融资中筹集了1600万美元。天使投资人包括前谷歌首席执行官Eric Schmidt、谷歌DeepMind首席科学家Jeff Dean、Cruise创始人Kyle Vogt和Dropbox联合创始人Arash Ferdowsi。
Vercept 的产品 Vy 是一款基于云端的 Mac 电脑控制代理。Anthropic 在 3 月 25 日关闭 Vy 服务前 30 天通知了 Vercept 用户,并收购了其团队。联合创始人 Ehsani 表示,她的团队“在加入 Anthropic 不到四周后就推出了首款产品”,并指出 Dispatch 就是那次快速迭代的成果。
自《人类学》以来,克劳德的电脑使用能力有了显著提高。 该功能于 2024 年底首次推出。在 OSWorld Verified(一项针对运行计算机的 AI 模型的标准评估)测试中,Claude Sonnet 模型在初始版本中的得分低于 15%。Claude Sonnet 4.6 的得分达到了 72.5%,接近了人类在同一基准测试中约 70-75% 的水平。Opus 4.6 在同一测试中的得分为 72.7%。
安全性和可靠性仍是悬而未决的问题
桌面控制会带来一些基于浏览器或 API 集成所没有的风险。当 Claude 操作实时桌面时,它可以访问屏幕上所有可见数据、打开的文件以及用户已授权的应用程序。Anthropic 此前的计算机使用研究表明,提示注入(即恶意指令嵌入屏幕内容中,从而可以覆盖用户意图)是主要的攻击面,而 Sonnet 4.6 相较于早期版本,对这种攻击的抵抗能力有所提升。
可靠性是另一个需要考虑的问题。Claude 早期使用的计算机架构处理的是连续的屏幕截图,而不是连续的视频流,这导致它无法处理短暂的操作或通知。Vercept 团队的方法是否能大规模解决这个问题,目前尚未公开记录。
OpenAI 自家的基于 macOS 浏览器的代理 类似产品在推广过程中遇到了阻力,部分原因是桌面自动化功能在软件接口变更时容易失效。Anthropic 选择将桌面控制功能限制为备用方案——仅在标准集成失败时激活——虽然减少了出错的可能性,但也缩小了该功能与完全自主的桌面代理相比的应用范围。
更重要的问题是: 用于业务自动化的 AI 代理 能够可靠地从受控演示环境过渡到实际生产环境。Claude 的计算机使用基准测试得分在大约 16 个月内提高了五倍,这是一个显著的进步。但是,在精心设计的任务中获得的基准测试提升并不总是能预测在更复杂的 macOS 实际环境中的性能——意外的对话框、应用程序更新和状态变化是任何评估都无法完全捕捉到的。一旦研究人员开始更系统地探索该功能,Anthropic 如何处理安全漏洞将是桌面控制是否准备好结束研究预览阶段的第一次真正考验。












