AI 模型与平台

人工智能Anthropic将Claude桌面控制功能引入Mac

mm

Anthropic已经扩展了Claude的功能,以包括在macOS上直接控制桌面,允许人工智能点击、输入和导航应用程序,当标准集成(如Slack和日历应用程序)不可用时。

该功能目前作为研究预览版本在Claude Cowork和Claude Code中提供,适用于Claude Pro订阅者(20美元/月)和Claude Max订阅者(100美元/月)。目前,该功能仅限于macOS。

桌面控制的工作原理

Claude不会默认使用桌面控制。系统首先尝试通过现有的应用程序集成(如连接的日历、Slack或其他支持的工具)来完成任务。只有当没有集成可用时,Claude才会接管鼠标和键盘来直接完成任务。

用户必须明确批准Claude控制每个应用程序,并且可以在会话期间的任何时候停止Claude。该设计反映了Anthropic在研究预览阶段将人类保持在循环中的优先事项。

除了桌面控制外,Anthropic还发布了Dispatch——一个伴侣功能,允许用户从iPhone上分配任务给Claude,并在桌面上返回已完成的工作。移动应用程序连接到活跃的Cowork会话,所有处理都在Mac上进行。

Vercept收购支撑技术

该功能建立在Vercept AI的技术之上,Vercept AI是一家位于西雅图的初创公司,Anthropic于2026年2月收购了该公司。Vercept由前Allen Institute for AI研究人员Kiana Ehsani、Luca Weihs、Ross Girshick和Matt Deitke于2024年11月创立,并在交易完成之前已从Fifty Years领投的种子轮中筹集了1600万美元。天使投资者包括前Google CEO Eric Schmidt、Google DeepMind首席科学家Jeff Dean、Cruise创始人Kyle Vogt和Dropbox联合创始人Arash Ferdowsi。

Vercept的产品Vy作为Mac的基于云的计算机控制代理运行。Anthropic在关闭Vy之前给Vercept用户30天的通知,并吸收了该团队。联合创始人Ehsani表示,她的团队“加入Anthropic后不到四周就发布了第一个产品”,指的是Dispatch是该冲刺的结果。

自Anthropic首次在2024年末引入计算机使用功能以来,Claude的计算机使用性能已经大大改善。在OSWorld Verified——一个用于评估操作计算机的AI模型的标准评估中,Claude Sonnet模型的初始发布成绩低于15%。随着Claude Sonnet 4.6的发布,该成绩达到72.5%,接近人类基线的70-75%。Opus 4.6在同一测试中获得72.7%的成绩。

安全性和可靠性仍然是开放的问题

桌面控制创建了浏览器或API集成不具有的风险。当Claude操作活跃的桌面时,它可以访问任何可见的屏幕数据、打开的文件和用户已批准的应用程序。Anthropic之前的计算机使用研究确定了提示注入——恶意指令嵌入在屏幕内容中,可以覆盖用户意图——作为主要攻击面,Sonnet 4.6显示出与早期版本相比对此的抵抗力有所改善。

可靠性也是一个问题。Claude早期的计算机使用架构处理的是序列化的屏幕截图,而不是连续的视频流,这导致它会错过短暂的操作或通知。Vercept团队的方法是否可以在规模上解决这个问题尚未公开记录。

OpenAI自己的macOS浏览器和类似的产品面临采用摩擦,部分原因是桌面自动化会在软件接口更改时轻易中断。Anthropic选择将桌面控制限制为一个后备位置——仅在标准集成失败时激活——减少了错误的表面积,但也将该功能的范围缩小了,相比之下,完全自治的桌面代理更为广泛。

更大的问题是,用于业务自动化的AI代理是否可以可靠地从受控演示转移到实时生产环境。Claude的计算机使用基准分数在大约16个月内提高了五倍,这是一个有意义的轨迹。但是在经过策划的任务上的基准增益并不总是预测在实时macOS环境中的性能——意外的对话框、应用程序更新和状态更改,这些都没有被任何评估完全捕获。Anthropic如何处理安全披露,当研究人员开始更系统地探测该功能时,将是Claude桌面控制是否准备好离开其研究预览状态的首个真正测试。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。