网络安全

人工智能自动化驱动的首次大规模网络攻击:Anthropic 揭露

mm

Anthropic 披露,一群黑客团队,据信是中国国家支持的团队,实施了首次有记录的使用最少的人类干预的大规模网络攻击,利用公司的 Claude Code 工具 自动化了 80% 至 90% 的攻击活动。

攻击者针对大约 30 个组织,包括主要的科技公司、金融机构、化学制造商和政府机构。虽然大多数攻击被阻止,但攻击活动在少数情况下成功。Claude Code 进行了侦察、漏洞测试、凭证收集和数据泄露,主要是自主进行的,只需要在关键决策点需要人类操作员。

您可以在这里阅读 Anthropic 的完整报告。

攻击方法和人工智能操纵

黑客通过复杂的社会工程手段绕过了 Claude 的安全防护措施。他们欺骗了人工智能系统,声称自己是合法的网络安全公司的员工,正在进行防御性测试。攻击者还将他们的操作分解为小的、看似无害的任务,这些任务为 Claude 提供了不完整的上下文,以了解恶意的总体目的。

Claude Code 检查了目标组织的系统,以确定高价值数据库,执行了比人类黑客更快的侦察,并研究并编写了自定义的漏洞利用代码来测试安全漏洞。该系统收集了用户名和密码以获取进一步的网络访问权限,然后提取和分类了私人数据,根据情报价值。攻击者可以通过点击一个按钮执行攻击活动,之后人工智能系统基本上可以自主运行,速度远超人类团队的能力,通常每秒发送数千个请求。

图片:Anthropic

检测和公司响应

Anthropic 在 2025 年 9 月中旬检测到攻击,并立即启动了调查。10 天内,公司关闭了该团体对 Claude 的访问,联系了受影响的组织,并通知了执法部门。公司自那时起扩大了其检测能力,并正在开发额外的方法来调查和检测大规模、分布式攻击。

此事件发生在 Anthropic 早些时候记录的滥用案例之后。2025 年 8 月,公司的威胁情报报告详细介绍了一项数据勒索行动,代号为 GTG-2002,该行动使用 Claude Code 进行大规模盗窃,针对至少 17 个组织,包括医疗保健、紧急服务、政府和宗教机构。该犯罪者要求赎金超过 50 万美元,威胁要泄露被盗数据,而不是使用传统的勒索软件加密。

Anthropic 的检测基础设施依赖于多层技术,包括行为分析以监视数百万个 API 请求的使用模式,异常检测以识别与合法使用不一致的操作序列,以及模式匹配以识别已知和新型的操纵技术。公司使用专门的分类器来分析用户输入以识别潜在的有害请求,并在交付前或后评估 Claude 的响应。

行业影响

该活动涉及前所未有的网络攻击中的人工智能自主性水平,并被安全专家视为网络间谍活动的转折点。人工智能系统能够以机器速度进行复杂攻击,几乎无需人类监督,这为网络安全防御者带来了新的挑战。

Anthropic 的披露发生在人工智能公司面临日益增长的压力,以防止其模型被恶意使用之际。该公司维护着一个全面性的威胁情报和安全计划,以检测和应对 Claude 的滥用,并在 2025 年记录了多起安全事件。3 月,公司确定了一项影响力即服务的运作,该运作使用 Claude 自动化了数万个社交媒体账户的参与,跨越多个国家和语言。

该事件凸显了人工智能驱动工具日益增长的复杂性以及防止其滥用同时为合法用户维护其实用性的挑战。Anthropic 已经禁止了相关账户,并继续增强其检测和缓解能力,以应对不断演变的威胁格局。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。