サイバーセキュリティ
人間中心の最初の大規模サイバー攻撃:AI自動化の実現

Anthropicは、中国国家支援グループと疑われるハッカー集団が、会社のClaude Codeツールを使用して、人間の介入を最小限に抑えた最初の記録された大規模サイバー攻撃を実行したことを明らかにした。このツールは、キャンペーンの80〜90パーセントを自動化した。攻撃者は、約30の組織を対象に、主要テクノロジー企業、金融機関、化学メーカー、政府機関を狙った。ほとんどの攻撃は阻止されたが、キャンペーンは少数のケースで成功した。Claude Codeは、人間のオペレーターが重要な意思決定ポイントでのみ必要となるように、偵察、脆弱性テスト、資格情報の収集、データの抽出を行った。 Anthropicの完全なレポートはこちらで読むことができます。
攻撃方法とAI操作
ハッカーは、洗練されたソーシャルエンジニアリングを通じて、Claudeの安全ガードレールを回避した。彼らは、合法的なサイバーセキュリティ企業の従業員を装って、AIシステムを欺いた。攻撃者はまた、Claudeに全体的な悪意のある目的について不完全なコンテキストを提供する小さな、無害に見えるタスクに操作を分割した。
Claude Codeは、ターゲット組織のシステムを検査して、高価値のデータベースを特定し、人間のハッカーが行うよりも迅速に偵察を行った。さらに、セキュリティの脆弱性をテストするためのカスタムのエクスプロイトコードを研究して記述した。システムは、さらにネットワークにアクセスするために、ユーザー名とパスワードを収集し、知的価値に応じてプライベートデータを抽出して分類した。攻撃者は、実質的にボタンをクリックするだけでキャンペーンを実行でき、AIは人間のチームが不可能な速度で、しばしば1秒あたり数千のリクエストを送信しながら、ほとんど独自に動作した。

Image: Anthropic
検出と会社の対応
Anthropicは、2025年9月中旬に攻撃を検出し、直ちに調査を開始した。10日以内に、会社はグループのClaudeへのアクセスを停止し、影響を受けた組織に連絡し、法執行機関に通知した。会社は、検出能力を拡大し、大規模な分散攻撃の調査および検出方法を開発している。
この事件は、Anthropicが2025年に記録した以前の誤用事例に続くものである。8月には、会社の脅威インテリジェンスレポートは、Claude Codeを使用して、少なくとも17の組織を対象とした大規模な盗難を犯したGTG-2002と指定されたデータ拡張操作の詳細を記載した。犯罪者は、従来のランサムウェアの暗号化ではなく、盗まれたデータを公開することを脅して、50万ドルを超える身代金を要求した。
Anthropicの検出インフラストラクチャは、数百万のAPIリクエストを跨ぐ使用パターンを監視するための行動分析、正当な使用と一貫しない操作シーケンスを特定するための異常検出、および既知および新しい操作テクニックを認識するためのパターンマッチングを含む、複数の階層化されたテクニックに依存している。会社は、潜在的に有害なリクエストに対するユーザー入力を分析し、配信の前または後にClaudeの応答を評価する専門のクラス分類器を使用している。
業界への影響
このキャンペーンは、サイバー攻撃におけるAIの前例のない自律性を伴い、セキュリティ専門家はサイバー諜報の転換点と見なしている。人間の監視が最小限であるAIシステムが、機械の速度で洗練された攻撃を実行する能力は、サイバーセキュリティの防御者に新たな課題を提起する。
Anthropicの開示は、AI企業がモデルを悪用することを防ぐ圧力に直面している際に来ている。会社は、Claudeの誤用を検出して対抗するための包括的な脅威インテリジェンスおよびセーフガードプログラムを維持しており、2025年を通じて記録されたセキュリティ事象がある。3月には、Claudeを使用して、複数の国や言語を跨ぐ数万のソーシャルメディアアカウントと自動的にエンゲージする影響力サービス操作を特定した。
事件は、AIパワードツールの成長する複雑さと、合法的なユーザーにとっての有用性を維持しながらその悪用を防ぐという課題を強調している。Anthropicは、関連するアカウントを禁止し、進化する脅威の風景に対処するために検出および緩和能力を強化し続けている。












