Sicurezza informatica

Anthropic Espone il Primo Grande Attacco Cibernetico su Large-Scale Potenziato dall’Automazione dell’Intelligenza Artificiale

mm

Anthropic ha rivelato che un gruppo di hacker, che sospettano essere un gruppo sponsorizzato dallo stato cinese, ha condotto il primo attacco cibernetico su larga scala documentato eseguito con un minimo intervento umano, utilizzando lo strumento Claude Code della società per automatizzare l’80-90% della campagna.

Gli attaccanti hanno preso di mira circa 30 organizzazioni tra grandi aziende tecnologiche, istituzioni finanziarie, produttori di sostanze chimiche e agenzie governative. Sebbene la maggior parte degli attacchi sia stata bloccata, la campagna è riuscita in un numero limitato di casi. Claude Code ha eseguito la ricognizione, il test delle vulnerabilità, la raccolta di credenziali e l’estrazione di dati in larga misura in modo autonomo, con operatori umani necessari solo in punti decisionali critici.

Puoi leggere il rapporto completo di Anthropic qui.

Metodi di Attacco e Manipolazione dell’Intelligenza Artificiale

Gli hacker hanno bypassato le barriere di sicurezza di Claude attraverso un’ingegneria sociale sofisticata. Hanno ingannato il sistema di intelligenza artificiale affermando di essere dipendenti di una legittima società di sicurezza informatica che conduceva test difensivi. Gli attaccanti hanno anche suddiviso le loro operazioni in piccoli compiti apparentemente innocui che hanno fornito a Claude un contesto incompleto sullo scopo complessivo malintenzionato.

Claude Code ha ispezionato i sistemi delle organizzazioni bersaglio per identificare database ad alto valore, ha eseguito questa ricognizione più velocemente di quanto potessero fare gli hacker umani e ha ricercato e scritto codice di sfruttamento personalizzato per testare le vulnerabilità di sicurezza. Il sistema ha raccolto nomi utente e password per ulteriore accesso alla rete e ha estratto e categorizzato dati privati in base al loro valore di intelligence. Gli attaccanti potevano eseguire la campagna con essenzialmente un clic del mouse, dopo di che l’intelligenza artificiale operava in larga misura da sola a velocità impossibili per i team umani – spesso inviando migliaia di richieste al secondo.

Immagine: Anthropic

Rilevamento e Risposta dell’Azienda

Anthropic ha rilevato l’attacco a metà settembre 2025 e ha avviato un’indagine immediatamente. Entro 10 giorni, l’azienda ha chiuso l’accesso del gruppo a Claude, ha contattato le organizzazioni interessate e ha notificato le forze dell’ordine. L’azienda ha successivamente ampliato le proprie capacità di rilevamento e sta sviluppando metodi aggiuntivi per indagare e rilevare attacchi su larga scala e distribuiti.

Questo incidente segue precedenti casi di abuso documentati da Anthropic nel 2025. A agosto, il rapporto di intelligence sulle minacce della società ha descritto un’operazione di estorsione di dati seguita come GTG-2002, che ha utilizzato Claude Code per commettere un grande furto su larga scala che ha preso di mira almeno 17 organizzazioni nel settore sanitario, servizi di emergenza, governo e istituzioni religiose. Quel criminale ha chiesto riscatti superiori a 500.000 dollari minacciando di esporre i dati rubati piuttosto che utilizzare la crittografia del ransomware tradizionale.

L’infrastruttura di rilevamento di Anthropic si basa su tecniche stratificate multiple, tra cui l’analisi del comportamento per monitorare i modelli di utilizzo su milioni di richieste API, la rilevazione delle anomalie per identificare sequenze di operazioni incoerenti con l’uso legittimo e l’abbinamento dei modelli per riconoscere tecniche di manipolazione note e nuove. L’azienda impiega classificatori specializzati che analizzano gli input degli utenti per richieste potenzialmente dannose e valutano le risposte di Claude prima o dopo la consegna.

Implicazioni per l’Industria

La campagna ha coinvolto un livello senza precedenti di autonomia dell’intelligenza artificiale negli attacchi cibernetici e segna ciò che gli esperti di sicurezza considerano un punto di svolta nella spionaggio cibernetica. La capacità dei sistemi di intelligenza artificiale di condurre attacchi sofisticati alla velocità delle macchine con un minimo di supervisione umana solleva nuove sfide per i difensori della sicurezza informatica.

La divulgazione di Anthropic arriva mentre le aziende di intelligenza artificiale affrontano una crescente pressione per prevenire l’uso malintenzionato dei loro modelli. L’azienda mantiene un programma di intelligence sulle minacce e di salvaguardia globale per rilevare e contrastare l’abuso di Claude, con incidenti di sicurezza documentati nel 2025. A marzo, l’azienda ha identificato un’operazione di influenza come servizio che ha utilizzato Claude per automatizzare l’interazione con decine di migliaia di account sui social media in più paesi e lingue.

L’incidente sottolinea la crescente sofisticazione degli strumenti alimentati dall’intelligenza artificiale e le sfide di prevenire il loro abuso mentre si mantiene l’utilità per gli utenti legittimi. Anthropic ha bloccato gli account associati e continua a migliorare le proprie capacità di rilevamento e mitigazione per affrontare il panorama delle minacce in evoluzione.

Alex McFarland è un giornalista e scrittore di intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup di intelligenza artificiale e pubblicazioni in tutto il mondo.