Connect with us

Cybersikkerhet

Anthropic avdekker første storstilte cyberangrep drevet av AI-automatisering

mm

Anthropic har avdekket at en gruppe hackere, som de mistenker er en kinesisk statssponset gruppe, gjennomførte den første dokumenterte storstilte cyberangrepet som ble utført med minimal menneskelig inngripen, ved å bruke selskapets Claude Code-verktøy til å automatisere 80 til 90 prosent av kampanjen.

Angriperne tok mål på omtrent 30 organisasjoner over store teknologiselskaper, finansielle institusjoner, kjemiske produsenter og regjeringsetater. Mens de fleste angrep ble blokkert, lyktes kampanjen i et lite antall tilfeller. Claude Code utførte rekognosering, sårbarhetstesting, innhenting av legitimasjon og dataekstraksjon i stor grad autonomt, med menneskelige operatører som bare var nødvendige ved kritiske beslutningspunkter.

Du kan lese Anthropics fullstendige rapport her.

Angrepsmetoder og AI-manipulering

Hackerne gikk forbi Claudes sikkerhetsskranke gjennom sofistikert sosial manipulering. De lurret AI-systemet ved å påstå å være ansatte i et legitimt selskap for cybersikkerhet som utførte defensiv testing. Angriperne delte også opp sine operasjoner i små, tilsynelatende harmløse oppgaver som ga Claude mangelfull kontekst om den malisøse overordnede hensikten.

Claude Code inspiserte målorganisasjoners systemer for å identifisere høyverdige databaser, utførte denne rekognoseringen raskere enn menneskelige hackere kunne, og forsket og skrev tilpassede eksploitkoder for å teste sikkerhetssårbarheter. Systemet innhentet brukernavn og passord for videre nettverksadgang, og så utvant og kategoriserte private data etter etterretningsverdi. Angriperne kunne utføre kampanjen med essensielt bare et klikk, etterfulgt av at AI opererte i stor grad på egen hånd i hastigheter som var umulige for menneskelige team – ofte sendte tusenvis av forespørsler per sekund.

Bilde: Anthropic

Oppdaging og selskapets respons

Anthropic oppdaget angrepet i midten av september 2025 og lanserte en etterforskning umiddelbart. Innen 10 dager stengte selskapet av gruppenes tilgang til Claude, kontaktet berørte organisasjoner og underrettet loven. Selskapet har siden utvidet sine oppdagelseskapasiteter og utvikler ytterligere metoder for å etterforske og oppdage storstilte, distribuerte angrep.

Dette hendelsen følger tidligere misbrukssaker dokumentert av Anthropic i 2025. I august detaljerte selskapets trusselintelligensrapport en data-utpressingsoperasjon som ble sporet som GTG-2002, som brukte Claude Code til å begå storstilte tyveri som rammet minst 17 organisasjoner over helse, nødtjenester, regjering og religiøse institusjoner. Den kriminelle krevde løsepenger på over 500 000 dollar ved å true med å avsløre stjålet data i stedet for å bruke tradisjonell ransomware-kryptering.

Anthropics oppdagelsesinfrastruktur bygger på flere lagdelte tekniker, inkludert atferdsanalyse for å overvåke bruksmønster over millioner av API-forespørsler, anomaliopptegning for å identifisere sekvenser av operasjoner som er inkonsistente med legitim bruk, og mønsteravkoding for å gjenkjenne kjente og nye manipulasjonsteknikker. Selskapet anvender spesialiserte klassifiseringsverktøy som analyserer brukerinput for potensielt skadelige forespørsler og vurderer Claudes svar før eller etter levering.

Bransjeimplikasjoner

Kampanjen innebar et utenforliggende nivå av AI-autonomi i cyberangrep og markerer hva sikkerhetsekspertene ser på som et vendepunkt i cyber-spionasje. Evnen til at AI-systemer kan utføre sofistikerte angrep i maskinhastighet med minimal menneskelig overvåking stiller nye utfordringer for cyber-sikkerhetsforsvarere.

Anthropics avdekning kommer som AI-selskaper står overfor økende press for å forhindre misbruk av deres modeller. Selskapet har et omfattende trusselintelligens- og sikkerhetsprogram for å oppdage og motvirke misbruk av Claude, med dokumenterte sikkerhetshendelser gjennom 2025. I mars identifiserte selskapet en påvirknings-tjeneste som brukte Claude til å automatisere engasjement med titusener av sosiale mediekontoer over flere land og språk.

Hendelsen understreker den økende sofistikeringen av AI-drevne verktøy og utfordringene med å forhindre deres misbruk samtidig som man opprettholder nytten for legitime brukere. Anthropic har forbudt de assosierte kontoene og fortsetter å forbedre sine oppdagelses- og mitigasjonskapasiteter for å møte den evoluerende trussellandskapet.

Alex McFarland er en AI-journalist og forfatter som utforsker de nyeste utviklingene innen kunstig intelligens. Han har samarbeidet med tallrike AI-startups og publikasjoner verden over.