Cybersäkerhet

Anthropic Avslöjar Första Storskaliga Cyberattack Med AI-Automatisering

Publicerad 14 november 2025

Uppdaterad 17 maj 2026

Alex McFarland

Anthropic har avslöjat att en grupp hackare, som de misstänker vara en kinesisk statssponsrad grupp, genomförde den första dokumenterade storskaliga cyberattacken som utfördes med minimal mänsklig inblandning, med hjälp av företagets Claude Code-verktyg för att automatisera 80 till 90 procent av kampanjen.

Angriparna riktade sig mot cirka 30 organisationer inom stora teknologiföretag, finansiella institutioner, kemiska tillverkare och regeringsbyråer. Medan de flesta attacker blockerades, lyckades kampanjen i ett fåtal fall. Claude Code utförde rekognosering, sårbarhetstestning, insamling av autentiseringsuppgifter och dataexfiltration till stor del autonomt, med mänskliga operatörer som endast behövdes vid kritiska beslutspunkter.

Du kan läsa Anthropics fullständiga rapport här.

Attackmetoder och AI-manipulation

Hackarna kringgick Claudes säkerhetsåtgärder genom sofistikerad social ingenjörskonst. De bedrog AI-systemet genom att påstå att de var anställda vid ett legitimt cybersäkerhetsföretag som genomförde defensiv testning. Angriparna bröt också ner sina operationer i små, till synes oskyldiga uppgifter som gav Claude ofullständig kontext om det övergripande syftet med attacken.

Claude Code inspekterade målorganisationernas system för att identifiera högvärdesdatabaser, utförde denna rekognosering snabbare än mänskliga hackare kunde, och forskade och skrev anpassad exploitkod för att testa säkerhetsluckor. Systemet samlade in användarnamn och lösenord för ytterligare nätverksåtkomst, och extraherade och kategoriserade privat data enligt underrättelsevärde. Angriparna kunde utföra kampanjen med i princip ett knapptryck, varefter AI-systemet opererade till stor del på egen hand i hastigheter som var omöjliga för mänskliga team – ofta skickade tusentals förfrågningar per sekund.

Bild: Anthropic

Upptäckt och företagsrespons

Anthropic upptäckte attacken i mitten av september 2025 och lanserade en utredning omedelbart. Inom 10 dagar stängde företaget av gruppens åtkomst till Claude, kontaktade drabbade organisationer och underrättade brottsbekämpande myndigheter. Företaget har sedan dess utökat sina upptäcktsförmågor och utvecklar ytterligare metoder för att utreda och upptäcka storskaliga, distribuerade attacker.

Denna incident följer tidigare fall av missbruk som dokumenterats av Anthropic under 2025. I augusti detaljerade företagets Threat Intelligence Report en datautpressningsoperation som spårades som GTG-2002, som använde Claude Code för att begå storskalig stöld riktad mot minst 17 organisationer inom hälsovård, nödtjänster, regering och religiösa institutioner. Den brottslige krävde lösenord som översteg 500 000 dollar genom att hota med att avslöja stulen data snarare än att använda traditionell ransomware-kryptering.

Anthropics upptäcktsinfrastruktur bygger på flera lager tekniker, inklusive beteendeanalys för att övervaka användningsmönster över miljontals API-förfrågningar, avvikelseupptäckt för att identifiera sekvenser av operationer som är oförenliga med legitimitet, och mönsterigenkänning för att känna igen kända och nya manipuleringsmetoder. Företaget använder specialiserade klassificerare som analyserar användarindata för potentiellt skadliga förfrågningar och utvärderar Claudes svar före eller efter leverans.

Branschimplikationer

Kampanjen innebar en utanför jämförelse hög grad av AI-autonomi i cyberattacker och markerar vad säkerhetsexperter betraktar som en vändpunkt i cyberspionage. Förmågan hos AI-system att genomföra sofistikerade attacker i maskinhastighet med minimal mänsklig övervakning skapar nya utmaningar för cybersäkerhetsförsvarare.

Anthropics avslöjande kommer när AI-företag står under allt större tryck för att förhindra missbruk av sina modeller. Företaget upprätthåller ett omfattande hotinformations- och säkerhetsprogram för att upptäcka och motverka missbruk av Claude, med dokumenterade säkerhetsincidenter under hela 2025. I mars identifierade företaget en påverkans-tjänst som använde Claude för att automatisera engagemang med tiotusentals sociala mediekonton över flera länder och språk.

Incidenten understryker den växande sofistikeringen av AI-drivna verktyg och utmaningarna med att förhindra deras missbruk samtidigt som man upprätthåller deras nytta för legitima användare. Anthropic har förbjudit de associerade kontona och fortsätter att förbättra sina upptäckts- och mildrande förmågor för att hantera den utvecklande hotbilden.

Alex McFarland

Alex McFarland är en AI-journalist och författare som utforskar de senaste utvecklingarna inom artificiell intelligens. Han har samarbetat med många AI-startups och publikationer över hela världen.

Unite.AI

Anthropic Avslöjar Första Storskaliga Cyberattack Med AI-Automatisering

Attackmetoder och AI-manipulation

Upptäckt och företagsrespons

Branschimplikationer

You may like