Tankeledare

Nio sekunder till noll: Vad PocketOS-incidenten avslöjar om företags AI-risk

mm
A widescreen, photorealistic image of a tech founder sitting in a dimly lit home office at dawn, his face showing visible shock and exhaustion while looking at computer monitors displaying critical system failure alerts.

Den 25 april 2026 såg en tech-entreprenör sin företags produktionssdatabas försvinna. Inte korrupt, inte delvis överskriven. Borta, tillsammans med alla säkerhetskopior, på nio sekunder. Boven var en AI-kodningsagent som körde Cursor, driven av Anthropics Claude Opus 4.6. Offret var PocketOS, en SaaS-plattform som servade biluthyrningsföretag över hela landet.

När han publicerade sin postmortem på X och fick över sex miljoner visningar, hade historien redan gått långt utöver en startups dåliga helg. Den hade blivit en spegel som varje företag som distribuerar AI-agenter i produktionsinfrastruktur behöver titta in i.

Vad som egentligen hände

Sekvensen är viktig, eftersom den visar något som chefer behöver förstå: detta var inte ett enskilt misslyckande. Det var en kaskad.

Cursor-agenten hade fått ett rutinuppdrag. När den stötte på en lösenordsmissmatch i PocketOS: s staging-miljö, stannade den inte. Den frågade inte en människa. Den beslutade, helt på egen hand, att lösa problemet genom att ta bort en Railway-infrastrukturvolym. För att göra det, letade den efter en API-nyckel i kodbasen och hittade en som hade etablerats för ett helt annat syfte: att hantera anpassade domänoperationer via Railway CLI.

Den token hade blankettillstånd över hela Railway-miljön. Det fanns ingen scopisolering, inga åtgärdsbegränsningar och ingen bekräftelseprompt innan en destruktiv, oåterkallelig kommando utfördes. Agenten utfärdade ett enda API-samtal. Railways arkitektur förvärrade sedan skadan: volymbackup finns på samma volym som källdata, så att ta bort volymen raderade backupen med den.

PocketOS lämnades med en 3 månader gammal backup och en 30+ timmes avbrott. Grundaren tillbringade dagar med att hjälpa kunder att återställa bokningar från Stripe-betalningshistorik, kalenderintegrationer och e-postbekräftelser.

När han senare förhörde Claude-modellen om vad den hade gjort, var svaret både tekniskt korrekt och djupt oroande. Agenten medgav att den hade brutit mot uttryckliga projektregler, inklusive en som löd “ALDRIG FÖR GUDS SKULL GISSA!” och erkände att den hade gissat ändå, utan att verifiera om en volym-ID delades över miljöer innan den utförde den mest destruktiva åtgärden som den hade tillgång till.

Det finns en frestelse att peka på AI och kalla det för dagen. Men denna incident är en kaskad, inte ett enskilt misslyckande. Ett kodningsverktyg agerade utanför sitt område. En token var överbehörig. En API utförde en destruktiv åtgärd utan bekräftelse. Backupen fanns på samma volym som den skulle skydda. Var och en av dessa kontroller, om den hade hållit, skulle ha förhindrat avbrottet. Försvar i djupet existerar just för att ingen enskild skikt är perfekt, och AI-agenter i produktion gör den principen oåterkallelig.

Säkerhetsarkitekturen har inte hunnit med

Förmågan hos AI-agenter utvecklas snabbare än säkerhetsarkitekturen runt dem. Företag kopplar autonomous agenter till produktionsinfrastruktur idag med IAM-modeller, API-mönster och backupstrategier som utvecklades för en värld där människor var det enda som fanns på tangentbordet. PocketOS är ett offentligt exempel. Det finns många fler incidenter som denna som händer tyst inom företag just nu som aldrig kommer att hamna i nyheterna.

PocketOS-incidenten avslöjar en strukturell lucka i hur organisationer tänker på åtkomstkontroll i agenter. Railways CLI-tokenmodell tillhandahöll ingen rollbaserad åtkomstkontroll, ingen miljöomfattning och ingen bekräftelselag för destruktiva åtgärder. Det är inte ett fel som är unikt för Railway. Det speglar en branschomfattande antagande som är inbyggt i IAM- och PAM-plattformar som byggts under de senaste två decennierna: att entiteterna som använder autentiseringsuppgifter är människor, eller i värsta fall långlivade tjänstekonton med förutsägbar beteende.

AI-agenter är varken. De startar på några sekunder. De kedjar verktyg ihop autonomt. De tar beslut i tvetydiga situationer, ibland korrekt och ibland katastrofalt. Och de försvinner ofta innan traditionella loggningsystem har fångat vad de gjorde.

En AI-agent som opererar i din produktionsinfrastruktur är inte ett verktyg och det är inte ett tjänstekonto. Det är en ny typ av identitet, en som tänker snarare än utför, och en som kräver sin egen diskreta konto, sin egen minst behöriga behörighet, sin egen beteendebaslinje och sin egen realtidsgranskningslogg. IAM- och PAM-plattformarna som de flesta företag fortfarande förlitar sig på byggdes för människor och långlivade tjänstekonton, var och en av dem startar inte på några sekunder, kedjar inte verktyg ihop och försvinner inte innan traditionella loggningsystem har fångat vad de gjorde. Att stänga den luckan är exakt där säkerhetsbranschen investerar just nu. Agentic AI-säkerhet har uppstått som sin egen kategori, och de företag som behandlar det på det sättet kommer att undvika att bli nästa fallstudie.

Vad företag behöver göra nu

PocketOS-incidenten ger en tydlig ritning, i omvänd ordning, för vad adekvata kontroller ser ut.

Behandla AI-agenter som en distinkt identitetsklass: Hantera inte agenter som du hanterar mänskliga konton eller tjänstekonton. AI-agenter behöver diskreta identiteter med sin egen livscykelhantering, behörighetsprofiler och beteendebaslinjer mot vilka avvikelser kan upptäckas. Om din IAM-plattform inte kan skilja mellan en mänsklig utvecklare, ett tjänstekonto och en autonom AI-agent, kräver den luckan omedelbar uppmärksamhet.

Tvinga minst behörighet på åtgärdsnivå, inte bara kontonivå: Railway-token som användes i PocketOS-incidenten hade behörigheter långt utöver vad agentens uppgift krävde. Token och autentiseringsuppgifter som utfärdas till AI-agenter bör begränsas till specifika åtgärder, specifika miljöer och specifika resurser. Blankettillstånd som ges till vilken entitet som helst som hittar en autentiseringsfil i kodbasen är inte längre acceptabelt.

Kräv utomstående mänsklig bekräftelse för destruktiva åtgärder: Oåterkalleliga åtgärder som att ta bort data, släppa databaser eller radera volymer bör kräva uttrycklig mänsklig godkännande som en autonom agent inte kan auto-komplettera. Det handlar inte om att sakta ner AI-produktivitet. Det handlar om att behålla en människa i loopen för den lilla delmängden av åtgärder där felets kostnad är oåterkallelig.

Flytta dina säkerhetskopior utanför skadans område: PocketOS-incidenten skulle ha varit ett allvarligt avbrott med intakta säkerhetskopior. Den blev en datautplåningshändelse eftersom säkerhetskopior fanns på samma volym som de skulle skydda. Ute på plats, oberoende säkerhetsstrategier är inte en trevlig sak att ha. De är skillnaden mellan en återhämtlig incident och en affärskris.

Instrumentera agentbeteende för realtidsupptäckt: Traditionell loggning är inte utformad för agenter AI-aktivitetens hastighet. Företag behöver verktyg som kan fånga vad en agent gör i realtid, flagga avvikande beteende som en agent som kommer åt autentiseringsuppgifter som inte är relaterade till dess tilldelade uppgift och utlösa automatiserade svar innan skada är gjord.

Kategorin har anlänt

Under många år har företags säkerhetsteam kunnat behandla AI som ett produktivitetslager som sitter ovanför deras befintliga kontroller: en smartare autocomplete, en snabbare sökning, ett bättre sammanfattningverktyg. PocketOS-incidenten gör det klart att den eran är över. AI-agenter opererar nu direkt inuti produktionsinfrastruktur, med tillgång till autentiseringsuppgifter, API:er och levande datasystem. Kontrollerna som utvecklades för den tidigare eran är inte tillräckliga för denna.

Företagen som erkänner agentic AI-säkerhet som sin egen disciplin, med sin egen ram, sitt eget verktyg och sin egen organisatoriska äganderätt, kommer att vara bättre positionerade för att fånga de produktiva fördelarna med autonoma AI utan att bli den varnande berättelsen som nästa våg av säkerhetschefer studerar i sin ombordstigning.

Nio sekunder. Det är så lång tid det tog att förlora månader av data. Frågan för varje företag som distribuerar AI-agenter idag är om deras kontroller kunde ha stoppat det.

Aaron Rose Àr en Cybersecurity Evangelist, Security Architect Manager och medlem i Office of the CTO pÄ Check Point Software Technologies. Som en Àmnesexperet inom Artificiell Intelligens och ApplikationssÀkerhet har Aaron dedikerat sin karriÀr till att skydda organisationer och deras resurser bortom den traditionella brandvÀggen.