Tankeledare
Debatten om Claude “Nerfing” handlar inte om Claude. Det handlar om vad som händer när dina operationer körs på någon annans beslut.

Tidigare i år publicerade Stella Laurenzo, Senior Director of AI på AMD, telemetri från nästan 7 000 Claude Code-sessioner som dokumenterade något som ingenjörer hade känt men kämpat för att uttrycka: mellan januari och mars föreföll synlig resonemangsdjup att minska med 73 %, API-samtal per uppgift ökade åttiofaldigt och modellen läste betydligt färre filer innan den gjorde ändringar. Siffrorna spreds snabbt. Tolkningen spreds ännu snabbare.
Anthropic bestrider ramverket. Företaget säger att förändringarna återspeglar medvetna produktbeslut, inklusive en ny adaptiv tänkemekanism och en övergång till medium ansträngning som standard. Oberoende analytiker har också motsatt sig delar av metodiken. Debatten pågår, och rimliga människor är oense om vad som faktiskt hände.
Men här är den del som är viktig om du kör ett företag ovanpå dessa system: oavsett om detta var försämring eller medveten finjustering ändrar det inte vad företagsoperatörerna upplevde. De kunde inte förutsäga det. De kunde inte kontrollera det. Och några av dem upplevde det i produktion innan de förstod vad som hände. Det är den riktiga historien, och den har ingenting att göra med Anthropic specifikt.
Detta är ett beroendeproblem, inte ett modellproblem.
Vad vi beskriver har ett namn: modellkänslighet. Det är tillståndet där verksamhetskritiska operationer är tätt kopplade till modellens beteende, så att varje förändring på modellskiktet, antingen en finjusteringsbeslut, en ny standard, en kapacitetsdriven omdirigering eller en tyst avveckling, påverkar företaget direkt, utan buffert och utan varning.
Detta är inte ett nytt mönster. GPT-4 gick igenom en version av det 2023. Claude 3.5 gick igenom en 2024. Claude Opus går igenom en nu. Det kommer att hända igen med nästa frontmodell, och den efter det. Inte för att någon leverantör handlar i dålig tro, utan för att optimera en frontmodell för kostnad, latency och skala i global volym är exakt vad frontleverantörer måste göra. Deras incitament och incitamenten för ett företag som kör produktionsoperationer ovanpå dem är relaterade. De är inte identiska. De kommer aldrig att vara det.
Vi startade Qurrent 2023 och har den historiska kunskapen för att veta hur företagsprogramvarucykler utspelar sig: Ett företag investerar i AI. Demon visar sig fungera. Piloten fungerar. Sedan går det live, något skiftar på modellskiktet, och plötsligt äger kunden problemet. De är de som underhåller arbetsflödena, jagar regressionerna, absorberar störningen. Det gjorde aldrig någon mening för mig som en hållbar modell för företagsoperationer.
Företagsversionen av denna historia är operativ, inte teknisk.
För utvecklare är den nuvarande situationen besvärlig. Tokenbudgetar bränns snabbare. Kodsessioner stannar. Benchmarkresultat besviken. Det är ett riktigt problem, men det är ett återhämtligt problem.
För företag som kör finansiella operationer, regelefterlevnadsarbetsflöden, kundfordringar och kreditfordringar och komplexa backofficeprocesser är insatserna olika. Dessa arbetsflöden kan inte absorbera en dålig vecka. Fel ackumuleras. Volym ackumuleras. SLA:er är åtaganden till faktiska kunder, inte interna preferenser. Ögonblicket en modell börjar underprestera på en högriskprocess ackumuleras skadan, oavsett om någon har märkt det eller inte.
Vad gör det svårare är att de flesta företag som försökte komma före AI genom att bygga interna agenter på en enda modell nu upptäcker hur ofullständig den grunden var. Den första agenten var den lätta delen. Vad som inte byggdes var den omgivande infrastrukturen: utvärderingsramar som upptäcker beteendeförändringar innan de når en kund, reservlogik som omdirigerar arbete automatiskt när en modell börjar underprestera, och kontinuerlig styrning som kan hålla jämna steg med ett landskap som förändras varje kvartal. Dessa tre luckor förblir inte hanterbara. De växer till en permanent ingenjörsfunktion som ingen budgeterat för, bemannad med människor vars jobb i princip är att hålla jämna steg med beslut som fattas av leverantörer de inte har någon inflytande över.
Vad som egentligen utgör motståndskraft i produktion.
På Qurrent byggde vi den digitala arbetsstyrkan för att vara modellagnostisk från början, inte som en marknadsposition utan som ett arkitekturkrav. Varje uppgift dirigeras till den bäst presterande modellen för den uppgiften, utvärderad kontinuerligt. När en bättre modell skickas, får kunderna den automatiskt. När en nuvarande modell regredierar på ett specifikt arbetsflöde, dirigerar orkestreringsskiktet om arbetet på några sekunder, utan mänskligt ingripande och utan att någon vaknar till en Slack-tråd klockan 02.00.
Under det körs automatiserade simuleringar mot produktionsarbetsflöden dygnet runt, mätande om utdata matchar förväntat beteende. Drift upptäcks på infrastrukturskiktet, innan operationsteamet känner av det och långt innan en kund gör det. Och varje beslut som fattas av varje digital arbetare loggas och granskas, en fullständig glasruta, eftersom man inte kan styra det man inte kan se.
Dessa är inte premiumfunktioner. De är priset för att köra AI i produktion på företagsskala. De flesta företag lär sig det mitt i en nyhetscykel, vilket är det dyra sättet att ta reda på det.
Frågan som är värd att ställa den här kvartalet.
Om modellen som dina operationer är beroende av mest hade en dålig vecka nästa kvartal, hur många av dina arbetsflöden skulle känna av det? Hur skulle du veta? Och hur snabbt kunde du dirigera runt det?
Om svaret på den andra frågan är “vi skulle höra från en kund”, är operationen inte produktionsklar. Det är en pilot som körs i skala, och skillnaden är viktigare än de flesta ledare förstår tills det inte gör det.
Den nuvarande debatten är, på ett bakvänt sätt, användbar. Varje CFO och COO som tittar på det här får en gratis förhandsvisning av vad modellkänslighet ser ut som under riktiga operativa belastningar, utan att betala för det själv. Den rätta reaktionen är inte att byta modell. Det är att bygga operationer som inte är beroende av en enda.
Teknologin kommer att fortsätta förändras. Det är den enda säkerheten på den här marknaden. Företagen som kommer ut ur det här decenniet starkast kommer inte att vara de som valde rätt modell. De kommer att vara de vars operationer aldrig behövde bry sig.












