Tankeledare

Överallt-problemet: Varför “Data Var Som Helst” Blir den Definierande Infrastrukturutmaningen i AI-eran

mm

Den mest betydelsefulla frågan inom AI idag är inte vilken modell som är smartast. Det är var datat finns och om intelligensen kan nå det.

För det mesta av ett decennium har AI-branschen opererat under en lugnande premis: centralisera datat, centralisera beräkningen och genialitet kommer att följa. Hyperskalermodellen – centralisera stora träningsdataset i stora molnkluster och applicera massiv GPU-beräkning för att komprimera dem till modellparametrar – producerade extraordinära resultat, men också en arkitektur som nu är ansträngd under tyngden av sin egen framgång.

Kalla det “data var som helst”-problemet. När AI sprider sig från forskningslaboratoriet och in i den operativa strukturen i sjukhus, fabriker, finansiella institutioner och suveräna stater, är datat som måste informera dessa systemer inneboende distribuerat, juridiskt begränsat och operativt oflyttbart. Regulatorer i Europa insisterar på att deras medborgares finansiella register aldrig lämnar kontinenten. Ett läkemedelsföretags kliniska prövningsdata i Basel kan inte lagligen samexistera med en genomics-dataset från Seoul.

Oavsett vad fallet är, måste intelligensen gå till datat. Datat, med emfas, kommer inte att komma till intelligensen.

Ekonomisk Förändring

Denna strukturella spänning förvärras av en samtidig revolution inom AI-ekonomi. Branschen genomgår en tektonisk omvägning från utbildningscentrerad till inferenscentrerad utgift, och implikationerna för dataarkitektur är djupgående.

Deloitte uppskattade att inferensarbetsbelastningar stod för hälften av all AI-beräkning 2025, en siffra som kommer att öka till två tredjedelar 2026. Förhållandet inverteras med förbluffande hastighet. Analytiker uppskattar att inferenskraven kommer att överträffa utbildningskraven med 118 gånger 2026. 2030 kommer inferens att kunna stå för 75% av den totala AI-beräkningen, vilket driver 7 biljoner dollar i infrastrukturinvesteringar.

Kostnadsmatematiken är lika hisnande. För varje 1 miljard dollar som spenderas på att utbilda en AI-modell, står organisationer inför 15–20 miljarder dollar i inferenskostnader under modellens produktionslivslängd: ett förhållande som illustreras starkt av GPT-4, vars utbildningskostnad uppskattades till 150 miljoner dollar, men kumulativa inferenskostnader nådde 2,3 miljarder dollar i slutet av 2024. Utbildning, som tidigare var den stora besattheten för AI-investorer och inköpare, omdefinieras som en engångsavgift. Inferens är den permanenta driftskostnaden för intelligens och är nu den dominerande posten.

Men här ligger paradoxen: inferenskostnaderna för en GPT-3.5-nivåsystem minskade med mer än 280 gånger mellan november 2022 och oktober 2024, med hårdvarukostnader som minskade med cirka 30% per år och energieffektivitet som förbättrades med 40% per år. Priserna sjunker; konsumtionen accelererar snabbare. Per-enhet-inferenskostnaderna minskade 100 gånger, medan Microsoft och Google rapporterade att AI-arbetsbelastningar ökade 31 gånger under samma period.

Den Jevons-paradoxen, där effektivitetsvinster driver större resursanvändning, har funnit en modern uttrycksform i GPU-kluster.

Där Data Bor, Måste Intelligensen Följa

Inferens-ekonomin förändrar fundamentalt infrastrukturkraven, och ingenstans mer än runt data-tyngd. Inferens, till skillnad från utbildning, är inte ett batch-jobb som körs en gång i ett datacenter. Det är en kontinuerlig, latenskänslig, geografiskt distribuerad tjänst, och bara lika bra som datat den kan nå vid frågetillfället.

Detta är kärnan i “data var som helst”-utmaningen.

Till exempel kan en språkmodell som resonemang över en patients live-ICU-telemetri inte ha råd med en 200-milliseconders returresa till en hyperscalers östkustkluster. En finansiell tjänst-modell som kör inferens vid transaktionspunkten kan inte exfiltrera kontoinformation till en jurisdiktion där det skulle bryta mot GDPR. En suverän AI-distribution kan inte baseras på infrastruktur som ägs och drivs av en utländsk kommersiell enhet.

Frontier-laboratorierna är akut medvetna om detta. Anthropics avtal med Google Cloud för upp till en miljon TPUs, som levererar mer än en gigawatt AI-beräkningskapacitet 2026, signalerar hur ledande laboratorier investerar i utanförskap för att forma den globala infrastrukturavtrycket för inferens.

En Taxonomi Av Dataintensitet

Inte alla AI-system konfronterar denna utmaning identiskt, och det är instruktivt att överväga en grov taxonomi, eftersom det finns olika typer av AI-modeller och komplexitet. Låt oss bryta ner det med tre kärnexempel: LLM, bild och fysiska modeller.

Stora språkmodeller – Claude-, GPT- och Gemini-familjerna – hanterar primärt språktoken: relativt lätta, komprimerbara och mottagliga för sekretessbevarande tekniker som differentiell sekretess eller federerad inlärning. Deras “data var som helst”-problem är mycket komplext.

Generativa visuella modeller presenterar ett ännu svårare fall. System som Black Forest Labs FLUX.2 kan producera högupplösta, fotorealistiska bilder på under en sekund på kraftfull hårdvara, men att generera en enda bild kräver mycket mer data och beräkning än att generera text. När visuell AI flyttar bortom kreativa verktyg och in i industriell inspektion, medicinsk avbildning och satellitanalys, är det underliggande datat ofta stort, känsligt och svårt att flytta, vilket ökar behovet av att köra AI där datat redan finns.

Den mest komplexa kategorin är fysisk AI. NVIDIA:s Jensen Huang har deklarerat att “fysisk AI har anlänt, och varje industriellt företag kommer att bli ett robotföretag”. Nya modeller som NVIDIA:s Cosmos 3 syftar till att ge maskiner en generaliserad förståelse av den fysiska världen genom att kombinera simulering, syn och resonemang, medan företag som Physical Intelligence tränar robotar på realvärldens sensordata – inklusive kraft, rörelse och visuella indata – för att möjliggöra mer anpassningsbar, autonomt beteende.

Samma skalningsdynamik som förbättrade stora resonemangsmodeller tillämpas nu på realvärldens data som vibration, ljud och sensorinmatning. Men denna information är inneboende lokal. En robot på en fabriksgolvet kan inte skicka realtidsvisuell och taktil data till ett avlägset moln för bearbetning utan att införa fördröjningar som kunde skapa säkerhetsrisker, vilket innebär att AI alltmer måste köras på kanten, nära där datat genereras.

Tillit, Förklarbarhet Och Resultat

Detta är där “data var som helst”-utmaningen flyttar bortom infrastruktur och blir en styrningsfråga. När AI tillämpas på högriskbeslut – från hälso- och sjukvårdsdiagnoser till finansiella riskmodeller till fysiska kontrollsystem – är frågor om var datat finns alltmer kopplade till vem som är ansvarig för resultaten.

I dagens regleringsmiljö är förklarbarhet inte valfri. EU:s AI-lag, till exempel, kräver att högrisk-system demonstrerar grunden för sina utdata, vilket är svårt om datat som informerar dessa beslut är distribuerat över flera system, jurisdiktioner och regleringsramar.

Tillit blir därför en förutsättning för antagande i stor skala. Kontroll över data-miljön blir lika viktig som kontroll över modellerna själva.

Nästa Generation Av AI-infrastruktur

Lösningen av “data var som helst”-utmaningen kommer att definiera den konkurrenskraftiga kartan för AI under de kommande tio åren. Federerad inferens, säkra data-bearbetningsmiljöer, edge-optimiserade modeller och orkestreringssystem som tar hänsyn till var datat får bo är inte nisch-tekniska funktioner, utan förutsättningar för AI:s expansion bortom användningsfallen där data kan centraliseras fritt.

Företag och regeringar som bygger infrastruktur som kan leverera pålitlig, förklarbar, suverän inferens – intelligens som når datat snarare än att kräva att datat reser till den – kommer att ha den mest varaktiga fördelen i AI-eran. Att träna en smartare modell är alltmer ett löst och kommodifierat problem. Att distribuera den på ett ansvarsfullt sätt, på kanten, över jurisdiktionsgränser, mot data som inte kan flyttas, är det problem som kvarstår.

Data var som helst är inte en slogan. Det är det svåraste olösta problemet i företags-AI. Och det kommer att avgöra om den extraordinära kapacitet som låstes upp av det senaste decenniets utbildningsinvesteringar någonsin översätts, i stor skala, till resultat som världen kan lita på.

Som chef för strategi leder Abhas det övergripande företagsstrategin för Cloudera och ansvarar för att skapa företagets vision, bygga affÀrs- och kundmÄlmodellen, kommunicera detta med nyckelintressenter via tydligt definierade OKR och genomföra viktiga transformationsinitiativ för att förverkliga planen. Han Àr ocksÄ ansvarig för att driva tillvÀxt och innovation och fatta lÀmpliga beslut om byggnation, inköp och partnerskap, inklusive prissÀttning och paketering, företagsutveckling och Clouderas innovationsaccelerator för att lansera nya produkter. Tidigare har han tjÀnstgjort som stabschef och vice president för affÀrstransformation i företaget.

Före sammanslagningen av Cloudera och Hortonworks hjÀlpte han till att skala upp Hortonworks marknadsanstrÀngningar som global chef för kundinnovation och vÀrdehantering. Som managementkonsult i utbildning Àr han passionerat engagerad i att driva handling och förÀndring i samhÀllet och har lett projekt med flera organisationer, inklusive World Economic Forum, Founders of the Future och andra ideella organisationer.