Tankeledere

Det Overalt-Problem: Hvorfor “Data Overalt” Bliver Den Definerende Infrastrukturudfordring i AI-Æraen

mm

Det mest konsekvensfulde spørgsmål i AI i dag er ikke, hvilket model er smartest. Det er, hvor dataene bor, og om intelligensen kan nå dem.

I det bedste del af et årti har AI-industrien opereret under en beroligende præmis: centraliser data, centraliser beregning, og genialitet vil følge. Hyperscaler-modellen – centralisering af store træningsdata i store cloud-kluster og anvendelse af massiv GPU-beregning til at komprimere dem til modelparametre – har produceret ekstraordinære resultater, men også en arkitektur, der nu er under pres på grund af sin egen succes.

Kald det “data overalt”-problemet. Da AI flyder ud af forskningslaboratoriet og ind i driftsstrukturen i hospitaler, fabrikker, finansielle institutioner og suveræne regeringer, er data, der skal informere disse systemer, inherent fordelt, juridisk begrænset og operativt ubevægelig. Regulatorer i Europa insisterer på, at deres borgere’s finansielle optegnelser aldrig forlader kontinentet. Et farmaceutisk selskabs kliniske prøvedata i Basel kan ikke lovligt dele en cloud-bucket med en genomics-dataset fra Seoul.

Uanset hvad, må intelligensen gå til dataene. Dataene, udtrykkeligt, vil ikke komme til intelligensen.

Økonomien Bag Skiftet

Denne strukturelle spænding er gjort akut af en samtidig revolution i AI-økonomi. Branchen er undergået en tektonisk omstrukturering fra trænings-centrisk til inferens-centrisk udgift, og implikationerne for dataarkitektur er dybtgående.

Deloitte estimerede , at inferens-arbejdsbyrder udgjorde halvdelen af alle AI-beregninger i 2025, et tal, der vil springe til to tredjedele i 2026. Forholdet er under inversion med forbløffende hastighed. Analytikere estimerer, at i 2026 vil inferens-efterfrage overgå trænings-efterfrage med 118 gange. I 2030 kan inferens udgøre 75% af den samlede AI-beregning, og drive 7 billioner dollars i infrastruktur-investering.

Omregningsmatematikken er lige så vertiginøs. For hver 1 milliard dollar, der bruges på træning af en AI-model, står organisationer over for 15-20 milliarder dollar i inferens-omkostninger over modellens produktionsliv: et forhold, der illustreres tydeligt af GPT-4, hvis træningsomkostninger udgjorde ca. 150 millioner dollar, men hvor kumulative inferens-omkostninger nåede 2,3 milliarder dollar ved udgangen af 2024. Træning, der tidligere var hovedbeskæftigelsen for AI-investorer og indkøbschefer, bliver nu omdefineret som en engangs-undervisningsgebyr. Inferens er den vedvarende drifts-omkostning for intelligens, og det er nu den dominerende linje-post.

Men her ligger paradokset: inferens-omkostninger for et GPT-3.5-niveau system faldt mere end 280 gange mellem november 2022 og oktober 2024, med hardware-omkostninger, der faldt ca. 30% årligt, og energi-effektivitet, der forbedredes 40% om året. Priserne falder; forbrug accelererer hurtigere. Pr. enheds-inferens-omkostninger faldt 100 gange, mens Microsoft og Google rapporterede, at AI-arbejdsbyrder voksede 31 gange i halvdelen af perioden.

Den Jevons-paradoks, hvor effektivitetsgevinster driver større ressourcebrug, har fundet en moderne udtryk i GPU-kluster.

Hvor Data Bor, Må Intelligensen Følge

Inferens-økonomien omdefinerer grundlæggende infrastruktur-krav, og intet sted mere end omkring data-tyngde. Inferens, i modsætning til træning, er ikke en batch-job, der køres én gang i et datacenter. Det er en kontinuerlig, latens-følsom, geografisk fordelt service, og kun så god som data, det kan nå i øjeblikket af forespørgsel.

Dette er kernen i “data overalt”-udfordringen.

For eksempel kan en sprogmodel, der resonerer over en patients live ICU-telemetri, ikke tillade en 200-millisecondes rundtur til en hyperscalers østkyst-kluster. En finansielle tjenester-svindel-model, der køre inferens på transaktionspunktet, kan ikke eksfiltrere kontoudtog til en jurisdiktion, hvor det ville krænke GDPR. En suveræn AI-udvikling kan ikke baseres på infrastruktur, der ejes og drives af en fremmed kommerciel enhed.

Frontier-laboratorierne er akut bevidste om dette. Anthropic’s aftale med Google Cloud om op til en million TPUs, der leverer mere end en gigawatt AI-beregning kapacitet ved udgangen af 2026, signalerer, hvordan førende laboratorier investerer i uden precedent skala for at forme den globale infrastruktur-fodaftryk af inferens.

En Taxonomi Over Data-Intensitet

Ikke alle AI-systemer konfronterer denne udfordring identisk, og det er instruktivt at overveje en omtrentlig taxonomi, da der er forskellige typer af AI-modeller og kompleksitet. Lad os bryde det ned med tre kerneeksempler: LLM’er, billedmodeller og fysisk modeller.

Store sprogmodeller — Claude-, GPT- og Gemini-familierne — beskæftiger sig primært med sprog-token: relativt letvægtede, komprimerbare og tilgængelige for privatlivsbeskyttende teknikker som differential-privatliv eller fødereret læring. Deres “data overalt”-problem er meget komplekst.

Generative visuelle modeller præsenterer et endnu hårdere tilfælde. Systemer som Black Forest Labs’ FLUX.2 kan producere højopløselige, fotorealistiske billeder på under en sekund på kraftfuld hardware, men generering af et enkelt billede kræver langt mere data og beregning end generering af tekst. Da visuel AI flytter sig ud over kreative værktøjer og ind i industrielle inspektioner, medicinske billeder og satellitanalyse, er den underliggende data ofte stor, følsom og svær at flytte, hvilket øger behovet for at køre AI, hvor data allerede bor.

Den mere komplekse kategori er fysisk AI. NVIDIA’s Jensen Huang har erklæret, at “fysisk AI er ankommet, og hver industriel virksomhed vil blive en robot-virksomhed”. Nye modeller som NVIDIA’s Cosmos 3 sigter til at give maskiner en generaliseret forståelse af den fysiske verden ved at kombinere simulation, syn og resonnering, mens virksomheder som Physical Intelligence træner robotter på realverdens sensor-data – herunder kraft, bevægelse og visuelle input – for at muliggøre mere tilpasningsdygtig, autonom adfærd.

De samme skalerings-dynamikker, der forbedrede store resonansmodeller, bliver nu anvendt på realverdens data som vibration, lyd og sensor-input. Men denne information er inherent lokal. En robot på en fabriks-gulv kan ikke sende realtids-visuel og berøringsdata til et fjernt cloud til bearbejdning uden at introducere forsinkelser, der kunne skabe sikkerhedsrisici, hvilket betyder, at AI må køre ved kanten, tæt på, hvor data genereres.

Tillid, Forklarlighed Og Resultater

Dette er, hvor “data overalt”-udfordringen flytter sig ud over infrastruktur og bliver et styre-problem. Da AI anvendes til høj-risiko-beslutninger – fra sundheds-diagnoser til finansielle risiko-modeller til fysiske kontrolsystemer – bliver spørgsmål om, hvor data bor, mere og mere knyttet til, hvem der er ansvarlig for resultater.

I dagens regulativ miljø er forklarbarhed ikke valgfri. EU’s AI-akt, for eksempel, kræver, at høj-risiko-systemer demonstrerer grundlaget for deres output, hvilket er svært, hvis data, der informerer disse beslutninger, er fordelt over flere systemer, jurisdiktioner og regulativ rammer.

Tillid bliver derfor en forudsætning for adoption i stor skala. Kontrol over data-miljøet bliver lige så vigtig som kontrol over modellerne selv.

Næste Generation Af AI-Infrastruktur

Løsningen af “data overalt”-udfordringen vil definere den konkurrencemæssige kort over AI for det næste årti. Fødereret inferens, sikre dataprocesserings-miljøer, edge-optimerede modeller og orkestrerings-systemer, der tager hensyn til, hvor data er tilladt at bo, er ikke niche-tekniske funktioner, men forudsætninger for AI’s udvidelse ud over brugs-tilfældene, hvor data kan centraliseres frit.

Virksomhederne og regeringerne, der bygger infrastruktur, der kan levere tillid, forklarbar og suveræn inferens – intelligens, der når data, i stedet for at kræve, at data rejser til den – vil have den mest varige fordel i AI-æraen. Træning af en smartere model er mere og mere et løst og kommercialiseret problem. Implementering af den ansvarligt, ved kanten, på tværs af jurisdiktionelle grænser, mod data, der ikke kan flyttes, er problemet, der bliver.

Data overalt er ikke et slogan. Det er det hårdeste uløste problem i enterprise AI. Og det vil bestemme, om den ekstraordinære kapacitet, der er låst op af det sidste årtis trænings-investering, nogensinde oversætter til resultater, som verden kan stole på.

Som chief strategy officer leder Abhas den overordnede virksomhedsstrategi for Cloudera og er ansvarlig for at skabe virksomhedens vision, opbygge forretnings- og kundemodellen, kommunikere dette med nøgleinteressenter via tydeligt definerede OKR'er og gennemføre nøgletransformationelle initiativer for at realisere planen. Han er også ansvarlig for at drive vækst og innovation og træffe passende byg/buy-partnerbeslutninger, herunder prissætning og pakning, virksomhedsudvikling og Clouderas innovationsaccelerator til at lancerer nye produkter. Tidligere fungerede han som chief of staff og vicepræsident for forretningsTransformation i virksomheden.

Før Cloudera/Hortonworks-fusionen hjalp han med at skala Hortonworks' go-to-market-bestræbelser som global chef for kundeinnovation og værdistyring. Som managementkonsulent af uddannelse er han passioneret om at drive handling og forandring i samfundet og har ledt projekter med multiple organisationer, herunder World Economic Forum, Founders of the Future og andre nonprofit-organisationer.