Tankeledere

Det Hellige Gral for Beregningskraft i AI

mm

Trods fantastisk fremgang er artificial intelligens’ evner stadig begrænsede i forhold til virkelighedens forventninger. Vi bygger komplekse modeller, kører neurale netværk og tester algoritmer, men fremgangen standsner af og til på de steder, vi mindst venter det.

Problemet ligger ofte ikke i algoritmerne eller data, men i beregningskraften, de ressourcer, der giver modellerne mulighed for at lære og fungere på den nødvendige skala. Så hvad ligger bag denne barriere? Lad os undersøge den kritiske ressource, uden hvilken selv de mest lovende AI-projekter ikke kan komme ud af laboratoriet.

Beregningsunderskuddet og dets konsekvenser

For at forstå dette emne, lad os starte med historien om mobilkommunikation. Da 3G- og 4G-netværk dukkede op, var internettet allerede næsten globalt. Og da 5G blev introduceret, spurgte mange mennesker en fuldstændig rimelig spørgsmål: “Internettet bliver hurtigere – men så hvad?”

I virkeligheden handler øgningen af internethastighed ikke om brugervenlighed. Det forvandler hele den teknologiske landskab. Brugstilfælde opstår, som tidligere var umulige. 5G viste sig at være langt hurtigere end 4G, og dette spring var ikke gradvist, som springet fra 1G til 2G, men eksponentielt. Som resultat heraf kan nye anvendelser, enheder og hele klasser af teknologi opstå.

Trafiklyskameraer, realtids-trafikanalyse-systemer og automatiserede trafikreguleringsmekanismer – alt dette bliver muligt takket være nye kommunikationsteknologier. Politiet får nye måder at udveksle data på, og i rummet kan teleskoper og satellitter transmittere enorme mængder af information til Jorden. Et kvalitetspring i en grundlæggende teknologi driver udviklingen af hele økosystemet.

Samme princip gælder for beregningskraft. Forestil dig, at menneskehedens samlede beregningskapacitet udtrykkes i hypotetiske enheder. I dag kunne vi have, sige, ti sådanne enheder. Med dem kan vi generere billeder og videoer, skrive tekster, oprette marketingmateriale… Dette er allerede betydeligt, men udvalget af anvendelser er hovedsagelig begrænset.

Nu forestil dig, at vi havde ikke ti, men tusind sådanne enheder. Pludselig bliver teknologier, der tidligere var for dyre, mulige, og startups, der blev opgivet på grund af høje beregningsomkostninger, begynder at give økonomisk mening.

Tag robotaxis som eksempel. I dag afhænger de mest af relativt svage lokale computere, der er installeret i køretøjet. Men hvis videostrømmen blev transmitteret til skyen med enorme beregningsressourcer, kunne data blive behandlet og returneret i realtid. Og dette er kritisk: en bil, der kører med 100 km/t, skal træffe beslutninger på brøkdele af en sekund – køre ligeud, dreje, bremse eller ikke bremse.

Dette er, når en fuldt fungerende robotaxi-industri bliver mulig, ikke kun isolerede løsninger som dem, vi ser i dag. Enhver lokal computer, der er installeret i en bil, er på en måde begrænset, som en tilsluttet system ikke er. Jo hurtigere vi kan skala det, jo hurtigere vil verden omkring os ændre sig.

Adgang til chips og den “gyldne billet” i AI

I sammenhæng med beregningskraft opstår spørgsmålet: bliver adgang til moderne chips den “gyldne billet” til at komme ind på AI-markedet? Skaber store spillere, der indgår kontrakter med chipfabrikanter eller producerer dem selv, en kløft mellem store virksomheder og alle andre?

En sådan kløft opstår kun i ét tilfælde: hvis en forretningsmodel er fokuseret udelukkende på at sælge chips til store kunder. I praksis sigter fabrikanter som NVIDIA mod at tilbyde cloudløsninger til alle. Deres optimerede chips er tilgængelige i cloudløsninger for både OpenAI og uafhængige udviklere.

Endda strategiske alliancer mellem selskaber som Google, Anthropic, Microsoft, OpenAI, Amazon og NVIDIA er primært partnerskaber for fælles ressourceudnyttelse og ikke forsøg på at lukke markedet. Denne model muliggør en effektiv allokering af beregningskraft, hvilket fremmer teknologisk udvikling.

Hvis vi følger kæden af beregningsressourceanvendelse, begynder den med slutbrugeren. For eksempel, når du bruger WhatsApp til videokald og beskeder, skal virksomheden sørge for, at tjenesten fungerer: gemme og behandle data, køre modeller for videorensning, tilføje effekter og forbedre billedkvalitet.

At vedligeholde egne servere er dyrt, de bliver forældede, og kræver konstant vedligehold. Derfor er cloudløsninger, “clouden”, opstået. Markedet domineres af tre spillere: Google Cloud, AWS og Microsoft Azure. Andre selskaber kan ikke konkurrere på dette niveau: infrastrukturens skala er for stor.

Cloudtjenester er enorme datacentre med køling, strømforsyning og døgnvagt. De huser servere og specialiserede chips fra NVIDIA, AMD og andre fabrikanter, hvilket muliggør store beregningsprocesser.

Her kommer vi til det centrale spørgsmål, jeg diskuterede i min tidligere artikel om datacentre, og ønsker at fortsætte her: hvad er den primære flaskehals i dette system? Er det mangel på elektricitet eller vanskeligheden ved at køle datacentre i regioner, hvor klimaet gør det særligt udfordrende? I virkeligheden ligger hemmeligheden i chipene selv…

Det Hellige Gral

Hvorfor er NVIDIA i dag vurderet til omkring 5 billioner dollars og regnet blandt de mest succesfulde børsnoterede selskaber i verden? Årsagen er enkel: NVIDIA producerer chipene, som AI-modeller trænes og køres på.

Hver af disse chips forbruger enorme mængder af elektricitet, når de træner store modeller eller behandler stadig voksende mængder af data. Men hvor effektivt bliver denne energi brugt? Her kommer specialiserede chips til spil; de håndterer bestemte opgaver langt mere effektivt end almindelige formålsgrene.

AI-modeller adskiller sig. OpenAI har for eksempel en familie af modeller, Anthropic en anden. Koncepterne kan være lignende, men de matematiske strukturer og beregningsprocesser er forskellige. En enkelt almindelig formålsgren, når den træner OpenAI-modeller (som ChatGPT) versus Anthropic-modeller (som Claude), fungerer som et “one-size-fits-all-værktøj”, der forbruger, sige, 100.000 timers beregning for en model og 150.000 for en anden. Effektiviteten varierer betydeligt og er sjældent optimal.

Selskaber løser dette problem ved at producere specialiserede chips. For eksempel kan en chip være optimeret til ChatGPT-arkitekturen og træne det på, sige, 20 minutter, mens en anden er tilpasset Anthropics arkitektur og også gennemfører træning på 20 minutter. Energiforbrug og træningstid reduceres flere gange i forhold til en almindelig formålsgren.

Når disse chips sælges til store selskaber, som Google, Amazon, Microsoft eller Azure, tilbydes de som selvstændige produkter. Brugere kan vælge, for eksempel, en chip, der er optimeret til en YOLO-model eller en enklere, billigere chip til en Xen-arkitektur. På denne måde får selskaber adgang til beregningsressourcer, der er tilpasset deres opgaver, i stedet for at købe almindelige formålsgrene. Hvis en bruger har ti forskellige funktioner, kan de bruge ti forskellige specialiserede chips.

Trenden er klar: specialiserede chips erstatter langsomt almindelige formålsgrene. Mange startups arbejder i dag med ASIC’er (Application-Specific Integrated Circuits), chips, der er designet til bestemte beregningsopgaver. De første ASIC’er dukkede op til Bitcoin-mining: initialt blev kryptocurrency minet på NVIDIA-GPU’er, derefter blev chips skabt udelukkende til Bitcoin og var ude af stand til at udføre andre opgaver.

Jeg ser dette i praksis: samme hardwarekonfiguration kan producere helt forskellige resultater afhængigt af opgaven. I mit startup Introspector studerer vi disse processer i rigtige projekter, og som strategisk rådgiver for Keymakr observerer jeg, hvordan kunder opnår effektivitet fra specialiserede chips, der giver modellerne mulighed for at køre hurtigere. Projekter, der tidligere strandede under træning eller inference, når stabile resultater med denne tilgang.

Men snæver specialisering medfører risici. En chip, der er optimeret til Anthropics arkitektur, vil ikke fungere til træning af OpenAI-modeller, og omvendt. Hver ny arkitektur kræver en ny generation af hardware, hvilket skaber en risiko for storstilet “afskrivning”. Hvis Anthropic udgiver en ny arkitektur i morgen, bliver alle tidligere generationers chips ineffektive eller værdiløse. At producere nye chips koster milliarder af dollars og kan tage år.

Dette skaber en dilemma: skal vi lave specialiserede chips, der fungerer perfekt i en snæver situation, eller fortsætte med at producere almindelige formålsgrene, der løser alle opgaver moderat godt, men ikke kræver komplet erstatning, når arkitekturerne ændrer sig?

Effektivitet i denne sammenhæng måles ved tre primære parametre: køretid, energiforbrug og varmeproduktion. Disse parametre er direkte relaterede: jo længere et system kører, jo mere energi forbruger det, og jo mere varme producerer det. At reducere en parameter forbedrer automatisk de to andre.

Her ligger “Det Hellige Gral” for AI-præstation: hvis mindst en af de grundlæggende effektivitetsparametre kan optimeres, forbedres de andre parametre næsten automatisk også.

Bæredygtig proces

Med den voksende brug af specialiserede chips er problemet med overproduktionsrisici blevet presserende. I øjeblikket er overskuddet af udstyr allerede betydeligt, og selskaberne løser dette problem på forskellige bæredygtige måder, herunder genbrug af eksisterende ressourcer.

Genanvendelse af udstyr er blevet en nøgleelement i bæredygtig udvikling i højteknologiske industrier. Chips indeholder betydelige mængder af ædelmetaller, kobber, aluminium, palladium og sjældne jordarter, samt materialer, der bruges i mikrochips og transistorer. Når udstyret bliver forældet, kan disse værdifulde ressourcer returneres til produktion, hvilket reducerer omkostningerne ved nye komponenter og samtidig sænker branchens miljømæssige fodaftryk.

Nogle specialiserede fabrikker og selskaber fokuserer på genanvendelse og udvinding af ædelmetaller fra forældede komponenter. For eksempel bruger nogle faciliteter hydrometallurgiske processer og avancerede kemiske metoder til at udvinde guld og kobber med høj renhed, hvilket giver mulighed for at genbruge disse materialer i nye chips.

Desuden implementerer selskaber lukkede modeller, hvor gammelt udstyr opgraderes eller integreres i nye løsninger, hvilket reducerer behovet for primær ressourceudvinding. Disse tilgange hjælper ikke kun med at minimere affald, men også med at sænke produktionens kulstofaftryk, da traditionel minedrift og metalbehandling kræver betydelig energi.

Bæredygtig ledelse af chip- og udstyrs livscyklus kan blive en branchestandard, hvor teknologisk fremgang harmonerer med miljømæssig ansvarlighed.

Michael Abramov er grundlægger og CEO af Introspector, og bringer mere end 15+ års erfaring med softwareingeniørarbejde og computer vision AI-systemer til udviklingen af virksomhedsklasse-etiketteringsværktøjer.

Michael begyndte sin karriere som softwareingeniør og R&D-chef, hvor han opbyggede skalerbare datasystemer og ledede tværfaglige ingeniørhold. Indtil 2025 har han fungeret som CEO af Keymakr, et data-etiketteringsservicefirma, hvor han var pioner inden for menneske-i-løkken-arbejdsgange, avancerede QA-systemer og tilpasset værktøj til at understøtte store skala-computer vision og autonomi databehov.

Han har en B.Sc. i datalogi og en baggrund i ingeniørarbejde og kreative kunstneriske fag, hvilket giver ham en tværfaglig indsigt i løsning af komplekse problemer. Michael befinder sig ved skæringen af teknologisk innovation, strategisk produktledelse og virkelige resultater, og driver fremad mod den næste front i autonome systemer og intelligent automation.