Tankeledere
For at reducere AI-omkostninger, start med skyudgifter

AI’s såkaldte “messy middle” kan have ramt sit største rod endnu.
Da en global hardware-knaphed kolliderer med massiv efterspørgsel, AI-omkostningerne er skudt i vejret. I en kamp for mere beregning, har AI-servicevirksomhederne ikke haft andre valg end at hæve deres priser og ændre deres faktureringsmodeller, hvilket har kastet budgetter ud af balance og sat innovation i stå, lige som mange virksomheder endelig havde fundet deres fodning.
Resultatet er mere end bare prischock: det er en eksistentiel krise for en forretningsverden, der effektivt lige har haft en. Virksomheder har omstruktureret deres vejvisere for at tilpasse sig AI’s indvirkning. Hold har omarrangeret deres arbejdsprocesser i overensstemmelse med AI-kapaciteter. AI-aktivering er blevet virksomheders primære konkurrencemæssige differentieringsfaktor. AI kom ind på banen, kickstartede en massiv forvandling, og nu bedes hold om at trække sig tilbage, når de kun lige er begyndt at operationalisere det.
Virksomheder som Uber har lavet overskrifter med at sætte aggressive begrænsninger på AI-brug for at stoppe udgifterne. Men selvom brugsbegrænsninger kan være en effektiv måde at reducere omkostningerne på, er det ikke den eneste måde, virksomheder kan reducere deres udgifter til beregning.
Det første sted, de skal se, er deres skyregning.
Det kan synes modsat intuitivt. Mens formelen altid har været, at mere beregningskraft giver mere AI-indvirkning, betyder det ikke nødvendigvis, at det er mere effektivt. Virksomheder bløder deres budgetter til AI-tjenester, mens de stadig afhænger af for store og dyre infrastrukturer; stigende AI-omkostninger afslører blot et dybtliggende problem, som virksomheder ikke længere kan ignorere.
Hvordan skyudgifterne opstår
IT-infrastruktur-udgifter er ofte en organisations andenstørste budgetpost efter personale, og udgør i gennemsnit 10% af en virksomheds årlige omsætning – en værdi, som AI-efterspørgsel har skudt i vejret de seneste par år. Men mange tilføjer volumen til en allerede overblæst IT-ramme.
CTO’er og andre tekniske beslutningstagerne er tiltrukket af, hvad der er familiært og pålideligt. Desværre er det også det, der får deres skyregninger til at stige. Ved at omfavne det velkendte, låser de sig selv inde i dyre, en-size-fits-all-aftaler med store hyperscalere, hvor de betaler for løsninger, der ikke genererer værdi.
Over tid finder de ud af, at de betaler for ubrugte eller inaktive tjenester, uoptimiseret hardware og tom lagring, når de kunne investere pengene i AI-innovation. Med AI, der kun bliver dyrere, har de brug for hver enkelt krone, de kan få.
Retting af infrastruktur for AI-effektivitet
At få sky-spread under kontrol kræver en kombination af akut, kortfristet handling og langfristig udvikling. At tackle, hvad der kan løses i dag, giver virksomhederne åndedrumsrum til at planlægge større justeringer over det næste år.
At skifte til ny infrastruktur tager tid, og virksomhederne har brug for løsninger nu, så deres hold kan fortsætte med at arbejde med AI. Her er tre skridt, virksomheder kan tage med det samme for at regulere deres skyudgifter:
1 – Analyser CPU- og hukommelsesbrug
Der er sådan noget som “for meget” ydelse. IT-holdene bør gennemføre en grundig diagnose af skytjenestebrug, og derefter nedgradere instanser, der overstiger ydelseskravene. En dybdykkende analyse af skybrug hjælper også holdene med at opdage funktioner og infrastruktur, der ikke bliver brugt overhovedet; hvis deres nuværende kontrakt tillader det, kan de måske dekommissionere disse tjenester eller forhandle en lavere betaling for resten af kontraktperioden. Ellers giver identificering af ubrugte funktioner en værdifuld ramme for at bestemme parametrene for deres genkonfigurerede skytilgang.
Da virksomhederne skifter deres infrastrukturstrategi, vil de ønske at vælge skytjenester, der økonomiserer hukommelsesbrug. For eksempel giver hukommelsesoptimeret infrastruktur og vCPUs mere billige muligheder for virksomhedsgrad af support i forhold til de Arm-baserede optimeringer, som hyperscalere typisk tilbyder. Dette lettter en del af overvågningsbyrden for IT-holdene, samtidig med at det reducerer den samlede skyudgift.
2 – Fastlæg strengt udgiftsgrænser
Udgifts- og brugsgrænser har været teknologiindustriens immunrespons på AI-prishøjninger, men det er ikke kun fastlæggelsen af grænserne, der betyder noget. Det er, hvordan disse grænser defineres, kommunikeres og gennemføres.
For det første bør udgiftsgrænserne være brugsspecifikke. Ledere bør kunne bruge dem som vejledning for projektplanlægning og ressourcer, så de kan strukturere budgetter, tidsplaner og enkeltprojektgrupper med henblik på effektivitet.
Vedrørende kommunikation er det afgørende, at hele arbejdsstyrken forstår hvorfor grænserne er sat. Vi er vant til at se det digitale som det uendelige, men på dette stadie af AI-boomet er vi op imod fysikkens love. Da mangel og faktureringsændringer påvirker medarbejdernes daglige arbejdsprocesser, bør udgiftsgrænserne præsenteres som en bæredygtig måde at opretholde deres nye afhængighed af AI-drevne værktøjer, snarere end en begrænsning.
3 – Gennemfør mærkningsprotokoller
Mærkningsprotokoller forhindrer ukontrolleret IT-brug, der hemmeligt driver op til beregningsudgifter. Med en robust mærkningskode kan IT-ledere få en bedre forståelse af skytjenestetrafik, så holdene kan målrette kilden til overbrug og gøre strategiske justeringer for at reducere ressourcer, hvor der opstår svulst. Samtidig kan mærkningsprotokoller også vise, hvor holdene måske har brug for en opgradering.
Da deres eksisterende skykontrakter udløber, har virksomhederne mulighed for at omstrukturere deres beregningsøkosystem med en sammensætlig, multi-cloud-tilgang. Dette betyder ikke nødvendigvis, at de skal forlade deres langvarige hyperscaler-partnere, men downsize deres kontrakter for at harmonisere med mere effektiv infrastruktur andre steder i stakken. Alternative skyer, kantløsninger, der afleverer belastningen på GPU-baseret infrastruktur, og open-source-softwareløsninger udgør en fleksibel, multivendor-strategi, der gør mere end blot at reducere omkostninger: den øger også ROI’en på hver AI-initiativ ved at maksimere pris-ydelsesforholdet, så virksomhederne kan investere besparelsen tilbage i AI-innovation.
Omstrukturering af effektivitetsmentaliteten
At styre AI-udgifter er også en kulturproblematik. AI-aktiverede arbejdsstyrker er bemærkelsesværdigt optaget af effektivitet. Derfor bygger de agenter, automatiserer deres kommunikation og lader AI udføre det grundlæggende arbejde, mens de udvider deres kapacitet for kreativitet og innovation. Men ansvarsløs brug af disse værktøjer har den modsatte effekt.
“Tokenmaxxing” og andre tendenser, der opmuntrer til spildende AI-brug, er uforenelige med en bias mod effektivitet. Hvis holdene vil faktisk gøre mere med mindre, skal deres interaktioner med AI reflektere dette princip.
Dette kræver en skift i både kultur og teknologi. Opfordr til brug af bedre prompts for at reducere slutningsbelastningen, men adoptér også infrastruktur, der automatisk økonomiserer slutning. Adoptér mindre AI-modeller med præcise brugsfald. Omfavn open-source-modeller og -software for at reducere træningsarbejdsbyrden. Giv udviklere mulighed for at løse problemer effektivt og uddann ikke-tekniske AI-brugere. Virksomheder, der vil opmuntre deres medarbejdere til at bruge AI, må gøre det ansvarligt.
Trods prishøjninger har vi ikke sat bremsen på AI-transformationen. At operationalisere AI i stor skala var altid en dyr beskæftigelse, der krævede omhyggelig planlægning og strategisk kapitalallokering for at forblive bæredygtig. Hvor vi er, er et knibtunkt: de træk, IT-ledere tager nu, vil bestemme, hvem der kommer igennem, og hvem der bliver tilbage.
Mens industrien mobiliserer for at løse den kommende beregningskrise, må virksomhederne finde måder at klare sig med, hvad de har. Virksomheder kan beskytte sig mod astronomiske AI-udgifter ved at adresse overudgifter til sky-løsninger, økonomisere slutning på tværs af en distribueret sky og investere i infrastruktur, der fremmer reel ROI.












