Tankeledere
For å kutte AI-utgifter, start med sky-utgifter

AI sin såkalte “messy middle” kan ha nådd sitt største problem ennå.
Da en global hardwareruks klager sammen med massiv etterspørsel, AI-utgiftene har skutt i været. I en kamp for mer beregning, har AI-tjenesteselskapene ingen annen valg enn å heve prisene og revidere faktureringsmodellene, noe som kaster budsjettene ut av balanse og avsporer innovasjon akkurat når mange organisasjoner var på vei til å nå sitt mål.
Resultatet er mer enn bare prischock: det er en eksistensiell krise for en forretningsverden som effektivt bare har hatt en. Selskaper har omskrevet sine veikart for å tilpasse seg AI-påvirkningen. Teamene har omorganisert arbeidsflytene i tråd med AI-egenskapene. AI-aktivering har blitt organisasjonenes primære konkurranseforskjell. AI kom inn på banen, startet en massiv transformasjon, og nå blir teamene bedt om å trekke tilbake når de bare har begynt å operasjonalisere det.
Selskaper som Uber har fått oppmerksomhet for å sette aggressive begrensninger på AI-bruk for å stoppe strømmen. Men mens bruksbegrensninger kan være en effektiv måte å kutte utgifter, er det ikke den eneste måten bedrifter kan kutte tilbake på beregningsutgifter.
Det første stedet de bør se er sky-regningen.
Det ser motsatt ut. Mens formelen alltid har vært at mer beregningskraft betyr mer AI-påvirkning, betyr det ikke nødvendigvis at det er mer effektivt. Bedrifter blør budsjetter til AI-tjenester mens de fortsatt avhenger av forstørrede, overprisede infrastrukturer; økende AI-utgifter avslører bare et dyptliggende problem som bedrifter ikke lenger kan ignorere.
Hvordan sky-utgifter akkumuleres
IT-infrastruktur-utgifter er ofte en organisasjonens nest største utgift etter lønn, og utgjør i gjennomsnitt 10% av en bedrifts årlige omsetning – et tall som AI-etterspørselen har presset oppover de siste årene. Men mange legger til volum til en allerede overblåst IT-ramme.
CTO-er og andre teknologiledere er tiltrekket av hva som er kjent og pålitelig. Dessverre er dette også det som driver opp sky-regningen. Ved å omfavne det prøvede og det sanne, låser de seg fast i dyre, en-size-fits-all-avtaler med store hyperscalere, hvor de betaler for løsninger som ikke genererer verdi.
Over tid finner de ut at de betaler for ubrukte eller inaktive tjenester, uoptimert maskinvare og tom lagring, når de kunne ha investert penger i AI-innovasjon. Med AI som bare blir dyrere, trenger de hver enkelt dollar de kan få.
Rettstørre infrastruktur for AI-effektivitet
Å få sky-sprengning under kontroll krever en kombinasjon av akutt, kortvarig handling og langvarig utvikling. Å takle hva som er løsbart i dag gir bedrifter pustepause til å planlegge for større justeringer over det neste året.
Overgang til ny infrastruktur tar tid, og organisasjonene trenger løsninger nå så teamene kan fortsette å arbeide med AI. Her er tre skritt bedrifter kan ta umiddelbart for å modulere sky-utgifter:
1 – Analyser CPU- og minnebruk
Det finnes en slik ting som “for mye” ytelse. IT-teamene bør utføre en grundig diagnose av skytjenestebruk, og deretter nedgradere eksemplarer som overstiger ytelseskrav. En dyptgående analyse av skytjenestebruk hjelper også teamene med å oppdage funksjoner og infrastruktur som ikke brukes i det hele tatt; hvis deres nåværende kontrakt tillater det, kan de kanskje dekommissionere disse tjenestene eller forhandle en lavere betaling gjennom resten av kontrakten. Ellers gir identifisering av ubrukte funksjoner en verdifull ramme for å bestemme parameterne for deres omkonfigurerte skytilnærming.
Etterhvert som bedrifter endrer infrastrukturstrategien, vil de ønske å velge skytjenester som økonomiserer med minnebruk. For eksempel tilbyr minne-optimert infrastruktur og vCPUs mer rimelig støtte for bedriftsgradert støtte sammenlignet med Arm-basert optimalisering som vanligvis tilbys av hyperscalere. Dette lettet en del av overvåkingsbyrden fra IT-teamene samtidig som det reduserer den totale sky-utgiften.
2 – Sette strenge utgiftsbegrensninger
Utgifts- og bruksbegrensninger har vært teknologiindustriens immunrespons på AI-prishopp, men det er ikke bare å sette begrensninger som teller. Det er hvordan disse begrensningene defineres, kommuniseres og håndheves.
For det første bør utgiftsbegrensninger være bruksbestemt. Ledere bør kunne bruke dem som en guide for prosjektplanlegging og ressursallokering, slik at de kan strukturere budsjetter, tidsplaner og individuelle prosjektteam med tanke på effektivitet.
Vedrørende kommunikasjon er det avgjørende at hele arbeidsstokken forstår hvorfor begrensningene er satt. Vi er vant til å se det digitale som det uendelige, men på dette stadiet av AI-boomen, er vi opp mot fysikkens lover. Ettersom mangler og faktureringsendringer påvirker ansattes daglige arbeidsflyt, bør utgiftsbegrensninger presenteres som en bærekraftig måte å opprettholde deres nye avhengighet av AI-verktøy, snarere enn en begrensning.
3 – Gjennomføre tagging-protokoller
Tagging-protokoller forhindrer ustyrt IT-bruk som hemmelig driver opp beregningsutgifter. Med en robust tagging-kode kan IT-ledere få en bedre forståelse av skytjenestetrafikk, noe som tillater teamene å målrette kilden til overbruk og gjøre strategiske justeringer for å kutte ressurser der det skjer bloat. Samtidig kan tagging-protokoller også vise hvor teamene kanskje trenger en oppgradering.
Ettersom deres eksisterende skykontrakter utløper, har bedrifter muligheten til å omstrukturere datamaskinekosen med en kompositt, multi-skytilnærming. Dette betyr ikke nødvendigvis å forlate deres langvarige hyperskalepartnere, men å nedsize kontraktene for å harmonisere med mer effektiv infrastruktur andre steder i stakken. Alternative skyer, kantløsninger som laster av belastningen på GPU-basert infrastruktur, og åpne kildekode-løsninger utgjør en fleksibel, multileverandørstrategi som gjør mer enn bare å spare kostnader: den øker avkastningen av hver AI-inisiativ ved å maksimere pris for ytelse, noe som tillater bedrifter å investere sparingene tilbake i AI-innovasjon.
Omgjøre effektivitetsmentaliteten
Å håndtere AI-utgifter er også en kulturmessig sak. AI-aktiverende arbeidsstokker er bemerkelsesverdig opptatt av effektivitet. Derfor bygger de agenter, automatiserer kommunikasjonen og lar AI gjøre gruntarbeidet mens de utvider kapasiteten for kreativitet og innovasjon. Men ansvarsløs bruk av disse verktøyene har den motsatte effekten.
“Tokenmaxxing” og andre trender som oppmuntre til sløs bruk av AI er uforenlig med en bias mot effektivitet. Hvis teamene vil faktisk gjøre mer med mindre, bør deres interaksjoner med AI reflektere dette prinsippet.
Dette krever en skifte i kultur og teknologi i tandem. Oppmuntre til bedre forespørsler for å redusere inferensbelastning, men også adoptere infrastruktur som automatisk økonomiserer inferens. Adoptere mindre AI-modeller med presise bruksområder. Omfavne åpne kildekode-modeller og -programvare for å redusere treningsskylden. Empower utviklere til å løse problemer effektivt og utdanne ikke-tekniske AI-brukere. Selskaper som ønsker å oppmuntre ansatte til å bruke AI, må gjøre det ansvarlig.
Til tross for prisøkninger, har vi ikke bremses opp AI-transformasjonen. Å operasjonalisere AI i stor skala var alltid et dyrt foretak, som krever nøye planlegging og strategisk kapitalallokering for å forbli bærekraftig. Der vi er nå, er et knippepunkt: bevegelsene IT-lederne gjør nå, vil bestemme hvem som kommer gjennom, og hvem blir igjen.
Mens industrien mobiliserer for å løse den brytende beregningskrisen, må bedrifter finne måter å klare seg med det de har. Selskaper kan beskytte seg mot astronomiske AI-utgifter ved å adresse overutgifter på sky-løsninger, økonomisere inferens over en distribuert sky, og investere i infrastruktur som fremmer virkelig avkastning.












