Tankeledere
AI-kostnadene akselererer – Slik holder du dem under kontroll

Skybruken fortsetter å øke, og det samme gjør de tilknyttede kostnadene - spesielt på det siste, de som er drevet av AI. Gartner-analytikere spår at verdensomspennende sluttbrukerutgifter på offentlige skytjenester vil øke til $ 723.4 milliarder i 2025, opp fra i underkant av 600 milliarder dollar i 2024. Og 70% av ledere undersøkt i en IBM-rapport siterte generativ AI som en kritisk driver for denne økningen.
Samtidig gjorde Kinas DeepSeek bølger da det hevdet det tok bare to måneder og 6 millioner dollar å trene sin AI-modell. Det er noen tvil om disse tallene forteller hele historien, men hvis Microsoft og Nvidias fortsatt rykkete aksjekurser er noen indikasjon, vekket kunngjøringen den vestlige verden til behovet for kostnadseffektive AI-systemer.
Til dags dato har selskaper vært i stand til å behandle økende AI-kostnader som FoU-avskrivninger. Men AI-kostnader - spesielt de som er forbundet med vellykkede produkter og funksjoner - vil til slutt ramme bedriftenes varekostnader (COGS) og følgelig deres bruttomarginer. AI-innovasjoner var alltid bestemt til å møte den kalde granskningen av forretningssans; DeepSeeks bombekunngjøring forkortet akkurat den tidslinjen.
Akkurat som de gjør med resten av den offentlige skyen, vil selskaper måtte administrere AI-kostnadene sine, inkludert både opplærings- og forbrukskostnader. De må koble AI-utgifter til forretningsresultater, optimalisere AI-infrastrukturkostnader, avgrense pris- og pakkestrategier og maksimere avkastningen på AI-investeringene sine.
Hvordan kan de gjøre det? Med skyenhetsøkonomi (CUE).
Hva er skyenhetsøkonomi (CUE)?
CUE omfatter måling og maksimering av skydrevet profitt. Dens grunnleggende mekanisme er å koble skykostnadsdata med kundebehov og inntektsdata, avsløre de mest og minst lønnsomme dimensjonene til en virksomhet og dermed vise bedrifter hvordan og hvor de kan optimalisere. CUE gjelder for alle kilder til skyutgifter, inkludert AI-kostnader.
Grunnlaget for CUE er kostnadsfordeling — organisere skykostnader etter hvem og/eller hva som driver dem. Vanlige tildelingsdimensjoner inkluderer kostnad per kunde, kostnad per ingeniørteam, kostnad per produkt, kostnad per funksjon og kostnad per mikrotjeneste. Bedrifter som bruker en moderne kostnadsstyringsplattform, allokerer ofte kostnader i et rammeverk som gjenspeiler deres forretningsstruktur (deres ingeniørhierarki, plattforminfrastruktur, etc.).
Deretter er hjertet til CUE enhetskostnadsberegning, som sammenligner kostnadsdata med etterspørselsdata for å vise et selskap deres totalkostnad for å betjene. For eksempel kan et B2B-markedsføringsselskap ønske å beregne "kostnaden per 1,000 meldinger" sendt via plattformen. For å gjøre dette, må det spore skykostnadene og antall sendte meldinger, mate disse dataene inn i et enkelt system, og instruere systemet om å dele skykostnadene etter meldingene og tegne resultatet i et dashbord.
Siden selskapet startet med kostnadsfordeling, kunne det se kostnadene per 1,000 meldinger etter kunde, produkt, funksjon, team, mikrotjeneste eller hvilken som helst annen oppfatning det anså som reflekterer forretningsstrukturen.
Resultatene:
- Fleksibel forretningsdimensjoner som de kan filtrere enhetskostnadsverdien etter, og vise dem hvilke områder av virksomheten som driver skykostnadene deres
- En lysende enhetskostnadsberegning som viser dem hvor effektivt de møter kundenes behov
- Evnen til å foreta målrettede effektivitetsforbedringer, som å omstrukturere infrastruktur, justere kundekontrakter eller avgrense pris- og pakkemodeller
CUE i AI-alderen
I CUE-modellen er AI-kostnader bare en ekstra kilde til skyutgifter som kan innlemmes i en virksomhets allokeringsramme. Måten AI-selskaper formidler kostnadsdata på, er fortsatt under utvikling, men i prinsippet behandler kostnadsstyringsplattformer AI-kostnader på omtrent samme måte som de behandler AWS-, Azure-, GCP- og SaaS-kostnader.
Moderne skykostnadsadministrasjonsplattformer allokerer AI-kostnader og viser deres effektivitetseffekt i sammenheng med enhetskostnadsberegninger.
Bedrifter bør fordele sine AI-kostnader på en rekke intuitive måter. En av dem ville være den nevnte kostnaden per team, en fordelingsdimensjon som er felles for alle kilder til skyutgifter, og som viser kostnadene som hvert ingeniørteam er ansvarlig for. Dette er spesielt nyttig fordi ledere vet nøyaktig hvem de skal varsle og holde ansvarlig når et bestemt teams kostnader stiger kraftig.
Bedrifter vil kanskje også vite deres kostnad per AI-tjenestetype — maskinlæringsmodeller (ML) versus grunnmodeller versus tredjepartsmodeller som OpenAI. Eller de kan beregne kostnadene sine per SDLC-trinn for å forstå hvordan kostnadene til en AI-drevet funksjon endres når den går fra utvikling til testing til iscenesettelse og til slutt til produksjon. Et selskap kan bli enda mer detaljert og beregne kostnadene per AI-utviklingsfase, inkludert datarensing, lagring, modelloppretting, modellopplæring og slutninger.
Zoome litt ut fra ugresset: CUE betyr å sammenligne organiserte skykostnadsdata med kundebehovsdata og deretter finne ut hvor du skal optimalisere. AI-kostnader er bare en kilde til skykostnadsdata som, med riktig plattform, passer sømløst inn i et selskaps overordnede CUE-strategi.
Unngå COGS-tsunamien
Fra og med 2024, bare 61% av selskapene hadde formaliserte skykostnadsstyringssystemer på plass (i henhold til en CloudZero-undersøkelse). Uadministrerte skykostnader blir snart uhåndterlige: 31 % av selskapene – i likhet med den delen som ikke formelt administrerer kostnadene sine – lider av store COGS-treff, og rapporterer at skykostnadene bruker 11 % eller mer av inntektene deres. Ustyrte AI-kostnader vil bare forverre denne trenden.
Dagens mest fremtidsrettede organisasjoner behandler skykostnader som alle andre store utgifter, beregner ROI, deler denne ROI ned etter deres mest kritiske forretningsdimensjoner, og gir de relevante teammedlemmene de dataene som trengs for å optimalisere denne ROIen. Neste generasjons skykostnadsadministrasjonsplattformer tilbyr en omfattende CUE-arbeidsflyt, som hjelper bedrifter med å unngå COGS-tsunamien og styrke langsiktig levedyktighet.