Connect with us

Thought leaders

AI-kosten versnellen — Hierdoor blijven ze onder controle

mm

Het gebruik van de cloud blijft stijgen, evenals de daarmee samenhangende kosten — in het bijzonder, de laatste tijd, die door AI worden aangedreven. Gartner-analisten voorspellen dat de wereldwijde uitgaven van eindgebruikers voor openbare cloudservices in 2025 zullen stijgen tot $723,4 miljard in 2025, tegenover slechts onder de $600 miljard in 2024. En 70% van de executives die zijn ondervraagd in een IBM-rapport noemden generatieve AI als een kritieke driver van deze toename.

Op hetzelfde moment zorgde China’s DeepSeek voor ophef toen het beweerde dat het slechts twee maanden en $6 miljoen kostte om zijn AI-model te trainen. Er is enige twijfel of deze cijfers het hele verhaal vertellen, maar als de nog steeds geschokte aandelenkoersen van Microsoft en Nvidia enige indicatie zijn, wekte de aankondiging de westerse wereld op voor de noodzaak van kostenefficiënte AI-systemen.

Tot nu toe konden bedrijven de stijgende AI-kosten behandelen als R&D-afschrijvingen. Maar AI-kosten — vooral die welke samenhangen met succesvolle producten en functies — zullen uiteindelijk de kostprijs van de goederen (COGS) van bedrijven en, gevolglich, hun brutowinstmarges raken. AI-innovaties zouden altijd onderworpen zijn aan de strenge controle van het zakenverstand; DeepSeek’s bomshell-aankondiging verkortte deze tijdlijn alleen maar.

Net zoals ze dat doen met de rest van de openbare cloud, zullen bedrijven hun AI-kosten moeten beheren, inclusief zowel trainings- als consumptiekosten. Ze zullen AI-uitgaven moeten koppelen aan bedrijfsresultaten, AI-infrastructuurkosten moeten optimaliseren, prijzings- en verpakkingsstrategieën moeten verfijnen en het rendement op hun AI-investeringen moeten maximaliseren.

Hoe kunnen ze dat doen? Met cloud-eenheidskosten (CUE).

Wat is cloud-eenheidskosten (CUE)?

CUE omvat de meting en maximalisatie van cloud-gedreven winst. De fundamentale mechanisme is het koppelen van cloudkostengegevens met klantvraag en omzetgegevens, waardoor de meest en minst winstgevende dimensies van een bedrijf zichtbaar worden en bedrijven laten zien hoe en waar ze moeten optimaliseren. CUE is van toepassing op alle bronnen van cloud-uitgaven, inclusief AI-kosten.

De basis van CUE is kostenallocatie — het organiseren van cloudkosten volgens wie en/of wat ze aandrijft. Gemeenschappelijke allocatiedimensies zijn kosten per klant, kosten per engineersteam, kosten per product, kosten per functie en kosten per microservice. Bedrijven die een modern kostbeheersplatform gebruiken, alloceren kosten vaak in een kader dat hun bedrijfsstructuur weerspiegelt (hun engineeringshiërarchie, platforminfrastructuur, enz.).

Vervolgens is het hart van CUE de eengeheidsmetric, die kostengegevens vergelijkt met vraaggegevens om een bedrijf zijn totale kosten voor dienstverlening te laten zien. Bijvoorbeeld, een B2B-marketingbedrijf zou zijn “kosten per 1.000 berichten” die via zijn platform worden verzonden, willen berekenen. Hiervoor zou het zijn cloudkosten en het aantal verzonden berichten moeten bijhouden, deze gegevens in een enkel systeem moeten invoeren en dat systeem moeten instrueren om zijn cloudkosten te delen door zijn berichten en het resultaat in een dashboard te grafischeren.

Aangezien het bedrijf begon met kostenallocatie, kon het vervolgens zijn kosten per 1.000 berichten bekijken per klant, product, functie, team, microservice of welke andere weergave het ook maar nodig achtte om zijn bedrijfsstructuur weer te geven.

De resultaten:

  • Flexibele zakelijke dimensies waarmee ze hun eenheidsmetric kunnen filteren, waardoor ze kunnen zien welke gebieden van hun bedrijf hun cloudkosten aandrijven
  • Een verhelderende eengeheidsmetric die aantoont hoe efficiënt ze klantvraag nakomen
  • De mogelijkheid om gerichte efficiëntieverbeteringen door te voeren, zoals het herschrijven van infrastructuur, het bijstellen van klantcontracten of het verfijnen van prijzings- en verpakkingsmodellen

CUE in de AI-tijdperk

In het CUE-model zijn AI-kosten slechts een extra bron van cloud-uitgaven die in een bedrijfsallocatiekader kunnen worden opgenomen. De manier waarop AI-bedrijven kostengegevens verspreiden, is nog in ontwikkeling, maar in principe behandelen kostbeheersplatforms AI-kosten op dezelfde manier als AWS-, Azure-, GCP- en SaaS-kosten.

Moderne cloudkostbeheersplatforms alloceren AI-kosten en laten hun efficiëntie-impact zien in de context van eenheidsmetrics.

Bedrijven zouden hun AI-kosten op een handvol intuïtieve manieren moeten alloceren. Een daarvan is de eerder genoemde kosten per team, een allocatiedimensie die gemeenschappelijk is voor alle bronnen van cloud-uitgaven, waardoor de kosten zichtbaar worden die elk engineersteam verantwoordelijk is. Dit is vooral nuttig omdat leiders exact weten wie ze moeten informeren en verantwoordelijk moeten stellen wanneer de kosten van een bepaald team plotseling stijgen.

Bedrijven zouden ook hun kosten per AI-servicetype willen weten — machine learning (ML)-modellen versus foundation-modellen versus third-party-modellen zoals OpenAI. Of ze zouden hun kosten per SDLC-fase kunnen berekenen om te begrijpen hoe de kosten van een AI-geactiveerde functie veranderen wanneer deze van ontwikkeling naar testen naar staging en uiteindelijk naar productie gaat. Een bedrijf zou nog meer gedetailleerd kunnen zijn en zijn kosten per AI-ontwikkelingslevenscyclusfase berekenen, inclusief gegevensreiniging, opslag, modelcreatie, modeltraining en inferentie.

Als we even uit de details stappen: CUE betekent het vergelijken van georganiseerde cloudkostengegevens met klantvraaggegevens en vervolgens bepalen waar te optimaliseren. AI-kosten zijn slechts een extra bron van cloudkostengegevens die, met het juiste platform, naadloos in een bedrijfsalgemene CUE-strategie passen.

De COGS-tsunami vermijden

Vanaf 2024 hadden slechts 61% van de bedrijven formeel cloudkostbeheerssystemen geïmplementeerd (volgens een CloudZero-enquête). Onbeheerde cloudkosten worden al snel onbeheerbaar: 31% van de bedrijven — vergelijkbaar met het deel dat zijn kosten niet formeel beheert — lijdt onder een grote COGS-klap, waarbij cloudkosten 11% of meer van hun omzet verbruiken. Onbeheerde AI-kosten zullen deze trend alleen maar verergeren.

Vandaag de dag behandelen de meest vooruitstrevende organisaties cloudkosten als elke andere grote uitgave, berekenen het rendement op de investering, breken dat rendement op de investering af naar hun meest kritieke zakelijke dimensies en voorzien de desbetreffende teamleden van de gegevens die nodig zijn om dat rendement op de investering te optimaliseren. Next-generation cloudkostbeheersplatforms bieden een alomvattende CUE-workflow, waardoor bedrijven de COGS-tsunami kunnen vermijden en hun langetermijnlevensvatbaarheid kunnen versterken.

Bill Buckley is een ervaren technisch directeur met een rijke achtergrond in software engineering en product management. Met een carrière die zich uitstrekt over bekende bedrijven zoals EMC, Unidesk, Citrix, en nu CloudZero, brengt Bill een grote hoeveelheid ervaring en expertise mee naar zijn rol als senior vice president van engineering.