Des leaders d'opinion
Les coûts de l'IA s'accélèrent : voici comment les maîtriser

L'utilisation du cloud continue de grimper en flèche, tout comme les coûts associés, notamment, ces derniers temps, ceux liés à l'IA. Les analystes de Gartner prévoient que les dépenses mondiales des utilisateurs finaux en services de cloud public augmenteront jusqu'à 723.4 milliards de dollars en 2025, contre un peu moins de 600 milliards de dollars en 2024. Et 70% des cadres Selon un rapport d'IBM, l'IA générative est citée comme un moteur essentiel de cette augmentation.
Dans le même temps, DeepSeek, une société chinoise, a fait des vagues en affirmant qu'il n'avait fallu que deux mois et 6 millions de dollars pour entraîner son modèle d'IA. On peut se demander si ces chiffres sont révélateurs, mais si l'on en croit les cours des actions de Microsoft et de Nvidia, encore sous le choc, cette annonce a éveillé le monde occidental à la nécessité de systèmes d'IA rentables.
Jusqu'à présent, les entreprises ont pu considérer les coûts croissants de l'IA comme des pertes de R&D. Mais les coûts de l'IA, notamment ceux liés aux produits et fonctionnalités performants, finiront par peser sur le coût des produits vendus (COGS) des entreprises et, par conséquent, sur leurs marges brutes. Les innovations en matière d'IA étaient vouées à l'échec ; l'annonce choc de DeepSeek vient de raccourcir ce délai.
Tout comme pour le reste du cloud public, les entreprises devront gérer leurs coûts d'IA, y compris les coûts de formation et de consommation. Elles devront associer les dépenses d'IA aux résultats commerciaux, optimiser les coûts d'infrastructure d'IA, affiner les stratégies de tarification et de packaging, et maximiser le retour sur investissement de leurs solutions.
Comment y parvenir ? Grâce à l'économie des unités cloud (CUE).
Qu'est-ce que l'économie des unités cloud (CUE) ?
Le CUE permet de mesurer et de maximiser les profits générés par le cloud. Son mécanisme fondamental consiste à relier les données de coûts du cloud à celles de la demande client et du chiffre d'affaires, révélant ainsi les dimensions les plus et les moins rentables d'une entreprise et indiquant ainsi comment et où optimiser ses activités. Le CUE s'applique à toutes les sources de dépenses liées au cloud, y compris les coûts liés à l'IA.
Le fondement du CUE est répartition des coûts — organiser les coûts du cloud en fonction de leurs déterminants. Les dimensions d'allocation courantes incluent le coût par client, par équipe d'ingénierie, par produit, par fonctionnalité et par microservice. Les entreprises utilisant une plateforme moderne de gestion des coûts répartissent souvent leurs coûts selon un cadre reflétant leur structure opérationnelle (hiérarchie d'ingénierie, infrastructure de la plateforme, etc.).
Ensuite, le cœur de CUE est le mesure du coût unitaire, qui compare les données de coût à celles de la demande pour indiquer à une entreprise son coût global de service. Par exemple, une agence de marketing B2B pourrait vouloir calculer son « coût pour 1,000 XNUMX messages » envoyés via sa plateforme. Pour ce faire, elle devrait suivre ses coûts cloud et le nombre de messages envoyés, alimenter un système unique avec ces données, puis demander à ce système de diviser ses coûts cloud par le nombre de messages et de représenter graphiquement le résultat dans un tableau de bord.
Depuis que l'entreprise a commencé avec la répartition des coûts, elle pouvait alors visualiser son coût pour 1,000 XNUMX messages par client, produit, fonctionnalité, équipe, microservice ou toute autre vue qu'elle jugeait représentative de sa structure commerciale.
Les résultats:
- Flexible dimensions de l'entreprise grâce auquel ils peuvent filtrer leur mesure de coût unitaire, leur montrant quels domaines de leur activité génèrent leurs coûts cloud
- Un éclairage mesure du coût unitaire cela leur montre avec quelle efficacité ils répondent à la demande des clients
- La capacité d'apporter des améliorations ciblées en matière d'efficacité, comme la refactorisation de l'infrastructure, l'ajustement des contrats clients ou l'affinement des modèles de tarification et de packaging
CUE à l'ère de l'IA
Dans le modèle CUE, les coûts de l'IA ne sont qu'une source supplémentaire de dépenses cloud pouvant être intégrée au cadre d'allocation des ressources d'une entreprise. La manière dont les entreprises d'IA diffusent les données sur les coûts est encore en évolution, mais en principe, les plateformes de gestion des coûts traitent les coûts de l'IA de la même manière qu'elles traitent les coûts d'AWS, d'Azure, de GCP et du SaaS.
Les plateformes modernes de gestion des coûts du cloud allouent les coûts de l’IA et montrent leur impact sur l’efficacité dans le contexte des mesures de coûts unitaires.
Les entreprises devraient répartir leurs coûts d'IA de plusieurs manières intuitives. L'une d'elles serait le coût par équipe, mentionné plus haut, une dimension de répartition commune à toutes les sources de dépenses cloud, indiquant les coûts dont chaque équipe d'ingénierie est responsable. Cette approche est particulièrement utile, car les dirigeants savent précisément qui informer et tenir responsable en cas de pic de coûts pour une équipe donnée.
Les entreprises pourraient également vouloir connaître leur coût par type de service d'IA — modèles d'apprentissage automatique (ML) comparés aux modèles de base et aux modèles tiers comme OpenAI. Ils pourraient également calculer leur coût par étape du cycle de développement logiciel (SDLC) pour comprendre l'évolution des coûts d'une fonctionnalité basée sur l'IA entre le développement, les tests, la mise en production et enfin la production. Une entreprise pourrait aller encore plus loin et calculer son coût par étape du cycle de développement de l'IA, incluant le nettoyage des données, le stockage, la création et l'entraînement des modèles, ainsi que l'inférence.
Pour aller plus loin : l'optimisation de l'expérience utilisateur (CUE) consiste à comparer les données de coûts cloud organisées avec les données de demande client, puis à déterminer les axes d'optimisation. Les coûts de l'IA ne sont qu'une source supplémentaire de données sur les coûts cloud qui, avec la plateforme adéquate, s'intègrent parfaitement à la stratégie CUE globale d'une entreprise.
Éviter le tsunami du COGS
Depuis 2024, seulement 61% des entreprises Des systèmes formalisés de gestion des coûts du cloud étaient en place (selon une enquête CloudZero). Les coûts du cloud non gérés deviennent rapidement ingérables : 31 % des entreprises, tout comme celles qui ne gèrent pas formellement leurs coûts, subissent des baisses importantes de leur coût des marchandises vendues (COGS), indiquant que les coûts du cloud absorbent 11 % ou plus de leur chiffre d'affaires. La non-gestion des coûts de l'IA ne fera qu'exacerber cette tendance.
Les entreprises les plus avant-gardistes d'aujourd'hui traitent les coûts du cloud comme n'importe quelle autre dépense importante : elles calculent leur retour sur investissement, le décomposent selon leurs dimensions métier les plus critiques et fournissent aux équipes concernées les données nécessaires à l'optimisation de ce retour sur investissement. Les plateformes de gestion des coûts cloud de nouvelle génération offrent un workflow CUE complet, aidant les entreprises à éviter la vague de coûts des marchandises vendues et à consolider leur viabilité à long terme.