Leaders d’opinion
Les coûts de l’IA s’accélèrent — Voici comment les contrôler

L’utilisation du cloud continue de croître, ainsi que les coûts associés — en particulier, ces derniers temps, ceux générés par l’IA. Les analystes de Gartner prévoient que les dépenses mondiales des utilisateurs finals pour les services cloud publics atteindront 723,4 milliards de dollars en 2025, contre moins de 600 milliards de dollars en 2024. Et 70% des dirigeants interrogés dans un rapport d’IBM ont cité l’IA générative comme un facteur clé de cette augmentation.
En même temps, la DeepSeek chinoise a fait les gros titres lorsqu’elle a affirmé qu’il lui a fallu seulement deux mois et 6 millions de dollars pour former son modèle d’IA. Il y a quelques doutes sur le fait que ces chiffres racontent toute l’histoire, mais si les cours de Bourse de Microsoft et Nvidia sont encore sous le choc, l’annonce a réveillé le monde occidental sur la nécessité de systèmes d’IA efficaces en termes de coûts.
Jusqu’à présent, les entreprises ont pu considérer les coûts d’IA croissants comme des écritures de recherche et développement. Mais les coûts d’IA — en particulier ceux associés à des produits et des fonctionnalités réussis — finiront par toucher les coûts des biens vendus (COGS) des entreprises et, par conséquent, leurs marges brutes. Les innovations d’IA étaient destinées à faire face à la froide analyse de la saine gestion ; l’annonce de DeepSeek a simplement accéléré ce délai.
Comme elles le font avec le reste du cloud public, les entreprises devront gérer leurs coûts d’IA, y compris les coûts de formation et de consommation. Elles devront relier les dépenses d’IA aux résultats commerciaux, optimiser les coûts d’infrastructure d’IA, affiner les stratégies de tarification et d’emballage, et maximiser le retour sur leurs investissements d’IA.
Comment peuvent-elles le faire ? Avec l’économie des unités de cloud (CUE).
Qu’est-ce que l’économie des unités de cloud (CUE) ?
La CUE comprend la mesure et la maximisation du profit généré par le cloud. Son mécanisme fondamental est de relier les données de coûts de cloud avec les données de demande et de chiffre d’affaires des clients, révélant les dimensions les plus et les moins rentables d’une entreprise et montrant ainsi aux entreprises comment et où optimiser. La CUE s’applique à toutes les sources de dépenses de cloud, y compris les coûts d’IA.
La base de la CUE est l’allocation des coûts — l’organisation des coûts de cloud selon qui et/ou ce qui les génère. Les dimensions d’allocation courantes incluent le coût par client, le coût par équipe d’ingénieurs, le coût par produit, le coût par fonctionnalité et le coût par microservice. Les entreprises utilisant une plate-forme moderne de gestion des coûts allouent souvent les coûts dans un cadre qui reflète leur structure commerciale (leur hiérarchie d’ingénierie, leur infrastructure de plate-forme, etc.).
Ensuite, le cœur de la CUE est la métrique de coût unitaire, qui compare les données de coûts avec les données de demande pour montrer à une entreprise son coût total pour servir. Par exemple, une entreprise de marketing B2B pourrait vouloir calculer son « coût par 1 000 messages » envoyés via sa plate-forme. Pour cela, elle devrait suivre ses coûts de cloud et le nombre de messages envoyés, intégrer ces données dans un système unique, et demander à ce système de diviser ses coûts de cloud par ses messages et de graphiquer le résultat dans un tableau de bord.
Puisque l’entreprise a commencé par l’allocation des coûts, elle pourrait alors afficher son coût par 1 000 messages par client, produit, fonctionnalité, équipe, microservice, ou toute autre vue qu’elle juge réfléchir sa structure commerciale.
Les résultats :
- Des dimensions commerciales flexibles par lesquelles elles peuvent filtrer leur métrique de coût unitaire, leur montrant quelles zones de leur entreprise génèrent leurs coûts de cloud
- Une métrique de coût unitaire éclairante qui leur montre à quel point elles répondent efficacement à la demande des clients
- La capacité d’apporter des améliorations ciblées d’efficacité, comme réaménager l’infrastructure, ajuster les contrats client, ou affiner les modèles de tarification et d’emballage
CUE à l’ère de l’IA
Dans le modèle CUE, les coûts d’IA ne sont qu’une autre source de dépenses de cloud qui peuvent être intégrées dans le cadre d’allocation d’une entreprise. La façon dont les entreprises d’IA diffusent les données de coûts est encore en évolution, mais en principe, les plate-formes de gestion des coûts de cloud traitent les coûts d’IA de la même manière que les coûts d’AWS, Azure, GCP et SaaS.
Les plate-formes modernes de gestion des coûts de cloud allouent les coûts d’IA et montrent leur impact sur l’efficacité dans le contexte des métriques de coût unitaire.
Les entreprises devraient allouer leurs coûts d’IA de quelques manières intuitives. L’une serait le coût par équipe mentionné ci-dessus, une dimension d’allocation commune à toutes les sources de dépenses de cloud, montrant les coûts pour lesquels chaque équipe d’ingénieurs est responsable. Cela est particulièrement utile car les dirigeants savent exactement qui notifier et tenir responsable lorsque les coûts d’une équipe particulière augmentent.
Les entreprises pourraient également vouloir connaître leur coût par type de service d’IA — les modèles d’apprentissage automatique (ML) par rapport aux modèles de base par rapport aux modèles tiers comme OpenAI. Ou, elles pourraient calculer leur coût par étape du cycle de vie du développement logiciel (SDLC) pour comprendre comment les coûts d’une fonctionnalité alimentée par l’IA changent lorsqu’elle passe du développement au test, au pré-lancement et enfin à la production. Une entreprise pourrait aller encore plus loin et calculer son coût par étape du cycle de vie du développement d’IA, y compris le nettoyage des données, le stockage, la création de modèles, la formation de modèles et l’inférence.
En zoomant un peu hors des détails : CUE signifie comparer les données de coûts de cloud organisées avec les données de demande des clients, puis déterminer où optimiser. Les coûts d’IA ne sont qu’une autre source de données de coûts de cloud qui, avec la bonne plate-forme, s’intègrent parfaitement dans la stratégie CUE globale d’une entreprise.
Éviter le tsunami des COGS
À partir de 2024, seules 61% des entreprises avaient des systèmes de gestion des coûts de cloud formalisés en place (selon une enquête de CloudZero). Les coûts de cloud non gérés deviennent bientôt ingérables : 31% des entreprises — une proportion similaire à celle qui ne gère pas formellement leurs coûts — subissent de graves impacts sur les COGS, signalant que les coûts de cloud consomment 11% ou plus de leurs revenus. Les coûts d’IA non gérés ne feront qu’exacerber cette tendance.
Aujourd’hui, les organisations les plus progressistes traitent les coûts de cloud comme n’importe quelle autre dépense majeure, en calculant leur retour sur investissement, en décomposant ce retour sur investissement par leurs dimensions commerciales les plus critiques, et en dotant les membres de l’équipe concernés des données nécessaires pour optimiser ce retour sur investissement. Les plate-formes de gestion des coûts de cloud de nouvelle génération offrent un flux de travail CUE complet, aidant les entreprises à éviter le tsunami des COGS et à renforcer leur viabilité à long terme.












