Des leaders d'opinion
Ce que DeepSeek peut nous apprendre sur le coût et l'efficacité de l'IA

Avec son joli logo de baleine, la récente sortie de DeepSeek aurait pu n'être rien de plus qu'une énième copie de ChatGPT. Ce qui l'a rendu si médiatisé – et qui a fait chuter les actions de ses concurrents – c'est le faible coût de sa création. Elle a effectivement remis en cause la notion américaine de l'investissement nécessaire pour former un Large Language Model (LLM) hautement fonctionnel.
DeepSeek n’aurait dépensé que 6 millions de dollars pour former son modèle d’IA. Comparez cela aux 80 à 100 millions de dollars qu’OpenAI aurait dépensés pour Chat GPT-4 ou au milliard de dollars qu’ils ont mis de côté pour GPT-1. DeepSeek remet en question ce niveau d’investissement et laisse de grands acteurs comme Nvidia – dont la valeur des actions a chuté de 5 milliards de dollars en une journée – TSMC et Microsoft inquiets de la viabilité financière à long terme de l’IA. S’il est possible de former des modèles d’IA pour beaucoup moins que prévu, qu’est-ce que cela présage pour les dépenses globales en IA ?
Bien que la perturbation de DeepSeek ait donné lieu à d’importantes discussions, certains points clés semblent se perdre dans la confusion. Cependant, cette nouvelle met davantage l’accent sur le coût de l’innovation et sur l’impact économique possible de l’IA. Voici trois enseignements importants qui ressortent de cette nouvelle :
1. Le prix de 6 millions de dollars de DeepSeek est trompeur
Les entreprises doivent comprendre le coût total de possession (TCO) de leur infrastructure. Bien que le prix de 6 millions de dollars de DeepSeek ait été largement évoqué, il s'agit probablement du coût de son exécution préalable à la formation plutôt que de son investissement total. Le coût total – non seulement de l'exécution, mais aussi de la création et de la formation de DeepSeek – est probablement beaucoup plus élevé. Cabinet d'analyse du secteur Semi-analyse L'entreprise à l'origine de DeepSeek a dépensé 1.6 milliard de dollars en matériel informatique pour concrétiser son LLM. Le coût se situe donc probablement quelque part entre les deux.
Quel que soit le coût réel, l’avènement de DeepSeek a mis l’accent sur l’innovation rentable qui pourrait être transformatrice. L’innovation est souvent stimulée par des limitations, et le succès de DeepSeek souligne la manière dont l’innovation peut se produire lorsque les équipes d’ingénierie optimisent leurs ressources face aux contraintes du monde réel.
2. C'est l'inférence qui rend l'IA précieuse, pas la formation
Il est important de prêter attention au coût de la formation du modèle d’IA, mais la formation représente une petite partie du coût global de création et d’exécution d’un modèle d’IA. Inférence — les multiples façons dont l’IA change la façon dont les gens travaillent, interagissent et vivent — c’est là que l’IA devient vraiment précieuse.
Cela nous amène au paradoxe de Jevons, une théorie économique suggérant que lorsque les progrès technologiques rendent l’utilisation d’une ressource plus efficace, la consommation globale de cette ressource peut en réalité augmenter. En d’autres termes, à mesure que les coûts de formation diminuent, l’inférence et la consommation agentique augmentent, et les dépenses globales suivent le même chemin.
L’efficacité de l’IA pourrait en fait conduire à une augmentation des dépenses dans ce domaine, ce qui devrait profiter à tous les bateaux, pas seulement aux Chinois. En supposant qu’ils surfent sur la vague de l’efficacité, des entreprises comme OpenAI et Nvidia en bénéficieront également.
3. Ce qui reste vrai, c'est que l'économie unitaire est ce qui compte le plus
Rendre l'IA plus efficace ne se résume pas seulement à réduire les coûts ; il s'agit également d'optimiser l'économie unitaire. The Motley Fool prévoit que cette année sera l'année de l'efficacité de l'IASi elles ont raison, les entreprises devraient veiller à réduire leurs coûts de formation en IA ainsi que leurs coûts de consommation d’IA.
Les entreprises qui développent ou utilisent l'IA doivent connaître leurs paramètres économiques plutôt que de se contenter de chiffres impressionnants comme le coût de formation de 6 millions de dollars de DeepSeek. Une véritable efficacité implique de répartir tous les coûts, de suivre la demande générée par l'IA et de garder un œil constant sur le rapport coût/valeur.
L'économie des unités cloud (CUE) consiste à mesurer et à maximiser les bénéfices générés par le cloud. CUE compare vos coûts cloud aux indicateurs de revenus et de demande, révélant l'efficacité de vos dépenses cloud, leur évolution au fil du temps et (si vous disposez de la bonne plateforme) les meilleurs moyens d'augmenter cette efficacité.
La compréhension de CUE est encore plus utile dans un contexte d’IA, étant donné qu’elle est intrinsèquement plus coûteuse à consommer que les services cloud traditionnels vendus par les hyperscalers. Les entreprises qui créent des applications agentiques pourraient calculer leur coût par transaction (par exemple, coût par facture, coût par livraison, coût par transaction, etc.) et l’utiliser pour évaluer le retour sur investissement de services, produits et fonctionnalités spécifiques basés sur l’IA. À mesure que les dépenses en IA augmentent, les entreprises seront obligées de le faire ; aucune entreprise ne peut indéfiniment consacrer des sommes infinies à l’innovation expérimentale. Au bout du compte, cela doit avoir un sens commercial.
Vers une plus grande efficacité
Aussi significatif que soit le montant de 6 millions de dollars, DeepSeek a peut-être marqué un tournant qui a fait prendre conscience à l'industrie technologique de l'importance inévitable de l'efficacité. Espérons que cela ouvre les vannes d'une formation, d'une inférence et d'applications agentiques rentables qui libèrent le véritable potentiel et le retour sur investissement de l'IA.