Leaders d’opinion
Les mega-modèles ne sont pas la clé de la crise de calcul

Chaque fois qu’un nouveau modèle d’IA est lancé – les mises à jour de GPT, DeepSeek, Gemini – les gens sont impressionnés par la taille, la complexité et de plus en plus, la faim de calcul de ces mega-modèles. L’hypothèse est que ces modèles définissent les besoins de ressources de la révolution de l’IA.
Cette hypothèse est fausse.
Oui, les grands modèles sont gourmands en calcul. Mais la plus grande contrainte sur l’infrastructure d’IA ne vient pas d’un petit nombre de mega-modèles – elle vient de la prolifération silencieuse de modèles d’IA à travers les industries, chacun affiné pour des applications spécifiques, chacun consommant du calcul à une échelle sans précédent.
Malgré la concurrence potentiellement gagnant-tout en développement parmi les LLM, le paysage de l’IA dans son ensemble ne se centralise pas – il se fragmente. Chaque entreprise n’utilise pas seulement l’IA – elles forment, personnalisent et déployent des modèles privés adaptés à leurs besoins. C’est cette dernière situation qui créera une courbe de demande d’infrastructure que les fournisseurs de cloud, les entreprises et les gouvernements ne sont pas prêts à affronter.
Nous avons déjà vu ce schéma. Le cloud n’a pas consolidé les charges de travail d’IT ; il a créé un écosystème hybride étendu. Tout d’abord, c’était la prolifération de serveurs. Ensuite, la prolifération de VM. Maintenant ? La prolifération de l’IA. Chaque vague de calcul a conduit à une prolifération, et non à une simplification. L’IA ne fait pas exception.
La prolifération de l’IA : pourquoi l’avenir de l’IA est un million de modèles, et non un
La finance, la logistique, la cybersécurité, le service client, la R&D – chacun a son propre modèle d’IA optimisé pour sa propre fonction. Les organisations ne forment pas un seul modèle d’IA pour régner sur toute leur opération. Ils forment des milliers. Cela signifie plus de cycles de formation, plus de calcul, plus de demande de stockage et plus de prolifération d’infrastructure.
Ceci n’est pas théorique. Même dans les industries qui sont traditionnellement prudentes quant à l’adoption de la technologie, l’investissement dans l’IA est en accélération. Un rapport de McKinsey de 2024 a constaté que les organisations utilisent maintenant l’IA dans une moyenne de trois fonctions commerciales, avec la fabrication, la chaîne d’approvisionnement et le développement de produits à la tête du peloton (McKinsey).
Les soins de santé sont un exemple primordial. Navina, une startup qui intègre l’IA dans les dossiers médicaux électroniques pour mettre en surface les connaissances cliniques, vient de lever 55 millions de dollars en financement de série C auprès de Goldman Sachs (Business Insider). L’énergie n’est pas différente – les leaders de l’indrie ont lancé le consortium Open Power AI pour apporter l’optimisation de l’IA aux opérations de réseau et d’usine (Axios).
La contrainte de calcul dont personne ne parle
L’IA brise déjà les modèles d’infrastructure traditionnels. L’hypothèse que le cloud peut se développer à l’infini pour soutenir la croissance de l’IA est complètement fausse. L’IA ne se développe pas comme les charges de travail traditionnelles. La courbe de demande n’est pas graduelle – elle est exponentielle, et les hyperscalers ne suivent pas.
- Contraintes de puissance : les centres de données spécifiques à l’IA sont maintenant construits autour de la disponibilité de puissance, et non seulement autour des réseaux de backbone.
- Goulots d’étranglement du réseau : les environnements hybrides d’IT deviennent ingérables sans automation, ce que les charges de travail d’IA ne feront qu’exacerber.
- Pression économique : les charges de travail d’IA peuvent consommer des millions en un seul mois, créant une imprévisibilité financière.
Les centres de données représentent déjà 1 % de la consommation d’électricité mondiale. En Irlande, ils consomment maintenant 20 % du réseau national, une part qui devrait augmenter considérablement d’ici 2030 (IEA).
Ajoutez à cela la pression imminente sur les GPU. Bain & Company a récemment averti que la croissance de l’IA prépare le terrain pour une pénurie de semi-conducteurs, alimentée par une demande explosive de puces de grade de centre de données (Bain).
Pendant ce temps, le problème de durabilité de l’IA grandit. Une analyse de 2024 dans Sustainable Cities and Society avertit que l’adoption généralisée de l’IA dans les soins de santé pourrait augmenter considérablement la consommation d’énergie et les émissions de carbone du secteur, à moins d’être compensée par des efficacités ciblées (ScienceDirect).
La prolifération de l’IA est plus grande que le marché – c’est une question de puissance étatique
Si vous pensez que la prolifération de l’IA est un problème d’entreprise, pensez à nouveau. Le principal moteur de la fragmentation de l’IA n’est pas le secteur privé – ce sont les gouvernements et les agences de défense, qui déployeront l’IA à une échelle que aucun hyperscaler ou entreprise ne peut égaler.
Le gouvernement américain seul a déployé l’IA dans plus de 700 applications à travers 27 agences, couvrant l’analyse d’intelligence, la logistique et plus encore (FedTech Magazine).
Le Canada investit jusqu’à 700 millions de dollars pour étendre la capacité de calcul d’IA domestique, lançant un défi national pour renforcer l’infrastructure de centre de données souveraine (Innovation, Science and Economic Development Canada).
Et il y a des appels croissants pour un « programme Apollo » pour l’infrastructure d’IA – mettant en évidence l’élévation de l’IA d’un avantage commercial à un impératif national (MIT Technology Review).
L’IA militaire ne sera pas efficace, coordonnée ou optimisée pour le coût – elle sera alimentée par des mandats de sécurité nationale, l’urgence géopolitique et le besoin de systèmes d’IA fermés et souverains. Même si les entreprises freinent la prolifération de l’IA, qui va dire aux gouvernements de ralentir ?
Parce que lorsque la sécurité nationale est en jeu, personne ne s’arrête pour demander si le réseau électrique peut le supporter.












