Connect with us

Leaders d’opinion

L’essor de l’IA n’a pas éclaté, mais l’informatique IA est définitivement en train de changer

mm

Ne craignez pas trop les ours de l’IA. Ils se demandent à haute voix si le grand essor des investissements dans l’IA est déjà venu et parti, si l’excitation du marché et les dépenses pour les systèmes de formation IA massifs alimentés par des multitudes de GPU haute performance se sont estompées, et si les attentes pour l’ère de l’IA devraient être radicalement réduites.

Mais si vous examinez de plus près les plans des grands hyperscalers, les investissements dans l’IA sont toujours vivants. Meta, Amazon, Microsoft et Google ont tous récemment doublé leurs investissements dans la technologie IA. Leur engagement collectif pour 2025 s’élève à plus de 300 milliards de dollars, selon un récent article du Financial Times. Le PDG de Microsoft, Satya Nadella, a déclaré que Microsoft pourrait dépenser 80 milliards de dollars rien que pour l’IA cette année. Le fondateur et PDG de Meta, Mark Zuckerberg, a déclaré sur Facebook : « Nous prévoyons d’investir 60-65 milliards de dollars en capex cette année, tout en faisant croître nos équipes IA de manière significative, et nous avons les capitaux pour continuer à investir dans les années à venir. »

Ce n’est pas le son d’un essor de l’IA qui éclate, mais il y a eu un malaise croissant autour de la somme d’argent dépensée pour permettre les applications IA. Après au moins deux ans pendant lesquels les géants de la technologie disaient qu’ils voyaient une demande claire pour plus de puissance de calcul pour aider à former des modèles IA massifs, 2025 a commencé avec ces mêmes sociétés étant appelées quotidiennement par les médias économiques pour avoir créé tant d’hystérie autour de l’IA.

Pourquoi y a-t-il eu un changement si soudain de l’espoir à la préoccupation ? La réponse se trouve en partie dans la montée rapide d’une nouvelle application IA de Chine. Mais pour comprendre vraiment ce qui se passe réellement et ce que cela signifie pour les investissements et les programmes technologiques IA dans les années à venir, nous devons reconnaître que l’ère de l’IA est en train de passer à une nouvelle phase de son évolution.

DeepSeeking la vérité

Aujourd’hui, le monde connaît tout sur DeepSeek, la société chinoise d’IA qui vantait comment elle a utilisé des moteurs d’inférence et un raisonnement statistique pour former des modèles de langage de grande taille de manière beaucoup plus efficace et avec moins de coûts que les autres sociétés n’ont formé leurs modèles.

Plus précisément, DeepSeek a affirmé que ses techniques ont abouti à nécessiter nettement moins de GPU (aussi peu que 2 048 GPU), ainsi que des GPU moins puissants (Nvidia H800) que les centaines de milliers de GPU haute performance (comme les Nvidia H100) que certaines sociétés hyperscalers ont nécessité pour former leurs modèles. En termes d’économies de coûts, alors qu’OpenAI a dépensé des milliards de dollars pour former ChatGPT, DeepSeek aurait dépensé aussi peu que 6,5 millions de dollars pour former son modèle R1.

Il convient de noter que de nombreux experts ont mis en doute les allégations de DeepSeek concernant ses dépenses, mais les dégâts étaient déjà faits, car les nouvelles de ses méthodes différentes ont entraîné un déclin important des valeurs boursières des hyperscalers et des sociétés dont les GPU ont coûté des milliards pour former leurs modèles IA.

Cependant, deux points importants ont été perdus dans le chaos. Le premier est une compréhension du fait que DeepSeek n’a pas « inventé » une nouvelle façon de travailler avec l’IA. Le second est que la majeure partie de l’écosystème IA était déjà conscient d’un changement imminent dans la façon dont les dollars d’investissement IA doivent être dépensés et de la façon dont l’IA elle-même sera mise à profit dans les années à venir.

En ce qui concerne les méthodes de DeepSeek, l’idée d’utiliser des moteurs d’inférence IA et un raisonnement statistique n’est rien de nouveau. L’utilisation d’un raisonnement statistique est un aspect du concept plus large du raisonnement du modèle d’inférence, qui implique que l’IA peut tirer des inférences sur la base de la reconnaissance de modèles. C’est essentiellement similaire à la capacité humaine à apprendre différentes façons d’aborder un problème et à les comparer pour trouver la meilleure solution possible. Le raisonnement du modèle d’inférence peut être utilisé aujourd’hui et n’est pas exclusif à une startup chinoise.

Pendant ce temps, l’écosystème IA a déjà anticipé depuis un certain temps un changement fondamental dans la façon dont nous travaillons avec l’IA et les ressources informatiques requises. Les premières années de l’ère de l’IA ont été toutes consacrées au grand travail de formation de grands modèles IA sur de très grands ensembles de données, qui ont tous nécessité beaucoup de traitement, de calculs complexes, d’ajustements de poids et de dépendance à la mémoire. Une fois les modèles IA formés, les choses changent. L’IA peut utiliser l’inférence pour appliquer tout ce qu’elle a appris à de nouveaux ensembles de données, tâches et problèmes. L’inférence, en tant que processus moins intensif en calcul que la formation, n’exige pas autant de GPU ou de ressources informatiques.

La vérité ultime sur DeepSeek est que même si ses méthodes n’ont pas autant surpris la plupart d’entre nous dans l’écosystème IA que les investisseurs du marché boursier occasionnels, elles ont mis en évidence l’une des façons dont l’inférence sera au cœur de la prochaine phase de l’évolution de l’IA.

IA : La prochaine génération

La promesse et le potentiel de l’IA n’ont pas changé. Les investissements massifs et continus dans l’IA par les grands hyperscalers montrent la confiance qu’ils ont dans la valeur future qu’ils peuvent débloquer à partir de l’IA, ainsi que les façons dont l’IA peut changer la façon dont pratiquement toutes les industries travaillent et dont pratiquement toutes les personnes mènent leur vie quotidienne.

Ce qui a changé pour ces hyperscalers, c’est la façon dont ces dollars seront probablement dépensés. Dans les premières années de l’ère de l’IA, la majeure partie de l’investissement était nécessairement consacrée à la formation. Si vous pensez à l’IA comme à un enfant, avec un esprit encore en développement, nous avons dépensé beaucoup d’argent pour l’envoyer dans les meilleures écoles et universités. Maintenant, cet enfant est un adulte éduqué – et il a besoin de trouver un emploi pour subvenir à ses besoins. En termes réels, nous avons investi beaucoup dans la formation de l’IA, et maintenant nous devons voir le retour sur cet investissement en utilisant l’IA pour générer de nouveaux revenus.

Pour réaliser ce retour sur investissement, l’IA doit devenir plus efficace et moins coûteuse pour aider les entreprises à maximiser son attrait pour le marché et son utilité pour autant d’applications que possible. Les nouveaux services les plus lucratifs seront les services autonomes qui ne nécessitent pas de surveillance et de gestion humaines.

Pour de nombreuses sociétés, cela signifie utiliser des techniques de calcul IA efficaces en termes de ressources, telles que le raisonnement du modèle d’inférence, pour permettre rapidement et de manière rentable des communications autonomes entre machines. Par exemple, dans l’industrie sans fil, l’IA peut être utilisée pour analyser de manière autonome les données en temps réel sur l’utilisation du spectre sur un réseau mobile pour optimiser l’utilisation du canal et atténuer les interférences entre les utilisateurs, ce qui permet finalement à un opérateur mobile de prendre en charge un partage de spectre plus dynamique sur son réseau. Ce type de communication entre machines IA plus efficace et autonome définira la prochaine génération de l’IA.

Comme cela a été le cas pour chaque autre grande ère de l’informatique, l’informatique IA continue d’évoluer. Si l’histoire de l’informatique nous a appris quelque chose, c’est que les nouvelles technologies nécessitent toujours beaucoup d’investissements initiaux, mais les coûts diminueront et l’efficacité augmentera à mesure que nous commencerons à utiliser des techniques améliorées et de meilleures pratiques pour créer des produits et des services plus bénéfiques et abordables pour attirer les marchés les plus grands possibles. L’innovation trouve toujours un moyen.

Le secteur de l’IA peut avoir récemment semblé subir un revers si vous écoutez les ours de l’IA, mais les dollars que les hyperscalers prévoient de dépenser cette année et l’utilisation croissante de techniques basées sur l’inférence racontent une histoire différente : l’informatique IA est en train de changer, mais la promesse de l’IA est toujours intacte.

Fernando a rejoint Digital Global Systems (DGS) en 2013 en provenance de PriceWaterhouseCoopers où il occupait plusieurs postes de direction aux États-Unis et en Amérique latine.

Fernando a été à la pointe de modèles d'investissement innovants pour des entreprises technologiques de pointe ; de partenariats novateurs utilisant des structures légères en CAPEX ; et d'une vision stratégique de la valeur commerciale tirant parti de nouvelles technologies et de structures opérationnelles. Dans ses rôles, Fernando a créé une valeur commerciale significative pour les entreprises en utilisant des portefeuilles de propriété intellectuelle uniques et des innovations émergentes dans les données, l'analyse et l'intelligence artificielle.