Suivez nous sur

Au-delĂ  de la rĂ©cupĂ©ration : NVIDIA trace la voie vers l'ère de l'informatique gĂ©nĂ©rative

Intelligence Artificielle

Au-delĂ  de la rĂ©cupĂ©ration : NVIDIA trace la voie vers l'ère de l'informatique gĂ©nĂ©rative

mm

NVIDIA Le PDG Jensen Huang a annoncĂ© une sĂ©rie d'avancĂ©es rĂ©volutionnaires dans les capacitĂ©s de calcul de l'IA au siège social de l'entreprise. Discours d'ouverture du GTC de mars 2025, dĂ©crivant ce qu'il a appelĂ© un « point d'inflexion informatique de 1 XNUMX milliards de dollars ». Le discours d'ouverture a rĂ©vĂ©lĂ© l'Ă©tat de prĂ©paration Ă  la production du Architecture GPU Blackwell, une feuille de route pluriannuelle pour les architectures futures, des avancĂ©es majeures dans les rĂ©seaux d'IA, de nouvelles solutions d'IA d'entreprise et des dĂ©veloppements significatifs dans la robotique et l'IA physique.

L'« économie des jetons » et les usines d'IA

Au cœur de la vision de Huang se trouve le concept de « jetons » en tant qu’éléments fondamentaux de l’IA et l’émergence d’« usines d’IA » en tant que centres de données spécialisés conçus pour l’informatique générative.

« C'est ainsi que l'intelligence est créée, un nouveau type d'usine génératrice de jetons, les éléments constitutifs de l'IA. Les jetons ont ouvert de nouvelles perspectives », a déclaré Huang à l'auditoire. Il a souligné que les jetons peuvent « transformer des images en données scientifiques cartographiant des atmosphères extraterrestres », « décoder les lois de la physique » et « détecter les maladies avant qu'elles ne s'installent ».

Cette vision représente une transition de l'« informatique de récupération » traditionnelle vers l'« informatique générative », où l'IA comprend le contexte et génère des réponses plutôt que de simplement récupérer des données préenregistrées. Selon Huang, cette transition nécessite une nouvelle architecture de centre de données où « l'ordinateur devient un générateur de jetons, et non un simple récupérateur de fichiers ».

Keynote GTC de mars 2025 avec le PDG de NVIDIA, Jensen Huang

L'architecture Blackwell offre des gains de performances massifs

L'architecture GPU NVIDIA Blackwell, dĂ©sormais en pleine production, offre ce que l'entreprise revendique comme Ă©tant « 40 fois supĂ©rieur Ă  Hopper Â» pour les modèles de raisonnement dans des conditions de consommation identiques. Cette architecture prend en charge la prĂ©cision FP4, ce qui permet d'amĂ©liorer considĂ©rablement l'efficacitĂ© Ă©nergĂ©tique.

« La puissance ISO de Blackwell est 25 fois supérieure », a déclaré Huang, soulignant les gains d'efficacité spectaculaires de la nouvelle plateforme.

L'architecture Blackwell prend également en charge une évolutivité extrême grâce à des technologies comme NVLink 72, permettant la création de systèmes GPU massifs et unifiés. Huang prédit que les performances de Blackwell rendront les GPU de la génération précédente nettement moins attractifs pour les charges de travail d'IA exigeantes.

(Source : Nvidia)

Feuille de route prévisible pour l'infrastructure de l'IA

NVIDIA a défini une cadence annuelle régulière pour ses innovations en matière d'infrastructure d'IA, permettant aux clients de planifier leurs investissements avec plus de certitude :

  • Blackwell Ultra (Second semestre 2025) : Une mise Ă  niveau de la plate-forme Blackwell avec des FLOP, une mĂ©moire et une bande passante accrus.
  • Vera Rubin (Seconde moitiĂ© 2026) : Une nouvelle architecture dotĂ©e d'un CPU aux performances doublĂ©es, d'un nouveau GPU et de technologies NVLink et mĂ©moire de nouvelle gĂ©nĂ©ration.
  • Rubin Ultra (Second semestre 2027) : Une architecture Ă©volutive extrĂŞme visant 15 exaflops de calcul par rack.

DĂ©mocratiser l'IA : du rĂ©seautage aux modèles

Pour concrétiser sa vision d'une adoption généralisée de l'IA, NVIDIA a annoncé des solutions complètes couvrant les domaines du réseau, du matériel et des logiciels. Au niveau de l'infrastructure, l'entreprise relève le défi de connecter des centaines de milliers, voire des millions de GPU dans les usines d'IA grâce à des investissements importants dans la technologie photonique sur silicium. Son premier système photonique sur silicium à optiques co-packagées (CPO), un CPO de 1.6 térabit par seconde basé sur la technologie MRM (micro ring resonator modulator), promet des économies d'énergie substantielles et une densité accrue par rapport aux émetteurs-récepteurs traditionnels, permettant des connexions plus efficaces entre un nombre important de GPU répartis sur différents sites.

Tout en jetant les bases d'usines d'IA à grande échelle, NVIDIA met simultanément la puissance de calcul de l'IA à la disposition des individus et des petites équipes. L'entreprise a lancé une nouvelle gamme de Supercalculateurs d'IA personnels DGX alimentés par la plateforme Grace Blackwell, visant à autonomiser les développeurs, chercheurs et data scientists en IA. La gamme comprend DGX Spark, une plateforme de développement compacte, et DGX Station, une station de travail de bureau hautes performances avec refroidissement liquide et une impressionnante puissance de calcul de 20 pétaflops.

NVIDIA DGX Spark (Source : NVIDIA)

En complément de ces avancées matérielles, NVIDIA a annoncé l'ouverture Famille de modèles Llama Nemotron avec des capacités de raisonnement, conçues pour être prêtes à l'emploi pour la création de solutions avancées Agents d'IACes modèles sont intégrés à NVIDIA NIM (NVIDIA Inference Microservices), permettant aux développeurs de les déployer sur différentes plateformes, des postes de travail locaux au cloud. Cette approche représente une solution complète pour l'adoption de l'IA en entreprise.

Huang a souligné que ces initiatives sont renforcées par de vastes collaborations avec de grandes entreprises de divers secteurs qui intègrent les modèles NVIDIA, NIM et les bibliothèques à leurs stratégies d'IA. Cette approche écosystémique vise à accélérer l'adoption tout en offrant une flexibilité adaptée aux différents besoins et cas d'utilisation des entreprises.

IA physique et robotique : une opportunitĂ© de 50 XNUMX milliards de dollars

Selon Huang, NVIDIA considère l'IA physique et la robotique comme une « opportunitĂ© de 50 00 milliards de dollars ». L'entreprise a annoncĂ© le NVIDIA Isaac GR1T NXNUMX open source, dĂ©crit comme un « modèle gĂ©nĂ©raliste de base pour les robots humanoĂŻdes ».

Des mises Ă  jour importantes des modèles de base mondiaux de NVIDIA Cosmos offrent un contrĂ´le sans prĂ©cĂ©dent sur la gĂ©nĂ©ration de donnĂ©es synthĂ©tiques pour l'entraĂ®nement des robots avec NVIDIA Omniverse. Comme l'explique Huang : « Utiliser Omniverse pour conditionner Cosmos, et Cosmos pour gĂ©nĂ©rer un nombre infini d'environnements, nous permet de crĂ©er des donnĂ©es Ă  la fois ancrĂ©es, contrĂ´lĂ©es par nous et systĂ©matiquement infinies. Â»

L'entreprise a Ă©galement dĂ©voilĂ© un nouveau moteur physique open source appelĂ© « Newton Â», dĂ©veloppĂ© en collaboration avec Google DeepMind et Disney Research. Ce moteur est conçu pour la simulation robotique haute fidĂ©litĂ©, incluant des corps rigides et souples, un retour tactile et l'accĂ©lĂ©ration GPU.

Isaac GR00T N1 (Source : NVIDIA)

L'IA agentique et la transformation de l'industrie

Huang a défini « l’IA agentique » comme une IA dotée d’une « agence » qui peut « percevoir et comprendre le contexte », « raisonner » et « planifier et agir », même en utilisant des outils et en apprenant à partir d’informations multimodales.

« L'IA agentique signifie essentiellement que l'on dispose d'une IA dotée d'une capacité d'action. Elle peut percevoir et comprendre le contexte d'une situation. Elle peut raisonner, et surtout réfléchir à la manière de répondre ou de résoudre un problème, et elle peut planifier et agir. Elle peut utiliser des outils », a expliqué Huang.

Cette capacitĂ© entraĂ®ne une forte augmentation des besoins en calcul : « La quantitĂ© de calcul requise, la loi d’échelle de l’IA, est plus rĂ©siliente et, de fait, hyper-accĂ©lĂ©rĂ©e. La quantitĂ© de calcul dont nous avons besoin aujourd’hui, grâce Ă  l’IA agentique et au raisonnement, est facilement cent fois supĂ©rieure Ă  ce que nous pensions avoir besoin Ă  la mĂŞme Ă©poque l’annĂ©e dernière Â», a-t-il ajoutĂ©.

En résumé

Lors de son discours d'ouverture à la GTC 2025, Jensen Huang a présenté une vision globale d'un avenir axé sur l'IA, caractérisé par des agents intelligents, des robots autonomes et des usines d'IA dédiées. Les annonces de NVIDIA concernant l'architecture matérielle, les réseaux, les logiciels et les modèles open source témoignent de la détermination de l'entreprise à propulser et accélérer la prochaine ère de l'informatique.

Alors que l'informatique poursuit sa transition des modèles basés sur la récupération vers des modèles génératifs, l'accent mis par NVIDIA sur les jetons comme monnaie principale de l'IA et sur les capacités de mise à l'échelle sur les plateformes cloud, d'entreprise et de robotique fournit une feuille de route pour l'avenir de la technologie, avec des implications de grande envergure pour les industries du monde entier.

Alex McFarland est un journaliste et écrivain en IA qui explore les derniers développements en matière d'intelligence artificielle. Il a collaboré avec de nombreuses startups et publications d'IA dans le monde entier.