Intelligence Artificielle
Au-delà de la récupération : NVIDIA trace la voie vers l'ère de l'informatique générative

NVIDIA Le PDG Jensen Huang a annoncé une série d'avancées révolutionnaires dans les capacités de calcul de l'IA au siège social de l'entreprise. Discours d'ouverture du GTC de mars 2025, décrivant ce qu'il a appelé un « point d'inflexion informatique de 1 XNUMX milliards de dollars ». Le discours d'ouverture a révélé l'état de préparation à la production du Architecture GPU Blackwell, une feuille de route pluriannuelle pour les architectures futures, des avancées majeures dans les réseaux d'IA, de nouvelles solutions d'IA d'entreprise et des développements significatifs dans la robotique et l'IA physique.
L'« économie des jetons » et les usines d'IA
Au cœur de la vision de Huang se trouve le concept de « jetons » en tant qu’éléments fondamentaux de l’IA et l’émergence d’« usines d’IA » en tant que centres de données spécialisés conçus pour l’informatique générative.
« C'est ainsi que l'intelligence est créée, un nouveau type d'usine génératrice de jetons, les éléments constitutifs de l'IA. Les jetons ont ouvert de nouvelles perspectives », a déclaré Huang à l'auditoire. Il a souligné que les jetons peuvent « transformer des images en données scientifiques cartographiant des atmosphères extraterrestres », « décoder les lois de la physique » et « détecter les maladies avant qu'elles ne s'installent ».
Cette vision représente une transition de l'« informatique de récupération » traditionnelle vers l'« informatique générative », où l'IA comprend le contexte et génère des réponses plutôt que de simplement récupérer des données préenregistrées. Selon Huang, cette transition nécessite une nouvelle architecture de centre de données où « l'ordinateur devient un générateur de jetons, et non un simple récupérateur de fichiers ».
L'architecture Blackwell offre des gains de performances massifs
L'architecture GPU NVIDIA Blackwell, désormais en pleine production, offre ce que l'entreprise revendique comme étant « 40 fois supérieur à Hopper » pour les modèles de raisonnement dans des conditions de consommation identiques. Cette architecture prend en charge la précision FP4, ce qui permet d'améliorer considérablement l'efficacité énergétique.
« La puissance ISO de Blackwell est 25 fois supérieure », a déclaré Huang, soulignant les gains d'efficacité spectaculaires de la nouvelle plateforme.
L'architecture Blackwell prend également en charge une évolutivité extrême grâce à des technologies comme NVLink 72, permettant la création de systèmes GPU massifs et unifiés. Huang prédit que les performances de Blackwell rendront les GPU de la génération précédente nettement moins attractifs pour les charges de travail d'IA exigeantes.

(Source : Nvidia)
Feuille de route prévisible pour l'infrastructure de l'IA
NVIDIA a défini une cadence annuelle régulière pour ses innovations en matière d'infrastructure d'IA, permettant aux clients de planifier leurs investissements avec plus de certitude :
- Blackwell Ultra (Second semestre 2025) : Une mise à niveau de la plate-forme Blackwell avec des FLOP, une mémoire et une bande passante accrus.
- Vera Rubin (Seconde moitié 2026) : Une nouvelle architecture dotée d'un CPU aux performances doublées, d'un nouveau GPU et de technologies NVLink et mémoire de nouvelle génération.
- Rubin Ultra (Second semestre 2027) : Une architecture évolutive extrême visant 15 exaflops de calcul par rack.
Démocratiser l'IA : du réseautage aux modèles
Pour concrétiser sa vision d'une adoption généralisée de l'IA, NVIDIA a annoncé des solutions complètes couvrant les domaines du réseau, du matériel et des logiciels. Au niveau de l'infrastructure, l'entreprise relève le défi de connecter des centaines de milliers, voire des millions de GPU dans les usines d'IA grâce à des investissements importants dans la technologie photonique sur silicium. Son premier système photonique sur silicium à optiques co-packagées (CPO), un CPO de 1.6 térabit par seconde basé sur la technologie MRM (micro ring resonator modulator), promet des économies d'énergie substantielles et une densité accrue par rapport aux émetteurs-récepteurs traditionnels, permettant des connexions plus efficaces entre un nombre important de GPU répartis sur différents sites.
Tout en jetant les bases d'usines d'IA à grande échelle, NVIDIA met simultanément la puissance de calcul de l'IA à la disposition des individus et des petites équipes. L'entreprise a lancé une nouvelle gamme de Supercalculateurs d'IA personnels DGX alimentés par la plateforme Grace Blackwell, visant à autonomiser les développeurs, chercheurs et data scientists en IA. La gamme comprend DGX Spark, une plateforme de développement compacte, et DGX Station, une station de travail de bureau hautes performances avec refroidissement liquide et une impressionnante puissance de calcul de 20 pétaflops.

NVIDIA DGX Spark (Source : NVIDIA)
En complément de ces avancées matérielles, NVIDIA a annoncé l'ouverture Famille de modèles Llama Nemotron avec des capacités de raisonnement, conçues pour être prêtes à l'emploi pour la création de solutions avancées Agents d'IACes modèles sont intégrés à NVIDIA NIM (NVIDIA Inference Microservices), permettant aux développeurs de les déployer sur différentes plateformes, des postes de travail locaux au cloud. Cette approche représente une solution complète pour l'adoption de l'IA en entreprise.
Huang a souligné que ces initiatives sont renforcées par de vastes collaborations avec de grandes entreprises de divers secteurs qui intègrent les modèles NVIDIA, NIM et les bibliothèques à leurs stratégies d'IA. Cette approche écosystémique vise à accélérer l'adoption tout en offrant une flexibilité adaptée aux différents besoins et cas d'utilisation des entreprises.
IA physique et robotique : une opportunité de 50 XNUMX milliards de dollars
Selon Huang, NVIDIA considère l'IA physique et la robotique comme une « opportunité de 50 00 milliards de dollars ». L'entreprise a annoncé le NVIDIA Isaac GR1T NXNUMX open source, décrit comme un « modèle généraliste de base pour les robots humanoïdes ».
Des mises à jour importantes des modèles de base mondiaux de NVIDIA Cosmos offrent un contrôle sans précédent sur la génération de données synthétiques pour l'entraînement des robots avec NVIDIA Omniverse. Comme l'explique Huang : « Utiliser Omniverse pour conditionner Cosmos, et Cosmos pour générer un nombre infini d'environnements, nous permet de créer des données à la fois ancrées, contrôlées par nous et systématiquement infinies. »
L'entreprise a également dévoilé un nouveau moteur physique open source appelé « Newton », développé en collaboration avec Google DeepMind et Disney Research. Ce moteur est conçu pour la simulation robotique haute fidélité, incluant des corps rigides et souples, un retour tactile et l'accélération GPU.

Isaac GR00T N1 (Source : NVIDIA)
L'IA agentique et la transformation de l'industrie
Huang a défini « l’IA agentique » comme une IA dotée d’une « agence » qui peut « percevoir et comprendre le contexte », « raisonner » et « planifier et agir », même en utilisant des outils et en apprenant à partir d’informations multimodales.
« L'IA agentique signifie essentiellement que l'on dispose d'une IA dotée d'une capacité d'action. Elle peut percevoir et comprendre le contexte d'une situation. Elle peut raisonner, et surtout réfléchir à la manière de répondre ou de résoudre un problème, et elle peut planifier et agir. Elle peut utiliser des outils », a expliqué Huang.
Cette capacité entraîne une forte augmentation des besoins en calcul : « La quantité de calcul requise, la loi d’échelle de l’IA, est plus résiliente et, de fait, hyper-accélérée. La quantité de calcul dont nous avons besoin aujourd’hui, grâce à l’IA agentique et au raisonnement, est facilement cent fois supérieure à ce que nous pensions avoir besoin à la même époque l’année dernière », a-t-il ajouté.
En résumé
Lors de son discours d'ouverture à la GTC 2025, Jensen Huang a présenté une vision globale d'un avenir axé sur l'IA, caractérisé par des agents intelligents, des robots autonomes et des usines d'IA dédiées. Les annonces de NVIDIA concernant l'architecture matérielle, les réseaux, les logiciels et les modèles open source témoignent de la détermination de l'entreprise à propulser et accélérer la prochaine ère de l'informatique.
Alors que l'informatique poursuit sa transition des modèles basés sur la récupération vers des modèles génératifs, l'accent mis par NVIDIA sur les jetons comme monnaie principale de l'IA et sur les capacités de mise à l'échelle sur les plateformes cloud, d'entreprise et de robotique fournit une feuille de route pour l'avenir de la technologie, avec des implications de grande envergure pour les industries du monde entier.