Intelligence artificielle

NVIDIA présente la plateforme Rubin : le prochain génération de puces d’intelligence artificielle

mm

Dans une autre grande annonce à la conférence Computex à Taipei, le PDG de NVIDIA, Jensen Huang, a présenté davantage des plans de l’entreprise pour l’avenir de l’informatique d’intelligence artificielle. Le projecteur s’est concentré sur la plateforme de puce d’intelligence artificielle Rubin, qui doit être lancée en 2026, et la puce Blackwell Ultra, prévue pour 2025.

La plateforme Rubin

En tant que successeur de l’architecture Blackwell très attendue, qui devrait être livrée plus tard en 2024, la plateforme Rubin représente un bond en avant dans les capacités de calcul d’intelligence artificielle de NVIDIA. Huang a souligné la nécessité d’un calcul accéléré pour répondre aux demandes croissantes de traitement de données, déclarant : “Nous voyons une inflation de calcul.” La technologie de NVIDIA promet de livrer une économie de coûts impressionnante de 98 % et une réduction de 97 % de la consommation d’énergie, positionnant l’entreprise en tant que leader sur le marché des puces d’intelligence artificielle.

Alors que les détails spécifiques sur la plateforme Rubin étaient rares, Huang a révélé qu’elle comporterait de nouveaux GPU et un processeur central nommé Vera. La plateforme intégrera également HBM4, la prochaine génération de mémoire à large bande passante, qui est devenue un goulet d’étranglement critique dans la production d’accélérateurs d’intelligence artificielle en raison de la demande croissante. Le principal fournisseur, SK Hynix Inc., est largement vendu à court terme pour HBM4 jusqu’en 2025, soulignant la concurrence féroce pour ce composant essentiel.

NVIDIA et AMD à la tête du mouvement

Le passage de NVIDIA à un calendrier de sortie annuel pour ses puces d’intelligence artificielle met en évidence la concurrence intensifiée sur le marché des puces d’intelligence artificielle. Alors que NVIDIA s’efforce de maintenir sa position de leader, d’autres géants de l’industrie font également des progrès importants. Lors de la conférence d’ouverture de Computex 2024, la présidente et directrice générale d’AMD, Lisa Su, a présenté la croissance du momentum de la famille d’accélérateurs AMD Instinct, en présentant une feuille de route pluriannuelle qui introduit un rythme annuel de performances et de capacités de mémoire pour l’intelligence artificielle.

La feuille de route d’AMD commence avec l’accélérateur AMD Instinct MI325X, qui doit être disponible au quatrième trimestre 2024, avec une capacité et une bande passante de mémoire de pointe. L’entreprise a également présenté les processeurs AMD EPYC de 5e génération, codés “Turin”, qui utiliseront le noyau “Zen 5” et devraient être disponibles dans la deuxième moitié de 2024. À l’avenir, AMD prévoit de sortir la série AMD Instinct MI400 en 2026, basée sur l’architecture AMD CDNA “Next”, promettant des performances et une efficacité améliorées pour la formation et l’inférence d’intelligence artificielle.

Implications, impact potentiel et défis

L’introduction de la plateforme Rubin de NVIDIA et l’engagement de l’entreprise à effectuer des mises à jour annuelles pour ses accélérateurs d’intelligence artificielle ont des implications de grande portée pour l’industrie de l’intelligence artificielle. Ce rythme accéléré d’innovation et de développement permettra des solutions d’intelligence artificielle plus efficaces et rentables, stimulant les progrès dans divers secteurs.

Alors que la plateforme Rubin offre des promesses immenses, il existe des défis et des considérations qui doivent être abordés. La forte demande de mémoire HBM4 et les contraintes d’approvisionnement posées par le principal fournisseur, SK Hynix Inc., qui est largement vendu à court terme jusqu’en 2025, pourraient potentiellement avoir un impact sur la production et la disponibilité de la plateforme Rubin.

De plus, NVIDIA doit trouver un équilibre délicat entre les performances, l’efficacité et le coût pour garantir que la plateforme Rubin reste accessible et viable pour une large gamme de clients. La compatibilité et l’intégration transparente avec les systèmes existants seront également cruciales pour faciliter l’adoption et minimiser les perturbations pour les utilisateurs.

Alors que la plateforme Rubin ouvre la voie à l’innovation et au développement accélérés de l’intelligence artificielle, les entreprises et les chercheurs doivent rester informés et préparés pour exploiter ces progrès. En exploitant la plateforme Rubin de NVIDIA, les organisations de diverses industries peuvent améliorer leur efficacité et acquérir un avantage concurrentiel sur leurs marchés.

Alex McFarland est un journaliste et écrivain en intelligence artificielle qui explore les derniers développements en intelligence artificielle. Il a collaboré avec de nombreuses startups et publications en intelligence artificielle dans le monde entier.