Critiques de livres

Critique de livre : La Machine Pensante : Jensen Huang, NVIDIA et le microprocesseur le plus convoité du monde par Stephen Witt

mm

La Machine Pensante : Jensen Huang, NVIDIA et le microprocesseur le plus convoité du monde se démarque des autres livres écrits sur l’intelligence artificielle parce qu’il aborde le sujet d’un angle que de nombreux lecteurs techniquement lettrés, dont moi-même, ont historiquement sous-estimé.

Comme beaucoup de personnes qui ont suivi l’IA pendant des années, ma compréhension du domaine a été façonnée par des jalons familiers. L’histoire commence généralement en 1956 avec l’atelier de Dartmouth, puis passe par les premiers systèmes symboliques, puis saute vers des moments marquants tels que la victoire d’IBM’s Deep Blue contre Garry Kasparov, DeepMind maîtrisant Go, et plus récemment OpenAI démontrant que les grands modèles de langage peuvent coordonner la stratégie dans des environnements multijoueurs complexes. Ces moments sont intellectuellement satisfaisants et faciles à retenir car ils sont centrés sur des victoires visibles.

Ce que le livre de Stephen Witt fait exceptionnellement bien, c’est de remettre en question cette perspective. Au lieu de se concentrer sur les moments où l’IA a impressionné le monde, La Machine Pensante se concentre sur la couche moins visible qui se trouve sous ces réalisations. Il soutient, de manière convaincante, que l’ère moderne de l’IA n’a pas été débloquée principalement par des idées ingénieuses seules, mais par un changement fondamental dans la façon dont le calcul lui-même était effectué.

En mettant l’histoire au centre de NVIDIA (NVDA -1.77%) et de son co-fondateur Jensen Huang, Witt repositionne la révolution de l’IA comme une histoire d’architecture informatique, d’écosystèmes de développeurs et de vision à long terme. Le résultat n’est pas seulement une biographie d’entreprise, mais un chapitre manquant dans l’histoire plus large de l’intelligence artificielle.

Des jeux vidéo à un nouveau paradigme informatique

Les débuts de NVIDIA sont loin des ambitions élevées maintenant associées à l’intelligence artificielle. L’entreprise a émergé en 1993 en tant que fabricant de puces graphiques, axé sur le rendu de mondes de jeux vidéo de plus en plus réalistes. Le défi à l’époque n’était pas l’intelligence, mais la vitesse. Les jeux nécessitaient un grand nombre de calculs pour être effectués instantanément afin de simuler la lumière, le mouvement et la profondeur.

La solution que NVIDIA a poursuivie était le calcul parallèle. Le calcul parallèle signifie effectuer de nombreux calculs en même temps plutôt que de les exécuter séquentiellement. Au lieu de s’appuyer sur un seul cœur de traitement puissant qui traite une instruction après l’autre, les GPU utilisent des milliers de petits cœurs qui travaillent simultanément sur des opérations mathématiques similaires. Cette approche est particulièrement puissante pour les charges de travail qui impliquent de répéter les mêmes calculs sur de grands ensembles de données.

À l’origine, cette architecture a été conçue pour les graphiques. Cependant, Witt montre comment cette décision a créé silencieusement les fondations idéales pour les réseaux de neurones des décennies plus tard. La formation de modèles d’IA modernes implique un grand nombre de calculs mathématiques identiques appliqués à de grandes quantités de données. Les GPU étaient déjà optimisés pour ce type de travail.

Ce qui rend cette partie du livre convaincante, c’est la façon dont Witt relie clairement les choix de conception techniques à la survie. NVIDIA n’a pas choisi le calcul parallèle parce qu’il prévoyait l’intelligence artificielle. Il l’a choisi parce que c’était la seule façon de concurrencer les graphiques en temps réel.

Jensen Huang et la pensée en termes de systèmes, et non de produits

Au centre de cette histoire se trouve Jensen Huang, décrit non comme un dirigeant conventionnel, mais comme quelqu’un qui pense systématiquement en termes de systèmes plutôt qu’en termes de produits individuels. Witt présente Huang comme exigeant, intense et souvent difficile, mais également remarquablement cohérent dans sa vision de la technologie sur de longues périodes.

Alors que les concurrents traitaient les GPU comme des composants jetables liés aux cycles de jeux, Huang les traitait comme la fondation d’une plate-forme informatique plus large. Cette distinction est cruciale. Les produits sont remplacés. Les plateformes s’accumulent.

À l’interne, NVIDIA reflétait cette mentalité. Les ingénieurs étaient encouragés à penser à long terme. Les logiciels étaient traités comme stratégiquement importants que le silicium. Des investissements ont été réalisés dans les outils et le support des développeurs longtemps avant qu’il n’y ait une demande claire. Beaucoup de ces choix semblaient excessifs ou inutiles à l’époque. Rétrospectivement, ils ont créé un avantage qui s’est étendu bien au-delà de la performance brute.

Witt souligne clairement que la montée en puissance de NVIDIA n’était pas inévitable. L’entreprise est venue près de l’échec plus d’une fois. Ce qui l’a portée en avant, ce n’était pas une seule percée, mais une croyance durable en l’importance du calcul accéléré au-delà de son cas d’utilisation initial.

CUDA et l’histoire originale de l’IA que beaucoup ont manquée

L’une des contributions les plus importantes de La Machine Pensante est la façon dont elle repositionne le rôle de CUDA dans l’histoire de l’IA.

Avant de lire ce livre, il est facile de penser que CUDA est simplement un outil de développement réussi. Witt montre pourquoi il mérite beaucoup plus d’attention. CUDA a été créé pour rendre le calcul parallèle utilisable en dehors des graphiques. Avant CUDA, utiliser des GPU pour le calcul général nécessitait de forcer les problèmes à travers des interfaces spécifiques aux graphiques. Cela était fragile, inefficace et limité aux spécialistes.

CUDA a changé cela en permettant aux développeurs de programmer des GPU en utilisant des modèles de programmation familiers. Des milliers de cœurs de calcul sont devenus accessibles en tant que ressource générale. Cela a abaissé les barrières à l’entrée pour le calcul haute performance d’une manière que peu de gens ont pleinement appréciée à l’époque.

C’est là que le livre résonne fortement avec mon expérience personnelle d’apprentissage de l’histoire de l’IA. Le récit que j’ai absorbé se concentrait lourdement sur les modèles et les algorithmes. Ce que La Machine Pensante rend clair, c’est que beaucoup de ces idées n’ont pu devenir pratiques qu’une fois que les chercheurs ont pu les former à grande échelle.

Les chercheurs en IA ont rapidement reconnu que les réseaux de neurones étaient une correspondance presque parfaite pour le calcul parallèle. La formation implique de répéter les mêmes opérations sur de grands ensembles de données, en ajustant des millions ou des milliards de paramètres au fil du temps. CUDA a permis à ce processus de se dérouler plus rapidement, moins cher et de manière plus fiable que les CPU ne l’auraient jamais pu.

Ceci est devenu particulièrement important à mesure que l’apprentissage profond s’est accéléré et que les modèles basés sur les transformateurs ont émergé. Les transformateurs prospèrent sur l’échelle. Sans l’accélération du GPU, de nombreux modèles qui définissent le paysage actuel de l’IA seraient restés théoriques ou prohibitivement coûteux. CUDA n’a pas inventé ces architectures, mais il a rendu leur évolution rapide possible.

Ce que Witt capture particulièrement bien, c’est que ce résultat n’a pas été entièrement planifié. CUDA a été construit pour le calcul scientifique. Les chercheurs en IA ont découvert son pouvoir et ont tiré NVIDIA au centre de la course à l’IA.

Infrastructure plutôt qu’algorithmes

L’une des idées les plus précieuses du livre est que les progrès de l’IA sont autant limités par l’infrastructure que par les idées. De nombreux comptes rendus populaires se concentrent sur les algorithmes, les astuces de formation et les ensembles de données. La Machine Pensante rappelle au lecteur que none de ces éléments importe sans un calcul suffisant.

De ce point de vue, le boom de l’IA moderne apparaît moins soudain et plus retardé. Les réseaux de neurones existaient depuis des décennies. Ce qui a changé, c’est la disponibilité du matériel capable de les former à une échelle significative.

NVIDIA n’a pas simplement fourni des puces plus rapides. Il a construit un écosystème de matériel, de bibliothèques logicielles et d’outils de développement qui se renforcent mutuellement au fil du temps. À mesure que les chercheurs optimisaient leur travail pour les plateformes NVIDIA, NVIDIA a affiné ses produits pour mieux servir les charges de travail de l’IA. Cette boucle de rétroaction a créé un avantage durable qui s’est étendu bien au-delà de la performance brute.

Le livre souligne discrètement une réalité qui est de plus en plus évidente aujourd’hui : le leadership dans l’IA est façonné par les chaînes d’approvisionnement, la capacité de fabrication, les écosystèmes logiciels et le contrôle des plateformes, et non seulement par la brillance de la recherche.

Vision, risque et conséquences cumulatives

Witt n’évite pas les implications de la domination de NVIDIA. À mesure que l’entreprise devient fondamentale pour l’infrastructure mondiale de l’IA, son influence augmente en conséquence. La croyance de Jensen Huang selon laquelle le calcul accéléré définira la prochaine phase du progrès technologique se retrouve tout au long du livre.

Plutôt que de moraliser, La Machine Pensante se concentre sur la façon dont les décisions d’ingénierie et les choix stratégiques se sont accumulés au fil du temps. NVIDIA n’a pas gagné en poursuivant les tendances. Elle a gagné en s’engageant tôt dans le calcul parallèle, en endurant des cycles de marché répétés et en investissant sans relâche dans les outils qui ont rendu son matériel indispensable.

Pour les lecteurs qui veulent comprendre comment l’IA a vraiment évolué

Pour les lecteurs qui connaissent déjà les moments clés de l’histoire de l’IA, ce livre remplit la couche manquante qui se trouve sous ces moments. Il explique pourquoi ces percées ont pu évoluer à l’échelle à laquelle elles l’ont fait, et pourquoi NVIDIA est devenue une force centrale dans le processus.

Ceci est un livre pour les lecteurs qui veulent comprendre l’intelligence artificielle en tant que système industriel plutôt qu’une collection de modèles ingénieux. Il résonnera fortement avec ceux qui s’intéressent aux puces, aux centres de données et aux décisions d’ingénierie souvent invisibles qui façonnent silencieusement le pouvoir technologique.

La Machine Pensante réussit parce qu’elle repositionne l’histoire de l’IA de la base, en montrant comment le calcul parallèle, les plateformes de développeurs et la vision à long terme ont construit les fondations sur lesquelles l’intelligence artificielle moderne repose désormais.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.