Buchrezensionen
Buchrezension: The Thinking Machine: Jensen Huang, NVIDIA und der weltweit begehrteste Mikrochip von Stephen Witt

The Thinking Machine: Jensen Huang, NVIDIA, and the World’s Most Coveted Microchip unterscheidet sich von den meisten Büchern über künstliche Intelligenz, da es das Thema aus einer Richtung angeht, die viele technisch versierte Leser, mich eingeschlossen, historisch unterschätzt haben.
Wie viele Menschen, die über Jahre hinweg künstliche Intelligenz verfolgt haben, wurde mein Verständnis des Fachgebiets durch vertraute Meilensteine geprägt. Die Geschichte beginnt normalerweise im Jahre 1956 mit dem Dartmouth-Workshop, geht dann zu frühen symbolischen Systemen über und springt dann zu Meilensteinen wie IBMs Deep Blue, das Garry Kasparow besiegte, DeepMind, das Go meisterte, und kürzlich OpenAI, das zeigte, dass große Sprachmodelle Strategien in komplexen Multiplayer-Umgebungen koordinieren können. Diese Momente sind intellektuell befriedigend und leicht zu merken, da sie sich auf sichtbare Erfolge konzentrieren.
Was Stephen Witts Buch außergewöhnlich gut macht, ist, dass es diese Darstellung in Frage stellt. Anstatt sich auf Momente zu konzentrieren, in denen künstliche Intelligenz die Welt beeindruckte, konzentriert sich The Thinking Machine auf die weniger sichtbare Schicht unter diesen Errungenschaften. Es argumentiert überzeugend, dass die moderne Ära der künstlichen Intelligenz nicht in erster Linie durch clevere Ideen allein entsperrt wurde, sondern durch eine grundlegende Veränderung in der Art und Weise, wie die Rechnung selbst durchgeführt wurde.
Indem Witt die Erzählung auf NVIDIA (NVDA +1.3%) und dessen Mitbegründer Jensen Huang konzentriert, wird die künstliche Intelligenz-Revolution als eine Geschichte über Computerarchitektur, Entwickler-Ökosysteme und langfristige Überzeugung umgedeutet. Das Ergebnis ist nicht nur eine Unternehmensbiografie, sondern ein fehlendes Kapitel in der breiteren Geschichte der künstlichen Intelligenz.
Von Videospielen zu einem neuen Rechenparadigma
NVIDIAs Anfänge sind weit entfernt von den hochgesteckten Zielen, die heute mit künstlicher Intelligenz verbunden sind. Das Unternehmen entstand im Jahr 1993 als Grafikchip-Hersteller, der sich auf die Darstellung immer realistischerer Videospielwelten konzentrierte. Die Herausforderung zu dieser Zeit war nicht die Intelligenz, sondern die Geschwindigkeit. Spiele erforderten eine enorme Anzahl von Berechnungen, die sofort durchgeführt werden mussten, um Licht, Bewegung und Tiefe zu simulieren.
Die Lösung, die NVIDIA verfolgte, war paralleles Rechnen. Paralleles Rechnen bedeutet, dass viele Berechnungen gleichzeitig durchgeführt werden, anstatt sie sequenziell auszuführen. Anstatt auf einen einzelnen leistungsstarken Kern zu vertrauen, der eine Anweisung nach der anderen ausführt, verwenden Grafikprozessoren Tausende von kleineren Kernen, die gleichzeitig auf ähnliche mathematische Operationen arbeiten. Dieser Ansatz ist besonders leistungsstark für Workloads, die das Wiederholen der gleichen Berechnungen über große Datensätze erfordern.
Ursprünglich wurde diese Architektur für Grafikzwecke entwickelt. Witt zeigt jedoch, wie diese Entscheidung stillschweigend die ideale Grundlage für neuronale Netze schuf, die Jahrzehnte später entstanden. Das Training moderner künstlicher Intelligenz-Modelle erfordert eine enorme Anzahl von identischen mathematischen Operationen, die auf große Datenmengen angewendet werden. Grafikprozessoren waren bereits für genau diese Art von Arbeit optimiert.
Was diesen Teil des Buches so überzeugend macht, ist, wie klar Witt technische Designentscheidungen mit dem Überleben verbindet. NVIDIA wählte paralleles Rechnen nicht, weil es künstliche Intelligenz vorhersah. Es wählte es, weil es der einzige Weg war, in Echtzeit-Grafiken zu konkurrieren. Diese Notwendigkeit zwang das Unternehmen, ein Rechenmodell zu beherrschen, das später weit über die Spieleindustrie hinaus transformierend sein würde.
Jensen Huang und das Denken in Systemen, nicht in Produkten
Im Mittelpunkt dieser Geschichte steht Jensen Huang, der nicht als konventioneller Manager, sondern als jemand dargestellt wird, der konsequent in Systemen und nicht in einzelnen Produkten denkt. Witt porträtiert Huang als fordernd, intensiv und oft schwierig, aber auch bemerkenswert konsequent in seiner Technologie-Sicht über lange Zeiträume hinweg.
Während Wettbewerber Grafikprozessoren als verbrauchsfertige Komponenten behandelten, die an Spielzyklen gebunden waren, behandelte Huang sie als Grundlage für eine breitere Rechenplattform. Dieser Unterschied ist entscheidend. Produkte werden ersetzt. Plattformen haben eine Verstärkungseffekt.
Intern spiegelte NVIDIA diese Einstellung wider. Ingenieure wurden ermutigt, Jahre im Voraus zu denken. Software wurde als strategisch wichtig wie Silizium behandelt. Investitionen wurden in Werkzeuge und Entwicklerunterstützung getätigt, lange bevor es einen klaren Bedarf gab. Viele dieser Entscheidungen erschienen zu diesem Zeitpunkt übermäßig oder unnötig. Im Nachhinein schufen sie eine Barriere, die Wettbewerber nur schwer überwinden konnten.
Witt macht deutlich, dass NVIDIAs Aufstieg nicht unvermeidlich war. Das Unternehmen stand mehr als einmal vor dem Scheitern. Was es vorantrieb, war nicht ein einzelner Durchbruch, sondern ein anhaltendes Vertrauen, dass beschleunigtes Rechnen letztendlich über seinen ursprünglichen Einsatz hinaus eine Rolle spielen würde.
CUDA und die künstliche Intelligenz-Ursprungsgeschichte, die viele verpasst haben
Einer der wichtigsten Beiträge von The Thinking Machine ist, wie es die Rolle von CUDA in der Geschichte der künstlichen Intelligenz umdeutet.
Bevor ich dieses Buch las, war es leicht, CUDA als einfaches erfolgreiches Entwickler-Tool zu betrachten. Witt zeigt, warum es weit mehr Aufmerksamkeit verdient. CUDA wurde entwickelt, um paralleles Rechnen außerhalb der Grafik nutzbar zu machen. Vor CUDA erforderte die Verwendung von Grafikprozessoren für allgemeine Berechnungen, Probleme durch grafikspezifische Schnittstellen zu zwängen. Dies war zerbrechlich, ineffizient und auf Spezialisten beschränkt.
CUDA änderte dies, indem es Entwicklern ermöglichte, Grafikprozessoren mit vertrauten Programmiermodellen zu programmieren. Tausende von Rechenkernen wurden als allgemeine Ressource zugänglich. Dies senkte die Einstiegshürde für Hochleistungsrechnen auf eine Weise, die nur wenige Menschen zu diesem Zeitpunkt vollständig schätzten.
Dies ist der Teil des Buches, der stark mit meiner eigenen Erfahrung der Lerngeschichte der künstlichen Intelligenz resoniert. Die Erzählung, die ich aufgenommen habe, konzentrierte sich stark auf Modelle und Algorithmen. Was The Thinking Machine klar macht, ist, dass viele dieser Ideen erst praktisch wurden, als Forscher sie im großen Maßstab trainieren konnten.
Forscher erkannten schnell, dass neuronale Netze ein nahezu perfekter Match für paralleles Rechnen waren. Das Training umfasst das Wiederholen der gleichen Operationen über große Datenmengen, das Anpassen von Millionen oder Milliarden von Parametern über die Zeit. CUDA ermöglichte diesen Prozess schneller, günstiger und zuverlässiger als CPUs es je könnten.
Dies wurde besonders wichtig, als das Deep Learning beschleunigte und später, als transformerbasierte Modelle auftraten. Transformer gedeihen auf Skalierbarkeit. Ohne die Beschleunigung durch Grafikprozessoren wären viele der Modelle, die das heutige Landschaftsbild der künstlichen Intelligenz prägen, theoretisch geblieben oder prohibitiv teuer. CUDA hat diese Architekturen nicht erfunden, aber es ermöglichte ihre schnelle Evolution.
Was Witt besonders gut einfängt, ist, dass dieses Ergebnis nicht vollständig geplant war. CUDA wurde für wissenschaftliches Rechnen entwickelt. KI-Forscher entdeckten seine Macht und zogen NVIDIA in den Mittelpunkt des KI-Rennens.
Infrastruktur über Algorithmen
Eine der wertvollsten Erkenntnisse des Buches ist, dass der Fortschritt der künstlichen Intelligenz ebenso sehr durch die Infrastruktur wie durch Ideen eingeschränkt ist. Viele populäre Berichte konzentrieren sich auf Algorithmen, Trainingskniffe und Datensätze. The Thinking Machine erinnert den Leser daran, dass all dies nichts bedeutet ohne ausreichende Rechenleistung.
Aus dieser Perspektive erscheint der moderne KI-Boom weniger plötzlich und mehr verzögert. Neuronale Netze existierten seit Jahrzehnten. Was sich änderte, war die Verfügbarkeit von Hardware, die in der Lage war, sie in einem sinnvollen Maßstab zu trainieren.
NVIDIA lieferte nicht einfach nur schnellere Chips. Es baute ein Ökosystem aus Hardware, Software-Bibliotheken und Entwickler-Tools, die sich über die Zeit hinweg gegenseitig verstärkten. Als Forscher ihre Arbeit für NVIDIA-Plattformen optimierten, verfeinerte NVIDIA seine Produkte, um KI-Workloads besser zu bedienen. Diese Rückkopplungsschleife schuf einen dauerhaften Vorteil, der weit über die reine Leistung hinausging.
Das Buch unterstreicht stillschweigend eine Realität, die heute immer offensichtlicher wird: die Führung in der KI wird durch Lieferketten, Fertigungskapazitäten, Software-Ökosysteme und Plattformkontrolle und nicht nur durch Forschungsbrillanz geprägt.
Vision, Risiko und verstärkte Konsequenzen
Witt scheut sich nicht, die Implikationen von NVIDIAs Dominanz zu thematisieren. Als das Unternehmen zu einer grundlegenden Infrastruktur für die globale KI-Infrastruktur wird, wächst sein Einfluss entsprechend. Jensen Huangs Überzeugung, dass beschleunigtes Rechnen die nächste Phase des technologischen Fortschritts definieren wird, zieht sich durch das gesamte Buch.
Anstatt zu moralisieren, konzentriert sich The Thinking Machine darauf, wie konsistente technische und strategische Entscheidungen über die Zeit hinweg kumulierten. NVIDIA gewann nicht, indem es Trends jagte. Es gewann, indem es sich frühzeitig auf paralleles Rechnen festlegte, wiederholte Marktzyklen überstand und unermüdlich in die Tools investierte, die seine Hardware unverzichtbar machten.
Für Leser, die verstehen möchten, wie KI wirklich skaliert
Für Leser, die bereits die Schlagzeilenmomente der KI-Geschichte kennen, füllt dieses Buch die fehlende Schicht unter ihnen aus. Es erklärt, warum diese Durchbrüche skalierten, als sie es taten, und warum NVIDIA als zentrale Kraft in diesem Prozess auftrat.
Dies ist ein Buch für Leser, die künstliche Intelligenz als industrielle Systeme und nicht als Sammlung cleverer Modelle verstehen möchten. Es wird stark bei denen resonieren, die an Chips, Rechenzentren und den oft unsichtbaren Ingenieursentscheidungen interessiert sind, die stillschweigend technologische Macht formen.
The Thinking Machine ist erfolgreich, weil es die KI-Geschichte von Grund auf neu erzählt und zeigt, wie paralleles Rechnen, Entwickler-Plattformen und langfristige Vision die Grundlage schufen, auf der die moderne künstliche Intelligenz heute steht.












