Reseñas de libros

Reseña del libro: La Máquina de Pensar: Jensen Huang, NVIDIA y el microchip más codiciado del mundo de Stephen Witt

mm

La Máquina de Pensar: Jensen Huang, NVIDIA y el microchip más codiciado del mundo se destaca de la mayoría de los libros escritos sobre inteligencia artificial porque se acerca al tema desde una dirección que muchos lectores técnicamente alfabetizados, incluido yo, han históricamente subestimado.

Al igual que muchas personas que han seguido la inteligencia artificial durante años, mi comprensión del campo se vio influenciada por hitos familiares. La historia generalmente comienza en 1956 con el taller de Dartmouth, pasa por sistemas simbólicos tempranos, luego avanza hacia momentos destacados como la victoria de Deep Blue sobre Garry Kasparov, DeepMind dominando Go, y más recientemente, OpenAI demostrando que los grandes modelos de lenguaje pueden coordinar estrategias en entornos de juego complejos. Estos momentos son intelectualmente satisfactorios y fáciles de recordar porque se centran en victorias visibles.

Lo que el libro de Stephen Witt hace excepcionalmente bien es desafiar ese marco. En lugar de centrarse en los momentos en que la inteligencia artificial impresionó al mundo, La Máquina de Pensar se centra en la capa menos visible debajo de esos logros. Argumenta, de manera persuasiva, que la era moderna de la inteligencia artificial no se desbloqueó principalmente por ideas inteligentes solas, sino por un cambio fundamental en la forma en que se realizaba la computación en sí.

Al centrar la narrativa en NVIDIA (NVDA +1.3%) y su cofundador Jensen Huang, Witt reframa la revolución de la inteligencia artificial como una historia sobre arquitectura de computación, ecosistemas de desarrolladores y visión a largo plazo. El resultado no es solo una biografía corporativa, sino un capítulo perdido en la historia más amplia de la inteligencia artificial.

De los videojuegos a un nuevo paradigma de computación

Los comienzos de NVIDIA están muy alejados de las ambiciones altas ahora asociadas con la inteligencia artificial. La empresa emergió en 1993 como un fabricante de chips gráficos, centrado en renderizar mundos de videojuegos cada vez más realistas. El desafío en ese momento no era la inteligencia, sino la velocidad. Los juegos requerían vastas cantidades de cálculos para ser realizados instantáneamente para simular la luz, el movimiento y la profundidad.

La solución que NVIDIA persiguió fue la computación paralela. La computación paralela significa realizar muchos cálculos al mismo tiempo en lugar de ejecutarlos secuencialmente. En lugar de confiar en un solo núcleo poderoso que procese una instrucción después de otra, las GPU utilizan miles de núcleos más pequeños que trabajan simultáneamente en operaciones matemáticas similares. Este enfoque es especialmente poderoso para cargas de trabajo que involucran repetir los mismos cálculos en grandes conjuntos de datos.

Originalmente, esta arquitectura se construyó para gráficos. Sin embargo, Witt muestra cómo esta decisión creó silenciosamente la base ideal para las redes neuronales décadas después. El entrenamiento de modelos de inteligencia artificial modernos implica un gran número de operaciones matemáticas idénticas aplicadas a grandes cantidades de datos. Las GPU ya estaban optimizadas para ese tipo de trabajo.

Lo que hace que esta parte del libro sea convincente es cómo Witt conecta claramente las decisiones de diseño técnico con la supervivencia. NVIDIA no eligió la computación paralela porque preveía la inteligencia artificial. La eligió porque era la única forma de competir en gráficos en tiempo real. Esa necesidad obligó a la empresa a dominar un modelo de computación que más tarde resultaría transformacional mucho más allá de los juegos.

Jensen Huang y el pensamiento en sistemas, no en productos

En el centro de esta historia se encuentra Jensen Huang, retratado no como un ejecutivo convencional, sino como alguien que consistentemente pensó en sistemas en lugar de productos individuales. Witt presenta a Huang como exigente, intenso y a menudo difícil, pero también notablemente consistente en cómo veía la tecnología a lo largo de períodos de tiempo.

Mientras que los competidores trataban las GPU como componentes desechables ligados a ciclos de juegos, Huang las trató como la base de una plataforma de computación más amplia. Esta distinción se vuelve crítica. Los productos se reemplazan. Las plataformas se acumulan.

Internamente, NVIDIA reflejó esta mentalidad. Los ingenieros fueron alentados a pensar años adelante. El software se trató como estratégicamente importante como el silicio. Las inversiones se hicieron en herramientas y soporte para desarrolladores mucho antes de que hubiera una demanda clara. Muchas de estas elecciones parecieron excesivas o innecesarias en ese momento. En retrospectiva, crearon una ventaja que los competidores lucharon por cruzar.

Witt deja claro que el ascenso de NVIDIA no fue inevitable. La empresa estuvo cerca de fracasar más de una vez. Lo que la llevó adelante no fue un solo avance, sino una creencia sostenida de que la computación acelerada eventualmente importaría mucho más allá de su caso de uso original.

CUDA y la historia de origen de la inteligencia artificial que muchos pasaron por alto

Una de las contribuciones más importantes de La Máquina de Pensar es cómo reframa el papel de CUDA en la historia de la inteligencia artificial.

Antes de leer este libro, es fácil pensar en CUDA como simplemente una herramienta de desarrollador exitosa. Witt muestra por qué merece mucha más atención. CUDA se creó para hacer que la computación paralela fuera utilizable fuera de los gráficos. Antes de CUDA, usar GPU para cálculos generales requería forzar problemas a través de interfaces específicas de gráficos. Esto era frágil, ineficiente y limitado a especialistas.

CUDA cambió eso al permitir a los desarrolladores programar GPU utilizando modelos de programación familiares. Miles de núcleos de computación se volvieron accesibles como un recurso general. Esto redujo la barrera de entrada para la computación de alto rendimiento de una manera que pocos apreciaron completamente en ese momento.

Esta es la parte del libro que más resonó con mi propia experiencia al aprender la historia de la inteligencia artificial. La narrativa que absorbí se centró mucho en modelos y algoritmos. Lo que La Máquina de Pensar hace claro es que muchas de esas ideas solo se volvieron prácticas una vez que los investigadores pudieron entrenarlas a escala.

Los investigadores de inteligencia artificial reconocieron rápidamente que las redes neuronales eran una coincidencia casi perfecta para la computación paralela. El entrenamiento implica repetir las mismas operaciones a través de grandes conjuntos de datos, ajustando millones o miles de millones de parámetros con el tiempo. CUDA permitió que este proceso sucediera más rápido, más barato y de manera más confiable que las CPU.

Esto se volvió especialmente importante a medida que el aprendizaje profundo se aceleró y más tarde a medida que surgieron los modelos basados en transformadores. Los transformadores prosperan en la escala. Sin la aceleración de la GPU, muchos de los modelos que definen el paisaje de la inteligencia artificial de hoy habrían permanecido teóricos o prohibitivamente costosos. CUDA no inventó esas arquitecturas, pero hizo posible su evolución rápida.

Lo que Witt captura particularmente bien es que este resultado no estuvo completamente planeado. CUDA se construyó para la computación científica. Los investigadores de inteligencia artificial descubrieron su poder y llevaron a NVIDIA al centro de la carrera de la inteligencia artificial.

Infraestructura sobre algoritmos

Una de las ideas más valiosas del libro es que el progreso de la inteligencia artificial está limitado tanto por la infraestructura como por las ideas. Muchos relatos populares se centran en algoritmos, trucos de entrenamiento y conjuntos de datos. La Máquina de Pensar recuerda al lector que ninguno de estos importa sin suficiente computación.

Desde esta perspectiva, el auge moderno de la inteligencia artificial parece menos repentino y más retrasado. Las redes neuronales existieron durante décadas. Lo que cambió fue la disponibilidad de hardware capaz de entrenarlas a una escala significativa.

NVIDIA no solo proporcionó chips más rápidos. Construyó un ecosistema de hardware, bibliotecas de software y herramientas para desarrolladores que se refuerzan mutuamente con el tiempo. A medida que los investigadores optimizaban su trabajo para las plataformas de NVIDIA, NVIDIA refinaba sus productos para servir mejor a las cargas de trabajo de la inteligencia artificial. Este bucle de retroalimentación creó una ventaja duradera que se extendió mucho más allá del rendimiento bruto.

El libro subraya silenciosamente una realidad que es cada vez más obvia hoy en día: el liderazgo en la inteligencia artificial se ve influenciado por cadenas de suministro, capacidad de fabricación, ecosistemas de software y control de plataforma, no solo por la brillantez de la investigación.

Visión, riesgo y consecuencias compuestas

Witt no se aparta de las implicaciones del dominio de NVIDIA. A medida que la empresa se convierte en fundamental para la infraestructura global de la inteligencia artificial, su influencia crece en consecuencia. La creencia de Jensen Huang de que la computación acelerada definirá la próxima fase del progreso tecnológico se extiende a lo largo del libro.

En lugar de moralizar, La Máquina de Pensar se centra en cómo las decisiones de ingeniería y estratégicas consistentes se compusieron con el tiempo. NVIDIA no ganó persiguiendo tendencias. Ganó comprometiéndose temprano con la computación paralela, soportando repetidos ciclos de mercado e invirtiendo implacablemente en las herramientas que hicieron que su hardware fuera indispensable.

Para lectores que buscan entender cómo la inteligencia artificial realmente se escaló

Para los lectores que ya conocen los momentos destacados de la historia de la inteligencia artificial, este libro llena la capa perdida debajo de ellos. Explica por qué esos avances pudieron escalar cuando lo hicieron y por qué NVIDIA emergió como una fuerza tan central en el proceso.

Este es un libro para lectores que desean entender la inteligencia artificial como un sistema industrial en lugar de una colección de modelos inteligentes. Resonará fuertemente con aquellos interesados en chips, centros de datos y las decisiones de ingeniería a menudo invisibles que dan forma silenciosamente al poder tecnológico.

La Máquina de Pensar tiene éxito porque reframa la historia de la inteligencia artificial desde abajo, mostrando cómo la computación paralela, las plataformas de desarrolladores y la visión a largo plazo construyeron la base sobre la cual se erige la inteligencia artificial moderna.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.