talón Los 6 mejores libros sobre aprendizaje automático e inteligencia artificial de todos los tiempos (mayo de 2024)
Contáctanos

Serie Futurista

Los 6 mejores libros sobre aprendizaje automático e inteligencia artificial de todos los tiempos (mayo de 2024)

mm
Actualizado on

El mundo de la IA puede resultar intimidante debido a la terminología y los diferentes algoritmos de aprendizaje automático disponibles. Después de haber leído más de 50 de los libros más recomendados sobre aprendizaje automático, he compilado mi lista personal de libros que debo leer.

Los libros que se eligieron se basan en los tipos de ideas que se presentan y qué tan bien se presentan diferentes conceptos como el aprendizaje profundo, el aprendizaje por refuerzo y los algoritmos genéticos. Lo que es más importante, la lista se basa en los libros que mejor allanan el camino a los futuristas e investigadores hacia la construcción de una IA demostrablemente responsable y explicable.

#6. Cómo funciona la IA: de la brujería a la ciencia por Ronald T. Kneusel

"Cómo funciona la IA" es un libro conciso y claro diseñado para delinear los fundamentos básicos del aprendizaje automático. Este libro facilita el aprendizaje sobre la rica historia del aprendizaje automático, desde el inicio de los sistemas de IA heredados hasta la llegada de las metodologías contemporáneas.

La historia tiene capas, comenzando con los sistemas de IA bien fundamentados, como las máquinas de vectores de soporte, los árboles de decisión y los bosques aleatorios. Estos sistemas anteriores allanaron el camino para avances innovadores, que llevaron al desarrollo de enfoques más sofisticados como redes neuronales y redes neuronales convolucionales. El libro analiza las increíbles capacidades que ofrecen los modelos de lenguajes grandes (LLM), que son el motor detrás de la IA generativa de última generación.

Comprender los conceptos básicos, como por ejemplo cómo la tecnología de conversión de ruido en imagen puede replicar imágenes existentes e incluso crear imágenes nuevas y sin precedentes a partir de indicaciones aparentemente aleatorias, es fundamental para comprender las fuerzas que impulsan los generadores de imágenes actuales. Este libro explica maravillosamente estos aspectos fundamentales, permitiendo a los lectores comprender las complejidades y la mecánica subyacente de las tecnologías de generación de imágenes.

Ron Kneusel, el autor, demuestra un esfuerzo encomiable al dilucidar sus perspectivas sobre por qué ChatGPT de OpenAI y su modelo LLM significan el comienzo de la verdadera IA. Presenta meticulosamente cómo los distintos LLM exhiben propiedades emergentes capaces de comprender intuitivamente la teoría de la mente. Estas propiedades emergentes parecen volverse más pronunciadas e influyentes según el tamaño del modelo de entrenamiento. Kneusel analiza cómo una mayor cantidad de parámetros generalmente da como resultado los modelos LLM más competentes y exitosos, proporcionando conocimientos más profundos sobre la dinámica de escalamiento y la eficacia de estos modelos.

Este libro es un faro para aquellos que quieran aprender más sobre el mundo de la IA, ofreciendo una descripción detallada pero comprensible de la trayectoria evolutiva de las tecnologías de aprendizaje automático, desde sus formas rudimentarias hasta las entidades pioneras de hoy. Ya sea que sea un principiante o alguien con un conocimiento sustancial del tema, "Cómo funciona la IA" está diseñado para brindarle una comprensión refinada de las tecnologías transformadoras que continúan dando forma a nuestro mundo.

#5. La vida 3.0 por Max Tegmark

"La vida 3.0” tiene un objetivo ambicioso y es explorar las posibilidades de cómo coexistiremos con la IA en el futuro. La Inteligencia General Artificial (IAG) es la eventual e inevitable consecuencia de la argumento de explosión de inteligencia realizado por el matemático británico Irving Good en 1965. Este argumento estipula que la inteligencia sobrehumana será el resultado de una máquina que puede mejorar continuamente. La famosa cita de la explosión de inteligencia es la siguiente:

“Que una máquina ultrainteligente se defina como una máquina que puede superar con creces todas las actividades intelectuales de cualquier hombre, por inteligente que sea. Dado que el diseño de máquinas es una de estas actividades intelectuales, una máquina ultrainteligente podría diseñar máquinas aún mejores; entonces incuestionablemente habría una 'explosión de inteligencia', y la inteligencia del hombre quedaría muy atrás. Por lo tanto, la primera máquina ultrainteligente es el último invento que el hombre necesita hacer”.

Max Tegmark lanza el libro a un futuro teórico de vivir en un mundo controlado por un AGI. A partir de este momento surgen preguntas explosivas como ¿qué es la inteligencia? ¿Qué es la memoria? ¿Qué es el cómputo? y, ¿qué es aprender? ¿Cómo estas preguntas y posibles respuestas conducen eventualmente al paradigma de una máquina que puede usar varios tipos de aprendizaje automático para lograr los avances en la superación personal que se necesitan para lograr la inteligencia a nivel humano y la inevitable superinteligencia resultante?

Estos son el tipo de pensamiento progresista y preguntas importantes que explora Life 3.0. Life 1.0 son formas de vida simples, como las bacterias, que solo pueden cambiar a través de la evolución que modifica su ADN. Life 2.0 son formas de vida que pueden rediseñar su propio software, como aprender un nuevo idioma o habilidad. Life 3.0 es una IA que no solo puede modificar su propio comportamiento y habilidades, sino que también puede modificar su propio hardware, por ejemplo, actualizando su yo robótico.

Solo cuando comprendemos los beneficios y las dificultades de una AGI, podemos comenzar a revisar las opciones para asegurarnos de construir una IA amigable que pueda alinearse con nuestros objetivos. Para hacer esto, es posible que también necesitemos comprender qué es la conciencia. ¿Y en qué se diferenciará la conciencia de la IA de la nuestra?

Hay muchos temas candentes que se exploran en este libro, y debería ser una lectura obligatoria para cualquier persona que realmente desee comprender cómo AGI es una amenaza potencial, además de ser un salvavidas potencial para el futuro de la civilización humana.

#4. Compatible con los humanos: la inteligencia artificial y el problema del control por Stuart Russell

¿Qué sucede si logramos construir un agente inteligente, algo que perciba, que actúe y que sea más inteligente que sus creadores? ¿Cómo convenceremos a las máquinas para que consigan nuestros objetivos en lugar de los suyos propios?

Lo anterior es lo que lleva a uno de los conceptos más importantes del libro “Compatible con los humanos: la inteligencia artificial y el problema del control” es que debemos evitar “poner un propósito en la máquina”, como dijo una vez Norbert Wiener. Una máquina inteligente que está demasiado segura de sus objetivos fijos es el último tipo de IA peligrosa. En otras palabras, si la IA no está dispuesta a considerar la posibilidad de que se equivoque al realizar su propósito y función preprogramados, entonces puede ser imposible que el sistema de IA se apague solo.

La dificultad, tal como lo describe Stuart Russell, es instruir a la IA/robot de que no se pretende lograr ningún comando instruido a toda costa. No está bien sacrificar una vida humana para ir a buscar un café o asar al gato para que sirva de almuerzo. Debe entenderse que “llévame al aeropuerto lo más rápido posible”, no implica que se puedan infringir las leyes de exceso de velocidad, aunque esta instrucción no sea explícita. En caso de que la IA se equivoque en lo anterior, entonces la seguridad es un cierto nivel de incertidumbre preprogramado. Con cierta incertidumbre, la IA puede desafiarse a sí misma antes de completar una tarea, quizás para buscar una confirmación verbal.

En un artículo de 1965 titulado "Especulaciones sobre la primera máquina de ultrainteligencia“, IJ Good, un brillante matemático que trabajó junto a Alan Turing, afirmó: “La supervivencia del hombre depende de la construcción temprana de una máquina ultrainteligente”. Es muy posible que para salvarnos del desastre ecológico, biológico y humanitario debamos construir la IA más avanzada que podamos.

Este artículo seminal explica la explosión de la inteligencia, siendo esta teoría que una máquina ultrainteligente puede diseñar máquinas aún mejores y superiores con cada iteración, y esto inevitablemente conduce a la creación de un AGI. Si bien el AGI inicialmente puede tener la misma inteligencia que un humano, superaría rápidamente a los humanos en un corto período de tiempo. Debido a esta conclusión inevitable, es importante que los desarrolladores de IA actualicen los principios básicos que se comparten en este libro y aprendan cómo aplicarlos de manera segura para diseñar sistemas de IA que sean capaces no solo de servir a los humanos, sino también de salvarlos de sí mismos. .

Como señaló Stuart Russell, retirarse de la investigación de IA no es una opción, debemos seguir adelante. Este libro es una hoja de ruta para guiarnos hacia el diseño de sistemas de IA seguros, responsables y demostrablemente beneficiosos.

#3. Cómo crear una mente por Ray Kurzweil

Ray Kurzweil es uno de los principales inventores, pensadores y futuristas del mundo, se le conoce como “el genio inquieto” de The Wall Street Journal y “la máquina de pensar definitiva” de la revista Forbes. También es cofundador de Singularity University, y es mejor conocido por su innovador libro "The Singularity is Near". “Cómo crear una mente” aborda menos los problemas del crecimiento exponencial que son los sellos distintivos de su otro trabajo, en cambio se enfoca en cómo necesitamos entender el cerebro humano para aplicarle ingeniería inversa para crear la máquina de pensar definitiva.

Uno de los principios básicos descritos en este trabajo seminal es cómo funciona el reconocimiento de patrones en el cerebro humano. ¿Cómo reconocen los humanos los patrones en la vida cotidiana? ¿Cómo se forman estas conexiones en el cerebro? El libro comienza con la comprensión del pensamiento jerárquico, esto es comprender una estructura que se compone de diversos elementos que se organizan en un patrón, este arreglo luego representa un símbolo como una letra o carácter, y luego se organiza en un patrón más avanzado. como una palabra, y eventualmente una oración. Eventualmente, estos patrones forman ideas, y estas ideas se transforman en los productos que los humanos son responsables de construir.

Dado que es un libro de Ray Kurzweil, por supuesto, no pasa mucho tiempo antes de que se introduzca el pensamiento exponencial. El "Ley de rendimientos acelerados' es un sello distintivo de este libro seminal. Esta ley muestra cómo las tecnologías y el ritmo de aceleración se aceleran debido a la tendencia de los avances a alimentarse a sí mismos, aumentando aún más la tasa de progreso. Este pensamiento se puede aplicar a qué tan rápido estamos aprendiendo a comprender y aplicar ingeniería inversa al cerebro humano. Esta comprensión acelerada de los sistemas de reconocimiento de patrones en el cerebro humano se puede aplicar para construir un sistema AGI.

Este libro fue tan transformador para el futuro de la IA que Eric Schmidt reclutó a Ray Kurzweil para trabajar en proyectos de IA después de terminar de leer este libro fundamental. Es imposible resumir todas las ideas y conceptos que se discuten en un artículo breve, sin embargo, es un libro instrumental que se debe leer para comprender mejor cómo funcionan las redes neuronales humanas para diseñar un sistema avanzado. Red neuronal artificial.

El reconocimiento de patrones es el elemento clave para el aprendizaje profundo, y este libro ilustra por qué.

#2. El algoritmo maestro por Pedro Domingos

La hipótesis central de El algoritmo maestro es que todo el conocimiento (pasado, presente y futuro) se puede derivar de los datos mediante un único algoritmo de aprendizaje universal que se cuantifica como un algoritmo maestro. El libro detalla algunas de las principales metodologías de aprendizaje automático, brinda explicaciones detalladas de cómo funcionan los diferentes algoritmos, cómo se pueden optimizar y cómo pueden trabajar en colaboración para lograr el objetivo final de crear el algoritmo maestro. Este es un algoritmo que es capaz de resolver cualquier problema que le alimentemos, y esto incluye curar el cáncer.

El lector comenzará aprendiendo sobre Bayes ingenuo, un algoritmo simple que se puede explicar en una ecuación simple. A partir de ahí, acelera a toda velocidad hacia técnicas de aprendizaje automático más interesantes. Para comprender las tecnologías que nos están acelerando hacia este algoritmo maestro, aprendemos sobre los fundamentos convergentes. Primero, de la neurociencia aprendemos sobre la plasticidad cerebral, las redes neuronales humanas. En segundo lugar, pasamos a la selección natural en una lección para comprender cómo diseñar un algoritmo genético que simule la evolución y la selección natural. Con un algoritmo genético, una población de hipótesis en cada generación se cruza y muta, a partir de ahí, los algoritmos más aptos producen la siguiente generación. Esta evolución ofrece lo último en superación personal.

Otros argumentos provienen de la física, la estadística y, por supuesto, lo mejor de la informática. Es imposible revisar exhaustivamente todas las diferentes facetas que toca este libro, debido al ambicioso alcance del libro de diseñar el marco para construir el algoritmo maestro. Es este marco el que ha llevado a este libro al segundo lugar, ya que todos los demás libros de aprendizaje automático se basan en esto de alguna forma.

#1. Mil cerebros por Jeff Hawkins

"Mil cerebros” se basa en los conceptos que se discuten en el libro anterior de Jeff Hawkins titulado “Sobre la inteligencia”. "Sobre la inteligencia" exploró el marco para comprender cómo funciona la inteligencia humana y cómo estos conceptos se pueden aplicar para construir los mejores sistemas de IA y AGI. Básicamente analiza cómo nuestros cerebros predicen lo que experimentaremos antes de que lo experimentemos.

Si bien “A Thousand Brains” es un gran libro independiente, se disfrutará y apreciará mejor si “En inteligencia” se lee primero.

“A Thousand Brains” se basa en las últimas investigaciones de Jeff Hawkins y la compañía que fundó llamada numentación. Numenta tiene el objetivo principal de desarrollar una teoría sobre cómo funciona la neocorteza, el objetivo secundario es cómo esta teoría del cerebro se puede aplicar al aprendizaje automático y la inteligencia artificial.

El primer gran descubrimiento de Numenta en 2010 implica cómo las neuronas hacen predicciones, y el segundo descubrimiento en 2016 involucró marcos de referencia similares a mapas en la neocorteza. El libro detalla ante todo qué es la “teoría de los mil cerebros”, qué son los marcos de referencia y cómo funciona la teoría en el mundo real. Uno de los componentes más fundamentales detrás de esta teoría es comprender cómo evolucionó la neocorteza hasta su tamaño actual.

La neocorteza comenzó pequeña, similar a otros mamíferos, pero creció exponencialmente (solo limitada por el tamaño del canal de parto) no creando nada nuevo, sino copiando un circuito básico repetidamente. En esencia, lo que diferencia a los humanos no es el material orgánico del cerebro sino el número de copias de los elementos idénticos que forman la neocorteza.

La teoría evoluciona aún más hacia cómo se forma la neocorteza con aproximadamente 150,000 columnas corticales que no son visibles bajo un microscopio ya que no hay límites visibles entre ellas. La forma en que estas columnas corticales se comunican entre sí es la implementación de un algoritmo fundamental que es responsable de todos los aspectos de la percepción y la inteligencia.

Más importante aún, el libro revela cómo se puede aplicar esta teoría para construir máquinas inteligentes y las posibles implicaciones futuras para la sociedad. Por ejemplo, el cerebro aprende un modelo del mundo al observar cómo cambian las entradas con el tiempo, especialmente cuando se aplica movimiento. Las columnas corticales requieren un marco de referencia que se fija a un objeto, estos marcos de referencia permiten que una columna cortical aprenda las ubicaciones de las características que definen las realidades de un objeto. En esencia, los marcos de referencia pueden organizar cualquier tipo de conocimiento. Esto lleva a la parte más importante de este libro seminal, ¿pueden los marcos de referencia ser potencialmente el eslabón perdido vital para construir una IA más avanzada o incluso un sistema AGI? El mismo Jeff cree en un futuro inevitable cuando un AGI aprenderá modelos del mundo utilizando marcos de referencia similares a mapas similares a la neocorteza, y hace un trabajo notable al ilustrar por qué cree esto.