Connect with us

Ronald T. Kneusel, Autor de “Cómo funciona la IA: De la brujería a la ciencia” – Serie de entrevistas

Inteligencia artificial

Ronald T. Kneusel, Autor de “Cómo funciona la IA: De la brujería a la ciencia” – Serie de entrevistas

mm

Recientemente recibimos una copia avanzada del libro “Cómo funciona la IA: De la brujería a la ciencia” de Ronald T. Kneusel. Hasta ahora he leído más de 60 libros sobre IA, y aunque algunos de ellos se vuelven repetitivos, este libro logró ofrecer una perspectiva fresca, me gustó lo suficiente como para agregarlo a mi lista personal de los Mejores libros de aprendizaje automático y IA de todos los tiempos.

“Cómo funciona la IA: De la brujería a la ciencia” es un libro conciso y claro diseñado para delinear los conceptos fundamentales de aprendizaje automático. A continuación, se presentan algunas preguntas que se le hicieron al autor Ronald T. Kneusel.

Esta es su tercer libro de IA, los dos primeros son: “Aprendizaje profundo práctico: Una introducción basada en Python” y “Matemáticas para el aprendizaje profundo: Lo que necesitas saber para entender las redes neuronales”. ¿Cuál fue su intención inicial al escribir este libro?

Público objetivo diferente. Mis libros anteriores están diseñados como introducciones para personas interesadas en convertirse en practicantes de IA. Este libro es para lectores en general, personas que escuchan mucho sobre IA en las noticias pero no tienen antecedentes en ella. Quiero mostrar a los lectores de dónde vino la IA, que no es magia y que cualquier persona puede entender lo que está haciendo.

Mientras que muchos libros de IA tienden a generalizar, usted ha tomado el enfoque opuesto de ser muy específico al enseñar el significado de varios términos y incluso explicar la relación entre la IA, el aprendizaje automático y el aprendizaje profundo. ¿Por qué cree que hay tanta confusión social entre estos términos?

Para entender la historia de la IA y por qué está en todas partes, necesitamos entender la distinción entre los términos, pero en el uso popular, es justo utilizar “IA” sabiendo que se refiere principalmente a los sistemas de IA que están transformando el mundo de manera tan rápida. Los sistemas de IA modernos surgieron del aprendizaje profundo, que surgió del aprendizaje automático y del enfoque connectionista de la IA.

El segundo capítulo se adentra profundamente en la historia de la IA, desde el mito de Talos, un robot gigante destinado a guardar a una princesa fenicia, hasta el artículo de Alan Turing de 1950, “Máquinas de computación e inteligencia”, hasta el advenimiento de la revolución del aprendizaje profundo en 2012. ¿Por qué es fundamental comprender la historia de la IA y el aprendizaje automático para entender completamente cómo ha evolucionado la IA?

Mi intención es mostrar que la IA no cayó del cielo. Tiene una historia, un origen y una evolución. Mientras que las capacidades emergentes de los modelos de lenguaje grande son una sorpresa, el camino que conduce a ellos no lo es. Es el resultado de décadas de pensamiento, investigación y experimentación.

Ha dedicado un capítulo entero a comprender sistemas de IA heredados como máquinas de vectores de soporte, árboles de decisión y bosques aleatorios. ¿Por qué cree que es tan importante comprender completamente estos modelos de IA clásicos?

La IA como redes neuronales es solo (!) un enfoque alternativo para el mismo tipo de modelado basado en optimización que se encuentra en muchos modelos de aprendizaje automático anteriores. Es una perspectiva diferente sobre lo que significa desarrollar un modelo de algún proceso, alguna función que mapea entradas y salidas. Conocer sobre modelos anteriores ayuda a enmarcar de dónde vinieron los modelos actuales.

Afirma que cree que el modelo LLM de ChatGPT de OpenAI es el amanecer de la verdadera IA. ¿Qué cree que fue el mayor cambio de juego entre esto y los métodos anteriores de abordar la IA?

Recientemente vi un video de los años 80 de Richard Feynman intentando responder a una pregunta sobre máquinas inteligentes. Dijo que no sabía qué tipo de programa podría actuar de manera inteligente. En cierto sentido, estaba hablando de IA simbólica, donde el misterio de la inteligencia es encontrar la secuencia lógica mágica, etc., que permita un comportamiento inteligente. Me pregunté, como muchos, sobre lo mismo – ¿cómo se programa la inteligencia?

Mi creencia es que realmente no se puede. Más bien, la inteligencia emerge de sistemas lo suficientemente complejos capaces de implementar lo que llamamos inteligencia (es decir, nosotros). Nuestros cerebros son redes vastas y complejas de unidades básicas. Eso es también lo que es una red neuronal. Creo que la arquitectura de transformadores, como se implementa en los LLM, ha encontrado accidentalmente una disposición similar de unidades básicas que pueden trabajar juntas para permitir que el comportamiento inteligente emerja.

Por un lado, es el “happy accident” definitivo de Bob Ross, mientras que por otro, no debería ser demasiado sorprendente una vez que la disposición y las interacciones permitidas entre las unidades básicas capaces de permitir un comportamiento inteligente emergente hayan sucedido. Parece claro ahora que los modelos de transformadores son una de esas disposiciones. Por supuesto, esto plantea la pregunta: ¿qué otras disposiciones podrían haber?

El mensaje que se lleva a casa es que las IA modernas (LLM) son, en esencia, solo una red neuronal que se entrena mediante retropropagación y descenso de gradiente. ¿Está personalmente sorprendido por lo efectivas que son las LLM?

Sí y no. Me sorprendo continuamente por sus respuestas y capacidades mientras las uso, pero refiriéndome a la pregunta anterior, la inteligencia emergente es real, así que ¿por qué no emergería en un modelo lo suficientemente grande con una arquitectura adecuada? Creo que investigadores como Frank Rosenblatt, si no antes, probablemente pensaron lo mismo.

La declaración de misión de OpenAI es “garantizar que la inteligencia artificial general – los sistemas de IA que son generalmente más inteligentes que los humanos – beneficie a toda la humanidad”. ¿Cree personalmente que la IA general es alcanzable?

No sé qué significa IA general más de lo que sé qué significa conciencia, así que es difícil responder. Como digo en el libro, puede que llegue un punto, muy pronto, en el que no tiene sentido preocuparse por tales distinciones – si camina como un pato y grazna como un pato, solo llámalo pato y siga adelante.

Respuestas juguetonas aparte, es completamente posible que un sistema de IA pueda, algún día, satisfacer muchas teorías de conciencia. ¿Queremos sistemas de IA completamente conscientes (sea lo que sea que eso signifique)? Quizás no. Si es consciente, entonces es como nosotros y, por lo tanto, una persona con derechos – y no creo que el mundo esté listo para personas artificiales. Tenemos suficientes problemas respetando los derechos de nuestros semejantes humanos, por no hablar de los de cualquier otro tipo de ser.

¿Hubo algo que aprendió durante la escritura de este libro que lo tomó por sorpresa?

Más allá del mismo nivel de sorpresa que siente todo el mundo por las capacidades emergentes de los LLM, no realmente. Aprendí sobre la IA como estudiante en los años 80. Comencé a trabajar con el aprendizaje automático a principios de la década de 2000 y estuve involucrado con el aprendizaje profundo cuando surgió a principios de la década de 2010. Presencié los desarrollos de la última década de primera mano, junto con miles de otros, mientras el campo crecía dramáticamente de conferencia en conferencia.

Gracias por la gran entrevista, los lectores también pueden querer echar un vistazo a mi reseña de este libro. El libro está disponible en todos los minoristas importantes, incluyendo Amazon.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.