Entrevistas
Patrick M. Pilarski, Ph.D. Canada CIFAR AI Chair (Amii) – Serie de Entrevistas

El Dr. Patrick M. Pilarski es un Chair de Inteligencia Artificial de CIFAR en Canadá, ex Chair de Investigación de Canadá en Inteligencia de Máquina para la Rehabilitación, y Profesor Asociado en la División de Medicina Física y Rehabilitación, Departamento de Medicina, Universidad de Alberta.
En 2017, el Dr. Pilarski cofundó la primera oficina de investigación internacional de DeepMind, ubicada en Edmonton, Alberta, donde se desempeñó como codirector de la oficina y como Científico de Investigación Senior hasta 2023. Es Fellow y miembro de la Junta Directiva del Instituto de Inteligencia de Máquina de Alberta (Amii), codirige el Laboratorio de Extremidades Biónicas para el Control Natural Mejorado (BLINC) y es investigador principal en el Laboratorio de Aprendizaje por Refuerzo y Inteligencia Artificial (RLAI) y la Red de Tecnología de Rehabilitación Adaptativa Sensorial y Motora (SMART) en la Universidad de Alberta.
El Dr. Pilarski es autor o coautor galardonado de más de 120 artículos revisados por pares, Miembro Senior de la IEEE, y ha sido apoyado por subvenciones de investigación provinciales, nacionales e internacionales.
Nos sentamos para una entrevista en la conferencia anual 2023 Upper Bound sobre IA que se lleva a cabo en Edmonton, AB y organizada por Amii (Instituto de Inteligencia de Máquina de Alberta).
¿Cómo se involucró en la IA? ¿Qué lo atrajo a la industria?
Essas son dos preguntas separadas. En cuanto a lo que me atrae a la IA, hay algo hermoso en cómo la complejidad puede emerger y cómo la estructura puede emerger de la complejidad. La inteligencia es solo uno de estos ejemplos asombrosos, así que ya sea que provenga de la biología o de cómo vemos comportamientos elaborados emerger en máquinas, creo que hay algo hermoso en eso. Eso siempre me ha fascinado durante mucho tiempo, y mi trayectoria muy larga y sinuosa para trabajar en el área de la IA en la que trabajo ahora, que es máquinas que aprenden a través de ensayo y error, sistemas de refuerzo que interactúan con humanos mientras ambos están inmersos en la corriente de experiencia, el flujo del tiempo, vino a través de todos los tipos de mesetas diferentes. Estudié cómo las máquinas y los humanos podrían interactuar en términos de dispositivos biomecatrónicos y biotecnología, cosas como extremidades artificiales y prótesis.
Miré cómo la IA se puede utilizar para apoyar el diagnóstico médico, cómo podemos utilizar la inteligencia de máquina para comenzar a entender patrones que conducen a la enfermedad o cómo diferentes enfermedades podrían presentarse en términos de grabaciones en una máquina. Pero eso es todo parte de esta larga y sinuosa trayectoria para realmente comenzar a apreciar cómo podrías obtener comportamientos muy complejos a partir de fundamentos muy simples. Y eso es lo que realmente me encanta, especialmente sobre el aprendizaje por refuerzo, es la idea de que la máquina puede incorporarse dentro del flujo del tiempo y aprender de su propia experiencia para exhibir comportamientos muy complejos y capturar tanto los fenómenos complejos, realmente, en el mundo que los rodea. Eso ha sido una fuerza impulsora.
La mecánica de ello, en realidad hice mucho entrenamiento en medicina deportiva y cosas como eso en la escuela secundaria. Estudié medicina deportiva y ahora aquí estoy trabajando en un entorno donde miro cómo la inteligencia de máquina y las tecnologías de rehabilitación se unen para apoyar a las personas en su vida diaria. Es un viaje muy interesante, como la fascinación lateral con sistemas complejos y complejidad, y luego la pragmática muy práctica de cómo podemos empezar a pensar en cómo los humanos pueden ser mejor apoyados, vivir las vidas que quieren vivir.
¿Cómo los deportes lo llevaron inicialmente a las prótesis?
Lo que es realmente interesante sobre campos como la medicina deportiva es mirar el cuerpo humano y cómo las necesidades únicas de alguien, ya sea deportivas o de otro tipo, pueden en realidad ser apoyadas por otras personas, por procedimientos y procesos. Las extremidades biónicas y las tecnologías de prótesis son sobre construir dispositivos, construir sistemas, construir tecnología que ayuda a las personas a vivir las vidas que quieren vivir. Estas dos cosas están realmente conectadas. Es realmente emocionante poder venir a dar la vuelta y tener algunos de esos intereses anteriores que se hacen realidad, de nuevo, codirigiendo un laboratorio donde miramos… Y especialmente sistemas de aprendizaje automático que trabajan de manera muy acoplada con la persona que están diseñados para apoyar.
Usted ha discutido previamente cómo una prótesis se adapta a la persona en lugar de que la persona se adapte a la prótesis. ¿Podría hablar sobre el aprendizaje automático detrás de esto?
Absolutamente. Como fundamento en la historia del uso de herramientas, los humanos se han adaptado a sí mismos a sus herramientas y luego hemos adaptado nuestras herramientas a las necesidades que tenemos. Y así hay este proceso iterativo de nosotros adaptándonos a nuestras herramientas. Ahora estamos, en este punto de inflexión, donde por primera vez, tal vez hayan escuchado que digo esto antes en charlas si han mirado algunas de las charlas que he dado. Pero realmente, estamos en este punto importante de la historia donde podemos imaginar construir herramientas que traen algunos de esos rasgos de la inteligencia humana. Herramientas que en realidad se adaptarán y mejorarán mientras están siendo utilizadas por una persona. Las tecnologías subyacentes apoyan el aprendizaje continuo. Sistemas que pueden aprender continuamente de una corriente de experiencia en curso. En este caso, el aprendizaje por refuerzo y los mecanismos que subyacen a él, cosas como el aprendizaje de diferencia temporal, son realmente críticos para construir sistemas que puedan adaptarse continuamente mientras interactúan con una persona y mientras están en uso por una persona que los apoya en su vida diaria.
¿Podría definir el aprendizaje de diferencia temporal?
Absolutamente, lo que realmente me gusta de esto es que podemos pensar en las tecnologías básicas, el aprendizaje de diferencia temporal y los algoritmos de aprendizaje de predicción fundamentales que subyacen a mucho de lo que trabajamos en el laboratorio. Tienes un sistema que, al igual que nosotros, está haciendo una predicción sobre cómo será el futuro con respecto a alguna señal, con respecto a algo como la recompensa futura es lo que usualmente vemos. Pero cualquier otra señal que puedas imaginar, como cuánta fuerza estoy ejerciendo ahora, cuánto calor hará mañana, cuántos donuts tendré mañana. Estas son las cosas posibles que podrías imaginar predecir. Y así el algoritmo básico realmente está mirando la diferencia entre mi suposición sobre lo que va a suceder ahora y mi suposición sobre lo que va a suceder en el futuro junto con cualquier tipo de señal que esté recibiendo actualmente.
Cuánta fuerza estoy ejerciendo como un brazo robótico que levanta una taza de café o una taza de agua. Esto podría estar mirando la diferencia entre la predicción sobre la cantidad de fuerza que ejerceré ahora o la cantidad que ejerceré durante algún período en el futuro. Y luego comparar eso con mis expectativas sobre el futuro y la fuerza que realmente estoy ejerciendo. Poner todo eso junto, y obtienes este error, el error de diferencia temporal. Es esta acumulación agradable de la predicción extendida en el tiempo y las diferencias entre ellas, que puedes utilizar para actualizar la estructura de la máquina de aprendizaje en sí.
Y así, de nuevo, para el aprendizaje por refuerzo convencional basado en recompensa, esto podría estar mirando la actualización de la forma en que la máquina actúa en función de la recompensa futura esperada que podría percibir. Para mucha de lo que hacemos, está mirando otros tipos de señales, utilizando funciones de valor generalizadas, que es la adaptación del proceso de aprendizaje por refuerzo, aprendizaje de diferencia temporal de señales de recompensa a cualquier tipo de señal de interés que podría ser aplicable a la operación de la máquina.
Usted a menudo habla de una prótesis llamada el Dedos del Cairo en sus presentaciones. ¿Qué tiene que enseñarnos?

El Dedo del Cairo Universidad de Basilea, LHTT. Imagen: Matjaž Kačičnik
Me gusta usar el ejemplo del Dedo del Cairo, una prótesis de 3000 años de antigüedad. Trabajo en el área de prótesis neurológicas, ahora vemos sistemas robóticos muy avanzados que pueden tener el mismo nivel de control o grados de control que las partes del cuerpo biológico. Y sin embargo, vuelvo a un dedo de madera estilizado de 3000 años de antigüedad. Creo que lo que es genial es que es un ejemplo de humanos extendiéndose con tecnología. Eso es lo que estamos viendo ahora en términos de prótesis neurológicas y la interacción entre humanos y máquinas es algo que no es extraño, nuevo o excéntrico. Hemos sido siempre usuarios de herramientas, los animales no humanos también usan herramientas. Hay muchos grandes libros sobre esto, especialmente de Frans de Waal, “¿Somos lo suficientemente inteligentes como para saber cuán inteligentes son los animales?”.
Esta extensión de nosotros mismos, la ampliación y mejora de nosotros mismos a través del uso de herramientas no es algo nuevo, es algo antiguo. Es algo que ha estado sucediendo desde el tiempo y el recuerdo en la misma tierra en la que estamos ahora por las personas que vivían aquí. La otra cosa interesante sobre el Dedo del Cairo es que la evidencia, al menos de los informes académicos sobre él, muestra que se adaptó múltiples veces a lo largo de sus interacciones con sus usuarios. En realidad, entraron y personalizaron, cambiaron y modificaron durante su uso.
Mi comprensión, no era solo una herramienta fija que se adjuntaba a una persona durante su vida, era una herramienta fija que se adjuntaba pero también se modificaba. Es un ejemplo de cómo, de nuevo, la idea de que las herramientas se adaptan durante su período de uso y un período de uso sostenido es en realidad algo que también es muy antiguo. No es algo nuevo, y hay muchas lecciones que podemos aprender de la coadaptación de personas y herramientas durante muchos, muchos años.
Usted ha mencionado previamente la vía de retroalimentación entre prótesis y humano, ¿podría elaborar sobre la vía de retroalimentación?
También estamos en un momento especial en términos de cómo estamos viendo la relación entre una persona y la máquina que apunta a apoyarla en su vida diaria. Cuando alguien está usando un miembro artificial, digamos alguien con diferencia de miembros, alguien con una amputación que está usando un miembro artificial. Tradicionalmente, lo usarán muy parecido a una herramienta, como una extensión de su cuerpo, pero veremos que confían en gran medida en lo que consideramos la vía de control. Que algún sentido de su rueda o su intención se está pasando a ese dispositivo, que luego se encarga de figurar qué es, y luego ejecutar sobre eso, ya sea abrir y cerrar una mano o doblar un codo o crear un agarre de pinza para agarrar una llave. A menudo no vemos a las personas estudiando o considerando la vía de retroalimentación.
Así que una gran cantidad de miembros artificiales que podrías ver desplegados comercialmente, la vía de información que fluye del dispositivo de regreso a la persona podría ser el acoplamiento mecánico, la forma en que realmente sienten las fuerzas del miembro y actúan sobre ellas. Podría ser que estén escuchando el zumbido de los motores o que estén mirando mientras recogen un cuello y lo mueven a través de un escritorio o que lo agarran de otra parte de su espacio de trabajo. Y así, esas vías son la forma tradicional de hacerlo. Hay cosas increíbles que están sucediendo en todo el mundo para mirar cómo la información podría fluir mejor desde un miembro artificial de regreso a la persona que lo usa. Especialmente incluso aquí en Edmonton, hay mucho trabajo realmente genial que utiliza la reconfiguración de los nervios y otras cosas para apoyar esa vía. Pero sigue siendo un área de estudio emergente muy caliente para pensar en cómo el aprendizaje automático apoya las interacciones con respecto a esa vía de retroalimentación.
¿Cómo el aprendizaje automático puede apoyar un sistema que podría estar percibiendo y prediciendo mucho sobre su mundo en realidad transmitir, teniendo que esa información se transmita de manera clara y efectiva de regreso a la persona que lo usa? ¿Cómo puede el aprendizaje automático apoyar eso? Creo que este es un gran tema, porque si tienes ambas vías, la vía de retroalimentación y la vía de control, ambas vías están adaptándose y tanto el dispositivo que está siendo utilizado por la persona como la persona en sí están construyendo modelos el uno del otro. Puedes hacer algo casi milagroso. Puedes transmitir información casi de forma gratuita. Si tienes ambos sistemas que en realidad están bien sintonizados el uno con el otro, han construido un modelo muy poderoso el uno del otro y tienen una adaptación tanto a la vía de control como a la vía de retroalimentación, puedes formar asociaciones muy estrechas entre humanos y máquinas que pueden pasar una cantidad masiva de información con muy poco esfuerzo y muy poco ancho de banda.
Y eso abre nuevos reinos de coordinación entre humanos y máquinas, especialmente en el área de prótesis neurológicas. Realmente creo que este es un momento bastante milagroso para que comencemos a estudiar esta área.
¿Cree que estas prótesis serán impresas en 3D en el futuro o cómo cree que procederá la fabricación?
No siento que esté en el mejor lugar para especular sobre cómo podría suceder. Puedo decir que estamos viendo un gran aumento en los proveedores comerciales de dispositivos de prótesis neurológica que utilizan la fabricación aditiva, la impresión 3D y otras formas de fabricación aditiva para crear sus dispositivos. Esto también es realmente genial de ver, que no es solo un prototipo que utiliza la fabricación aditiva o la impresión 3D, es la impresión 3D que se está convirtiendo en una parte integral de cómo proporcionamos dispositivos a las personas y cómo optimizamos esos dispositivos para las personas exactas que los están utilizando.
La fabricación aditiva o la fabricación personalizada, la adaptación de prótesis sucede en los hospitales todo el tiempo. Esto es una parte natural de la provisión de atención a las personas con diferencia de miembros que necesitan tecnologías de apoyo o otras tecnologías de rehabilitación. Creo que estamos empezando a ver que mucha de esa personalización se está fusionando con los fabricantes de los dispositivos, y no solo se deja a los proveedores de atención en el punto de cuidado. Y eso también es realmente emocionante. Creo que hay una gran oportunidad para dispositivos que no solo se parezcan a las manos o se utilicen como manos, sino dispositivos que muy precisamente satisfagan las necesidades de la persona que los utiliza, que les permitan expresarse de la manera en que quieren expresarse, y les permitan vivir las vidas que quieren vivir, no solo la manera en que pensamos que una mano debería usarse en la vida diaria.
Ha escrito más de 120 artículos. ¿Hay uno que se destaque para usted que debemos saber?
Hay un artículo publicado recientemente en aplicaciones de computación neural, pero representa la punta del iceberg de una forma de pensar que hemos puesto forward durante más de una década ahora, sobre marcos para cómo interactúan humanos y máquinas, especialmente cómo interactúan humanos y dispositivos de prótesis. Es la idea de capital comunicativo. Y así, este es el artículo que recientemente publicamos.
Y este artículo presenta nuestra visión sobre cómo las predicciones que se aprenden y se mantienen en tiempo real por, digamos, un dispositivo de prótesis que interactúa con la persona, la persona en sí puede formar esencialmente capital, puede formar un recurso que ambas partes puedan confiar. Recuerde, anteriormente dije que podemos hacer algo realmente espectacular cuando tenemos un humano y una máquina que están construyendo modelos el uno del otro, adaptándose en tiempo real en función de la experiencia, y empezando a pasar información en un canal bidireccional. Como una nota al margen, porque vivimos en un mundo mágico donde hay grabaciones y puedes cortar cosas de ellas.
Es esencialmente como magia.
Exacto. Suena como magia. Si volvemos a pensadores como Ashby, W. Ross Ashby, en la década de 1960 y su libro “Introducción a la cibernética” habló sobre cómo podríamos amplificar la inteligencia humana. Y realmente dijo que se reduce a amplificar la capacidad de una persona para elegir entre una de muchas opciones. Y esto se hace posible por sistemas donde una persona está interactuando con, digamos, una máquina, donde hay un canal de comunicación abierto entre ellos. Así que si tenemos ese canal de comunicación abierto, si es bidireccional, y si ambos sistemas están construyendo capital en la forma de predicciones y otras cosas, entonces puedes empezar a ver que realmente se alinean y se convierten en más que la suma de sus partes. Puedes obtener más de lo que están poniendo.
Y creo que esto es por qué considero que este es uno de nuestros artículos más emocionantes, porque representa un cambio de pensamiento. Representa un cambio de pensamiento hacia pensar en dispositivos de prótesis neurológica como sistemas con agencia, sistemas que no solo podemos describir como agencia, sino confiar en que puedan coadaptarse con nosotros para construir estos recursos. El capital comunicativo que nos permite multiplicar nuestra capacidad para interactuar con el mundo, nos permite obtener más de lo que estamos poniendo y permite a las personas, voy a decir, desde una lente de prótesis, dejar de pensar en la prótesis en su vida diaria y empezar a pensar en vivir su vida diaria. No el dispositivo que los ayuda a vivir su vida diaria.
¿Cuáles son algunas de las aplicaciones que vería para las interfaces de cerebro-máquina con lo que acaba de discutir?
Una de mis favoritas es algo que hemos puesto forward, de nuevo, durante los últimos casi 10 años, es una tecnología llamada conmutación adaptativa. La conmutación adaptativa se basa en el conocimiento de que muchos sistemas con los que interactuamos en nuestra vida diaria confían en que cambiemos entre muchos modos o funciones. Ya sea que esté cambiando entre aplicaciones en mi teléfono o que esté tratando de figurar la configuración correcta en mi taladro o que esté adaptando otras herramientas en mi vida, cambiamos entre muchos modos o funciones todo el tiempo, pensando en Ashby, nuestra capacidad para elegir entre muchas opciones. Así que en la conmutación adaptativa, utilizamos el aprendizaje de diferencia temporal para permitir que un miembro artificial aprenda qué función de motor una persona podría querer usar y cuándo quiere usarla. Realmente es un concepto bastante simple, es que el acto de alcanzar y cerrar mi mano.
Bueno, un sistema debería poder construir predicciones a través de la experiencia de que en esta situación, es probable que esté utilizando la función de abrir y cerrar la mano. Y luego, en el futuro, en situaciones similares, poder predecir eso. Y cuando estoy navegando en la nube de modos y funciones, darme más o menos las que quiero sin tener que buscar entre todas esas muchas opciones. Y esto es un ejemplo simple de construir ese capital comunicativo. Tienes un sistema que en realidad está construyendo predicciones a través de la interacción, son predicciones sobre esa persona, esa máquina, su relación en esa situación en ese momento. Y ese recurso compartido entonces permite que el sistema reconfigure su interfaz de control en vuelo, de tal manera que la persona obtenga lo que quiere y cuando lo quiere. Y realmente, en una situación en la que el sistema está muy, muy seguro de qué función de motor una persona podría querer, en realidad puede seleccionar eso para ellos mientras van.
Y lo genial es que la persona siempre tiene la capacidad de decir, “Ah, esto es lo que realmente quería”, y cambiar a otra función de motor. En un brazo robótico, eso podría ser diferentes tipos de agarres, ya sea que sea formar el agarre para agarrar un picaporte o recoger una llave o estrechar la mano de alguien. Esos son diferentes modos de funciones, diferentes patrones de agarre. Es muy interesante que el sistema pueda empezar a construir una apreciación de qué es apropiado en qué situación. Unidades de capital que ambas partes pueden confiar para moverse más rápidamente por el mundo, y con menos carga cognitiva, especialmente en la parte de la unidad.
Gracias por la increíble entrevista, los lectores que deseen aprender más pueden visitar los siguientes recursos:
- Dr. Patrick M. Pilarski página de la Universidad de Alberta.
- Conferencia de IA Upper Bound.
- Amii (Instituto de Inteligencia de Máquina de Alberta)












