Entrevistas
Patrick M. Pilarski, Ph.D. Cadeira de Inteligência Artificial do Canadá (Amii) – Série de Entrevistas

Dr. Patrick M. Pilarski é um titular da Cadeira de Inteligência Artificial do Canadá, ex-titular da Cadeira de Pesquisa do Canadá em Inteligência de Máquina para Reabilitação, e Professor Associado na Divisão de Medicina Física e Reabilitação, Departamento de Medicina, Universidade de Alberta.
Em 2017, o Dr. Pilarski co-fundou o primeiro escritório internacional de pesquisa da DeepMind, localizado em Edmonton, Alberta, onde atuou como co-líder do escritório e Cientista de Pesquisa Sênior até 2023. Ele é Fellow e membro do Conselho de Administração do Instituto de Inteligência de Máquina de Alberta (Amii), co-líder do Laboratório de Pernas Biónicas para Controle Natural Aprimorado (BLINC) e é investigador principal nos Laboratórios de Aprendizado por Reforço e Inteligência Artificial (RLAI) e na Rede de Tecnologia de Reabilitação Adaptativa Sensorial e Motora (SMART) na Universidade de Alberta.
O Dr. Pilarski é autor ou co-autor de mais de 120 artigos revisados por pares, Membro Sênior do IEEE e tem sido apoiado por subvenções de pesquisa provinciais, nacionais e internacionais.
Nós nos sentamos para uma entrevista na conferência anual de 2023 Upper Bound sobre IA, realizada em Edmonton, AB, e sediada pela Amii (Instituto de Inteligência de Máquina de Alberta).
Como você se tornou envolvido com a IA? O que o atraiu para a indústria?
Essas são duas perguntas separadas. Em termos do que me atrai para a IA, há algo bonito sobre como a complexidade pode emergir e como a estrutura pode emergir da complexidade. A inteligência é apenas um desses exemplos incríveis disso, então, seja vindo da biologia ou seja vindo de como vemos comportamentos elaborados emergirem em máquinas, acho que há algo bonito nisso. Isso sempre me fascinou por um muito longo tempo, e minha longa e sinuosa trajetória para trabalhar na área de IA em que trabalho agora, que é máquinas que aprendem por meio de tentativa e erro, sistemas de reforço que interagem com humanos enquanto ambos estão imersos no fluxo de experiência, fluxo de tempo, veio através de todos os tipos de diferentes planos.
Eu estudei como máquinas e humanos poderiam interagir em termos de dispositivos biomecatrônicos e biotecnologia, coisas como membros artificiais e próteses.
Eu olhei para como a IA pode ser usada para apoiar diagnósticos médicos, como podemos usar inteligência de máquina para começar a entender padrões que levam a doenças ou como diferentes doenças podem se apresentar em termos de gravações em uma máquina. Mas isso tudo faz parte dessa longa e sinuosa jornada para realmente começar a apreciar como você pode obter comportamentos muito complexos a partir de fundamentos muito simples. E é isso que eu realmente amo, especialmente sobre aprendizado por reforço, é a ideia de que a máquina pode se embutir dentro do fluxo de tempo e aprender com sua própria experiência para exibir comportamentos muito complexos e capturar tanto os fenômenos complexos, realmente, no mundo ao seu redor. Isso tem sido uma força impulsionadora.
A mecânica disso, eu realmente fiz um monte de treinamento em medicina esportiva e coisas assim no ensino médio. Eu estudei medicina esportiva e agora estou aqui trabalhando em um ambiente onde olho para como inteligência de máquina e tecnologias de reabilitação se juntam para apoiar as pessoas em sua vida diária. É uma jornada muito interessante, como a fascinação lateral com sistemas complexos e complexidade, e então muito pragmatismo prático de como começamos a pensar sobre como os humanos podem ser melhor apoiados, vivam as vidas que eles querem viver.
Como os esportes inicialmente o levaram às próteses?
O que é realmente interessante sobre campos como medicina esportiva é olhar para o corpo humano e como as necessidades únicas de alguém, seja esportiva ou de outra forma, podem de fato ser apoiadas por outras pessoas, por procedimentos e processos. As pernas biónicas e tecnologias de prótese são sobre construir dispositivos, construir sistemas, construir tecnologia que ajuda as pessoas a viver as vidas que elas querem viver. Essas duas coisas estão realmente conectadas. É realmente emocionante poder vir full circle e ter algumas dessas interesses mais antigos virem a fruição em, novamente, co-liderar um laboratório onde olhamos… E especialmente sistemas de aprendizado de máquina que trabalham de uma maneira estreitamente acoplada, a pessoa que eles são projetados para apoiar.
Você discutiu anteriormente como uma prótese se adapta à pessoa em vez de a pessoa se adaptar à prótese. Pode falar sobre o aprendizado de máquina por trás disso?
Absolutamente. Como fundamento na história do uso de ferramentas, os humanos se adaptaram a si mesmos às suas ferramentas e, em seguida, adaptamos nossas ferramentas às necessidades que temos. E então há esse processo iterativo de nos adaptarmos às nossas ferramentas. Nós estamos, agora, em um ponto de inflexão onde, pela primeira vez, você pode ter ouvido falar disso antes em palestras se você olhou para algumas das palestras que eu dei. Mas realmente, estamos em um ponto importante da história onde podemos agora imaginar construir ferramentas que trazem alguns desses marcos da inteligência humana. Ferramentas que realmente se adaptarão e melhorarão enquanto estão sendo usadas por uma pessoa. As tecnologias subjacentes suportam aprendizado contínuo. Sistemas que podem aprender continuamente a partir de uma corrente contínua de experiência. Nesse caso, aprendizado por reforço e os mecanismos que subjazem a ele, coisas como aprendizado por diferença temporal, são realmente críticos para construir sistemas que possam se adaptar continuamente enquanto interagem com uma pessoa e enquanto estão em uso por uma pessoa que os apoia em sua vida diária.
Pode definir aprendizado por diferença temporal?
Absolutamente, o que eu realmente gosto sobre isso é que podemos pensar sobre as tecnologias core, aprendizado por diferença temporal e os algoritmos de aprendizado de previsão fundamentais que subjazem a muito do que trabalhamos no laboratório. Você tem um sistema que, muito como nós, está fazendo uma previsão sobre como o futuro vai ser com respeito a algum sinal, com respeito a algo como a recompensa futura é o que usualmente vemos. Mas qualquer outro sinal que você possa imaginar, como, quanto força estou exercendo agora? Quanto vai estar quente amanhã? Quantos donuts vou ter amanhã? Essas são as coisas possíveis que você pode imaginar prever.
E então o algoritmo core está realmente olhando para a diferença entre minha suposição sobre o que vai acontecer agora e minha suposição sobre o que vai acontecer no futuro, juntamente com qualquer tipo de sinal que estou recebendo atualmente.
Quanto força estou exercendo como um braço robótico está levantando um copo de café ou um copo de água? Isso pode estar olhando para a diferença entre a previsão sobre a quantidade de força que vou exercer agora ou a quantidade que vou exercer sobre algum período no futuro. E então comparar isso com minhas expectativas sobre o futuro e a força que estou realmente exercendo. Coloque todos juntos, e você obtém esse erro, o erro de diferença temporal. É essa acumulação bonita da previsão estendida no tempo e as diferenças entre elas, que você pode usar para atualizar a estrutura da máquina de aprendizado em si.
E então, novamente, para aprendizado por reforço convencional baseado em recompensa, isso pode estar olhando para atualizar a maneira como a máquina age com base na recompensa futura esperada que você pode perceber. Para muita coisa que fazemos, é olhar para outros tipos de sinais, usando funções de valor generalizadas, que é a adaptação do processo de aprendizado por reforço, aprendizado por diferença temporal de sinais de recompensa para qualquer tipo de sinal de interesse que possa ser aplicável à operação da máquina.
Você costuma falar sobre uma prótese chamada Cairo Toe em suas apresentações. O que ela tem a nos ensinar?

O Cairo Toe Universidade de Basileia, LHTT. Imagem: Matjaž Kačičnik
Eu gosto de usar o exemplo do Cairo Toe, uma prótese de 3000 anos. Eu trabalho na área de neuropróteses, agora vemos sistemas robóticos muito avançados que podem, em alguns casos, ter o mesmo nível de controle ou os graus de controle que partes do corpo biológico. E, no entanto, eu volto a um dedo de madeira estilizado de 3000 anos atrás. Eu acho que o que é legal é que é um exemplo de humanos se estendendo com tecnologia. Isso é o que estamos vendo agora em termos de neuropróteses e interação humano-máquina, não é algo que é estranho, novo ou esquisito. Nós sempre fomos usuários de ferramentas, animais não humanos também usam ferramentas. Há muitos grandes livros sobre isso, especialmente por Frans de Waal, “São Nós Inteligentes o Bastante para Saber Quão Inteligentes São os Animais?”.
Essa extensão de nós mesmos, o aumento e o aprimoramento de nós mesmos por meio do uso de ferramentas, não é algo novo, é algo antigo. É algo que tem acontecido desde o tempo e memorial na terra em que estamos agora, pelas pessoas que viveram aqui. A outra coisa interessante sobre o Cairo Toe é que as evidências, pelo menos dos relatórios acadêmicos sobre ele, mostram que ele foi adaptado várias vezes ao longo do curso de suas interações com seus usuários. Eles realmente entraram e personalizaram, mudaram e modificaram durante seu uso.
Minha compreensão, não era apenas uma ferramenta fixa que foi anexada a uma pessoa durante sua vida, era uma ferramenta fixa que foi anexada, mas também modificada. É um exemplo de como, novamente, a ideia de que as ferramentas são adaptadas durante seu span de uso e um span de uso sustentado é, na verdade, algo também bastante antigo. Não é algo novo, e há muitas lições que podemos aprender com a co-adaptação de pessoas e ferramentas ao longo de muitos, muitos anos.
Você mencionou anteriormente o caminho de feedback entre próteses e humanos, pode elaborar sobre o caminho de feedback?
Também estamos em um momento especial em termos de como estamos vendo a relação entre uma pessoa e a máquina que visa apoiá-la em sua vida diária. Quando alguém está usando um membro artificial, digamos, alguém com diferença de membro, alguém com uma amputação está usando um membro artificial. Tradicionalmente, eles estarão usando isso muito como uma ferramenta, como uma extensão de seu corpo, mas veremos que eles confiam muito no que consideramos o caminho de controle. Que algum sentido de sua roda ou sua intenção está sendo passado para o dispositivo, que é então encarregado de descobrir o que é e, em seguida, executar sobre isso, seja abrindo e fechando uma mão ou dobrando um cotovelo ou criando uma pegada para segurar uma chave. Geralmente não vemos as pessoas estudando ou considerando o caminho de feedback.
Então, um grande número de membros artificiais que você pode ver implantados comercialmente, o caminho de informações fluindo do dispositivo de volta para a pessoa pode ser o acoplamento mecânico, a maneira como eles realmente sentem as forças do membro e agem sobre elas. Pode ser eles ouvindo o zumbido dos motores ou eles assistindo enquanto eles pegam um canivete e movem-no sobre uma mesa ou eles o pegam de outra parte de seu espaço de trabalho. E então, esses caminhos são a maneira tradicional de fazer isso. Há coisas incríveis acontecendo em todo o mundo para olhar como as informações podem ser melhor transmitidas de um membro artificial para a pessoa que o está usando. Especialmente aqui em Edmonton, há muito trabalho legal usando a reorganização do sistema nervoso, renovação de nervo direcionada e outras coisas para apoiar esse caminho. Mas ainda é uma área de estudo emergente e quente para pensar sobre como o aprendizado de máquina pode apoiar as interações com respeito a esse caminho de feedback.
Como o aprendizado de máquina pode apoiar um sistema que pode estar percebendo e prevendo muito sobre seu mundo, na verdade, transmitir, tendo essa informação transmitida claramente e de forma eficaz de volta para a pessoa que o está usando. Como o aprendizado de máquina pode apoiar isso? Eu acho que isso é um ótimo tópico, porque se você tiver ambos os caminhos de feedback e controle, ambos os caminhos estão se adaptando e tanto o dispositivo sendo usado pela pessoa e a pessoa em si estão construindo modelos um do outro. Você pode fazer algo quase milagroso. Você pode quase transmitir informações de graça. Se você tiver ambos os sistemas que estão realmente afinados um com o outro, eles construíram um modelo muito poderoso um do outro e têm uma adaptação tanto para controlar os caminhos de feedback, você pode formar parcerias muito estreitas entre humanos e máquinas que podem passar uma quantidade enorme de informações com muito pouco esforço e muito pouco largura de banda.
E isso abre todo um novo reino de coordenação humano-máquina, especialmente na área de neuropróteses. Eu realmente acho que é um momento bastante milagroso para começarmos a estudar essa área.
Acha que essas próteses serão impressas em 3D no futuro ou como você acha que a fabricação procederá?
Eu não sinto que sou o melhor lugar para especular sobre como isso pode acontecer. Posso dizer, no entanto, que estamos vendo um grande aumento nos fornecedores comerciais de dispositivos neuropróteses usando fabricação aditiva, impressão 3D e outras formas de fabricação aditiva para criar seus dispositivos. Isso também é realmente legal de ver, que não é apenas um protótipo usando fabricação aditiva ou impressão 3D, é a impressão 3D se tornando uma parte integral de como fornecemos dispositivos para indivíduos e como otimizamos esses dispositivos para as pessoas exatas que os estão usando.
Fabricação aditiva ou fabricação personalizada, ajuste de prótese personalizado acontece em hospitais o tempo todo. Isso é uma parte natural da provisão de cuidados para pessoas com diferença de membro que precisam de tecnologias assistidas ou outras tecnologias de reabilitação. Eu acho que estamos começando a ver que muita dessa personalização está começando a se misturar com os fabricantes dos dispositivos, e não apenas deixada para os provedores de cuidados. E isso também é realmente emocionante. Eu acho que há uma grande oportunidade para dispositivos que não apenas se parecem com mãos ou são usados como mãos, mas dispositivos que atendem muito precisamente às necessidades da pessoa que os está usando, que permite que eles expressem a si mesmos da maneira que eles querem expressar, e os deixam viver as vidas que eles querem viver, não apenas a maneira como pensamos que uma mão deve ser usada na vida diária.
Você escreveu mais de 120 trabalhos. Há um que se destaca para você que devemos saber?
Há um trabalho recentemente publicado em aplicações de computação neural, mas ele representa a ponta do iceberg de pensamento que colocamos para a frente por bem mais de uma década agora, sobre estruturas para como humanos e máquinas interagem, especialmente como humanos e dispositivos de prótese interagem. É a ideia de capital comunicativo. E então, este é o trabalho que recentemente publicamos.
E este trabalho apresenta nossa visão sobre como previsões que são aprendidas e mantidas em tempo real por um dispositivo de prótese, digamos, interagindo com a pessoa, a pessoa em si pode formar essencialmente capital, pode formar um recurso que ambas as partes possam confiar. Lembre-se de que, anteriormente, eu disse que podemos fazer algo realmente espetacular quando temos um humano e uma máquina que estão construindo modelos um do outro, se adaptando em tempo real com base na experiência, e começando a passar informações em um canal bidirecional. Como uma linha lateral, porque vivemos em um mundo mágico onde há gravações e você pode cortar coisas delas.
É basicamente como mágica.
Exatamente. Soa como mágica. Se voltarmos a pensadores como Ashby, W. Ross Ashby, nos anos 1960 e seu livro “Introdução à Cibernética” falou sobre como podemos amplificar o intelecto humano. E ele realmente disse que isso se resume a ampliar a capacidade de uma pessoa de escolher entre uma das muitas opções. E isso é feito possível por sistemas onde uma pessoa está interagindo com, digamos, uma máquina, onde há um canal de comunicação aberto entre eles. Então, se tivermos esse canal de comunicação aberto, se for bidirecional, e se ambos os sistemas estiverem construindo capital na forma de previsões e outras coisas, então você pode começar a ver que eles realmente se alinham e se tornam mais do que a soma de suas partes. Você pode obter mais do que está colocando.
E eu acho que é por isso que considero este um dos nossos trabalhos mais emocionais, porque ele realmente representa uma mudança de pensamento. Representa uma mudança de pensamento para pensar em dispositivos de prótese como sistemas com agência, sistemas que não apenas descrevemos agência, mas confiamos para poder co-adaptar conosco para construir esses recursos. O capital comunicativo que nos permite multiplicar nossa capacidade de interagir com o mundo, nos permite obter mais do que estamos colocando e permitir que as pessoas, vou dizer, de uma perspectiva de prótese, parem de pensar na prótese em sua vida diária e comecem a pensar em viver sua vida diária. Não o dispositivo que os ajuda a viver sua vida diária.
Quais são algumas das aplicações que você vê para interfaces cérebro-máquina com o que você acabou de discutir?
Uma das minhas favoritas é algo que colocamos para a frente, novamente, nos últimos quase 10 anos, é uma tecnologia chamada comutação adaptativa. A comutação adaptativa é baseada no conhecimento de que muitos sistemas com os quais interagimos diariamente confiam em nós para alternar entre muitos modos ou funções. Seja eu alternando entre aplicativos no meu telefone ou eu tentando descobrir a configuração certa no meu drill ou seja eu adaptando outras ferramentas na minha vida, nós alternamos entre muitos modos ou funções o tempo todo, pensando de volta a Ashby, nossa capacidade de escolher entre muitas opções. Então, na comutação adaptativa, usamos aprendizado por diferença temporal para permitir que um membro artificial aprenda qual função motora uma pessoa pode querer usar e quando ela quer usá-la. Então, realmente, um conceito muito simples é que, apenas o ato de eu alcançar um copo e fechar minha mão.
Bem, um sistema deve ser capaz de construir previsões por meio da experiência de que, nessa situação, eu provavelmente vou usar a função de abrir e fechar a mão. Vou abrir e fechar minha mão. E então, no futuro, em situações semelhantes, ser capaz de prever isso. E quando eu estou navegando na nuvem de modos e funções, me dar mais ou menos as que eu quero sem ter que procurar por todas essas muitas opções. E isso é um exemplo simples de construir esse capital comunicativo. Você tem um sistema que está construindo previsões por meio da interação, são previsões sobre essa pessoa, essa máquina, sua relação nessa situação, nesse momento. E então, esse recurso compartilhado permite que o sistema reconfigure sua interface de controle em tempo real, de tal forma que a pessoa obtenha o que ela quer e quando ela quer. E realmente, em uma situação em que o sistema está muito, muito seguro sobre qual função motora uma pessoa pode querer, ele pode, de fato, apenas selecionar isso para ela enquanto ela está indo.
E a coisa legal é que a pessoa sempre tem a capacidade de dizer, “Ah, isso é o que eu realmente queria,” e mudar para outra função motora. Em um braço robótico, isso pode ser diferentes tipos de agarre, seja moldando o agarre para pegar uma maçaneta ou pegar uma chave ou apertar a mão de alguém. Essas são diferentes funções de modos, diferentes padrões de agarre. É muito interessante que o sistema possa começar a construir uma apreciação do que é apropriado em que situação. Unidades de capital que ambas as partes podem confiar para se mover mais rapidamente pelo mundo, e com menos carga cognitiva, especialmente na parte da unidade.
Obrigado pela entrevista incrível, leitores que desejam aprender mais devem visitar os seguintes recursos:
- Dr. Patrick M. Pilarski página da Universidade de Alberta.
- Conferência Upper Bound AI.
- Amii (Instituto de Inteligência de Máquina de Alberta)












