Entrevistas
Patrick M. Pilarski, Ph.D. Canadá CIFAR AI Chair (Amii) - Série de entrevistas

Dr. Patrick M. Pilarski é presidente da CIFAR de Inteligência Artificial do Canadá, ex-presidente de Pesquisa do Canadá em Inteligência de Máquina para Reabilitação e professor associado na Divisão de Medicina Física e Reabilitação, Departamento de Medicina da Universidade de Alberta.
Em 2017, o Dr. Pilarski foi cofundador do primeiro escritório de pesquisa internacional da DeepMind, localizado em Edmonton, Alberta, onde atuou como colíder do escritório e cientista sênior de pesquisa até 2023. Ele é membro do conselho e membro do conselho de administração da DeepMind. Instituto de Inteligência de Máquinas de Alberta (Amii), co-lidera o Laboratório de Membros Biônicos para Controle Natural Aprimorado (BLINC) e é pesquisador principal do Laboratório de Aprendizagem por Reforço e Inteligência Artificial (RLAI) e da Rede Sensory Motor Adaptive Rehabilitation Technology (SMART) da Universidade de Alberta.
Dr. Pilarski é o premiado autor ou co-autor de mais de 120 artigos revisados por pares, um membro sênior do IEEE, e tem sido apoiado por bolsas de pesquisa provinciais, nacionais e internacionais.
Sentamos para uma entrevista no anual 2023 Limite superior conferência sobre IA realizada em Edmonton, AB e organizada por Amii (Instituto de Inteligência de Máquinas de Alberta).
Como você se encontrou na IA? O que te atraiu na indústria?
Essas são duas questões distintas. Em termos do que me atrai na IA, há algo de belo em como a complexidade pode emergir e como a estrutura pode emergir da complexidade. A inteligência é apenas um desses exemplos incríveis disso, então, seja vindo da biologia ou de como vemos comportamentos elaborados emergirem em máquinas, acho que há algo de belo nisso. Isso sempre me fascinou por muito tempo, e minha longa e sinuosa trajetória para trabalhar na área de IA em que trabalho agora, que são máquinas que aprendem por tentativa e erro, sistemas de reforço que interagem com humanos enquanto ambos estão imersos nisso, o fluxo de experiência, o fluxo de tempo, passou por todos os tipos de platôs diferentes. Estudei como máquinas e humanos poderiam interagir em termos de dispositivos biomecatrônicos e biotecnologia, coisas como membros artificiais e próteses.
Analisei como a IA pode ser usada para auxiliar diagnósticos médicos, como podemos usar a inteligência artificial para começar a entender padrões que levam a doenças ou como diferentes doenças podem se apresentar em termos de registros em uma máquina. Mas tudo isso faz parte desse longo caminho para realmente começar a apreciar como é possível obter comportamentos muito complexos a partir de fundamentos muito simples. E é isso que eu realmente adoro, especialmente no aprendizado por reforço: a ideia de que a máquina pode se incorporar ao fluxo do tempo e aprender com sua própria experiência para exibir comportamentos muito complexos e capturar tanto os fenômenos complexos quanto o mundo ao seu redor. Essa tem sido uma força motriz.
A mecânica disso... na verdade, fiz muito treinamento em medicina esportiva e coisas do tipo no ensino médio. Estudei medicina esportiva e agora estou aqui, trabalhando em um ambiente onde observo como a inteligência artificial e as tecnologias de reabilitação se unem para apoiar as pessoas em seu dia a dia. É uma jornada muito interessante, com o fascínio paralelo por sistemas complexos e complexidade, e a pragmática muito prática de como começamos a pensar em como os humanos podem ser melhor apoiados e viver a vida que desejam.
Como o esporte inicialmente o levou às próteses?
O que é realmente interessante em áreas como a medicina esportiva é observar o corpo humano e como as necessidades únicas de alguém, sejam elas esportivas ou não, podem de fato ser atendidas por outras pessoas, por meio de procedimentos e processos. Membros biônicos e tecnologias protéticas envolvem a construção de dispositivos, sistemas e tecnologias que ajudam as pessoas a viver a vida que desejam. Essas duas coisas estão intimamente conectadas. É realmente muito empolgante poder fechar o ciclo e ver alguns desses interesses muito antigos se concretizarem, novamente, coliderando um laboratório onde analisamos... E especialmente sistemas de aprendizado de máquina que trabalham de forma fortemente acoplada com a pessoa para a qual foram projetados.
Você discutiu anteriormente como uma prótese se adapta à pessoa em vez da pessoa se adaptar às próteses. Você poderia falar sobre o aprendizado de máquina por trás disso?
Com certeza. Como base na história do uso de ferramentas, os humanos se adaptaram às suas ferramentas e, então, as adaptamos às suas necessidades. E então há esse processo iterativo de adaptação às suas ferramentas. Estamos, agora, em um ponto de inflexão em que, pela primeira vez, vocês talvez já tenham me ouvido dizer isso antes em palestras, se assistiram a algumas das palestras que dei. Mas, na verdade, estamos neste ponto importante da história em que podemos imaginar a construção de ferramentas que trazem algumas dessas características da inteligência humana. Ferramentas que realmente se adaptam e melhoram enquanto são usadas por uma pessoa. As tecnologias subjacentes suportam o aprendizado contínuo. Sistemas que podem aprender continuamente a partir de uma experiência contínua. Nesse caso, o aprendizado por reforço e os mecanismos que o sustentam, como o aprendizado por diferença temporal, são realmente essenciais para a construção de sistemas que podem se adaptar continuamente enquanto interagem com uma pessoa e enquanto são usados por uma pessoa, apoiando-a em sua vida diária.
Você poderia definir a aprendizagem por diferença temporal?
Com certeza, o que eu realmente gosto nisso é que podemos pensar nas tecnologias principais, no aprendizado de diferença temporal e nos algoritmos fundamentais de aprendizado de previsão que sustentam muito do que trabalhamos no laboratório. Você tem um sistema que, assim como nós, faz uma previsão sobre como será o futuro com relação a algum sinal, com relação a algo como a recompensa futura, que é o que normalmente vemos. Mas qualquer outro sinal que você possa imaginar, como quanta força estou exercendo agora? Quão quente estará? Quantos donuts comerei amanhã? Essas são as coisas possíveis que você pode imaginar prever. E então o algoritmo principal está realmente analisando a diferença entre meu palpite sobre o que vai acontecer agora e meu palpite sobre o que vai acontecer no futuro, juntamente com qualquer tipo de sinal que eu esteja recebendo no momento.
Quanta força estou exercendo enquanto um braço robótico levanta uma xícara de café ou uma xícara de água? Isso pode ser feito observando a diferença entre a previsão sobre a quantidade de força que ele estará exercendo agora ou a quantidade que exercerá em algum período no futuro. E então comparando isso com suas expectativas sobre o futuro e a força que ele está realmente exercendo. Somando tudo isso, você obtém este erro, o erro da diferença temporal. É esse belo acúmulo da previsão temporalmente estendida no futuro e as diferenças entre elas, que você pode então usar para atualizar a estrutura da própria máquina de aprendizado.
E então, novamente, para o aprendizado por reforço convencional baseado em recompensa, isso poderia estar buscando atualizar a maneira como a máquina age com base na recompensa futura esperada que você possa perceber. Para muito do que fazemos, estamos observando outros tipos de sinais, usando funções de valor generalizadas, que é a adaptação do processo de aprendizado por reforço, aprendizado de diferença temporal de sinais de recompensa a qualquer tipo de sinal de interesse que possa ser aplicável à operação da máquina.
Você costuma falar sobre uma prótese chamada Dedo do pé do Cairo em suas apresentações. O que ela tem a nos ensinar?

Universidade Cairo Toe de Basel, LHTT. Imagem: Matjaž Kačičnik
Gosto de usar o exemplo do dedo do pé do Cairo, uma prótese de 3000 anos. Trabalho na área de neuropróteses; agora vemos sistemas robóticos muito avançados que podem, em alguns casos, ter o mesmo nível de controle ou os mesmos graus de controle que as partes biológicas do corpo. E, no entanto, volto a um dedo do pé de madeira muito estilizado de 3000 anos atrás. Acho que o interessante é que é um exemplo de humanos se expandindo com a tecnologia. É isso que estamos vendo agora em termos de neuropróteses, e a interação homem-máquina não é algo estranho, novo ou maluco. Sempre fomos usuários de ferramentas; animais e animais não humanos também usam ferramentas. Há muitos livros excelentes sobre isso, especialmente de Frans de Waal.Somos inteligentes o suficiente para saber como os animais são inteligentes?".
Essa extensão de nós mesmos, o aumento e o aprimoramento de nós mesmos através do uso de ferramentas não é algo novo, é algo antigo. É algo que vem acontecendo desde tempos imemoriais, na própria terra em que estamos agora, pelas pessoas que viveram aqui. Outro aspecto interessante sobre o Dedo do Pé do Cairo é que as evidências, pelo menos a partir dos relatórios acadêmicos sobre ele, mostram que ele foi adaptado diversas vezes ao longo de suas interações com seus usuários. Eles, de fato, o personalizaram, o modificaram e o modificaram durante seu uso.
No meu entender, não se tratava apenas de uma ferramenta fixa que era anexada a uma pessoa ao longo de sua vida, mas sim de uma ferramenta fixa que era anexada, mas também modificada. É um exemplo de como, mais uma vez, a ideia de que as ferramentas se adaptam ao longo de seu período de uso e de um período de uso sustentado é, na verdade, algo bastante antigo. Não é algo novo, e há muitas lições que podemos aprender com a coadaptação de pessoas e ferramentas ao longo de muitos e muitos anos.
Você mencionou anteriormente o caminho de feedback entre as próteses e o ser humano, você poderia elaborar sobre o caminho de feedback?
Também estamos em um momento especial em termos de como vemos a relação entre uma pessoa e a máquina que visa apoiá-la em sua vida diária. Quando alguém usa um membro artificial, digamos, alguém com deficiência de membro, alguém com uma amputação, está usando um membro artificial. Tradicionalmente, eles o usarão como uma ferramenta, como uma extensão de seu corpo, mas os veremos confiando amplamente no que consideramos a via de controle. Que alguma noção de sua roda ou sua intenção está sendo transmitida a esse dispositivo, que então é encarregado de descobrir o que é e, em seguida, executar isso, seja abrindo e fechando uma mão, dobrando um cotovelo ou criando uma pinça para pegar uma chave. Muitas vezes não vemos pessoas estudando ou considerando a via de feedback.
Assim, em um grande número de membros artificiais que você pode ver implantados comercialmente, o caminho da informação fluindo do dispositivo de volta para a pessoa pode ser o acoplamento mecânico, a maneira como eles realmente sentem as forças do membro e agem sobre elas. Pode ser eles ouvindo o ruído dos motores ou observando enquanto pegam uma braçadeira e a movem sobre uma mesa ou a pegam de outra parte de seu espaço de trabalho. E, portanto, esses caminhos são a maneira tradicional de fazer isso. Há coisas incríveis acontecendo ao redor do mundo para observar como a informação pode ser melhor realimentada de um membro artificial para a pessoa que o usa. Especialmente aqui em Edmonton, há muitos trabalhos muito interessantes usando a religação do sistema nervoso, renovação nervosa direcionada e outras coisas para dar suporte a esse caminho. Mas ainda é uma área de estudo emergente muito interessante pensar sobre como o aprendizado de máquina dá suporte às interações em relação a esse caminho de feedback.
Como o aprendizado de máquina pode dar suporte a um sistema que pode estar percebendo e prevendo muito sobre seu mundo e, na verdade, transmitindo, fazendo com que essa informação seja transmitida de forma clara e eficaz de volta para a pessoa que o utiliza. Como o aprendizado de máquina pode dar suporte a isso? Acho que este é um ótimo tópico, porque se você tem tanto essa via de feedback quanto essa via de controle, ambas as vias estão se adaptando, e tanto o dispositivo usado pela pessoa quanto a própria pessoa estão construindo modelos um do outro. Você pode fazer algo quase milagroso. Você pode quase transmitir informações de graça. Se você tem esses dois sistemas que estão realmente bem sintonizados um com o outro, eles construíram um modelo muito poderoso um do outro e têm uma adaptação para controlar as vias de feedback, você pode formar parcerias muito estreitas entre humanos e máquinas que podem passar uma quantidade enorme de informações com muito pouco esforço e muito pouca largura de banda.
E isso abre novos horizontes para a coordenação entre humanos e máquinas, especialmente na área de neuropróteses. Eu realmente acho que este é um momento bastante milagroso para começarmos a estudar essa área.
Você acha que eles serão impressos em 3D no futuro ou como você acha que a fabricação continuará?
Não me considero a melhor pessoa para especular sobre como isso pode acontecer. Posso dizer, porém, que estamos observando um grande aumento no número de fornecedores comerciais de dispositivos neuroprotéticos que utilizam manufatura aditiva, impressão 3D e outras formas de manufatura aditiva no local para criar seus dispositivos. Também é muito interessante ver que não se trata apenas de um protótipo usando manufatura aditiva ou impressão 3D, mas sim da impressão 3D se tornando parte integrante de como fornecemos dispositivos a indivíduos e como os otimizamos para as pessoas que os utilizam.
Fabricação aditiva ou fabricação sob medida, o ajuste de próteses personalizadas acontece em hospitais o tempo todo. Isso é uma parte natural do atendimento a pessoas com deficiência de membros que precisam de tecnologias assistidas ou outros tipos de tecnologias de reabilitação. Acho que estamos começando a ver que grande parte dessa personalização está começando a se integrar aos fabricantes dos dispositivos, e não apenas aos prestadores de cuidados. E isso também é muito empolgante. Acho que há uma grande oportunidade para dispositivos que não se parecem apenas com mãos ou são mãos usadas, mas dispositivos que atendem com muita precisão às necessidades da pessoa que os usa, que permitem que ela se expresse da maneira que deseja e que viva a vida que deseja, da maneira que deseja, não apenas da maneira como achamos que uma mão deve ser usada na vida diária.
Você escreveu mais de 120 artigos. Existe algum que se destaca para você que devemos conhecer?
Há um artigo publicado recentemente sobre aplicações de computação neural, mas ele representa a ponta de um iceberg de pensamento que temos defendido há mais de uma década, sobre estruturas de como humanos e máquinas interagem, especialmente como humanos e dispositivos protéticos interagem. É a ideia de capital comunicativo. E então este é o artigo que apresentamos recentemente. publicado.
E este artigo apresenta nossa visão sobre como as previsões aprendidas e mantidas em tempo real por, digamos, um dispositivo protético interagindo com a pessoa, a própria pessoa, podem formar essencialmente capital, podem formar um recurso no qual ambas as partes podem confiar. Lembre-se, eu disse anteriormente que podemos fazer algo realmente espetacular quando temos um humano e uma máquina construindo modelos um do outro, adaptando o tempo real com base na experiência e começando a transmitir informações em um canal bidirecional. Como um detalhe, porque vivemos em um mundo mágico onde há gravações e você pode cortar coisas delas.
É basicamente como mágica.
Exatamente. Parece mágica. Se voltarmos a pensadores como Ashby, W. Ross Ashby, na década de 1960 e seu livro “Introdução à Cibernética” falou sobre como poderíamos ampliar o intelecto humano. E ele realmente disse que tudo se resume a ampliar a capacidade de uma pessoa de escolher entre uma de muitas opções. E isso é possível graças a sistemas em que uma pessoa interage com, digamos, uma máquina, onde há um canal de comunicação aberto entre elas. Então, se tivermos essa comunicação canalizada aberta, se ela for bidirecional, e se ambos os sistemas estiverem gerando capital na forma de previsões e outras coisas, então você pode começar a vê-los realmente se alinharem e se tornarem mais do que a soma de suas partes. Você pode obter mais do que eles estão investindo.
E acho que é por isso que considero este um dos nossos artigos mais empolgantes, porque representa uma mudança de pensamento. Representa uma mudança de pensamento para pensar em dispositivos neuroprotéticos como sistemas com agência, sistemas aos quais podemos não apenas descrever a agência, mas nos quais confiamos para serem capazes de se coadaptar conosco e construir esses recursos. O capital comunicativo que nos permite multiplicar nossa capacidade de interagir com o mundo nos permite extrair mais do que estamos investindo e permite que as pessoas, eu diria, a partir de uma lente protética, parem de pensar na prótese em sua vida diária e comecem a pensar em viver sua vida diária. Não no dispositivo que as está ajudando a viver sua vida diária.
Quais são alguns dos aplicativos que você veria para interfaces cérebro-máquina com o que acabou de discutir?
Um dos meus favoritos é algo que apresentamos, novamente, nos últimos quase 10 anos, uma tecnologia chamada comutação adaptativa. A comutação adaptativa se baseia no conhecimento de que muitos sistemas com os quais interagimos diariamente dependem de alternarmos entre muitos modos ou funções. Seja alternando entre aplicativos no meu telefone, tentando descobrir a configuração correta na minha furadeira ou adaptando outras ferramentas na minha vida, alternamos entre muitos modos ou funções o tempo todo, pensando em Ashby, nossa capacidade de escolher entre muitas opções. Então, na comutação adaptativa, usamos o aprendizado de diferença temporal para permitir que um membro artificial aprenda qual função motora uma pessoa pode querer usar e quando ela quer usá-la. Então, uma premissa bem simples é que, apenas o ato de eu alcançar uma xícara e fechar minha mão.
Bem, um sistema deve ser capaz de construir previsões por meio da experiência. Nesta situação, provavelmente usarei a função de abrir e fechar a mão. Estarei abrindo e fechando a mão. E, no futuro, em situações semelhantes, ser capaz de prever isso. E quando estiver navegando na nuvem rodopiante de modos e funções, me dê mais ou menos aqueles que eu quero sem ter que escolher entre todas essas opções. E este é um exemplo muito simples de construção desse capital comunicativo. Você tem um sistema que está, de fato, construindo previsões por meio da interação; são previsões sobre aquela pessoa, aquela máquina, seu relacionamento naquela situação naquele momento. E esse recurso compartilhado permite que o sistema reconfigure sua interface de controle em tempo real, de modo que a pessoa obtenha o que deseja e quando deseja. E, na verdade, em uma situação em que o sistema tem muita, muita certeza sobre qual função motora uma pessoa pode desejar, ele pode, de fato, simplesmente selecionar isso para ela conforme ela entra.
E o mais legal é que a pessoa sempre tem a capacidade de dizer: "Ah, é isso que eu realmente queria", e mudar para outra função motora. Em um braço robótico, isso pode ser diferentes tipos de preensão manual, seja moldando a pegada para segurar uma maçaneta, pegar uma chave ou apertar a mão de alguém. São diferentes modos de função, diferentes padrões de preensão. É muito interessante que o sistema possa começar a desenvolver uma apreciação do que é apropriado em cada situação. Unidades de capital nas quais ambas as partes podem confiar para se mover mais rapidamente pelo mundo e com menos carga cognitiva, especialmente na parte da unidade.
Obrigado pela incrível entrevista, os leitores que desejam aprender mais devem visitar os seguintes recursos:
- Dr. Patrick M. Pilarski Página da Universidade de Alberta.
- Conferência de AI de limite superior.
- Amii (Instituto de Inteligência de Máquinas de Alberta)












