Entretiens

Patrick M. Pilarski, Ph.D. Chaire de recherche en intelligence artificielle du Canada CIFAR (Amii) – Série d’entretiens

Published May 30, 2023

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Le Dr Patrick M. Pilarski est titulaire de la Chaire de recherche en intelligence artificielle du Canada CIFAR, ancien titulaire de la Chaire de recherche du Canada en intelligence des machines pour la réadaptation, et professeur agrégé au sein de la Division de médecine physique et de réadaptation, Département de médecine, Université de l’Alberta.

En 2017, le Dr Pilarski a co-fondé le premier bureau de recherche international de DeepMind, situé à Edmonton, en Alberta, où il a occupé le poste de co-responsable du bureau et de chercheur principal jusqu’en 2023. Il est fellow et membre du conseil d’administration de l’Institut d’intelligence des machines de l’Alberta (Amii), co-dirige le laboratoire BLINC (Bionic Limbs for Improved Natural Control) et est chercheur principal au sein du laboratoire RLAI (Reinforcement Learning and Artificial Intelligence) et du réseau SMART (Sensory Motor Adaptive Rehabilitation Technology) à l’Université de l’Alberta.

Le Dr Pilarski est l’auteur ou co-auteur de plus de 120 articles examinés par des pairs, membre senior de l’IEEE, et a bénéficié de subventions de recherche provinciales, nationales et internationales.

Nous nous sommes assis pour une entrevue lors de la conférence annuelle Upper Bound 2023 sur l’IA, qui se tient à Edmonton, en Alberta, et est organisée par Amii (Institut d’intelligence des machines de l’Alberta).

Comment êtes-vous arrivé dans le domaine de l’IA ? Qu’est-ce qui vous a attiré dans cette industrie ?

Ce sont deux questions distinctes. En termes de ce qui m’attire dans l’IA, il y a quelque chose de beau dans la façon dont la complexité peut émerger et dont la structure peut émerger de la complexité. L’intelligence est juste l’un de ces exemples incroyables, donc que ce soit issu de la biologie ou de la façon dont nous voyons des comportements élaborés émerger dans les machines, je pense qu’il y a quelque chose de beau dans cela. Cela m’a toujours fasciné depuis très longtemps, et mon parcours sinueux pour travailler dans le domaine de l’IA où je travaille maintenant, qui est les machines qui apprennent par essais et erreurs, les systèmes de renforcement qui interagissent avec les humains tandis que tous deux sont immergés dans le flux d’expérience, le flux du temps, est venu à travers toutes sortes de plateformes différentes.

J’ai étudié la façon dont les machines et les humains pourraient interagir en termes de dispositifs biomécaniques et de biotechnologie, des choses comme les membres artificiels et les prothèses.

J’ai examiné la façon dont l’IA peut être utilisée pour soutenir les diagnostics médicaux, la façon dont nous pouvons utiliser l’intelligence des machines pour commencer à comprendre les modèles qui conduisent à la maladie ou la façon dont différentes maladies pourraient se présenter en termes d’enregistrements sur une machine. Mais tout cela fait partie de ce long cheminement pour vraiment commencer à apprécier comment vous pourriez obtenir des comportements très complexes à partir de fondements très simples. Et c’est vraiment ce que j’aime, surtout sur l’apprentissage par renforcement, c’est l’idée que la machine peut s’immerger dans le flux du temps et apprendre de son propre expérience pour exposer des comportements très complexes et capturer à la fois les phénomènes complexes, vraiment, dans le monde qui l’entoure. Cela a été une force motrice.

La mécanique de tout cela, j’ai fait beaucoup de formation en médecine du sport et des choses comme ça au lycée. J’ai étudié la médecine du sport et maintenant, me voici travaillant dans un environnement où j’examine la façon dont l’intelligence des machines et les technologies de réadaptation se réunissent pour soutenir les gens dans leur vie quotidienne. C’est un voyage très intéressant, comme la fascination latérale pour les systèmes complexes et la complexité, et puis la pragmatique très pratique de la façon dont nous commençons à penser à la façon dont les humains peuvent être mieux soutenus, vivre les vies qu’ils veulent vivre.

Comment les sports vous ont-ils mené aux prothèses initialement ?

Ce qui est vraiment intéressant dans des domaines comme la médecine du sport, c’est regarder le corps humain et la façon dont les besoins uniques d’une personne, qu’il s’agisse de sport ou autre, peuvent en fait être soutenus par d’autres personnes, par des procédures et des processus. Les membres bioniques et les technologies de prothèse sont sur la construction de dispositifs, la construction de systèmes, la construction de technologies qui aident les gens à vivre les vies qu’ils veulent vivre. Ces deux choses sont vraiment étroitement liées. C’est vraiment excitant de pouvoir revenir en arrière et avoir certains de ces intérêts plus anciens qui se concrétisent, encore une fois, en co-dirigeant un laboratoire où nous regardons… Et surtout les systèmes d’apprentissage automatique qui fonctionnent de manière étroitement couplée, la personne qu’ils sont conçus pour soutenir.

Vous avez précédemment discuté de la façon dont une prothèse s’adapte à la personne plutôt que l’inverse. Pouvez-vous parler de l’apprentissage automatique derrière cela ?

Absolument. En tant que fondement de l’histoire de l’utilisation d’outils, les humains se sont adaptés à leurs outils, puis nous avons adapté nos outils à nos besoins. Et il y a ce processus itératif de nous adapter à nos outils. Nous sommes, en ce moment, à un point d’inflexion où, pour la première fois, vous avez peut-être entendu dire que nous pouvons maintenant imaginer construire des outils qui intègrent certains de ces signes distinctifs de l’intelligence humaine. Des outils qui s’adapteront et s’amélioreront pendant qu’ils sont utilisés par une personne. Les technologies sous-jacentes soutiennent l’apprentissage continu. Des systèmes qui peuvent apprendre en continu à partir d’un flux d’expérience en cours. Dans ce cas, l’apprentissage par renforcement et les mécanismes qui le sous-tendent, des choses comme l’apprentissage par différence temporelle, sont vraiment critiques pour construire des systèmes qui peuvent s’adapter en continu pendant qu’ils interagissent avec une personne et pendant qu’ils sont utilisés par une personne pour la soutenir dans sa vie quotidienne.

Pouvez-vous définir l’apprentissage par différence temporelle ?

Absolument, ce que j’aime à ce sujet, c’est que nous pouvons réfléchir aux technologies de base, à l’apprentissage par différence temporelle et aux algorithmes d’apprentissage de prédiction fondamentaux qui sous-tendent une grande partie de ce sur quoi nous travaillons dans le laboratoire. Vous avez un système qui, comme nous, fait une prédiction sur la façon dont le futur va se présenter par rapport à un signal, par rapport à quelque chose comme la récompense future qui est ce que nous voyons généralement. Mais n’importe quel autre signal que vous pourriez imaginer, comme la quantité de force que j’exerce en ce moment ou à quelle température il fera demain ? Ce sont les choses possibles que vous pourriez imaginer prédire. Et donc, l’algorithme de base est vraiment axé sur la différence entre ma supposition sur ce qui va se passer maintenant et ma supposition sur ce qui va se passer dans le futur, ainsi que sur tout signal que je reçois actuellement.

Combien de force est-ce que j’exerce en tant que bras robotique qui soulève une tasse de café ou une tasse d’eau ? Cela pourrait être en regardant la différence entre la prédiction de la quantité de force que je vais exercer maintenant ou la quantité que je vais exercer sur une période de temps future. Et puis en comparant cela à mes attentes concernant le futur et la force que je suis en train d’exercer. Mettez tout cela ensemble, et vous obtenez cette erreur, l’erreur de différence temporelle. C’est une accumulation agréable de la prévision étendue dans le temps et des différences entre elles, que vous pouvez ensuite utiliser pour mettre à jour la structure de la machine d’apprentissage elle-même.

Et donc, encore une fois, pour un apprentissage par renforcement classique basé sur la récompense, cela pourrait consister à mettre à jour la façon dont la machine agit en fonction de la récompense attendue dans le futur que l’on pourrait percevoir. Pour beaucoup de ce que nous faisons, il s’agit de regarder d’autres types de signaux, en utilisant des fonctions de valeur généralisées, qui est l’adaptation du processus d’apprentissage par renforcement, l’apprentissage par différence temporelle des signaux de récompense à tout type de signal d’intérêt qui pourrait être applicable au fonctionnement de la machine.

Vous parlez souvent d’une prothèse appelée le Cairo Toe dans vos présentations. Qu’est-ce qu’il a à nous apprendre ?

Le Cairo Toe Université de Bâle, LHTT. Image : Matjaž Kačičnik

J’aime utiliser l’exemple du Cairo Toe, une prothèse il y a 3 000 ans. Je travaille dans le domaine des neuroprothèses, nous voyons maintenant des systèmes robotiques très avancés qui peuvent, dans certains cas, avoir le même niveau de contrôle ou les degrés de contrôle que les membres biologiques. Et pourtant, je reviens à un orteil en bois très stylisé il y a 3 000 ans. Je pense que ce qui est agréable, c’est qu’il s’agit d’un exemple d’humains qui s’étendent avec la technologie. C’est ce que nous voyons actuellement en termes de neuroprothèses et d’interaction humaine-machine, ce n’est pas quelque chose de bizarre, de nouveau ou de loufoque. Nous avons toujours été des utilisateurs d’outils, les animaux non humains utilisent également des outils. Il y a de nombreux excellents livres sur ce sujet, notamment ceux de Frans de Waal, “Are We Smart Enough to Know How Smart Animals Are?“.

Cette extension de nous-mêmes, l’amélioration et l’amélioration de nous-mêmes grâce à l’utilisation d’outils n’est pas quelque chose de nouveau, c’est quelque chose d’ancien. C’est quelque chose qui se passe depuis des temps immémoriaux, sur la terre où nous sommes en ce moment, par les gens qui y vivaient. L’autre chose intéressante à propos du Cairo Toe est que les preuves, du moins selon les rapports universitaires, montrent qu’il a été adapté à plusieurs reprises au cours de ses interactions avec ses utilisateurs. Ils l’ont en fait personnalisé et modifié, modifié pendant son utilisation.

Ma compréhension, ce n’était pas juste un outil fixe qui était attaché à une personne pendant sa vie, c’était un outil fixe qui était attaché mais également modifié. C’est un exemple de la façon dont, encore une fois, l’idée que les outils sont adaptés pendant leur durée d’utilisation et une durée d’utilisation prolongée est en fait quelque chose d’ancien. Ce n’est pas quelque chose de nouveau, et il y a beaucoup de leçons que nous pouvons tirer de la co-adaptation des personnes et des outils sur de nombreuses années.

Vous avez précédemment mentionné le chemin de rétroaction entre les prothèses et l’humain, pouvez-vous élargir sur le chemin de rétroaction ?

Nous sommes également dans un moment spécial en termes de la façon dont nous considérons la relation entre une personne et la machine qui vise à la soutenir dans sa vie quotidienne. Lorsqu’une personne utilise un membre artificiel, disons quelqu’un avec une différence de membre, quelqu’un avec une amputation qui utilise un membre artificiel. Traditionnellement, ils l’utiliseront très probablement comme un outil, comme une extension de leur corps, mais nous les verrons principalement s’appuyer sur ce que nous considérons comme le chemin de contrôle. Que certains de leurs sens ou de leurs intentions sont transmis à l’appareil, qui est ensuite chargé de déterminer ce que c’est, puis d’exécuter, que ce soit ouvrir et fermer une main ou plier un coude ou créer une prise pour saisir une clé. Nous ne voyons généralement pas les gens étudier ou considérer le chemin de rétroaction.

Donc, un grand nombre de membres artificiels que vous pourriez voir déployés commercialement, le chemin d’information allant de l’appareil à la personne pourrait être le couplage mécanique, la façon dont ils ressentent réellement les forces du membre et agissent en conséquence. Cela pourrait être qu’ils entendent le bruit des moteurs ou qu’ils regardent tandis qu’ils ramassent un objet et le déplacent sur un bureau ou qu’ils le saisissent à partir d’une autre partie de leur espace de travail. Et donc, ces chemins sont la façon traditionnelle de procéder. Il y a des choses incroyables qui se passent partout dans le monde pour examiner comment l’information pourrait être mieux transmise d’une prothèse à la personne qui l’utilise. Surtout même ici à Edmonton, il y a beaucoup de travaux vraiment intéressants qui utilisent la réorganisation du système nerveux, la rénovation ciblée des nerfs et d’autres choses pour soutenir ce chemin. Mais il s’agit toujours d’un domaine d’étude émergent très chaud pour réfléchir à la façon dont l’apprentissage automatique soutient les interactions par rapport à ce chemin de rétroaction.

Comment l’apprentissage automatique peut-il soutenir un système qui perçoit et prédit beaucoup de choses sur son monde, mais qui transmet en fait cette information de manière claire et efficace à la personne qui l’utilise ? Comment l’apprentissage automatique peut-il soutenir cela ? Je pense que c’est un excellent sujet, car si vous avez à la fois ce chemin de rétroaction et ce chemin de contrôle, les deux chemins s’adaptent et que l’appareil utilisé par la personne et la personne elle-même construisent des modèles l’un de l’autre. Vous pouvez faire quelque chose d’presque miraculeux. Vous pouvez presque transmettre des informations gratuitement. Si vous avez ces deux systèmes qui sont en fait bien accordés l’un à l’autre, ils ont construit un modèle très puissant l’un de l’autre et ils ont une adaptation à la fois au chemin de contrôle et au chemin de rétroaction, vous pouvez former des partenariats très étroits entre les humains et les machines qui peuvent transmettre une quantité massive d’informations avec très peu d’effort et très peu de bande passante.

Et cela ouvre de nouveaux domaines entiers de coordination humaine et machine, surtout dans le domaine des neuroprothèses. Je pense vraiment que c’est un moment assez miraculeux pour commencer à étudier ce domaine.

Pensez-vous que ceux-ci seront imprimés en 3D à l’avenir ou comment pensez-vous que la fabrication va évoluer ?

Je ne me sens pas comme si j’étais le meilleur endroit pour spéculer sur la façon dont cela pourrait se produire. Je peux dire cependant que nous voyons une augmentation importante des fournisseurs commerciaux de dispositifs neuroprothétiques qui utilisent la fabrication additive, l’impression 3D et d’autres formes de fabrication additive sur place pour créer leurs dispositifs. C’est également vraiment agréable de voir que ce n’est pas juste un prototype qui utilise la fabrication additive ou l’impression 3D, mais que l’impression 3D devient une partie intégrante de la façon dont nous fournissons des dispositifs aux individus et de la façon dont nous optimisons ces dispositifs pour les personnes exactes qui les utilisent.

La fabrication additive ou la fabrication sur mesure, l’adaptation des prothèses se produit dans les hôpitaux tout le temps. C’est une partie naturelle de la prestation de soins aux personnes ayant une différence de membre qui ont besoin de technologies d’assistance ou d’autres technologies de réadaptation. Je pense que nous commençons à voir que beaucoup de cette personnalisation commence à se fondre dans la fabrication des appareils, et non juste laissée aux prestataires de soins. Et c’est également vraiment excitant. Je pense qu’il y a une grande opportunité pour des appareils qui ne ressemblent pas juste à des mains ou qui sont utilisés comme des mains, mais des appareils qui répondent très précisément aux besoins de la personne qui les utilise, qui leur permettent de s’exprimer de la façon dont ils veulent s’exprimer, et qui leur permettent de vivre leur vie de la façon dont ils veulent la vivre, et non juste de la façon dont nous pensons qu’une main devrait être utilisée dans la vie quotidienne.

Vous avez écrit plus de 120 articles. Y en a-t-il un qui vous tient à cœur que nous devrions savoir ?

Il y a un article récemment publié dans les applications de calcul neuronal, mais il représente le sommet de l’iceberg de la réflexion que nous avons avancée depuis maintenant plus d’une décennie, sur les cadres de la façon dont les humains et les machines interagissent, surtout sur la façon dont les humains et les dispositifs prothétiques interagissent. C’est l’idée de capital de communication. Et donc, c’est l’article que nous avons récemment publié.

Et cet article expose notre point de vue sur la façon dont les prédictions apprises et maintenues en temps réel par un appareil prothétique, par exemple, interagissant avec la personne, la personne elle-même peut former essentiellement un capital, peut former une ressource que les deux parties peuvent utiliser. Rappelez-vous, précédemment, j’ai dit que nous pouvons faire quelque chose de vraiment spectaculaire lorsque nous avons un humain et une machine qui construisent tous deux des modèles l’un de l’autre, s’adaptant en temps réel en fonction de l’expérience, et commençant à transmettre des informations dans un canal bidirectionnel. Comme une note en marge, parce que nous vivons dans un monde magique où il y a des enregistrements et que vous pouvez couper des choses dedans.

C’est essentiellement comme de la magie.

Exactement. Cela ressemble à de la magie. Si nous revenons à des penseurs comme Ashby, W. Ross Ashby, dans les années 60 et son livre “Introduction à la cybernétique” a parlé de la façon dont nous pourrions amplifier l’intellect humain. Et il a vraiment dit que cela se résume à amplifier la capacité d’une personne à choisir entre l’une des nombreuses options. Et ceci est rendu possible par des systèmes où une personne interagit avec, disons, une machine, où il y a un canal de communication ouvert entre eux. Donc, si nous avons ce canal de communication ouvert, s’il est bidirectionnel, et si les deux systèmes construisent du capital sous forme de prédictions et d’autres choses, alors vous pouvez commencer à voir qu’ils s’alignent vraiment et deviennent plus que la somme de leurs parties. Vous pouvez obtenir plus que ce que vous mettez dedans.

Et je pense que c’est pourquoi je considère que ceci est l’un de nos articles les plus passionnants, car il représente un changement de pensée. Il représente un changement de pensée vers la considération des dispositifs neuroprothétiques comme des systèmes dotés d’une agence, des systèmes sur lesquels nous ne nous contentons pas de décrire l’agence, mais que nous comptons sur pour co-évoluer avec nous pour construire ces ressources. Le capital de communication qui nous permet de multiplier notre capacité à interagir avec le monde, nous permet de obtenir plus que ce que nous mettons dedans et permet aux gens de, je vais dire, d’un point de vue prothétique, arrêter de penser à la prothèse dans leur vie quotidienne et commencer à penser à vivre leur vie quotidienne. Non pas à l’appareil qui les aide à vivre leur vie quotidienne.

Quelles sont certaines des applications que vous voyez pour les interfaces cerveau-machine avec ce que vous venez de discuter ?

L’une de mes préférées est quelque chose que nous avons avancé, encore une fois, au cours des dix dernières années, c’est une technologie appelée commutation adaptative. La commutation adaptative est basée sur la connaissance que de nombreux systèmes avec lesquels nous interagissons dans la vie quotidienne s’appuient sur nous pour basculer entre de nombreux modes ou fonctions. Que ce soit basculer entre des applications sur mon téléphone ou que je tente de déterminer le bon réglage sur mon perceuse ou que je m’adapte à d’autres outils dans ma vie, nous basculons entre de nombreux modes ou fonctions tout le temps, en pensant à Ashby, notre capacité à choisir entre de nombreuses options. Donc, dans la commutation adaptative, nous utilisons l’apprentissage par différence temporelle pour permettre à un membre artificiel d’apprendre quelle fonction motrice une personne pourrait vouloir utiliser et quand elle veut l’utiliser. Vraiment, un principe très simple est que, simplement le fait que je tends la main pour prendre une tasse.

Eh bien, un système devrait être capable de construire des prédictions à travers l’expérience qui, dans cette situation, je vais probablement utiliser la fonction d’ouverture et de fermeture de la main. Je vais ouvrir et fermer ma main. Et puis, dans des situations similaires à l’avenir, pour être capable de prédire cela. Et lorsque je navigue dans le nuage tourbillonnant de modes et de fonctions, me donner plus ou moins celles que je veux sans avoir à parcourir toutes ces nombreuses options. Et c’est un exemple très simple de construction de ce capital de communication. Vous avez un système qui construit en fait des prédictions à travers l’interaction, ce sont des prédictions sur cette personne, cette machine, leur relation dans cette situation à ce moment-là. Et cette ressource partagée permet ensuite au système de reconfigurer son interface de contrôle en temps réel, de telle sorte que la personne obtienne ce qu’elle veut et quand elle le veut. Et vraiment, dans une situation où le système est très, très sûr de quelle fonction motrice une personne pourrait vouloir, il peut en fait la sélectionner pour elle pendant qu’elle y va.

Et la chose cool, c’est que la personne a toujours la capacité de dire : “Ah, c’est ce que je voulais vraiment”, et de basculer vers une autre fonction motrice. Dans un bras robotique, cela pourrait être différents types de prises, que ce soit façonner la prise pour saisir une poignée de porte ou ramasser une clé ou serrer la main de quelqu’un. Ce sont différents modes de fonctions, différents modèles de prises. Il est vraiment intéressant de voir que le système peut commencer à construire une appréciation de ce qui est approprié dans quelle situation. Des unités de capital que les deux parties peuvent utiliser pour se déplacer plus rapidement dans le monde, et avec moins de charge cognitive, surtout dans la partie de l’unité.

Merci pour cette interview incroyable, les lecteurs qui souhaitent en savoir plus devraient visiter les ressources suivantes :

Dr. Patrick M. Pilarski page de l’Université de l’Alberta.
Conférence Upper Bound AI.
Amii (Institut d’intelligence des machines de l’Alberta)

Antoine Tardif, CEO & Founder of Unite.AI

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.

Unite.AI

Patrick M. Pilarski, Ph.D. Chaire de recherche en intelligence artificielle du Canada CIFAR (Amii) – Série d’entretiens

You may like