Interviews
Patrick M. Pilarski, Ph.D. Canada CIFAR AI Chair (Amii) – Intervieuserie

Dr. Patrick M. Pilarski er en Canada CIFAR Artificial Intelligence Chair, tidligere Canada Research Chair i Machine Intelligence for Rehabilitation, og en Associate Professor i afdelingen for Fysisk Medicin og Rehabilitation, Medicinafdelingen, University of Alberta.
I 2017 co-foundede Dr. Pilarski DeepMinds første internationale forskningskontor, beliggende i Edmonton, Alberta, hvor han fungerede som kontorleder og Senior Staff Research Scientist indtil 2023. Han er Fellow og bestyrelsesmedlem i Alberta Machine Intelligence Institute (Amii), co-leader af Bionic Limbs for Improved Natural Control (BLINC) Laboratory, og er hovedundersøger ved Reinforcement Learning and Artificial Intelligence Laboratory (RLAI) og Sensory Motor Adaptive Rehabilitation Technology (SMART) Network på University of Alberta.
Dr. Pilarski er award-vindende forfatter eller co-forfatter af over 120 peer-reviewed artikler, Senior Member of the IEEE, og har været støttet af provinsiale, nationale og internationale forskningsbevillinger.
Vi satte os ned til en interview under den årlige 2023 Upper Bound-konference om AI, der afholdes i Edmonton, AB, og afholdes af Amii (Alberta Machine Intelligence Institute).
Hvordan fandt du vej til AI? Hvad tiltrak dig til branchen?
Det er to separate spørgsmål. I forhold til, hvad der tiltrækker mig til AI, er der noget smukt ved, hvordan kompleksitet kan opstå, og hvordan struktur kan opstå ud af kompleksitet. Intelligens er blot et af disse fantastiske eksempler på det, så uanset om det kommer fra biologi eller om det kommer fra, hvordan vi ser kompleks adfærd opstå i maskiner, synes jeg, der er noget smukt ved det. Det har altid fascineret mig i en meget lang tid, og min meget lange og snoede vej til at arbejde i området af AI, som jeg arbejder i nu, som er maskiner, der lærer gennem prøver og fejl, forstærkningssystemer, der interagerer med mennesker, mens de begge er dybt involveret i erfaringen, strømmen af oplevelse, flowet af tid, kom gennem alle mulige forskellige plateauer. Jeg studerede, hvordan maskiner og mennesker kunne interagere i forhold til biomekaniske enheder og bioteknologi, ting som kunstige lemmer og proteser.
Jeg kiggede på, hvordan AI kan bruges til at støtte medicinske diagnoser, hvordan vi kan bruge maskinintelligens til at begynde at forstå mønstre, der fører til sygdom eller hvordan forskellige sygdomme måske præsenterer sig i forhold til optagelser på en maskine. Men det er alle en del af denne lange og snoede vej til at begynde at værdsætte, hvordan man kan få meget komplekse adfærder ud af meget simple grundlag. Og det er det, jeg virkelig elsker, især om forstærkningslæring, idéen om, at maskinen kan indlejre sig i strømmen af tid og lære af sin egen erfaring for at udvise meget komplekse adfærder og fange både de komplekse fænomener, virkelig, i verden omkring det. Det har været en drivende kraft.
Mekanikken af det, jeg faktisk gjorde en masse sportsmedicinsk træning og ting som sådan tilbage i high school. Jeg studerede sportsmedicin, og nu er jeg her og arbejder i en miljø, hvor jeg kigger på, hvordan maskinintelligens og rehabiliteringsteknologier kommer sammen for at støtte mennesker i deres daglige liv. Det er en meget interessant rejse, som den sideløbende fascination med komplekse systemer og kompleksitet, og så den meget praktiske pragmatik om, hvordan vi starter med at tænke over, hvordan mennesker kan blive bedre støttet, leve livene, de vil leve.
Hvordan førte sport til, at du kom til at arbejde med proteser?
Hvad er virkelig interessant om fag som sportsmedicin er at kigge på det menneskelige legeme og hvordan en persons unikke behov, enten det er sport eller andet, kan faktisk blive støttet af andre mennesker, af procedurer og processer. De bioniske lemmer og proteseteknologier handler om at bygge enheder, bygge systemer, bygge teknologi, der hjælper mennesker med at leve livene, de vil leve. Disse to ting er virkelig tæt forbundne. Det er faktisk rigtig spændende at kunne komme fuldkreds og have nogle af disse meget tidligere interesser komme til udfoldelse i, igen, co-lede et laboratorium, hvor vi kigger på… og især maskinlæringsystemer, der arbejder sammen på en tæt koplet måde med personen, de er designet til at støtte.
Du har tidligere diskuteret, hvordan en protese tilpasser sig personen i stedet for, at personen tilpasser sig protesen. Kan du tale om maskinlæringen bag det?
Absolut. Som grundlag i historien om værktøjsbrug har mennesker tilpasset os selv til vores værktøjer, og derefter har vi tilpasset vores værktøjer til de behov, vi har. Og så er der denne iterative proces af, at vi tilpasser os til vores værktøjer. Vi er, lige nu, på et vendepunkt, hvor vi for første gang kan forestille os at bygge værktøjer, der bringer nogle af de samme kendetegn som menneskelig intelligens. Værktøjer, der faktisk vil tilpasse sig og forbedre sig, mens de bliver brugt af en person. De underliggende teknologier støtter kontinuerlig læring. Systemer, der kan kontinuerligt lære af en pågående strøm af erfaring. I dette tilfælde er forstærkningslæring og mekanismerne, der understøtter det, ting som temporal difference learning, virkelig kritiske for at bygge systemer, der kan kontinuerligt tilpasse sig, mens de interagerer med en person og mens de er i brug af en person, der støtter dem i deres daglige liv.
Kan du definere temporal difference learning?
Absolut, hvad jeg virkelig kan lide om det, er, at vi kan tænke over de grundlæggende teknologier, temporal difference learning og de fundamentale prædiktionslæringsalgoritmer, der understøtter meget af det, vi arbejder med i laboratoriet. Du har et system, der, ligesom vi, laver en prædiktionsom, hvad fremtiden vil se ud til med hensyn til en signal, med hensyn til noget som det fremtidige belønning, som vi normalt ser. Men enhver anden signal, du måske kan forestille dig, som hvor meget kraft jeg udøver lige nu? Hvor varmt vil det være i morgen? Hvor mange donuts vil jeg have i morgen? Disse er de mulige ting, du måske kan forestille dig at prædiktere. Og så er den grundlæggende algoritme virkelig at kigge på forskellen mellem min gæt om, hvad der vil ske lige nu, og min gæt om, hvad der vil ske i fremtiden sammen med enhver form for signal, jeg modtager lige nu.
Hvor meget kraft udøver jeg som en robotarm, der løfter op en kop kaffe eller en kop vand? Dette kan være at kigge på forskellen mellem prædiktionen om, hvor meget kraft det vil udøve lige nu eller over en periode i fremtiden. Og så sammenligne det med mine forventninger om fremtiden og den kraft, det faktisk udøver. Sæt det hele sammen, og du får denne fejl, den temporale difference fejl. Det er denne nice akkumulation af den temporalt udstrakte forudsigelse i fremtiden og forskellen mellem dem, som du kan bruge til at opdatere strukturen af den læringsmaskine selv.
Og så, igen, for konventionel forstærkningslæring baseret på belønning, kan dette være at kigge på at opdatere, hvordan maskinen handler baseret på den fremtidige forventede belønning, man måske kan se. For meget af det, vi gør, er det at kigge på andre former for signaler, bruge generaliserede værdifunktioner, som er tilpasningen af forstærkningslæringsprocessen, temporal difference learning af belønningsignaler til enhver form for signal, der måske er relevant for maskinens drift.
Du taler ofte om en protese kaldet Cairo Toe i dine præsentationer. Hvad har den at lære os?

The Cairo Toe University of Basel, LHTT. Image: Matjaž Kačičnik
Jeg kan lide at bruge eksemplet på Cairo Toe, en 3000 år gammel protese. Jeg arbejder i området af neuroproteser, og vi ser nu meget avancerede robotiske systemer, der i nogle tilfælde kan have det samme niveau af kontrol eller graden af kontrol som biologiske kropsdele. Og alligevel går jeg tilbage til en meget stiliseret trætå fra 3000 år siden. Jeg synes, det er dejligt, fordi det er et eksempel på, hvordan mennesker udvider sig selv med teknologi. Det er det, vi ser lige nu i forhold til neuroproteser og menneske-maskine-interaktion, ikke noget, der er underligt, nyt eller skørt. Vi har altid været værktøjsbrugere, og ikke-menneskelige dyr bruger også værktøjer. Der er mange fantastiske bøger om det, især af Frans de Waal, “Are We Smart Enough to Know How Smart Animals Are?”.
Denne udvidelse af os selv, forstærkningen og forbedringen af os selv gennem brugen af værktøjer er ikke noget nyt, det er noget, der har været sket siden tid og minde på den jord, vi er på lige nu, af de mennesker, der boede her. Det andet interessante ved Cairo Toe er, at beviset, i hvert fald fra de lærde rapporter om det, viser, at det blev tilpasset flere gange over dens samspil med dens brugere. De tilføjede faktisk og ændrede det, modificerede det under dens brug.
Min forståelse, det var ikke bare et fast værktøj, der var fastgjort til en person under deres liv, men det var et fast værktøj, der var fastgjort, men også modificeret. Det er et eksempel på, hvordan, igen, idéen om, at værktøjer tilpasses under deres levetid, og en vedvarende levetid, faktisk er noget, der også er meget gammelt. Det er ikke noget nyt, og der er mange lærepunkter, vi kan lære af samspillet mellem mennesker og værktøjer over mange, mange år.
Du har tidligere nævnt den feedback-vej mellem proteser og mennesket, kan du uddybe om feedback-vejen?
Vi er også i en særlig tid i forhold til, hvordan vi ser på forholdet mellem en person og maskinen, der søger at støtte dem i deres daglige liv. Når en person bruger en kunstig lem, lad os sige en person med lem-forskel, en person med en amputation, der bruger en kunstig lem. Traditionelt vil de bruge det meget som et værktøj, som en udvidelse af deres krop, men vi vil se, at de overvejende afhænger af, hvad vi betragter som kontrol-vejen. At nogen form for deres hjul eller deres intention bliver overført til enheden, der så er opgaven med at finde ud af, hvad det er, og derefter udføre på det, enten åbner og lukker en hånd eller bøjer en albue eller skaber en knibtak for at gribe en nøgle. Vi ser ofte ikke mennesker, der studerer eller overvejer feedback-vejen.
Så et stort antal kunstige lemmer, du måske ser udrullet kommercielt, kan vejene af information, der flyder fra enheden tilbage til personen, være den mekaniske kobling, måden, de faktisk føler kræfterne på lemmen og handler på dem. Det kan være, de hører motorens knagen eller de ser, mens de samler en krave og flytter den over en skrivebord eller de griber den fra en anden del af deres arbejdsplads. Og så er disse veje den traditionelle måde at gøre det på. Der sker fantastiske ting over hele verden for at se på, hvordan information måske bedre kan blive ført tilbage fra en kunstig lem til personen, der bruger den. Især her i Edmonton, er der en masse rigtig cool arbejde med at genforbinde nervesystemet, målrettet nerve-renovering og andre ting for at støtte den vej. Men det er stadig et meget varmt og nyt område at studere for at tænke over, hvordan maskinlæring kan støtte interaktionerne i forhold til den feedback-vej.
Hvordan maskinlæring kan støtte et system, der måske opfatter og prædikerer meget om sin verden, faktisk transmitterer, at have den information overført tydeligt og effektivt tilbage til personen, der bruger det. Hvordan kan maskinlæring støtte det? Jeg synes, det er et fantastisk emne, fordi hvis du har både den feedback-vej og den kontrol-vej, begge veje tilpasser sig, og både enheden, der bruges af personen, og personen selv bygger modeller af hinanden. Du kan gøre noget næsten mirakuløst. Du kan næsten transmittere information for gratis. Hvis du har begge disse systemer, der faktisk er godt afstemt til hinanden, har de bygget en meget kraftfuld model af hinanden, og de har en tilpasning til både kontrol- og feedback-vejene, du kan danne meget tætte partnerskaber mellem mennesker og maskiner, der kan overføre en masse information med meget lidt indsats og meget lidt båndbredde.
Og det åbner op for hele nye områder af menneske-maskine-koordination, især i området af neuroproteser. Jeg synes, det er en ret mirakuløs tid for os at starte med at studere dette område.
Tænker du, at disse vil blive 3D-printet i fremtiden eller hvordan tænker du, at produktionen vil gå?
Jeg føler ikke, at jeg er den bedste til at spekulere over, hvordan det måske kan ske. Jeg kan sige, at vi ser en stor stigning i kommercielle leverandører af neuroprotese-enheder, der bruger additiv fremstilling, 3D-printning, og andre former for additiv på stedet-fremstilling til at skabe deres enheder. Det er også rigtig spændende at se, at det ikke bare er en prototype, der bruger additiv fremstilling eller 3D-printning, men 3D-printning bliver en integreret del af, hvordan vi leverer enheder til enkeltpersoner, og hvordan vi optimerer disse enheder til de præcise mennesker, der bruger dem.
Additiv fremstilling eller skræddersyede proteser passerer i hospitaler hele tiden. Det er en naturlig del af pleje til mennesker med lem-forskel, der har brug for assisterende teknologier eller andre former for rehabiliteringsteknologier. Jeg synes, vi begynder at se, at meget af denne tilpasning begynder at blande sig med fabrikationen af enhederne, og ikke bare efterlades til plejeudbyderne. Og det er også rigtig spændende. Jeg synes, der er en fantastisk mulighed for enheder, der ikke bare ligner hænder eller bruges som hænder, men enheder, der meget præcist møder behovene hos den person, der bruger dem, og som tillader dem at udtrykke sig på den måde, de vil udtrykke sig, og leve livene, de vil leve, ikke bare på den måde, vi tænker, en hånd skal bruges i daglig liv.
Du har skrevet over 120 artikler. Er der en, der står ud for dig, som vi bør kende til?
Der er en artikel, der er offentliggjort i Neural Computing Applications, men det repræsenterer toppen af en isbjerg af tanker, vi har fremført i mere end et årti nu, om rammer for, hvordan mennesker og maskiner interagerer, især hvordan mennesker og protese-enheder interagerer. Det er idéen om kommunikativ kapital. Og så er dette artiklen, vi nyligt offentliggjorde.
Og denne artikel lægger frem vores syn på, hvordan prædiktioner, der lærer og vedligeholdes i realtid af en, sagen, en protese-enhed, der interagerer med personen, personen selv kan danne en kapital, en ressource, som begge parter kan stole på. Husk, tidligere sagde jeg, vi kan gøre noget ret fantastisk, når vi har et menneske og en maskine, der begge bygger modeller af hinanden, tilpasser sig i realtid baseret på erfaring, og starter med at overføre information i en to-vejs kanal. Som en sideløbende bemærkning, fordi vi lever i en magisk verden, hvor der er optagelser, og du kan klippe ting ud af det.
Det er næsten som magi.
Præcis. Det lyder som magi. Hvis vi går tilbage til tænkere som Ashby, W. Ross Ashby, tilbage i 1960’erne og hans bog “Introduction of Cybernetics” talte om, hvordan vi kan forstærke den menneskelige intelligens. Og han sagde faktisk, at det kommer ned til at forstærke evnen hos en person til at vælge mellem en af mange muligheder. Og dette gøres muligt af systemer, hvor en person interagerer med, sagen, en maskine, hvor der er en kanal af kommunikation åben mellem dem. Så hvis vi har denne kanalen af kommunikation åben, hvis det er to-vejs, og hvis begge systemer bygger kapital i form af prædiktioner og andre ting, så kan du starte med at se dem virkelig tilpasse sig og blive mere end summen af deres dele. Du kan få mere ud end de putter i.
Og jeg synes, det er hvorfor jeg betragter denne som en af vores mest spændende artikler, fordi det faktisk repræsenterer en tankevending. Det repræsenterer en tankevending mod at tænke på neuroprotese-enheder som systemer med agentur, systemer, vi ikke bare kan tilskrive agentur til, men også stole på for at kunne tilpasse os med os for at bygge op disse ressourcer. Den kommunikative kapital, der lader os multiplicere vores evne til at interagere med verden, lader os få mere ud end vi putter i, og lader mennesker, jeg vil sige, fra et protese-perspektiv, stoppe med at tænke på protesen i deres daglige liv og starte med at tænke på at leve deres daglige liv. Ikke enheden, der hjælper dem med at leve deres daglige liv.
Hvad er nogle af de anvendelser, du ser for hjernen-maskine-grænseflader med det, du lige diskuterede?
En af mine favoritter er noget, vi har fremført, igen, over de sidste næsten 10 år, er en teknologi kaldet adaptiv skiftning. Adaptiv skiftning er baseret på kendskabet til, at mange systemer, vi interagerer med på daglig basis, afhænger af os skiftende mellem mange tilstande eller funktioner. Enten jeg skifter mellem apps på min telefon eller jeg prøver at finde den rigtige indstilling på min boremaskine eller jeg tilpasser andre værktøjer i mit liv, vi skifter mellem mange tilstande eller funktioner hele tiden, tænker tilbage på Ashby, vores evne til at vælge mellem mange muligheder. Så i adaptiv skiftning bruger vi temporal difference learning til at låse en kunstig lem op til at lære, hvilken motorfunktion en person måske vil bruge, og hvornår de vil bruge den. Så virkelig ret enkelt præmis er, at blot det faktum, at jeg rækker ud efter en kop og lukker min hånd.
Vel, et system skal være i stand til at bygge op prædiktioner gennem erfaring, så i denne situation er jeg sandsynligvis gået til at bruge hånd-åbn-luk-funktionen. Og derefter i fremtiden, i lignende situationer, kan det forudsige det. Og når jeg navigerer gennem den svirrende sky af tilstande og funktioner, kan det give mig mere eller mindre de funktioner, jeg vil have, uden at jeg skal gå igennem alle disse mange muligheder. Og dette er et meget enkelt eksempel på at bygge op den kommunikative kapital. Du har et system, der faktisk bygger op prædiktioner gennem interaktion, de er prædiktioner om personen, maskinen, deres forhold i den situation på det tidspunkt. Og den fælles ressource tillader så systemet at omkonfigurere sin kontrolgrænseflade på flyvet, så personen får, hvad de vil have, og hvornår de vil have det. Og virkelig, i en situation, hvor systemet er meget, meget sikker på, hvilken motorfunktion en person måske vil have, kan det faktisk bare vælge det for dem, mens de går ind.
Og det cool er, at personen altid har muligheden for at sige, “Ah, det er, hvad jeg virkelig ville have,” og skifte til en anden motorfunktion. I en robotarm kan det være forskellige former for håndgreb, enten det er at forme grebet for at gribe en dørhåndtag eller samle en nøgle eller give hånd. Disse er forskellige tilstande eller funktioner, forskellige greb-mønstre. Det er virkelig interessant, at systemet kan starte med at bygge op en forståelse af, hvad der er passende i hvilken situation. Enheder af kapital, som begge parter kan stole på for at flytte mere hurtigt gennem verden, og med mindre kognitivt pres, især i den enhed.
Tak for det fantastiske interview, læsere, der ønsker at lære mere, skal besøge følgende ressourcer:
- Dr. Patrick M. Pilarski University of Alberta-side.
- Upper Bound AI Konference.
- Amii (Alberta Machine Intelligence Institute)












