Connect with us

Patrick M. Pilarski, fil. dr. Kanadas CIFAR AI-stol (Amii) – Intervjuserie

Intervjuer

Patrick M. Pilarski, fil. dr. Kanadas CIFAR AI-stol (Amii) – Intervjuserie

mm

Dr. Patrick M. Pilarski är en Kanadas CIFAR Artificial Intelligence Chair, tidigare Kanadas forskningsledare i maskinintelligens för rehabilitering och biträdande professor i avdelningen för fysisk medicin och rehabilitering, medicinska fakulteten, University of Alberta.

År 2017 co-founded Dr. Pilarski DeepMinds första internationella forskningskontor, belägen i Edmonton, Alberta, där han tjänstgjorde som kontorsledare och senior forskare fram till 2023. Han är fellow och styrelseledamot i Alberta Machine Intelligence Institute (Amii), co-leder Bionic Limbs for Improved Natural Control (BLINC) Laboratory och är huvudforskare vid Reinforcement Learning and Artificial Intelligence Laboratory (RLAI) och Sensory Motor Adaptive Rehabilitation Technology (SMART) Network vid University of Alberta.

Dr. Pilarski är en prisbelönt författare eller medförfattare till mer än 120 granskade artiklar, senior medlem i IEEE och har stötts av provinsiella, nationella och internationella forskningsbidrag.

Vi satte oss ner för en intervju på den årliga 2023 Upper Bound-konferensen om AI som hålls i Edmonton, AB och som arrangeras av Amii (Alberta Machine Intelligence Institute).

Hur hamnade du i AI? Vad drog dig till branschen?

Det är två separata frågor. Vad som drar mig till AI är att det finns något vackert i hur komplexitet kan uppstå och hur struktur kan uppstå ur komplexitet. Intelligens är bara ett av dessa fantastiska exempel, så oavsett om det kommer från biologi eller hur vi ser komplicerat beteende uppstå i maskiner, tycker jag att det finns något vackert i det. Det har alltid fascinerat mig under en mycket lång tid, och min långa och vindlande resa till att arbeta inom det område jag arbetar inom nu, som är maskiner som lär sig genom trial and error, förstärknings-system som interagerar med människor medan de båda är nedsänkta i det, flödet av upplevelse, tidsflöde, kom genom alla möjliga olika platser.

Jag studerade hur maskiner och människor kunde interagera i termer av biomekatroniska enheter och bioteknik, saker som konstgjorda lemmar och proteser.

Jag tittade på hur AI kan användas för att stödja medicinsk diagnostik, hur vi kan använda maskinintelligens för att börja förstå mönster som leder till sjukdom eller hur olika sjukdomar kan presentera sig i termer av inspelningar på en maskin. Men allt detta är en del av denna långa och vindlande resa för att verkligen börja uppskatta hur man kan få mycket komplexa beteenden ur mycket enkla grunder. Och det är vad jag verkligen älskar, särskilt om förstärkningsinlärning, är idén att maskinen kan inbädda sig i flödet av tid och lära av sin egen upplevelse för att utvisa mycket komplexa beteenden och fånga både de komplexa fenomenen, verkligen, i världen runt omkring.

Mechanikerna i det, jag gjorde faktiskt mycket idrottsmedicinsk utbildning och sådant som det. Jag studerade idrottsmedicin och nu är jag här och arbetar i en miljö där jag tittar på hur maskinintelligens och rehabiliteringsteknologi kommer samman för att stödja människor i deras dagliga liv. Det är en mycket intressant resa, som den sidofascinationen med komplexa system och komplexitet, och sedan den mycket praktiska pragmatismen i hur vi börjar tänka på hur människor kan bli bättre stödda, leva liv de vill leva.

Hur ledde idrotten dig initialt till proteser?

Vad som är riktigt intressant om fält som idrottsmedicin är att titta på den mänskliga kroppen och hur någons unika behov, antingen det är idrott eller annat, faktiskt kan stödjas av andra människor, av förfaranden och processer. De bioniska lemmarna och protesteknologierna handlar om att bygga enheter, bygga system, bygga teknologi som hjälper människor att leva liv de vill leva. Dessa två saker är riktigt tätt sammankopplade. Det är faktiskt riktigt spännande att kunna komma full cirkel och ha några av dessa mycket tidigare intressen komma till frukt i, igen, co-ledda ett labb där vi tittar på… Och särskilt maskinlärningssystem som fungerar i en tätt kopplad väg, personen som de är utformade för att stödja.

Du har tidigare diskuterat hur en protes anpassar sig till personen istället för att personen anpassar sig till protesen. Kan du prata om maskinlärningen bakom detta?

Absolut. Som en grund i historien om verktygsanvändning har människor anpassat sig till sina verktyg och sedan har vi anpassat våra verktyg till de behov vi har. Och så finns det denna iterativa processen av oss som anpassar oss till våra verktyg. Vi ser nu, för första gången, att vi kan bygga verktyg som bringar in några av de kännetecken som mänsklig intelligens har. Verktyg som faktiskt anpassar sig och förbättras medan de används av en person. De underliggande teknologierna stöder kontinuerligt lärande. System som kan kontinuerligt lära av en pågående ström av upplevelser. I det här fallet är förstärkningsinlärning och de mekanismer som ligger till grund för det, saker som tidsdifferensinlärning, riktigt kritiska för att bygga system som kan kontinuerligt anpassa sig medan de interagerar med en person och medan de används av en person som stödjer dem i deras dagliga liv.

Kan du definiera tidsdifferensinlärning?

Absolut, vad jag verkligen gillar med det här är att vi kan tänka på de grundläggande teknologierna, tidsdifferensinlärning och de grundläggande prediktionsinlärningsalgoritmerna som ligger till grund för mycket av det vi arbetar med i labbet. Du har ett system som, likt oss, gör en prediktion om vad framtiden kommer att se ut som med avseende på något signal, med avseende på något som den framtida belöningen är vad vi vanligtvis ser. Men vilken annan signal du kan tänka dig, som hur mycket kraft jag utövar just nu? Hur varmt kommer det att bli? Hur många munkar kommer jag att ha imorgon? Dessa är de möjliga sakerna du kan tänka dig förutsäga.

Hur mycket kraft jag utövar som en robotarm lyfter upp en kopp kaffe eller en kopp vatten? Detta kan vara att titta på skillnaden mellan min gissning om vad som kommer att hända just nu och min gissning om vad som kommer att hända i framtiden tillsammans med vilken signal jag för närvarande tar emot.

Hur mycket kraft jag utövar som en robotarm lyfter upp en kopp kaffe eller en kopp vatten? Detta kan vara att titta på skillnaden mellan min gissning om vad som kommer att hända just nu och min gissning om vad som kommer att hända i framtiden tillsammans med vilken signal jag för närvarande tar emot.

Ställ allt detta tillsammans, och du får det här felet, tidsdifferensfelet. Det är denna fina ackumulering av den tidsutsträckta förutsägelsen i framtiden och skillnaderna mellan dem, som du sedan kan använda för att uppdatera strukturen på lärmaskinen själv.

Och så, igen, för konventionell förstärkningsinlärning baserad på belöning, detta kunde vara att titta på uppdatering av hur maskinen agerar baserat på den framtida förväntade belöningen du kan uppfatta. För mycket av det vi gör, är det att titta på andra typer av signaler, att använda generaliserade värdefunktioner, som är anpassningen av förstärkningsinlärningsprocessen, tidsdifferensinlärning av belöningsignal till vilken signal som helst som kan vara tillämplig för maskinens drift.

Du pratar ofta om en protes som kallas Kairo-tån i dina presentationer. Vad har den att lära oss?

Kairo-tån University of Basel, LHTT. Bild: Matjaž Kačičnik

Jag gillar att använda exemplet Kairo-tån, en 3000 år gammal protes. Jag arbetar inom området neuroproteser, vi ser nu mycket avancerade robotiska system som i vissa fall kan ha samma nivå av kontroll eller grad av kontroll som biologiska kroppsdelar. Och ändå, jag går tillbaka till en mycket stiliserad trä-tå från 3000 år sedan. Jag tycker att det är något som är trevligt, det är ett exempel på att människor utvidgar sig med teknologi. Det är vad vi ser just nu i termer av neuroproteser och människa-maskin-interaktion, det är inte något som är konstigt, nytt eller underligt. Vi har alltid varit verktygsanvändare, icke-mänskliga djur använder också verktyg. Det finns många bra böcker om det, särskilt av Frans de Waal, “Är vi tillräckligt smarta för att veta hur smarta djur är?“.

Denna utvidgning av oss själva, förstärkningen och förbättringen av oss genom användningen av verktyg är inte något nytt, det är något som har hänt sedan tid och minne i den mark vi befinner oss på just nu av de människor som bodde här. Den andra intressanta saken om Kairo-tån är att bevisen, åtminstone från de lärda rapporterna om det, visar att det anpassades flera gånger under dess interaktioner med dess användare. De gick faktiskt in och anpassade det och ändrade det, modifierade det under dess användning.

Min förståelse, det var inte bara ett fast verktyg som var fäst vid en person under deras livstid, det var ett fast verktyg som var fäst men också modifierat. Det är ett exempel på hur, igen, idén att verktyg anpassas under deras användningstid och en varaktig användningstid är faktiskt något som också är ganska gammalt. Det är inte något nytt, och det finns många lärdomar vi kan lära oss från den samanpassning av människor och verktyg under många, många år.

Du har tidigare nämnt den återkopplingsväg som finns mellan proteser och människor, kan du utveckla den återkopplingsvägen?

Vi är också i en speciell tid i termer av hur vi ser på förhållandet mellan en person och maskinen som syftar till att stödja dem i deras dagliga liv. När någon använder en konstgjord lem, säg någon med lem-differens, någon med en amputation som använder en konstgjord lem. Traditionellt kommer de att använda den mycket som ett verktyg, som en utvidgning av deras kropp, men vi ser dem i stor utsträckning lita på vad vi kallar kontrollvägen. Att någon form av deras hjul eller deras avsikt överförs till enheten, som sedan är uppgiften att lista ut vad det är, och sedan utföra på det, antingen det är att öppna och stänga en hand eller böja en armbåge eller skapa en gripande grepp för att gripa en nyckel. Vi ser ofta inte människor studera eller överväga återkopplingsvägen.

Så många konstgjorda lemmar som du kan se distribueras kommersiellt, vägen för information som flödar från enheten tillbaka till personen kan vara den mekaniska kopplingen, sättet som de faktiskt känner av krafterna i lemmen och agerar på dem. Det kan vara att de hör motorn eller att de tittar på när de plockar upp en kopp och flyttar den över ett skrivbord eller när de griper den från en annan del av sin arbetsplats. Och så, dessa vägar är det traditionella sättet att göra det på. Det finns otroliga saker som händer över hela världen för att titta på hur information kan bättre föras tillbaka från en konstgjord lem till personen som använder den. Särskilt även här i Edmonton, det finns mycket coolt arbete som använder omkopplingen av nervsystemet, riktad nervrenovering och andra saker för att stödja den vägen. Men det är fortfarande ett mycket het och framväxande område för studier för att tänka på hur maskinlärning kan stödja interaktioner med avseende på den återkopplingsvägen.

Hur maskinlärning kan stödja ett system som kan uppfatta och förutsäga mycket om sin värld faktiskt överföra, ha den informationen överförd tydligt och effektivt tillbaka till personen som använder den. Hur kan maskinlärning stödja det? Jag tycker att det är ett fantastiskt ämne, för om du har båda den återkopplingsvägen och kontrollvägen, båda vägarna anpassar sig och både enheten som används av personen och personen själv bygger modeller av varandra. Du kan göra något nästan mirakulöst. Du kan nästan överföra information utan kostnad. Om du har båda dessa system som faktiskt är väl anpassade till varandra, de har byggt en mycket kraftfull modell av varandra och de har en anpassning båda till kontroll och återkopplingsvägar, du kan bilda mycket tighta partnerskap mellan människor och maskiner som kan överföra en enorm mängd information med mycket liten ansträngning och mycket liten bandbredd.

Och det öppnar upp hela nya riken av människa-maskin-samordning, särskilt inom området neuroproteser. Jag tycker att det är en ganska mirakulös tid för oss att börja studera det här området.

Tror du att de kommer att skrivas ut i 3D i framtiden eller hur tror du tillverkningen kommer att fortskrida?

Jag känner inte att jag är den bästa platsen att spekulera i hur det kan hända. Jag kan säga att vi ser en stor ökning av kommersiella leverantörer av neuroprotesenheter som använder additiv tillverkning, 3D-utskrifter och andra former av additiv tillverkning på plats för att skapa sina enheter. Det är också riktigt kul att se att det inte bara är en prototyp som använder additiv tillverkning eller 3D-utskrifter, det är 3D-utskrifter som blir en integrerad del av hur vi tillhandahåller enheter till individer och hur vi optimerar dessa enheter till exakt de personer som använder dem.

Additiv tillverkning eller skräddarsydd tillverkning, anpassad protespassning händer på sjukhus hela tiden. Det är en naturlig del av vårdtjänster till människor med lem-differens som behöver assisterad teknik eller annan typ av rehabiliteringsteknik. Jag tycker att vi börjar se att mycket av den anpassningen börjar blanda sig med tillverkarna av enheterna, och inte bara lämnas till vården. Och det är också riktigt spännande. Jag tycker att det finns en stor möjlighet för enheter som inte bara ser ut som händer eller används som händer, men enheter som mycket exakt möter behoven hos den person som använder dem, som låter dem uttrycka sig på det sätt de vill uttrycka sig, och låter dem leva liv de vill leva, inte bara det sätt vi tror en hand ska användas i dagligt liv.

Du har skrivit över 120 papper. Finns det ett som sticker ut för dig som vi borde veta om?

Det finns ett nyligen publicerat papper i neurala datorapplikationer, men det representerar toppen av ett isberg av tankar som vi har lagt fram under en mycket lång tid nu, på ramverk för hur människor och maskiner interagerar, särskilt hur människor och protesenheter interagerar. Det är idén om kommunikativt kapital. Och så detta är papper som vi nyligen publicerade.

Och detta papper lägger fram vår syn på hur förutsägelser som lärts och underhålls i realtid av en, säg, protesenhet som interagerar med personen, personen själv kan bilda vad som i princip är kapital, kan bilda en resurs som båda parter kan lita på. Kom ihåg, tidigare sa jag att vi kan göra något riktigt spektakulärt när vi har en människa och en maskin som båda bygger modeller av varandra, anpassar sig i realtid baserat på upplevelse, och börjar överföra information i en bidirektional kanal. Som en sidanot, eftersom vi lever i en magisk värld där det finns inspelningar och du kan klippa ut saker ur det.

Det är i princip som magi.

Exakt. Det låter som magi. Om vi går tillbaka till tänkare som Ashby, W. Ross Ashby, tillbaka på 1960-talet och hans bok “Introduktion till cybernetik” pratade om hur vi kan förstärka den mänskliga intelligensen. Och han sa att det kommer ner till att förstärka förmågan hos en person att välja mellan ett av många alternativ. Och detta görs möjligt av system där en person interagerar med, säg, en maskin, där det finns en kanal för kommunikation öppen mellan dem. Så om vi har den kanalen för kommunikation öppen, om den är bidirektional, och om båda systemen bygger kapital i form av förutsägelser och andra saker, då kan du börja se dem verkligen anpassa sig och bli mer än summan av deras delar. Du kan få ut mer än de sätter in.

Och jag tycker att det är varför jag anser att detta är ett av våra mest spännande papper, för det representerar en tankeförändring. Det representerar en tankeförändring mot att tänka på neuroprotesenheter som system med agentur, system som vi inte bara kan beskriva agentur till, men också lita på för att kunna anpassa oss till att bygga upp dessa resurser. Det kommunikativa kapitalet som låter oss förstärka vår förmåga att interagera med världen, låter oss få ut mer än vi sätter in och låter människor, jag ska säga, från ett protesperspektiv, sluta tänka på protesen i deras dagliga liv och börja tänka på att leva sitt dagliga liv. Inte enheten som hjälper dem att leva sitt dagliga liv.

Vilka är några av de tillämpningar du ser för maskin-till-hjärna-gränssnitt med det du just diskuterade?

En av mina favoriter är något vi lagt fram, igen, under de senaste nästan 10 åren, är en teknik som kallas adaptiv switchning. Adaptiv switchning är baserad på kunskapen att många system vi interagerar med i dagligt liv beror på att vi växlar mellan många lägen eller funktioner. Antingen jag växlar mellan appar på min telefon eller jag försöker lista ut rätt inställning på min borr eller jag anpassar andra verktyg i mitt liv, vi växlar mellan många lägen eller funktioner hela tiden, tänkande tillbaka till Ashby, vår förmåga att välja mellan många alternativ. Så i adaptiv switchning, använder vi tidsdifferensinlärning för att låta en konstgjord lem lära sig vilken motorfunktion en person kan vilja använda och när de vill använda den. Så verkligen ganska enkelt är att, bara handlingen att jag når över till en kopp och stänger min hand.

Antoine är en visionär ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och främja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika omstörtande för samhället som elektricitet, och fångas ofta i extas över potentialen för omstörtande teknologier och AGI. Som en futurist, är han dedikerad till att utforska hur dessa innovationer kommer att forma vår värld. Dessutom är han grundare av Securities.io, en plattform som fokuserar på att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.