Interviews
Paolo Pirjanian, CEO og grundlægger af Embodied – Interview Series

Paolo Pirjanian er en Armenien født i Iran og flygtede til Danmark som teenager. Fra han var ung, var han fascineret af computere og begyndte at kode i sit soveværelse. Efter at have fået sin ph.d. i robotteknologi, blev Paolo en tidlig leder inden for forbrugerrobotik, som har mere end 16 års erfaring med at udvikle og kommercialisere avancerede hjemmerobotter. Han arbejdede hos NASA JPL og ledede hold og virksomheder i verdensklasse hos iRobot®, Evolution Robotics® og andre. I 2016 grundlagde Paolo Embodied, Inc. med visionen om at bygge socialt og følelsesmæssigt intelligente digitale ledsagere, der forbedrer pleje og velvære og støtter mennesker i at leve et bedre liv hver dag.
Hvad tiltrak dig oprindeligt til kunstig intelligens og robotteknologi?
Min fascination af kunstig intelligens og robotteknologi stammer tilbage fra min barndom. Jeg blev fordrevet fra land til land flere gange, indtil vores familie flyttede til Danmark. Ved et uheld opdagede jeg en computer. Jeg blev så fascineret af det, at jeg låste mig inde på mit værelse og begyndte at kode hele dagen og natten i månedsvis. Mine forældre troede, jeg var deprimeret eller på stoffer, men det var ikke noget af det. Jeg var bare så fuldstændig fascineret af computeren!
På samme tid så jeg en dokumentar på tv af Pixar. Pixar præsenterede deres første animerede kortfilm, Luxo Jr., en kortfilm på to minutter om to bordlamper, der løber rundt og leger med en bold. Jeg var så fascineret af det og forbløffet over, at en computer, som jeg lige skulle lære at kode, kunne generere så indtagende karakterer på tv, som vækker så mange følelser i mig. Så derfra besluttede jeg mig for at gå i skole for at studere robotteknologi, og til sidst fik jeg min ph.d.
Jeg flyttede derefter til USA for at arbejde på Mars-rovere hos NASA, hvilket var et barndomsdrømmejob. Til sidst kom jeg i gang med iværksætteri for at udvikle SLAM navigationsteknologi, der nu muliggør iRobots produkter.
Men når jeg ser tilbage, indså jeg, at min inspiration til hele denne rejse faktisk var Pixars korte animation om at bringe liv til livløse genstande. Så det er derfor, vi skabte Embodied – for at bringe liv til robotter, der kan interagere med mennesker, med fokus på at hjælpe børn med social-emotionel udvikling.
Hvornår stødte du først på konceptet til at lancere Evolution Robotics?
Evolution Robotics blev oprindeligt startet af Bill Gross fra Idealab i 2001 for at blive Robotics Microsoft, en dristig vision, som viste sig at være alt for tidligt og til sidst mislykkedes. Jeg var CTO og GM hos Evolution Robotics, og efter dets fiasko forhandlede jeg med Idealab om at udskille nogle af de kerneteknologier, som mit team og jeg havde udviklet, og starte en ny virksomhed. I 2008 startede den nye enhed, også kendt som Evolution Robotics, med at udvikle produkter ved hjælp af vores kernenavigationsteknologier, herunder NorthStar og vSLAM, som var banebrydende tilgange til rumlig kortlægning og autonom navigation svarende til det, vi ser i selvkørende biler, men målrettet mod billige forbrugerelektronikprodukter.
Vi udviklede en serie af produkter til automatisk fejning og mopping af hårde gulve kaldet Mint, som vi lancerede i 2010. I 2011 voksede vi hurtigt til $25 mio. i salg og blev købt af iRobot i 2012 for vores produktindtægter og vores navigationsteknologi vSLAM, som nu driver Roomba og Braava produktlinjer hos iRobot.
På det tidspunkt blev du CTO hos iRobot. Kunne du diskutere din erfaring med iRobot, og hvad du lærte af din erfaring?
Som CTO for iRobot var jeg i stand til hurtigt at integrere vSLAM i Roomba-produktlinjen for at lancere en ny model, der systematisk var i stand til at dække hele grundplanen uden at gå glip af et sted. Det hjalp virksomheden med at være foran konkurrenter som Dyson, der kom ud med systematiske rengøringsløsninger. vSLAM er nu en integreret del af iRobots flagskibsproduktlinjer Roomba og Braava.
Jeg nød at arbejde tæt sammen med Colin Angel, administrerende direktør for iRobot for at hjælpe med at sætte en strategisk retning for at gøre Roomba centralt i det tilsluttede hjems økosystem, hvor Roombas rumlige bevidsthed giver det en unik position i at forstå grundplanen og blive bindevævet mellem alle tilsluttede enheder. Den strategi ser ud til at have haft et stærkt fodfæste siden min afgang i 2015.
Derudover besluttede vi at fordoble Consumer Robotics-forretningen for at hjælpe iRobot med at fastholde sin globale førende position. Dette førte til frasalg af forsvarsforretningen og udtræden af andre perifere virksomheder for at bringe fokus og intensitet til forbrugerforretningen.
Ydermere skulle vi re-arkitekte organisationen for at kunne understøtte en softwaretung strategi med forbundne produkter. Det krævede en transformation af virksomhedskulturen for at omfavne en mere agil, iterativ tilgang.
Listen over ting, jeg lærte hos iRobot, er lang. En ting, der stikker ud, er styrken i teamkulturen. At forblive smidig og engageret i missionen er nok den vigtigste konkurrencefordel, som enhver virksomhed kan have over enhver patentportefølje og over forretningshemmeligheder. Hvis du har et højtydende team, som føler sig styrket og inspireret mod et klart mål, vil de være svære at stoppe.
Du er i øjeblikket grundlægger og administrerende direktør for Embodied. Kan du diskutere, hvad inspirationen var bag lanceringen af denne virksomhed?
Jeg nød virkelig min tid hos iRobot som CTO, og vi arbejdede på en masse spændende projekter og rykkede grænserne for robotteknologi. Det var spændende at lancere kommercielt succesfulde robotter på markedet, der udførte nyttige fysiske opgaver, såsom at støvsuge gulvet.
Men i baghovedet vidste jeg, at jeg stadig havde en livslang drøm at opfylde – at bygge socialt og følelsesmæssigt intelligente robot-ledsagere, der forbedrer pleje og velvære og forbedrer vores daglige liv. Jeg vidste, at vi var på et vendepunkt i den måde, vi vil interagere med teknologi på. Så med det besluttede jeg at sige op fra iRobot og starte Embodied.
Da vi startede Embodied, gentænkte og genopfandt vi, hvordan menneske-maskine-interaktion udføres ud over simple verbale kommandoer, for at aktivere den næste generation af computere og for at drive en ny klasse af maskiner, der er i stand til flydende social interaktion. Specifikt var det første produkt at fokusere på at opbygge en animeret ledsager for at hjælpe børn med at opbygge sociale og følelsesmæssige færdigheder gennem legebaseret læring. Denne følgesvend ville blive kendt som Moxie. Moxie er en ny type robot, der har evnen til at forstå og udtrykke følelser med følelsesladet tale, troværdige ansigtsudtryk og kropssprog, der udnytter menneskets psykologi og neurologi for at skabe dybere bånd. For at gøre dette samlede vi et tværfunktionelt team af passionerede ledere inden for teknik, teknologi, underholdning, spildesign og børns udvikling. I de sidste fire år har Embodied arbejdet utrætteligt på at bringe al den nyeste teknologi sammen for at bringe Moxie til live, og teamet er begejstrede for endelig at levere det til familier, der har brug for en co-pilot til at støtte sund børns udvikling.
Hvad er nogle af de unikke iværksættermæssige udfordringer bag en robotstartup?
Det er sjovt at gøre det umulige, men det kan også være lidt skræmmende. Vi vidste, at hvis vi ville revolutionere, hvordan mennesker interagerer med maskiner, skulle vi løse problemer, der ikke var blevet løst før. Nogle problemer inkluderede:
- Fladskærme er på enheder, og vi vil gerne bringe en enhed til live. Så hvordan skaber vi et ansigt, der er mere livagtigt, afrundet og ikke todimensionelt?
- De nuværende samtalemotorer tillader kun en meget begrænset samtale, så hvordan skaber vi en løsning, der giver mulighed for mere naturlig samtale?
- Vi ønsker ikke, at stemmen skal lyde robotisk, så hvordan får vi stemmen til at lyde naturlig med kontekstuelt passende tonalitet og bøjninger?
- Vi vidste, at øjenkontakt var meget vigtig, så vi var nødt til at finde ud af, hvordan vi kunne bruge computersyn for at sikre pålidelige øjensporingsfunktioner.
Alle disse spørgsmål om Moxies funktioner førte til mange avancerede teknologiske innovationer.
Først projiceret og afrundet ansigt. Statistikken er begyndt at hobe sig op for at vise os, at for meget skærmtid kan have ødelæggende virkninger på udviklende sind. Endnu værre, de fleste teknologiske enheder til børn har digitale skærme. Det er derfor, vi besluttede at investere i den ekstra investering for at gøre Moxies ansigt fuldt projiceret, hvilket gjorde det muligt for os at skabe en ansigtsskærm, der er afrundet med naturligt buede kanter, i stedet for en flad skærm. Dette gør at interaktion med Moxie føles mere livagtig, realistisk og troværdig. Faktisk er det kun gennem dette 3D-udseende af ansigtet muligt for Moxie at have faktisk øjenkontakt med barnet. Så Moxies ansigt beskytter ikke kun børn mod overdreven skærmtid, men det får også interaktionsoplevelsen til at føles endnu mere ægte.
For det andet samtalemotoren. Hidtil har smarte højttalere og stemmeassistenter krævet den gentagne brug af vågne ord for at starte kommandoer. Moxies samtalemotor er anderledes. Den følger en naturlig samtale og reagerer på typisk kommunikationsflow uden brug af vågne ord (som "Hey Siri" eller "Ok Google"). Avanceret naturlig sprogbehandling gør det muligt for Moxie at genkende, forstå og generere sprog problemfrit, hvilket får interaktionen til at føles mere personlig og naturlig.
For det tredje talesyntese. Moxies stemme har ikke den samme robottale og monotone lyd, som findes i de fleste robotter og stemmeassistenter. I stedet bruger Moxie naturlige og følelsesmæssige vokale bøjninger, som hjælper med at kommunikere en bredere række af følelser. Dette øger omfanget af social-emotionelle lektioner, Moxie kan deltage i, samtidig med at det giver en ekstra livagtighed og troværdighed til interaktionen.
For det fjerde øjnene. En af de vigtigste funktioner er Moxies store, animerede øjne. Innovativ eye tracking-teknologi gør det muligt for Moxie at holde øjenkontakt med barnet, selvom barnet bevæger sig rundt i rummet. Denne øjensporingsfunktion skaber ikke kun en utrolig livagtig interaktion, men den hjælper også barnet med at øve øjenkontakt. Derudover hjælper de store, animerede øjne med at overdrive følelsesmæssig kommunikation, så barnet lettere kan genkende visse følelser. Øvelse af øjenkontakt og forståelse af følelser er to centrale udviklingsmål i social-emotionelle læseplaner.
Endelig tillader alle disse teknologiske funktioner, at interaktioner med Moxie føles realistiske og naturlige. Moxies multimodale sensoriske fusion gør Moxie opmærksom på miljøet og dets brugere. Moxies computersyn og øjensporingsteknologi hjælper med at bevare øjenkontakten, når barnet bevæger sig. Maskinlæring hjælper Moxie med at lære brugerpræferencer og behov og genkende mennesker, steder og ting. Specielt placerede mikrofoner gør det muligt for Moxie at høre den retning, en stemme kom fra, og nemt vende sig til kilden. Berøringssensorer gør det muligt for Moxie at genkende kram og håndtryk. Alle disse stykker kommer sammen for at gøre oplevelsen meget realistisk.
Kan du fortælle os nogle af de ting, der gør Moxie perfekt til børn?
Med Moxie kan børn engagere sig i meningsfuld leg hver dag med indhold, der er baseret på bedste praksis inden for børns udvikling og førskoleundervisning. Hver uge er et andet tema såsom venlighed, venskab, empati eller respekt, og børn får til opgave at hjælpe Moxie med missioner, der udforsker menneskelige erfaringer, ideer og livsfærdigheder. Disse missioner er aktiviteter, der inkluderer kreativ ustruktureret leg som tegning, mindfulness-øvelser gennem åndedrætsøvelser og meditation, læsning med Moxie og udforskning af måder at være venlige over for andre. Moxie opmuntrer til nysgerrighed, så børn opdager verden og mennesker omkring dem. Alle disse aktiviteter hjælper børn med at lære og sikkert øve væsentlige livsfærdigheder såsom turtagning, øjenkontakt, aktiv lytning, følelsesregulering, empati, relationsledelse og problemløsning.
Embodied har også indgået et samarbejde med Encyclopaedia Britannica og Merriam-Webster for at integrere Merriam-Websters ordbog for børn, hvilket gør Moxie i stand til at give alderssvarende definitioner og relateret information for at hjælpe børn med at lære og forstå betydningen af nye ord og begreber. Dette er den første af mange integrationer med Moxie, der leverer på Britannica og Merriam-Websters fælles mission om at inspirere nysgerrighed og glæde ved at lære.
Embodied har også udviklet et komplet økosystem, der hjælper forældre med at støtte deres barns rejse med Moxie og giver børn mulighed for at udvide deres brug af Moxie på en sikker og forældregodkendt måde:
- Embodied Moxie Parent-appen giver et dashboard til at hjælpe forældre med at forstå deres barns udviklingsfremskridt med Moxie. Appen vil give nøgleindsigt til et barns sociale, følelsesmæssige og kognitive udvikling gennem deres aktiviteter med Moxie. Appen giver yderligere værdifulde forslag og tips til forældre for at forbedre deres barns oplevelse og fremskridt med Moxie.
- Et online børneportal-websted (omtalt som Global Robotics Laboratory eller GRL) tilbyder yderligere aktiviteter, spil og historier, der vil forbedre oplevelsen med Moxie.
- Månedlige Moxie Mission Packs er forsendelser beregnet til at engagere børn i nye aktiviteter med Moxie og også give sjove ting som samlekort og klistermærker.
Med tiden lærer Moxie mere om barnet for bedre at personliggøre dets indhold for at hjælpe med hvert barns individuelle udviklingsmål. Embodied har taget omhyggelige skridt for at sikre, at oplysninger fra børn og familier håndteres med høje standarder for privatliv og sikkerhed. Vi har til hensigt, at Moxie vil være fuldt COPPA (Children's Online Privacy Protection Act) Safe Harbor-certificeret, så forældre kan føle sig trygge ved at vide, at Moxie anvender førende dataintegritets- og sikkerhedsprocedurer, og at dets systemer regelmæssigt revideres for at sikre fuld overholdelse. Yderligere er personligt identificerbare data og følsomme oplysninger krypteret med det højeste sikkerhedsniveau og kan kun dekrypteres med en unik nøgle, som kun forælderen har adgang til.
Hvad er nogle af de naturlige sprogbehandlingsudfordringer, som Moxie står over for?
Hos Embodied stræber vi efter at omdefinere, hvordan mennesker interagerer med maskiner, især i samtale gennem naturlig sprogbehandling. Så vi besluttede at skabe SocialXTM, som er en platform, der gør det muligt for børn at engagere sig med Moxie gennem naturlig interaktion (dvs. ansigtsudtryk, samtale, kropssprog osv.), der vækker tillid, empati og motivation samt dybere engagement for at fremme udviklingsmæssige færdigheder. Med SocialXTM introducerer Embodied en helt ny kategori af robotter: animerede ledsagere. "Animer" betyder at bringe til live, og SocialXTM giver Moxie mulighed for at legemliggøre det allerbedste af menneskeheden i en ny og avanceret form for teknologi, der kan give næring til nye måder at lære på.
Naturlig sprogbehandling er kernen i vores naturlige samtalemotor, og der er mange unikke funktioner til samtalemotoren, som vi har arbejdet utrætteligt på at skabe.
Nøglefunktionen, vi arbejdede på, var Moxies evne til at fokusere samtale med en enkelt bruger og adskille baggrundssamtaler og lyde, så Moxie kun reagerer på brugeren. Dette giver mulighed for en mere fokuseret og personlig interaktion. Dette er en løsning på, hvad mange kalder "cocktailparty-problemet". Når du er til et cocktailparty, og der er mange mennesker rundt omkring dig, der taler i et rum, mens du forsøger at forblive i samtale med én person, er det ikke voldsomt svært for mennesker. For en computer er dette utroligt svært. Hvordan sikrer vi os, at Moxie kun reagerer på, hvad den enkelte bruger siger, og ikke bliver kastet ud af baggrundsstøj, samtaler, tv osv. Der er mange måder, vi griber løsningen på dette problem an.
- Vi bruger vores visionssystem til at identificere, hvem der ser på og står overfor Moxie.
- Vi har en række mikrofoner foran på Moxie, der fortæller os, hvor lyden kommer fra.
- Vi kan så bruge maskinlæring til at matche lyden til den, der taler foran Moxie. Dette giver os mulighed for at filtrere de andre samtaler fra og holde fokus på en enkelt bruger.
Generelt har samtaleagenter på markedet undgået "cocktailparty-problemet" ved at bruge vågne ord, såsom "Hey (enhed, efterfulgt af et spørgsmål)". Dette vækkeord giver samtaleagenten mulighed for at lytte efter det vågne ord og kun reagere, når det vågne ord er sagt. Men da Moxie kan fokusere på en enkelt bruger, behøver Moxie ikke at have vågne ord for at aktivere et svar.
Vi ville sikre os, at Moxies samtalemotor er så sofistikeret, at den er kontekstuelt opmærksom på samtalesvar. Dette giver mulighed for en mere nuanceret samtale. For eksempel kan Moxie forstå de forskellige betydninger bag "Jeg ved det ikke" og "nej".
Er der andet, du gerne vil dele om Moxie eller Embodied?
Vi har arbejdet på dette projekt i fire år med et dedikeret team, der har arbejdet utrætteligt for at lave de fantastiske opfindelser, der kræves for at bringe Moxie til live. Nu er vi glade for endelig at bringe Moxie til familier for at hjælpe deres børn med social følelsesmæssig udvikling. Så vi glæder os til turen!
Tak for interviewet, jeg elskede at høre, hvordan du oprindeligt blev inspireret af en kort Pixar-film, og hvordan du siden har forfulgt din livspassion. Læsere, der ønsker at lære mere, eller som ønsker at bestille en Moxie, bør besøge Embodied, Inc.