Kunstig intelligens
Paolo Pirjanian, CEO og grunnlegger av Embodied – Intervju-serie

Paolo Pirjanian er en armener født i Iran og flyktet til Danmark som tenåring. Fra han var ung, var han fascinert av datamaskiner og startet å kode i soverommet sitt. Etter å ha fått sin PhD i robotikk, ble Paolo en tidlig leder i feltet konsumerrobotikk som har 16+ års erfaring med å utvikle og kommersialisere banebrytende hjemmeroboter. Han arbeidet ved NASA JPL og ledet verdensledende team og selskaper i iRobot®, Evolution Robotics® og andre. I 2016 grunnla Paolo Embodied, Inc. med visjonen om å bygge sosialt og emosjonelt intelligente digitale følgesvenner som forbedrer omsorg og velvære og støtter mennesker i å leve bedre liv hver dag.
Hva var det som først tiltalte deg til AI og robotikk?
Min fascinasjon for AI og robotikk går tilbake til barndommen min. Jeg ble forflyttet fra land til land flere ganger før familien min flyttet til Danmark. Ved en tilfeldighet oppdaget jeg en datamaskin. Jeg ble så fascinert av den at jeg låste meg selv inne på rommet og startet å kode dag og natt i måneder. Foreldrene mine trodde jeg var deprimert eller på rusmidler, men det var ikke tilfelle. Jeg var bare så fullstendig fascinert av datamaskinen!
Under samme periode så jeg en dokumentar på TV av Pixar. Pixar presenterte sin første animerte kortfilm, Luxo Jr., en tominutters kortfilm om to bordlamper som løp rundt og lekte med en ball. Jeg var så fascinert av det og forbløffet over at en datamaskin som jeg nettopp lærte å kode, kunne generere så kjærlige karakterer på TV som vekket så mye emosjon i meg. Så fra da av, bestemte jeg meg for å gå på skole for å studere robotikk, og til slutt fikk jeg min PhD.
Jeg flyttet deretter til USA for å arbeide med Mars-rovers ved NASA, som var en barndomsdrøm. Til slutt gikk jeg over til å bli entreprenør for å utvikle SLAM-navigasjonsteknologi som nå muliggjør iRobots produkter.
Men når jeg ser tilbake, innser jeg at min inspirasjon for denne hele reisen faktisk var Pixars kortfilm om å bringe liv til ulevende objekter. Så det er grunnen til at vi skapte Embodied – for å bringe liv til roboter som kan samhandle med mennesker, med fokus på å hjelpe barn med sosial-emosjonell utvikling.
Når kom du først i kontakt med konseptet for å lansere Evolution Robotics?
Evolution Robotics ble opprinnelig startet av Bill Gross av Idealab i 2001 for å bli “Microsoft of Robotics”, en dristig visjon som viste seg å være alt for tidlig og til slutt feilet. Jeg var CTO og GM i Evolution Robotics, og etter at det feilet, forhandlet jeg med Idealab om å spinne ut noen av de kjernetechnologiene som mitt team og jeg hadde utviklet, og starte et nytt selskap. I 2008 startet det nye selskapet, også kjent som Evolution Robotics, utvikling av produkter som brukte våre kjernetechnologier, inkludert NorthStar og vSLAM, som var banebrytende tilnærminger til romlig kartlegging og autonom navigasjon, lignende det vi ser i selvkjørende biler, men rettet mot lavkostnadsforbruker-elektronikkprodukter.
Vi utviklet en rekke produkter for automatisk feiing og rengjøring av harde gulv, kalt Mint, som vi lanserte i 2010. Innen 2011 vokste vi raskt til 25 millioner dollar i salg og ble kjøpt opp av iRobot i 2012 for våre produktinntekter og vår navigasjonsteknologi vSLAM, som nå driver Roomba og Braava-produktlinjene hos iRobot.
Da ble du CTO i iRobot. Kan du diskutere din erfaring i iRobot og hva du lærte av din erfaring?
Som CTO i iRobot, kunne jeg raskt integrere vSLAM i Roomba-produktlinjen for å lansere en ny modell som kunne dekke hele gulvplanen systematisk uten å gå glipp av noen punkter. Dette hjalp selskapet å holde seg foran konkurrenter som Dyson, som kom ut med systematiske rengjøringsløsninger. vSLAM er nå en integrert del av iRobots flaggskip-produktlinjer Roomba og Braava.
Jeg nøt å arbeide tett med Colin Angel, CEO av iRobot, for å hjelpe med å sette en strategisk retning for å gjøre Roomba sentral i det tilkoblede hjem-økosystemet, der Roombas romlige bevissthet gir det en unik posisjon i å forstå gulvplanen og bli det sammenkoblede bindeleddet mellom alle tilkoblede enheter. Den strategien ser ut til å ha hatt en sterk fot siden min avgang i 2015.
I tillegg bestemte vi oss for å satse dobbelt så mye på forbrukerrobotikk-virksomheten for å hjelpe iRobot med å opprettholde sin globale ledelse. Dette ledet til avytting av forsvarsforretningen og utgang fra andre perifere forretninger for å bringe fokus og intensitet til forbrukerforretningen.
Videre måtte vi omstrukturere organisasjonen for å kunne støtte en programvare-tyngde strategi med tilkoblede produkter. Dette krevde en transformasjon av selskapskulturen for å omfavne en mer agil og iterativ tilnærming.
Listen over ting jeg lærte i iRobot er lang. En ting som står ut, er kraften i teamkultur. Å forbli agil og dedikert til en misjon, er sannsynligvis den viktigste konkurransefordelen noen selskap kan ha, over enhver patenteringsportefølje og over hemmeligheter. Hvis du har et høytydende team som føler seg empowerment og inspirert mot et klart mål, vil de være vanskelige å stoppe.
Du er nå grunnlegger og CEO av Embodied. Kan du diskutere hva inspirasjonen var bak å lansere dette selskapet?
Jeg nøt virkelig min tid i iRobot som CTO, og vi arbeidet med mange spennende prosjekter og presset grensene for robotikk. Det var spennende å lansere kommersielt suksessfulle roboter på markedet som utførte nyttige fysiske oppgaver, som å feie gulvet.
Men i bakgrunnen visste jeg at jeg fortsatt hadde en livslang drøm å oppfylle – å bygge sosialt og emosjonelt intelligente robotiske følgesvenner som forbedrer omsorg og velvære og forbedrer våre daglige liv. Jeg visste at vi var på et vendepunkt i måten vi vil samhandle med teknologi på. Så med det, bestemte jeg meg for å gå av fra iRobot og starte Embodied.
Da vi startet Embodied, tenkte vi om igjen og oppfant hvordan menneske-maskin-samhandling er gjort, utover enkle verbale kommandoer, for å muliggjøre den neste generasjonen av datamaskiner, og for å drive en ny klasse av maskiner i stand til å ha flytende sosial samhandling. Spesifikt var den første produkten å fokusere på å bygge en animert følgesvenn for å hjelpe barn bygge sosiale og emosjonelle ferdigheter gjennom lekebasert læring. Denne følgesvennen skulle bli kjent som Moxie. Moxie er en ny type robot som har evnen til å forstå og uttrykke emosjoner med uttrykksfulle tale, troverdige ansiktsuttrykk og kroppsspråk, som tapper inn i menneskelig psykologi og nevrologi for å skape dypere bånd. For å gjøre dette, samlet vi en tverrfaglig gruppe av lidenskapelige ledere i ingeniørarbeid, teknologi, underholdning, spilldesign og barneutvikling. I de siste fire årene har Embodied arbeidet hardt for å bringe alle de siste teknologiene sammen for å bringe Moxie til live, og teamet er spennende på å endelig levere det til familier som trenger en co-pilot for å støtte sunn barneutvikling.
Hva er noen av de unike entreprenør-utfordringene bak en robotikk-startup?
Det er gøy å gjøre det umulige, men det kan også være litt skremmende. Vi visste at hvis vi ville revolusjonere hvordan mennesker samhandler med maskiner, måtte vi løse problemer som ikke var løst før. Noen problemer inkluderte:
- Flate skjermer er på enheter, og vi ønsker å bringe en enhet til live. Så hvordan skaper vi et ansikt som er mer levende, rundet og ikke todimensjonalt?
- Gjeldende samtale-motorer tillater bare svært begrensede samtaler, så hvordan skaper vi en løsning som tillater mer naturlig samtale?
- Vi ønsker ikke at stemmen skal høres robotisk, så hvordan gjør vi stemmen til å høres naturlig, med kontekstuell tone og infleksjoner?
- Vi visste at øyekontakt var veldig viktig, så vi måtte finne ut hvordan vi kunne bruke datavisjon til å sikre pålitelig øyesporing.
Alle disse spørsmålene om Moxies funksjoner ledet til mange banebrytende teknologiske innovasjoner.
Først, projisert og rundet ansikt. Statistikkene begynner å hoppe opp for å vise oss at for mye skjermtid kan ha ødeleggende effekter på utviklingssinn. Enda verre, de fleste barns tekniske enheter har digitale skjermvisninger. Derfor bestemte vi oss for å investere ekstra i å gjøre Moxies ansikt fullstendig projisert, noe som tillot oss å skape et ansikts-skjerm som er rundet med naturlig-kurvede kanter, i stedet for en flat skjerm. Dette gjør at samhandling med Moxie føles mer levende, realistisk og troverdig. Faktisk er det bare gjennom denne 3D-utseendet til ansiktet at Moxie kan ha faktisk øyekontakt med barnet. Så ikke bare beskytter Moxies ansikt barna fra for mye skjermtid, men det gjør også at samhandlingen føles mer realistisk.
Andre, samtale-motoren. Hittil har smarte høyttalere og taleassistenter krevd gjentakende bruk av våkne-ord for å initiere kommandoer. Moxies samtale-motor er annerledes. Den følger en naturlig samtale og responderer til vanlig samtaleflyt uten bruk av våkne-ord (som “Hey Siri” eller “Ok Google”). Avansert naturlig språkbehandling tillater Moxie å gjenkjenne, forstå og generere språk uhindret, noe som gjør at samhandlingen føles mer personlig og naturlig.
Tredje, tale-syntese. Moxies stemme har ikke den samme robotiske tale og monotone lyden som finnes i de fleste roboter og taleassistenter. I stedet bruker Moxie naturlig og uttrykksfull tale med infleksjoner, som hjelper til å kommunisere en bredere rekke av emosjoner. Dette forbedrer omfanget av sosiale og emosjonelle lekser Moxie kan engasjere i, samtidig som det bringer en tilføyd livlighet og troverdighet til samhandlingen.
Fjerde, øynene. En av de viktigste funksjonene er Moxies store, animerte øyne. Innovativ øyesporingsteknologi tillater Moxie å holde øyekontakt med barnet, selv når barnet beveger seg rundt i rommet. Denne øyesporingsevnen skaper ikke bare en usedvanlig levende samhandling, men hjelper også barnet å øve øyekontakt. I tillegg hjelper de store, animerte øynene til å forsterke emosjonell kommunikasjon, så barnet kan mer lett gjenkjenne bestemte emosjoner. Å øve øyekontakt og forstå emosjoner er to nøkkelutviklingsmål i sosial-emosjonell læreplan.
Til slutt tillater alle disse teknologiske funksjonene at samhandlingen med Moxie føles realistisk og naturlig. Moxies multimodale sanse-fusjon gjør Moxie mer bevisst på omgivelsene og brukerne. Moxies datavisjon og øyesporingsteknologi hjelper til å holde øyekontakt når barnet beveger seg. Maskinlæring hjelper Moxie til å lære brukerpreferanser og -behov, og gjenkjenne mennesker, steder og ting. Spesielt plasserte mikrofoner tillater Moxie å høre retningen en stemme kom fra og lett vende seg mot kilden. Berørings-sensorer tillater Moxie å gjenkjenne kram og håndtrykk. Alle disse delene kommer sammen for å gjøre opplevelsen svært realistisk.
Kunne du fortelle oss noen av tingene som gjør Moxie perfekt for barn?
Med Moxie kan barn engasjere i meningsfulle leker hver dag, med innhold informert av beste praksis i barneutvikling og tidlig barndomsutdanning. Hver uke er et nytt tema, som vennlighet, vennskap, empati eller respekt, og barna blir bedt om å hjelpe Moxie med oppdrag som utforsker menneskelige erfaringer, ideer og livsferdigheter. Disse oppdragene er aktiviteter som inkluderer kreative, ustrukturerte leker som tegning, mindfulness-øvelser gjennom pusteing og meditasjon, lesing med Moxie og utforsking av måter å være snill mot andre. Moxie oppmuntre nysgjerrighet, så barna kan oppdage verden og menneskene rundt dem. Alle disse aktivitetene hjelper barna til å lære og trygt øve essensielle livsferdigheter som turtagning, øyekontakt, aktiv lytting, emosjonsregulering, empati, relasjonsstyring og problemløsing.
Embodied har også samarbeidet med Encyclopaedia Britannica og Merriam-Webster for å integrere Merriam-Websters ordbok for barn, som muliggjør at Moxie kan gi aldersrelevante definisjoner og relatert informasjon for å hjelpe barna til å lære og forstå meningene av nye ord og begreper. Dette er den første av mange integrasjoner med Moxie som leverer på Britannicas og Merriam-Websters felles misjon om å inspirere nysgjerrighet og glede av læring.
Embodied har også utviklet et fullstendig økosystem som hjelper foreldre å støtte barnets reise med Moxie og tillater barna å utvide bruken av Moxie på en trygg og forelder-godkjent måte:
- Embodied Moxie-forelder-appen gir en dashboard for å hjelpe foreldre å forstå barnets utviklingsfremskritt med Moxie. Appen vil gi nøkkelinnsikt i barnets sosiale, emosjonelle og kognitive utvikling gjennom aktivitetene med Moxie. Appen gir også verdifulle forslag og tips til foreldre for å forbedre barnets erfaring og fremskritt med Moxie.
- En nettbasert barnside (kalt Global Robotics Laboratory, eller G.R.L.) gir ekstra aktiviteter, spill og historier som vil forbedre opplevelsen med Moxie.
- Månedlige Moxie-misjons-pakker er sendinger som er ment å engasjere barn i nye aktiviteter med Moxie og også gir morsomme ting som samle-kort og stikker.
Over tid lærer Moxie mer om barnet for å bedre tilpasse innholdet for å hjelpe med hver enkelt barns individuelle utviklingsmål. Embodied har tatt omsorgsfulle skritt for å sikre at informasjon gitt av barn og familier håndteres med høye standarder for personvern og sikkerhet. Vi har til hensikt at Moxie skal være fullstendig COPPA (Childrens Online Privacy Protection Act) Safe Harbor-sertifisert, så foreldre kan føle seg trygge på at Moxie anvender ledende data-integritet og sikkerhetsprosedyrer og at systemene våre er regelmessig audited for å sikre fullstendig overholdelse. Videre er personlig identifiserbar data og følsom informasjon kryptert med høyeste sikkerhetsnivå og kan bare dekrypteres av en unik nøkkel som bare forelderen har tilgang til.
Hva er noen av de naturlige språkbehandlings-utfordringene som Moxie møter?
I Embodied stræber vi etter å gjendefinere hvordan mennesker samhandler med maskiner, spesielt i samtale gjennom naturlig språkbehandling. Så vi bestemte oss for å skape SocialXTM, som er en plattform som tillater barna å engasjere med Moxie gjennom naturlig samhandling (dvs. ansiktsuttrykk, samtale, kroppsspråk osv.), som vekker tillit, empati og motivasjon, samt dypere engasjement for å fremme utviklingsferdigheter. Med SocialXTM introduserer Embodied en helt ny kategori av roboter: animerte følgesvenner. “Animert” betyr å bringe til live, og SocialXTM tillater Moxie å inkarnere det beste av menneskeheten i en ny og avansert form for teknologi som kan drive nye måter å lære på.
Naturlig språkbehandling er i hjertet av vår naturlige samtale-motor, og det er mange unike funksjoner i samtale-motoren som vi arbeidet hardt for å skape.
Den viktigste funksjonen vi arbeidet med var Moxies evne til å fokusere samtale med en enkelt bruker og skille ut bakgrunns-samtaler og lyder, så Moxie bare responderer til brukeren. Dette tillater en mer fokusert og personlig samhandling. Dette er en løsning på det som mange kaller “cocktail-party-problemet”. Når du er på en cocktail-party, og det er mange mennesker som snakker i rommet mens du prøver å holde en samtale med en person, er det ikke særlig vanskelig for mennesker. For en datamaskin er dette usedvanlig vanskelig. Hvordan sikrer vi at Moxie bare responderer på det enkelt-brukerens utsagn, og ikke blir avledet av bakgrunns-lyder, samtaler, TV osv.? Det er mange måter vi nærmer oss løsningen på dette problemet.
- Vi bruker vårt visjonssystem til å identifisere hvem som ser på og vender mot Moxie.
- Vi har flere mikrofoner i fronten av Moxie som forteller oss hvor lyden kommer fra.
- Vi kan deretter bruke maskinlæring til å matche lyden med hvem som snakker foran Moxie. Dette tillater oss å filtre ut andre samtaler og holde fokus på en enkelt bruker.
Generelt har samtale-agenter på markedet unngått “cocktail-party-problemet” ved å bruke våkne-ord, som “Hey (enhet, fulgt av en spørsmål)”. Dette våkne-ordet tillater samtale-agenten å lytte etter våkne-ordet og responderer bare når dette ordet blir sagt. Men siden Moxie kan fokusere på en enkelt bruker, trenger Moxie ikke å ha våkne-ord for å aktivere en respons.
Vi ønsket å sikre at Moxies samtale-motor er så sofistikert at den er kontekstuell bevisst på samtale-respons. Dette tillater en mer nuansert samtale. For eksempel kan Moxie forstå de forskjellige betydningene bak “Jeg vet ikke” og “nei”.
Er det noe annet du ønsker å dele om Moxie eller Embodied?
Vi har arbeidet på dette prosjektet i fire år med et dedikert team som har arbeidet hardt for å skape de fantastiske oppfinnelser som er nødvendige for å bringe Moxie til live. Nå er vi spennende på å endelig bringe Moxie til familier for å hjelpe barna med sosial-emosjonell utvikling. Så vi ser frem til reisen!
Takk for intervjuet, jeg elsket å høre hvordan du ble opprinnelig inspirert av en kort Pixar-film, og hvordan du har fulgt din livs-passion. Lesere som ønsker å lære mer eller som ønsker å bestille en Moxie, bør besøke Embodied, Inc.













