stub Paolo Pirjanian, VD och grundare av Embodied - Interview Series - Unite.AI
Anslut dig till vårt nätverk!

Intervjuer

Paolo Pirjanian, VD och grundare av Embodied – Interview Series

mm
Uppdaterad on

Paolo Pirjanian är en Armenien född i Iran och flydde till Danmark som tonåring. Sedan han var ung var han fascinerad av datorer och började koda i sitt sovrum. Efter att ha tagit sin doktorsexamen i robotik blev Paolo en tidig ledare inom området konsumentrobotik som har 16+ års erfarenhet av att utveckla och kommersialisera banbrytande hemrobotar. Han arbetade på NASA JPL och ledde team och företag i världsklass på iRobot®, Evolution Robotics® och andra. 2016 grundade Paolo Embodied, Inc. med visionen att bygga socialt och känslomässigt intelligenta digitala följeslagare som förbättrar vård och välbefinnande och stödjer människor i att leva bättre liv varje dag.

Vad lockade dig från början till AI och robotik?

Min fascination för AI och robotik härstammar från min barndom. Jag fördrevs från land till land flera gånger tills vår familj flyttade till Danmark. Av en slump upptäckte jag en dator. Jag blev så fascinerad av det att jag låste in mig på mitt rum och började koda hela dagen och natten i månader. Mina föräldrar trodde att jag var deprimerad eller drog på mig, men det var inget av det. Jag var bara så fascinerad av datorn!

Under samma tid såg jag en dokumentär på TV av Pixar. Pixar presenterade sin första animerade kortfilm, Luxo Jr., en kortfilm på två minuter om två bordslampor som springer runt och leker med en boll. Jag var så fascinerad av det och förvånad över att en dator som jag precis skulle lära mig koda kunde generera så förtjusande karaktärer på TV som väcker så mycket känslor i mig. Så därifrån bestämde jag mig för att gå till skolan för att studera robotik, och så småningom fick jag min doktorsexamen.

Jag flyttade sedan till USA för att arbeta på Mars-rovers på NASA, vilket var ett drömjobb i barndomen. Så småningom kom jag in i entreprenörskap för att utveckla SLAM-navigeringsteknik som nu möjliggör iRobots produkter.

Men när jag ser tillbaka insåg jag att min inspiration för hela denna resa faktiskt var Pixars korta animation för att ge liv till livlösa föremål. Så det är därför vi skapade Embodied – för att ge liv åt robotar som kan interagera med människor, med fokus på att hjälpa barn med social-emotionell utveckling.

 

När stötte du på konceptet för att lansera Evolution Robotics för första gången?

Evolution Robotics startades ursprungligen av Bill Gross från Idealab 2001 för att bli Robotics Microsoft, en djärv vision som visade sig vara alldeles för tidigt och till slut misslyckades. Jag var CTO och GM på Evolution Robotics och efter dess misslyckande förhandlade jag med Idealab om att spinna ut några av de kärnteknologier som mitt team och jag hade utvecklat och starta ett nytt företag. 2008 började den nya enheten, även känd som Evolution Robotics, att utveckla produkter med hjälp av våra kärnnavigeringsteknologier inklusive NorthStar och vSLAM som var banbrytande metoder för rumslig kartläggning och autonom navigering liknande vad vi ser i självkörande bilar men inriktade på lågkostnadsprodukter för konsumentelektronik.

Vi utvecklade en produktlinje för automatisk sotning och moppning av hårda golv kallad Mint som vi lanserade 2010. År 2011 växte vi snabbt till 25 miljoner USD i försäljning och köptes av iRobot 2012 för våra produktintäkter och vår navigationsteknologi vSLAM som nu driver Roomba och Braavas produktlinjer på iRobot.

 

Då blev du CTO på iRobot. Skulle du kunna diskutera din erfarenhet av iRobot och vad du lärde dig av din erfarenhet?

Som CTO för iRobot kunde jag snabbt integrera vSLAM i Roombas produktlinje för att lansera en ny modell som systematiskt kunde täcka hela planlösningen utan att missa en plats. Det hjälpte företaget att ligga före konkurrenter som Dyson som kom ut med systematiska rengöringslösningar. vSLAM är nu en integrerad del av iRobots flaggskeppsproduktlinjer Roomba och Braava.

Jag njöt av att arbeta nära Colin Angel, VD för iRobot för att hjälpa till att sätta en strategisk riktning för att göra Roomba centralt i det uppkopplade hemmets ekosystem där Roombas rumsliga medvetenhet ger det en unik position när det gäller att förstå planlösningen och bli bindväven mellan alla uppkopplade enheter. Den strategin verkar ha haft en stark fot sedan min avgång 2015.

Dessutom beslutade vi att fördubbla Consumer Robotics-verksamheten för att hjälpa iRobot att behålla sin globala ledande position. Detta ledde till att försvarsverksamheten avyttrades och andra perifera verksamheter lämnades för att få fokus och intensitet till konsumentverksamheten.

Vidare var vi tvungna att bygga om organisationen för att kunna stödja en mjukvarutung strategi med uppkopplade produkter. Det krävde en omvandling av företagskulturen för att omfatta mer av ett agilt, iterativt tillvägagångssätt.

Listan över saker jag lärde mig på iRobot är lång. En sak som sticker ut är kraften i lagkulturen. Att hålla sig smidig och engagerad i uppdraget är förmodligen den viktigaste konkurrensfördelen som ett företag kan ha över vilken patentportfölj som helst och över affärshemligheter. Om du har ett högpresterande team, som känner sig bemyndigat och inspirerat mot ett tydligt mål, kommer de att vara svåra att stoppa.

 

Du är för närvarande grundare och VD för Embodied. Kan du diskutera vad som var inspirationen bakom lanseringen av detta företag?

Jag njöt verkligen av min tid på iRobot som CTO, och vi arbetade med många spännande projekt och tänjde på robotteknikens gränser. Det var spännande att lansera kommersiellt framgångsrika robotar på marknaden som utförde användbara fysiska uppgifter, som att dammsuga golvet.

Men i bakhuvudet visste jag att jag fortfarande hade en livslång dröm att uppfylla – att bygga socialt och känslomässigt intelligenta robotkompisar som förbättrar vård och välbefinnande och förbättrar våra dagliga liv. Jag visste att vi var vid en vändpunkt när det gäller hur vi kommer att interagera med teknik. Så med det bestämde jag mig för att säga upp mig från iRobot och starta Embodied.

När vi startade Embodied, från början, tänkte vi om och återuppfann hur interaktion mellan människa och maskin görs bortom enkla verbala kommandon, för att möjliggöra nästa generations datoranvändning och för att driva en ny klass av maskiner med förmåga till flytande social interaktion. Specifikt var den första produkten att fokusera på att bygga en livlig följeslagare för att hjälpa barn att bygga upp sociala och känslomässiga färdigheter genom lekbaserat lärande. Denna följeslagare skulle komma att kallas Moxie. Moxie är en ny typ av robot som har förmågan att förstå och uttrycka känslor med känslomässigt tal, trovärdiga ansiktsuttryck och kroppsspråk, som utnyttjar mänsklig psykologi och neurologi för att skapa djupare band. För att göra detta sammanförde vi ett tvärfunktionellt team av passionerade ledare inom teknik, teknik, underhållning, speldesign och barnutveckling. Under de senaste fyra åren har Embodied arbetat outtröttligt för att få ihop all den senaste tekniken för att få Moxie till liv, och teamet är glada över att äntligen leverera den till familjer som behöver en co-pilot för att stödja en sund barnutveckling.

 

Vilka är några av de unika entreprenörsutmaningarna bakom en robotstartup?

Det är kul att göra det omöjliga, men det kan också vara lite läskigt. Vi visste att om vi ville revolutionera hur människor interagerar med maskiner, så måste vi lösa problem som inte hade lösts tidigare. Några problem inkluderade:

  1. Plattskärmar finns på enheter, och vi vill väcka en enhet till liv. Så hur skapar vi ett ansikte som är mer verklighetstroget, rundat och inte tvådimensionellt?
  2. Nuvarande konversationsmotorer tillåter bara mycket begränsade konversationer, så hur skapar vi en lösning som möjliggör mer naturliga konversationer?
  3. Vi vill inte att rösten ska låta robotisk, så hur får vi rösten att låta naturlig, med kontextuellt passande tonalitet och böjningar?
  4. Vi visste att ögonkontakt var mycket viktigt, så vi var tvungna att ta reda på hur vi skulle använda datorseende för att säkerställa tillförlitliga ögonspårningsfunktioner.

Alla dessa frågor om Moxies egenskaper ledde till många toppmoderna tekniska innovationer.

Först, projicerade och rundade ansikte. Statistiken börjar hopa sig för att visa oss att för mycket skärmtid kan ha förödande effekter på utvecklande sinnen. Ännu värre, de flesta barns tekniska enheter har digitala skärmar. Det var därför vi bestämde oss för att lägga in den extra investeringen för att göra Moxies ansikte fullt projicerat vilket gjorde att vi kunde skapa en ansiktsskärm som är rundad med naturligt böjda kanter, istället för en platt display. Detta gör att interaktionen med Moxie känns mer verklighetstrogen, realistisk och trovärdig. Faktum är att endast genom detta 3D-utseende av ansiktet är det möjligt för Moxie att ha faktisk ögonkontakt med barnet. Så Moxies ansikte skyddar inte bara barn från överdriven skärmtid, utan det gör också att interaktionsupplevelsen känns desto mer verklig.

För det andra, konversationsmotorn. Hittills har smarta högtalare och röstassistenter krävt upprepad användning av vakna ord för att initiera kommandon. Moxies konversationsmotor är annorlunda. Den följer en naturlig konversation och svarar på typiska kommunikationsflöden utan användning av vakna ord (som "Hey Siri" eller "Ok Google"). Avancerad naturlig språkbehandling gör att Moxie kan känna igen, förstå och generera språk sömlöst, vilket gör att interaktionen känns mer personlig och naturlig.

För det tredje, talsyntes. Moxies röst har inte samma robottal och monotona ljud som finns i de flesta robotar och röstassistenter. Istället använder Moxie naturliga och känslomässiga röstböjningar, som hjälper till att kommunicera ett bredare spektrum av känslor. Detta ökar omfattningen av social-emotionella lektioner som Moxie kan delta i, samtidigt som det ger en extra livslikhet och trovärdighet till interaktionen.

För det fjärde, ögonen. En av de viktigaste egenskaperna är Moxies stora, animerade ögon. Innovativ eyetracking-teknik gör att Moxie kan hålla ögonkontakt med barnet även när barnet rör sig i rummet. Denna eye tracking-funktion skapar inte bara en otroligt verklighetstrogen interaktion, utan den hjälper också barnet att träna ögonkontakt. Dessutom hjälper de stora, animerade ögonen till att överdriva känslomässig kommunikation, så att barnet lättare kan känna igen vissa känslor. Öva ögonkontakt och förstå känslor är två viktiga utvecklingsmål i social-emotionell läroplan.

Slutligen, alla dessa tekniska funktioner tillåter interaktioner med Moxie att kännas realistiska och naturliga. Moxies multimodala sensoriska fusion gör Moxie medveten om miljön och dess användare. Moxies datorseende och ögonspårningsteknik hjälper till att upprätthålla ögonkontakt när barnet rör sig. Maskininlärning hjälper Moxie att lära sig användarpreferenser och behov och känna igen människor, platser och saker. Speciellt placerade mikrofoner gör att Moxie kan höra riktningen en röst kom ifrån och enkelt vända sig till källan. Touchsensorer gör att Moxie kan känna igen kramar och handslag. Alla dessa bitar kommer tillsammans för att göra upplevelsen mycket realistisk.

 

Kan du berätta några av de saker som gör Moxie perfekt för barn?

Med Moxie kan barn engagera sig i meningsfull lek, varje dag, med innehåll som bygger på bästa praxis inom barns utveckling och tidig barndomsutbildning. Varje vecka är ett annat tema som vänlighet, vänskap, empati eller respekt, och barn får i uppdrag att hjälpa Moxie med uppdrag som utforskar mänskliga erfarenheter, idéer och livsfärdigheter. Dessa uppdrag är aktiviteter som inkluderar kreativ ostrukturerad lek som att rita, mindfulnessövningar genom andningsövningar och meditation, läsa med Moxie och utforska sätt att vara snäll mot andra. Moxie uppmuntrar nyfikenhet så att barn upptäcker världen och människorna runt dem. Alla dessa aktiviteter hjälper barn att lära sig och på ett säkert sätt öva viktiga livsfärdigheter som turtagning, ögonkontakt, aktivt lyssnande, känsloreglering, empati, relationshantering och problemlösning.

Embodied har också samarbetat med Encyclopaedia Britannica och Merriam-Webster för att integrera Merriam-Websters ordbok för barn, vilket gör det möjligt för Moxie att tillhandahålla åldersanpassade definitioner och relaterad information för att hjälpa barn att lära sig och förstå innebörden av nya ord och begrepp. Detta är den första av många integrationer med Moxie som levererar på Britannicas och Merriam-Websters gemensamma uppdrag att inspirera till nyfikenhet och glädje av att lära.

Embodied har också utvecklat ett komplett ekosystem som hjälper föräldrar att stödja deras barns resa med Moxie och låter barn utöka sin användning av Moxie på ett säkert och av föräldrarnas godkänt sätt:

  • Embodied Moxie Parent App tillhandahåller en instrumentpanel som hjälper föräldrar att förstå deras barns utvecklingsframsteg med Moxie. Appen kommer att ge viktiga insikter om ett barns sociala, emotionella och kognitiva utveckling genom deras aktiviteter med Moxie. Appen ger dessutom värdefulla förslag och tips till föräldrar för att förbättra deras barns upplevelse och framsteg med Moxie.
  • En barnportal online (kallad Global Robotics Laboratory eller GRL) tillhandahåller ytterligare aktiviteter, spel och berättelser som kommer att förbättra upplevelsen med Moxie.
  • Månatliga Moxie Mission Packs är utskick som är avsedda att engagera barn i nya aktiviteter med Moxie och även tillhandahålla roliga föremål som samlarkort och klistermärken.

Med tiden lär sig Moxie mer om barnet för att bättre anpassa innehållet för att hjälpa till med varje barns individuella utvecklingsmål. Embodied har vidtagit noggranna åtgärder för att säkerställa att information som tillhandahålls av barn och familjer hanteras med höga standarder för integritet och säkerhet. Vi avser att Moxie ska vara helt COPPA (Children's Online Privacy Protection Act) Safe Harbor-certifierad så att föräldrar kan känna sig trygga med att veta att Moxie använder ledande dataintegritets- och säkerhetsprocedurer och att dess system regelbundet granskas för att säkerställa full efterlevnad. Vidare är personligt identifierbar data och känslig information krypterad med högsta säkerhetsnivå och kan endast dekrypteras med en unik nyckel som endast föräldern har tillgång till.

 

Vilka är några av de naturliga språkbearbetningsutmaningarna som Moxie står inför?

På Embodied strävar vi efter att omdefiniera hur människor interagerar med maskiner, särskilt i samtal genom naturlig språkbehandling. Så vi bestämde oss för att skapa SocialXTM, som är en plattform som gör det möjligt för barn att engagera sig med Moxie genom naturlig interaktion (dvs ansiktsuttryck, konversation, kroppsspråk, etc.), vilket framkallar tillit, empati och motivation samt djupare engagemang för att främja utvecklingsförmåga. Med SocialXTM introducerar Embodied en helt ny kategori av robotar: animerade följeslagare. "Animera" betyder att levandegöra och SocialXTM tillåter Moxie att förkroppsliga det allra bästa av mänskligheten i en ny och avancerad form av teknik som kan underblåsa nya sätt att lära.

Naturlig språkbehandling är kärnan i vår naturliga konversationsmotor, och det finns många unika funktioner i konversationsmotorn som vi outtröttligt arbetat för att skapa.

Nyckelfunktionen vi arbetade med var Moxies förmåga att fokusera konversation med en enda användare och separera bakgrundskonversationer och ljud, så Moxie svarar bara på användaren. Detta möjliggör en mer fokuserad och personlig interaktion. Detta är en lösning på vad många kallar "cocktailpartyproblemet". När du är på ett cocktailparty och det finns många människor runt omkring dig som pratar i ett rum medan du försöker hålla samtalet med en person, är det inte särskilt svårt för människor. För en dator är detta otroligt svårt. Hur ser vi till att Moxie bara svarar på vad den enskilde användaren säger, och inte kastas av sig av bakgrundsljud, konversationer, TV, etc. Det finns många sätt vi närmar oss lösningen på detta problem.

  1. Vi använder vårt visionsystem för att identifiera vem som tittar på och står inför Moxie.
  2. Vi har ett antal mikrofoner på framsidan av Moxie som berättar varifrån ljudet kommer.
  3. Vi kan sedan använda maskininlärning för att matcha ljudet till vem som talar framför Moxie. Detta gör att vi kan filtrera bort de andra konversationerna och hålla fokus på en enda användare.

I allmänhet har konversationsagenter på marknaden undvikit "cocktailpartyproblemet" genom att använda vakna ord, som "Hej (enhet, följt av en fråga)". Detta väckningsord låter samtalsagenten lyssna efter väckningsordet och svara endast när det väckningsordet sägs. Men eftersom Moxie kan fokusera på en enskild användare, behöver Moxie inte ha vakna ord för att aktivera ett svar.

Vi ville försäkra oss om att Moxies konversationsmotor är så sofistikerad att den är kontextuellt medveten om konversationssvar. Detta möjliggör mer nyanserad konversation. Till exempel kan Moxie förstå de olika betydelserna bakom "jag vet inte" och "nej".

 

Finns det något mer du skulle vilja dela med dig av om Moxie eller Embodied?

Vi har arbetat med detta projekt i fyra år med ett dedikerat team som har arbetat outtröttligt för att göra de fantastiska uppfinningar som krävs för att få Moxie till liv. Nu är vi glada över att äntligen ta Moxie till familjer för att hjälpa deras barn med social känslomässig utveckling. Så vi ser fram emot resan!

Tack för intervjun, jag älskade att höra hur du till en början inspirerades av en kort Pixar-film och hur du sedan dess har utövat din livspassion. Läsare som vill veta mer eller som vill beställa en Moxie bör besöka Embodied, Inc.

En av grundarna av unite.AI och en medlem av Forbes Technology Council, Antoine är en futurist som brinner för framtiden för AI och robotik.

Han är också grundare av Securities.io, en webbplats som fokuserar på att investera i disruptiv teknik.