Artificiell intelligens

Paolo Pirjanian, VD och grundare av Embodied – Intervjuerien

mm

Paolo Pirjanian är en armenier född i Iran och flydde till Danmark som tonåring. Redan från ung ålder var han fascinerad av datorer och började koda i sitt sovrum. Efter att ha tagit sin doktorsexamen i robotik blev Paolo en tidig ledare inom området konsumentrobotik med över 16 års erfarenhet av att utveckla och kommersialisera banbrytande hemmarobotar. Han arbetade på NASA JPL och ledde världsklassiga team och företag på iRobot®, Evolution Robotics® och andra. 2016 grundade Paolo Embodied, Inc. med visionen att bygga socialt och emotionellt intelligenta digitala kamrater som förbättrar omsorg och välbefinnande och stöder människor i att leva bättre liv varje dag.

Vad var det som initialt drog dig till AI och robotik?

Min fascination för AI och robotik går tillbaka till min barndom. Jag blev tvungen att flytta från land till land flera gånger tills min familj flyttade till Danmark. Av en tillfällighet upptäckte jag en dator. Jag blev så fascinerad av den att jag låste in mig i mitt rum och började koda dygnet runt i månader. Min föräldrar trodde att jag var deprimerad eller på droger, men det var inte så. Jag var bara så helt och hållet fascinerad av datorn!

Under samma tid såg jag en dokumentär på TV av Pixar. Pixar presenterade sin första animerade kortfilm, Luxo Jr., en tvåminuters film om två bordlampor som sprang runt och lekte med en boll. Jag var så fascinerad av det och förvånad över att en dator som jag just lärde mig att koda kunde generera så ömkanliga karaktärer på TV som väckte så mycket känslor i mig. Så från och med då bestämde jag mig för att gå i skolan för att studera robotik, och till slut tog jag min doktorsexamen.

Jag flyttade sedan till USA för att arbeta med Mars-rover på NASA, som var en barndomsdröm. Till slut gick jag in i entreprenörskap för att utveckla SLAM-navigeringsteknologi som nu möjliggör iRobots produkter.

Men när jag ser tillbaka insåg jag att min inspiration för hela resan faktiskt var Pixars animerade kortfilm om att ge liv till oanimaade föremål. Så det är därför vi skapade Embodied – för att ge liv till robotar som kan interagera med människor, med fokus på att hjälpa barn med social-emotionell utveckling.

 

När kom du först i kontakt med konceptet för att lansera Evolution Robotics?

Evolution Robotics startades ursprungligen av Bill Gross på Idealab 2001 för att bli “Microsoft of Robotics”, ett vågat vision som visade sig vara alldeles för tidigt och till slut misslyckades. Jag var CTO och GM på Evolution Robotics och efter dess misslyckande förhandlade jag med Idealab för att spinna ut några av de kärnteknologier som mitt team och jag hade utvecklat och starta ett nytt företag. 2008 började det nya företaget, också känt som Evolution Robotics, att utveckla produkter med vår kärnavigeringsteknologi, inklusive NorthStar och vSLAM, som var banbrytande tillvägagångssätt för rumslig kartläggning och autonom navigering liknande det vi ser i självkörande bilar men riktade mot lågkostnads, konsumentelektronikprodukter.

Vi utvecklade en rad produkter för automatisk sopning och rengöring av hårda golv som heter Mint som vi lanserade 2010. Redan 2011 växte vi snabbt till 25 miljoner dollar i försäljning och förvärvades av iRobot 2012 för vår produktförsäljning och vår navigeringsteknologi vSLAM som nu driver Roomba och Braava-produktlinjerna på iRobot.

 

På den tiden blev du CTO på iRobot. Kan du diskutera din erfarenhet på iRobot och vad du lärde dig av din erfarenhet?

Som CTO på iRobot kunde jag snabbt integrera vSLAM i Roomba-produktlinjen för att lansera en ny modell som kunde täcka hela golvytan utan att missa en enda fläck. Det hjälpte företaget att hålla sig före konkurrenter som Dyson som kom ut med systematiska rengöringslösningar. vSLAM är nu en integrerad del av iRobots flaggskeppproduktlinjer Roomba och Braava.

Jag njöt av att arbeta nära med Colin Angel, VD på iRobot för att hjälpa till att sätta en strategisk riktning för att göra Roomba central för det anslutna hemmamiljön där Roombas rumsliga medvetenhet ger det en unik position i att förstå golvytan och bli det sammanlänkande vävnaden mellan alla anslutna enheter. Den strategin verkar ha haft en stark grund sedan min avgång 2015.

Dessutom beslutade vi oss för att dubbla ned på konsumentrobotikverksamheten för att hjälpa iRobot att behålla sin globala ledarposition. Det ledde till avyttringen av försvarsverksamheten och att lämna andra perifera verksamheter för att bringa fokus och intensitet till konsumentverksamheten.

Dessutom var vi tvungna att omstrukturera organisationen för att kunna stödja en mjukvaru tung strategi med anslutna produkter. Det krävde en omvandling av företagskulturen för att omfamna en mer agil och iterativ tillvägagångssätt.

Listan över saker jag lärde mig på iRobot är lång. En sak som sticker ut är kraften i teamkultur. Att vara agil och engagerad i uppdraget är förmodligen den viktigaste konkurrensfördelen som något företag kan ha ovanför alla patentportföljer och ovanför affärshemligheter. Om du har ett högpresterande team som känner sig befogen och inspirerad mot ett tydligt mål, kommer de att vara svåra att stoppa.

 

Du är för närvarande grundare och VD för Embodied. Kan du diskutera vad inspirationen var bakom att lansera det här företaget?

Jag njöt verkligen av min tid på iRobot som CTO, och vi arbetade med många spännande projekt och drev gränserna för robotik. Det var spännande att lansera kommersiellt framgångsrika robotar på marknaden som utförde hjälpsamma fysiska uppgifter, såsom att dammsuga golvet.

Men i bakhuvudet visste jag att jag fortfarande hade en livslång dröm att uppfylla – att bygga socialt och emotionellt intelligenta robotkamrater som förbättrar omsorg och välbefinnande och förhöjer våra dagliga liv. Jag visste att vi var på en vändpunkt i hur vi kommer att interagera med teknik. Så med det bestämde jag mig för att avgå från iRobot och starta Embodied.

När vi startade Embodied, tänkte vi om och uppfinde hur mänsklig-maskininteraktion görs, bortom enkla verbala kommandon, för att möjliggöra nästa generation av datorer och för att driva en ny klass av maskiner som kan ha flytande social interaktion. Specifikt var den första produkten att fokusera på att bygga en animerad kamrat för att hjälpa barn bygga sociala och emotionella färdigheter genom lekbaserat lärande. Den här kamraten skulle komma att kallas Moxie. Moxie är en ny typ av robot som har förmågan att förstå och uttrycka känslor med uttrycksfull tal, trovärdiga ansiktsuttryck och kroppsspråk, som tar till humanpsykologi och neurologi för att skapa djupare band. För att göra det, samlade vi ihop ett tvärfunktionellt team av passionerade ledare inom teknik, underhållning, speldesign och barnutveckling. Under de senaste fyra åren har Embodied arbetat outtröttligt för att bringa samman all den senaste tekniken för att bringa Moxie till liv, och teamet är ivriga att till slut leverera det till familjer som behöver en co-pilot för att stödja hälsosam barnutveckling.

 

Vilka är några av de unika entreprenöriella utmaningarna bakom en robotstart?

Det är roligt att göra det omöjliga, men det kan också vara lite skrämmande. Vi visste att om vi ville revolutionera hur människor interagerar med maskiner, skulle vi vara tvungna att lösa problem som inte hade lösts tidigare. Några problem inkluderade:

  1. Platta skärmar är på enheter, och vi vill bringa en enhet till liv. Så hur skapar vi ett ansikte som är mer levande, rundat och inte tvådimensionellt?
  2. Nuvarande konversationsmotorer tillåter bara mycket begränsad konversation, så hur skapar vi en lösning som tillåter mer naturlig konversation?
  3. Vi vill inte att rösten ska låta robotlik, så hur gör vi så att rösten låter naturlig, med kontextuellt lämplig tonalitet och inflexioner?
  4. Vi visste att ögonkontakt var mycket viktigt, så vi var tvungna att lösa hur vi kunde använda datorseende för att säkerställa tillförlitlig ögonspårning.

Alla dessa frågor om Moxies funktioner ledde till många banbrytande tekniska innovationer.

Först, projicerat och rundat ansikte. Statistiken börjar hopa sig för att visa oss att för mycket skärmtid kan ha förödande effekter på utvecklande sinnen. Ännu värre, de flesta barns tekniska enheter har digitala skärmar. Det är därför vi bestämde oss för att investera extra för att göra Moxies ansikte fullt projicerat, vilket gjorde det möjligt för oss att skapa en ansiktsskärm som är rundad med naturligt krökta kanter, istället för en platt skärm. Det gör att interagera med Moxie känns mer levande, realistiskt och trovärdigt. I själva verket är det bara genom denna 3D-utseende av ansiktet som Moxie kan ha riktigt ögonkontakt med barnet. Så inte bara skyddar Moxies ansikte barnen från överdriven skärmtid, men det gör också att interaktionen känns mer verklig.

Sedan, konversationsmotorn. Hittills har smarta högtalare och röstassistenter krävt upprepade användningar av väckord för att initiera kommandon. Moxies konversationsmotor är annorlunda. Den följer en naturlig konversation och svarar på typisk konversationsflöde utan användning av väckord (som “Hej Siri” eller “Ok Google”). Avancerad naturlig språkbehandling tillåter Moxie att känna igen, förstå och generera språk sömlöst, vilket gör interaktionen känns mer personlig och naturlig.

Tredje, talsyntes. Moxies röst har inte samma robotiska tal och monotont ljud som finns i de flesta robotar och röstassistenter. Istället använder Moxie naturlig och uttrycksfull röst med inflexioner, som hjälper till att kommunicera en bredare range av känslor. Detta förbättrar omfattningen av social-emotionella lektioner Moxie kan engagera sig i, samtidigt som det också lägger till ett livlikt och trovärdigt utseende till interaktionen.

Fjärde, ögonen. En av de viktigaste funktionerna är Moxies stora, animerade ögon. Innovativ ögonspårningsteknologi tillåter Moxie att behålla ögonkontakt med barnet även när barnet rör sig runt i rummet. Detta ögonspårningsförmåga skapar inte bara en otroligt levande interaktion, men det hjälper också barnet att öva ögonkontakt. Dessutom hjälper de stora, animerade ögonen till att förstärka emotionell kommunikation, så att barnet kan mer lätt känna igen vissa känslor. Att öva ögonkontakt och förstå känslor är två nyckelutvecklingsmål i social-emotionell läroplan.

Slutligen, alla dessa tekniska funktioner tillåter interaktioner med Moxie att känns realistiska och naturliga. Moxies multimodala sensorförening gör Moxie medveten om miljön och dess användare. Moxies datorseende och ögonspårningsteknologi hjälper till att behålla ögonkontakt när barnet rör sig. Maskinlärning hjälper Moxie att lära sig användarpreferenser och behov, och känna igen människor, platser och saker. Särskilt placerade mikrofoner tillåter Moxie att höra riktningen en röst kom från och enkelt vända sig till källan. Beröringssensorer tillåter Moxie att känna igen kramar och handslag. Alla dessa bitar kommer samman för att göra upplevelsen mycket realistisk.

 

Kunde du berätta om några av de saker som gör Moxie perfekt för barn?

Med Moxie kan barn engagera sig i meningsfull lek, varje dag, med innehåll som är informerat av de bästa metoderna i barnutveckling och tidig barndomsutbildning. Varje vecka är ett annat tema, såsom vänlighet, vänskap, empati eller respekt, och barnen får i uppdrag att hjälpa Moxie med uppdrag som utforskar mänskliga upplevelser, idéer och livsfärdigheter. Dessa uppdrag är aktiviteter som inkluderar kreativ ostrukturerad lek som ritning, medvetenhetsträning genom andningsövningar och meditation, läsning med Moxie och utforskning av sätt att vara snäll mot andra. Moxie uppmuntrar nyfikenhet så att barn upptäcker världen och människorna runt omkring dem. Alla dessa aktiviteter hjälper barn att lära sig och säkert öva essentiella livsfärdigheter som turtagning, ögonkontakt, aktivt lyssnande, känslereglering, empati, relationshantering och problemlösning.

Embodied har också samarbetat med Encyclopaedia Britannica och Merriam-Webster för att integrera Merriam-Websters ordbok för barn, vilket möjliggör för Moxie att tillhandahålla åldersanpassade definitioner och relaterad information för att hjälpa barn att lära sig och förstå betydelsen av nya ord och begrepp. Detta är den första av många integrationer med Moxie som levererar på Britannicas och Merriam-Websters gemensamma uppdrag att inspirera nyfikenhet och glädje i lärandet.

Embodied har också utvecklat ett fullständigt ekosystem som hjälper föräldrar att stödja barnets resa med Moxie och tillåter barn att expandera sin användning av Moxie på ett säkert och föräldragodkänt sätt:

  • Embodied Moxie Föräldraapp tillhandahåller en instrumentpanel för att hjälpa föräldrar att förstå barnets utvecklingsframsteg med Moxie. Appen kommer att tillhandahålla nyckelinsikter till barnets sociala, emotionella och kognitiva utveckling genom deras aktiviteter med Moxie. Appen tillhandahåller dessutom värdefulla förslag och tips till föräldrar för att förbättra barnets upplevelse och framsteg med Moxie.
  • En onlinebarnportal (kallad Global Robotics Laboratory, eller G.R.L.) tillhandahåller ytterligare aktiviteter, spel och berättelser som kommer att förbättra upplevelsen med Moxie.
  • Månatliga Moxie Uppdragspaket är utskick som är avsedda att engagera barn i nya aktiviteter med Moxie och också tillhandahålla roliga saker som samlingskort och klistermärken.

Över tiden lär sig Moxie mer om barnet för att bättre anpassa sitt innehåll för att hjälpa till med varje barns individuella utvecklingsmål. Embodied har tagit omsorgsfulla steg för att säkerställa att information som tillhandahålls av barn och familjer hanteras med höga standarder för sekretess och säkerhet. Vi avser att Moxie ska vara fullständigt COPPA (Barns online-skyddslag) säkerhetscertifierad så att föräldrar kan känna sig säkra på att Moxie använder ledande dataintegritets- och säkerhetsförfaranden och att dess system regelbundet granskas för att säkerställa fullständig efterlevnad. Dessutom är personligt identifierbar data och känslig information krypterad med den högsta säkerhetsnivån och kan bara dekrypteras med en unik nyckel som bara föräldern har tillgång till.

 

Vilka är några av de naturliga språkbehandlingsutmaningar som Moxie står inför?

På Embodied strävar vi efter att omdefiniera hur människor interagerar med maskiner, särskilt i konversation genom naturlig språkbehandling. Så vi bestämde oss för att skapa SocialXTM, som är en plattform som tillåter barn att engagera sig med Moxie genom naturlig interaktion (dvs. ansiktsuttryck, konversation, kroppsspråk etc.), som väcker förtroende, empati och motivation samt djupare engagemang för att främja utvecklingsfärdigheter. Med SocialXTM introducerar Embodied en helt ny kategori av robotar: animerade kamrater. “Animerad” betyder att bringa till liv och SocialXTM tillåter Moxie att personifiera det allra bästa av mänskligheten i en ny och avancerad form av teknik som kan bränsle nya sätt att lära.

Naturlig språkbehandling är kärnan i vår naturliga konversationsmotor, och det finns många unika funktioner i konversationsmotorn som vi arbetade outtröttligt för att skapa.

Den viktigaste funktionen vi arbetade med var Moxies förmåga att fokusera konversationen med en enskild användare och separera ut bakgrundskonversationer och ljud, så att Moxie bara svarar på användaren. Det tillåter en mer fokuserad och personlig interaktion. Det är en lösning på vad många kallar “cocktail party-problemet”. När du är på en cocktailparty och det finns många människor som pratar runt omkring dig i ett rum medan du försöker hålla en konversation med en person, är det inte särskilt svårt för människor. För en dator är det otroligt svårt. Hur säkerställer vi att Moxie bara svarar på vad den enskilda användaren säger och inte blir störd av bakgrundsljud, konversationer, TV etc.? Det finns många sätt vi närmar oss lösningen på det problemet.

  1. Vi använder vårt visionsystem för att identifiera vem som tittar på och möter Moxie.
  2. Vi har flera mikrofoner i framsidan av Moxie som berättar för oss var ljudet kommer ifrån.
  3. Vi kan sedan använda maskinlärning för att matcha ljudet till vem som talar framför Moxie. Det tillåter oss att filtrera ut andra konversationer och hålla fokus på en enskild användare.

Generellt har konversationsagenter på marknaden undvikit “cocktail party-problemet” genom att använda väckord, såsom “Hej (enhet, följt av en fråga)”. Det väckordet tillåter konversationsagenten att lyssna på väckordet och svara bara när det väckordet sägs. Men eftersom Moxie kan fokusera på en enskild användare behöver Moxie inte ha väckord för att aktivera ett svar.

Vi ville säkerställa att Moxies konversationsmotor är så avancerad att den är kontextuellt medveten om konversationsresponser. Det tillåter en mer nyanserad konversation. Till exempel kan Moxie förstå de olika betydelserna bakom “Jag vet inte” och “nej”.

 

Finns det något annat du vill dela om Moxie eller Embodied?

Vi har arbetat med det här projektet i fyra år med ett dedikerat team som har arbetat outtröttligt för att skapa de otroliga uppfinningarna som krävs för att bringa Moxie till liv. Nu är vi ivriga att till slut bringa Moxie till familjer för att hjälpa deras barn med social emotionell utveckling. Så vi ser fram emot resan!

<Tack för intervjun, jag älskade att höra hur du initialt inspirerades av en kort Pixar-film, och hur du sedan har följt din livspassion. Läsare som vill lära sig mer eller som vill beställa en Moxie bör besöka Embodied, Inc.

Antoine är en visionär ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och främja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika omstörtande för samhället som elektricitet, och fångas ofta i extas över potentialen för omstörtande teknologier och AGI. Som en futurist, är han dedikerad till att utforska hur dessa innovationer kommer att forma vår värld. Dessutom är han grundare av Securities.io, en plattform som fokuserar på att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.