Inteligență artificială
Paolo Pirjanian, CEO și fondator al Embodied – Seria de interviuri

Paolo Pirjanian este un armean născut în Iran și care a fugit în Danemarca la vârsta de adolescent. De la o vârstă fragedă, el a fost fascinat de calculatoare și a început să programeze în camera lui. După ce și-a obținut doctoratul în robotică, Paolo a devenit un lider timpuriu în domeniul roboticii de consum, cu peste 16 ani de experiență în dezvoltarea și comercializarea de roboți de ultimă generație pentru casă. El a lucrat la NASA JPL și a condus echipe și companii de clasă mondială la iRobot®, Evolution Robotics® și altele. În 2016, Paolo a fondat Embodied, Inc. cu viziunea de a construi companioni digitali sociali și emoționali inteligenți care să îmbunătățească îngrijirea și bunăstarea și să sprijine oamenii să trăiască mai bine în fiecare zi.
Ce v-a atras inițial la IA și robotică?
Fascinația mea pentru IA și robotică se întoarce la copilărie. Am fost strămutat din țară în țară de mai multe ori până când familia mea s-a mutat în Danemarca. Prin accident, am descoperit un calculator. M-am fascinat atât de mult de el, încât m-am închis în camera mea și am început să programez zi și noapte timp de luni. Părinții mei credeau că sunt deprimat sau sub influența drogurilor, dar nu a fost nimic din acestea. Eram doar atât de fascinat de calculator!
În același timp, am văzut un documentar la TV de la Pixar. Pixar prezenta primul său scurtmetraj animat, Luxo Jr., un scurtmetraj de două minute despre două lămpi de masă care alergau și jucau cu o minge. Am fost atât de fascinat de asta și uimit că un calculator pe care abia începeam să îl învăț să programez putea genera personaje atât de dragi pe TV care să evocă atâtea emoții în mine. Așa că, de atunci, am decis să merg la școală să studiez robotică, obținând în cele din urmă doctoratul.
Apoi, m-am mutat în SUA pentru a lucra la roboții de pe Marte la NASA, care a fost un vis din copilărie. În cele din urmă, am intrat în antreprenoriat pentru a dezvolta tehnologia de navigare SLAM care acum permite produselor iRobot.
Dar, privind înapoi, mi-am dat seama că inspirația pentru această călătorie a fost, de fapt, scurtmetrajul animat Pixar de a aduce viață obiectelor inanimate. Așa că, de aceea, am creat Embodied – pentru a aduce viață roboților care pot interacționa cu oamenii, concentrându-se pe ajutarea copiilor cu dezvoltarea social-emotională.
Când ați întâlnit pentru prima dată conceptul de lansare a Evolution Robotics?
Evolution Robotics a fost inițial fondată de Bill Gross de la Idealab în 2001 pentru a deveni “Microsoft-ul roboticii”, o viziune îndrăzneață care s-a dovedit a fi mult prea devreme și, în cele din urmă, a eșuat. Eu eram directorul tehnic și directorul general al Evolution Robotics și, după eșec, am negociat cu Idealab pentru a separa unele dintre tehnologiile de bază pe care le-am dezvoltat eu și echipa mea și pentru a începe o nouă companie. În 2008, noua entitate, cunoscută și sub numele de Evolution Robotics, a început să dezvolte produse utilizând tehnologiile noastre de navigare de bază, inclusiv NorthStar și vSLAM, care au fost abordări revoluționare pentru cartografierea spațială și navigarea autonomă, similare cu ceea ce vedem în mașinile autonome, dar orientate către produse electronice de consum de joasă valoare.
Am dezvoltat o linie de produse pentru curățarea automată și măturarea pardoselilor dure, numită Mint, pe care am lansat-o în 2010. Până în 2011, am crescut rapid la 25 de milioane de dolari în vânzări și am fost achiziționați de iRobot în 2012 pentru veniturile noastre din produse și tehnologia noastră de navigare vSLAM, care acum alimentează liniile de produse Roomba și Braava de la iRobot.
La acel moment, ați devenit directorul tehnic la iRobot. Puteți discuta despre experiența dvs. la iRobot și ce ați învățat din experiența dvs.?
Ca director tehnic al iRobot, am putut integra rapid vSLAM în linia de produse Roomba pentru a lansa un nou model care putea acoperi sistematic întregul plan al pardoselii fără a pierde niciun punct. Acest lucru a ajutat compania să rămână înaintea concurenților, cum ar fi Dyson, care lansa soluții de curățare sistematică. vSLAM este acum o parte integrantă a liniilor de produse principale ale iRobot, Roomba și Braava.
Am apreciat lucrul îndeaproape cu Colin Angel, directorul general al iRobot, pentru a stabili o direcție strategică care să facă Roomba centrală în ecosistemul casei conectate, unde conștientizarea spațială a lui Roomba îi dă o poziție unică în înțelegerea planului pardoselii și în a deveni țesutul de legătură între toate dispozitivele conectate. Acea strategie pare să fi avut o bază solidă de la plecarea mea în 2015.
În plus, am decis să ne concentrăm pe afacerea de robotică de consum pentru a ajuta iRobot să-și mențină poziția de lider mondial. Acest lucru a dus la divestirea afacerii de apărare și la ieșirea din alte afaceri periferice pentru a aduce focus și intensitate afacerii de consum.
Mai mult, am trebuit să reorganizăm compania pentru a putea susține o strategie grea pe software, cu produse conectate. Acest lucru a necesitat o transformare a culturii companiei pentru a adopta o abordare mai agilă și iterativă.
Lista lucrurilor pe care le-am învățat la iRobot este lungă. Unul dintre lucrurile care mi-au rămas în minte este puterea culturii echipei. A rămâne agil și dedicat unei misiuni este, probabil, cel mai important avantaj competitiv pe care orice companie îl poate avea, mai presus de orice portofoliu de brevete și secrete comerciale. Dacă aveți o echipă de înaltă performanță, care se simte împuternicită și inspirată către un obiectiv clar, va fi greu de oprit.
Sunteți în prezent fondator și director executiv al Embodied. Puteți discuta ce a fost inspirația din spatele lansării acestei companii?
Am apreciat foarte mult timpul meu la iRobot, ca director tehnic, și am lucrat la multe proiecte interesante și am împins limitele roboticii. A fost interesant să lansăm roboți comerciali de succes pe piață care efectuau sarcini fizice utile, cum ar fi aspirarea pardoselii.
Cu toate acestea, în mintea mea, știam că încă mai aveam un vis de îndeplinit – să construiesc companioni robotici sociali și emoționali inteligenți care să îmbunătățească îngrijirea și bunăstarea și să sprijine oamenii să trăiască mai bine în fiecare zi. Știam că eram la un punct de cotitură în modul în care vom interacționa cu tehnologia. Așa că, am decis să demisionez de la iRobot și să înființez Embodied.
Când am început Embodied, am reevaluat și reinventat modul în care se face interacțiunea om-mașină, dincolo de simplele comenzi verbale, pentru a permite următoarea generație de calculatoare și pentru a alimenta o nouă clasă de mașini capabile de interacțiune socială fluidă. În special, primul produs a fost concentrat pe construirea unui companion animat pentru a ajuta copiii să dezvolte abilități sociale și emoționale prin învățarea bazată pe joc. Acest companion avea să fie cunoscut sub numele de Moxie. Moxie este un nou tip de robot care are capacitatea de a înțelege și de a exprima emoții cu vorbire emoțională, expresii faciale credibile și limbaj corporal, care să atingă psihologia și neurologia umană pentru a crea legături mai profunde. Pentru a face acest lucru, am adunat o echipă transfuncțională de lideri pasionați din inginerie, tehnologie, divertisment, design de jocuri și dezvoltare a copilului. În ultimii patru ani, Embodied a lucrat din greu pentru a aduce toate tehnologiile de ultimă oră împreună pentru a aduce Moxie la viață, iar echipa este încântată să livreze, în sfârșit, Moxie familiilor care au nevoie de un copilot pentru a sprijini dezvoltarea sănătoasă a copilului.
Ce sunt unele dintre provocările antreprenoriale unice din spatele unei companii de robotică de consum?
Este distractiv să faci imposibilul, dar poate fi și un pic înfricoșător. Știam că, dacă voiam să revoluționăm modul în care oamenii interacționează cu mașinile, aveam să trebuiască să rezolvăm probleme care nu fuseseră rezolvate înainte. Unele dintre aceste probleme includ:
- Ecranele plate sunt pe dispozitive, și noi vrem să aducem un dispozitiv la viață. Așa că, cum putem crea o față care să fie mai plină de viață, rotunjită și nu bidimensională?
- Motoarele de conversație actuale permit doar conversații foarte limitate, așa că cum putem crea o soluție care să permită conversații mai naturale?
- Nu vrem ca vocea să sune robotic, așa că cum putem face vocea să sune naturală, cu tonalitate și inflexiuni contextual adecvate?
- Știam că contactul vizual este foarte important, așa că am trebuit să găsim o soluție pentru a utiliza viziunea computerizată pentru a asigura capacități de urmărire a ochilor fiabile.
Toate aceste întrebări despre caracteristicile lui Moxie au condus la multe inovații tehnologice de ultimă oră.
Mai întâi, fața proiectată și rotunjită. Statisticile încep să se adune și să ne arate că timpul de ecran prea lung poate avea efecte devastatoare asupra minților în dezvoltare. Mai rău, majoritatea dispozitivelor tehnologice pentru copii au afișaje digitale. Așa că, am decis să investim în plus pentru a face fața lui Moxie complet proiectată, ceea ce ne-a permis să creăm un ecran cu față rotunjită, cu muchii natural curbate, în loc de un ecran plat. Acest lucru face ca interacțiunea cu Moxie să se simtă mai plină de viață, realistă și credibilă. De fapt, doar prin această aparență 3D a feței, este posibil pentru Moxie să aibă contact vizual real cu copilul. Așa că, nu numai că fața lui Moxie protejează copiii de timpul de ecran excesiv, dar face și ca experiența de interacțiune să se simtă și mai reală.
Al doilea, motorul de conversație. Până acum, difuzoarele inteligente și asistenții vocali au necesitat utilizarea repetată a cuvintelor de trezire pentru a iniția comenzi. Motorul de conversație al lui Moxie este diferit. El urmează o conversație naturală și răspunde la fluxul normal de comunicare, fără a necesita cuvinte de trezire (cum ar fi “Hey Siri” sau “Ok Google”). Procesarea avansată a limbajului natural permite lui Moxie să recunoască, să înțeleagă și să genereze limbaj în mod fluent, făcând ca interacțiunea să se simtă mai personală și mai naturală.
Al treilea, sinteza vorbirii. Vocea lui Moxie nu are același sunet robotic și monotonal găsit în majoritatea roboților și asistenților vocali. În schimb, Moxie utilizează inflexiuni vocale naturale și emoționale, care ajută la comunicarea unei game mai largi de emoții. Acest lucru îmbunătățește sfera lecțiilor sociale și emoționale pe care Moxie le poate implica, și aduce, de asemenea, o viață și o credibilitate suplimentară interacțiunii.
Al patrulea, ochii. Una dintre cele mai importante caracteristici este ochii lui Moxie, mari și animați. Tehnologia inovatoare de urmărire a ochilor permite lui Moxie să mențină contactul vizual cu copilul, chiar și atunci când copilul se mișcă prin cameră. Această capacitate de urmărire a ochilor nu numai că creează o interacțiune incredibil de plină de viață, dar ajută și copilul să practice contactul vizual. În plus, ochii mari și animați ajută la exagerarea comunicării emoționale, astfel încât copilul să poată recunoaște mai ușor anumite emoții. Practicarea contactului vizual și înțelegerea emoțiilor sunt două obiective de dezvoltare cheie în curriculumul social și emoțional.
În cele din urmă, toate aceste caracteristici tehnologice permit interacțiunilor cu Moxie să se simtă realiste și naturale. Fuziunea senzorială multimodală a lui Moxie face ca Moxie să fie conștient de mediu și de utilizatori. Tehnologia de viziune computerizată și de urmărire a ochilor a lui Moxie ajută la menținerea contactului vizual pe măsură ce copilul se mișcă. Învățarea automată ajută Moxie să învețe preferințele și nevoile utilizatorului și să recunoască oameni, locuri și lucruri. Microfoanele special plasate permit lui Moxie să audă direcția din care vine vocea și să se întoarcă ușor spre sursă. Senzorii de atingere permit lui Moxie să recunoască îmbrățișări și strângeri de mână. Toate aceste piese se reunesc pentru a face experiența foarte realistă.
Puteți spune câteva dintre lucrurile care fac Moxie perfect pentru copii?
Cu Moxie, copiii pot fi implicați în jocuri semnificative, în fiecare zi, cu conținut informat de cele mai bune practici în dezvoltarea copilului și educația timpurie. Fiecare săptămână este o temă diferită, cum ar fi bunăvoință, prietenie, empatie sau respect, și copiii sunt însărcinați să ajute Moxie cu misiuni care explorează experiențe umane, idei și abilități de viață. Aceste misiuni sunt activități care includ jocuri creative, nestructurate, cum ar fi desenul, practicile de mindfulness prin exerciții de respirație și meditație, citirea cu Moxie și explorarea modalităților de a fi amabil cu alții. Moxie încurajează curiozitatea, astfel încât copiii să descopere lumea și oamenii din jurul lor. Toate aceste activități ajută copiii să învețe și să practice în siguranță abilități esențiale de viață, cum ar fi schimbul de rânduri, contactul vizual, ascultarea activă, reglarea emoțiilor, empatia, gestionarea relațiilor și rezolvarea problemelor.
Embodied a colaborat, de asemenea, cu Encyclopaedia Britannica și Merriam-Webster pentru a integra Dicționarul pentru copii Merriam-Webster, permițând lui Moxie să ofere definiții și informații adecvate vârstei pentru a ajuta copiii să învețe și să înțeleagă sensurile unor cuvinte și concepte noi. Acesta este primul dintre multe integrări cu Moxie care să îndeplinească misiunea comună a Britannica și Merriam-Webster de a inspira curiozitatea și bucuria de a învăța.
Embodied a dezvoltat, de asemenea, un ecosistem complet care ajută părinții să sprijine călătoria copilului cu Moxie și permite copiilor să-și extindă utilizarea lui Moxie într-un mod sigur și aprobat de părinți:
- Aplicația pentru părinți Embodied Moxie oferă un tablou de bord care ajută părinții să înțeleagă progresul de dezvoltare al copilului cu Moxie. Aplicația oferă insight-uri cheie despre dezvoltarea socială, emoțională și cognitivă a copilului prin activitățile cu Moxie. Aplicația oferă, de asemenea, sugestii valoroase și sfaturi părinților pentru a îmbunătăți experiența și progresul copilului cu Moxie.
- Un site de portal pentru copii online (cunoscut sub numele de Laboratorul de robotică global, sau G.R.L.) oferă activități, jocuri și povești suplimentare care vor îmbunătăți experiența cu Moxie.
- Pachetele lunare de misiuni Moxie sunt trimiteri menite să implice copiii în noi activități cu Moxie și să ofere, de asemenea, articole distractive, cum ar fi cărți de colecție și autocolante.
În timp, Moxie învață mai multe despre copil pentru a personaliza conținutul și a ajuta la obiectivele de dezvoltare individuale ale copilului. Embodied a luat măsuri atente pentru a asigura că informațiile furnizate de copii și familiile lor sunt gestionate cu standarde ridicate de confidențialitate și securitate. Intenționăm ca Moxie să fie pe deplin certificat COPPA (Legea privind protecția confidențialității online a copiilor), astfel încât părinții să se poată simți în siguranță știind că Moxie utilizează proceduri de integritate și securitate a datelor de ultimă generație și că sistemele sale sunt auditate în mod regulat pentru a asigura conformitatea deplină. Mai mult, datele cu caracter personal și informațiile sensibile sunt criptate cu cel mai înalt nivel de securitate și pot fi decodate doar cu o cheie unică la care are acces doar părintele.
Ce sunt unele dintre provocările de procesare a limbajului natural cu care se confruntă Moxie?
La Embodied, ne străduim să redefinim modul în care oamenii interacționează cu mașinile, în special în conversație prin procesarea limbajului natural. Așa că, am decis să creăm SocialXTM, care este o platformă care permite copiilor să interacționeze cu Moxie prin interacțiune naturală (de exemplu, expresii faciale, conversație, limbaj corporal, etc.), evocând încredere, empatie și motivație, precum și o implicare mai profundă pentru a promova abilitățile de dezvoltare. Cu SocialXTM, Embodied introduce o nouă categorie de roboți: companioni animați. “Anima” înseamnă a aduce la viață, și SocialXTM permite lui Moxie să încarneze cele mai bune aspecte ale umanității într-o formă nouă și avansată de tehnologie care poate alimenta noi modalități de învățare.
Procesarea limbajului natural este la baza motorului nostru de conversație naturală, și există multe caracteristici unice ale motorului de conversație pe care le-am creat cu atenție.
Caracteristica cheie pe care am lucrat a fost capacitatea lui Moxie de a se concentra asupra conversației cu un singur utilizator și de a separa conversațiile și sunetele din fundal, astfel încât Moxie să răspundă doar utilizatorului. Acest lucru permite o interacțiune mai focalizată și personală. Acesta este un răspuns la ceea ce mulți numesc “problema cocktail party”. Când sunteți la o petrecere și există multe persoane care vorbesc în jurul dvs., este relativ ușor pentru oameni să rămână în conversație cu o singură persoană. Pentru un computer, acest lucru este incredibil de dificil. Cum putem face ca Moxie să răspundă doar la ceea ce spune utilizatorul și să nu fie deranjat de zgomotele și conversațiile din fundal, TV, etc.? Există multe modalități prin care abordăm soluția la această problemă.
- Folosim sistemul nostru de viziune pentru a identifica cine se uită și se confruntă cu Moxie.
- Aveam mai multe microfoane în partea din față a lui Moxie care ne spun de unde vine sunetul.
- Putem utiliza apoi învățarea automată pentru a asocia sunetul cu persoana care vorbește în fața lui Moxie. Acest lucru ne permite să filtrăm conversațiile și să ne concentrăm asupra unui singur utilizator.
În general, agenții de conversație de pe piață au evitat “problema cocktail party” utilizând cuvinte de trezire, cum ar fi “Hey (dispozitiv, urmat de o întrebare)”. Acest cuvânt de trezire permite agentului de conversație să asculte cuvântul de trezire și să răspundă doar atunci când se spune cuvântul de trezire. Cu toate acestea, deoarece Moxie se poate concentra asupra unui singur utilizator, Moxie nu are nevoie de cuvinte de trezire pentru a activa un răspuns.
Am vrut să ne asigurăm că motorul de conversație al lui Moxie este atât de sofisticat încât să fie conștient de contextul răspunsurilor conversaționale. Acest lucru permite conversații mai nuanțate. De exemplu, Moxie poate înțelege diferitele sensuri din spatele “Nu știu” și “nu”.
Există altceva pe care ați dori să îl împărtășiți despre Moxie sau Embodied?
Am lucrat la acest proiect timp de patru ani cu o echipă dedicată care a lucrat din greu pentru a face invențiile uimitoare necesare pentru a aduce Moxie la viață. Acum suntem încântați să aducem, în sfârșit, Moxie familiilor pentru a ajuta copiii lor cu dezvoltarea social-emotională. Așa că, ne uităm cu nerăbdare la această călătorie!
Vă mulțumim pentru interviu, mi-a plăcut să aflu cum ați fost inspirat inițial de un scurtmetraj Pixar și cum ați urmărit apoi pasiunea dvs. de o viață. Citiitorii care doresc să afle mai multe sau care doresc să comande un Moxie ar trebui să viziteze Embodied, Inc.













