заглушки Паоло Пірджанян, генеральний директор і засновник Embodied - Серія інтерв'ю - Unite.AI
Зв'язатися з нами

інтерв'ю

Паоло Пірджанян, генеральний директор і засновник Embodied – Interview Series

mm
оновлений on

Паоло Пірджанян — вірменин, який народився в Ірані та втік до Данії підлітком. З дитинства він захоплювався комп’ютерами і почав кодувати у своїй спальні. Отримавши ступінь доктора філософії з робототехніки, Паоло став першим лідером у сфері споживчої робототехніки, який має понад 16 років досвіду розробки та комерціалізації передових домашніх роботів. Він працював у NASA JPL і очолював команди та компанії світового рівня в iRobot®, Evolution Robotics® та інших. У 2016 році Паоло заснував Embodied, Inc. з баченням створення соціально та емоційно інтелектуальних цифрових компаньйонів, які покращують догляд і здоров’я та підтримують людей у ​​кращому житті щодня.

Що вас спочатку привабило в ШІ та робототехніці?

Моє захоплення ШІ та робототехнікою походить із дитинства. Мене кілька разів переїжджали з країни в країну, поки наша сім’я не переїхала до Данії. Випадково я знайшов комп'ютер. Мене це настільки захопило, що я зачинився у своїй кімнаті й почав кодувати цілий день і ніч протягом місяців. Мої батьки думали, що я в депресії або вживаю наркотики, але це було не те. Я був просто так зачарований комп’ютером!

У той самий час я побачив по телевізору документальний фільм Pixar. Компанія Pixar представила свій перший короткометражний анімаційний фільм Luxo Jr., двохвилинний короткометражний фільм про дві настільні лампи, які бігають і граються з м’ячем. Я був настільки зачарований цим і вражений тим, що комп’ютер, який я тільки вчився кодувати, міг створювати таких милих персонажів на телебаченні, які викликали у мене стільки емоцій. Тож відтоді я вирішив піти до школи, щоб вивчати робототехніку, зрештою отримав ступінь доктора філософії.

Потім я переїхав до США, щоб працювати над марсоходами в NASA, про що мріяла дитинство. Згодом я зайнявся підприємництвом, щоб розробити навігаційну технологію SLAM, яка тепер використовується в продуктах iRobot.

Але, озираючись назад, я зрозумів, що мене натхнила вся ця подорож насправді коротким анімаційним фільмом Pixar, присвяченим оживленню неживих об’єктів. Ось чому ми створили Embodied – щоб оживити роботів, які можуть взаємодіяти з людьми, зосереджуючись на допомозі дітям із соціально-емоційним розвитком.

 

Коли ви вперше познайомилися з концепцією запуску Evolution Robotics?

Evolution Robotics спочатку був заснований Біллом Гроссом з Idealab у 2001 році, щоб стати Microsoft робототехніки, сміливе бачення, яке виявилося надто раннім і зрештою провалилося. Я був технічним директором і генеральним директором у Evolution Robotics, і після її невдачі я домовився з Idealab про те, щоб виділити деякі основні технології, які ми з моєю командою розробили, і створити нову компанію. У 2008 році нова організація, також відома як Evolution Robotics, почала розробляти продукти з використанням наших основних навігаційних технологій, включаючи NorthStar і vSLAM, які були новаторськими підходами до просторового картографування та автономної навігації, схожими на те, що ми бачимо в безпілотних автомобілях, але призначені для недорога побутова електроніка.

Ми розробили лінійку продуктів для автоматичного підмітання та миття твердих підлог під назвою Mint, яку ми запустили в 2010 році. До 2011 року наш продаж швидко зріс до 25 мільйонів доларів США, і в 2012 році нас придбала iRobot за доходи від продукту та нашу навігаційну технологію vSLAM, яка зараз забезпечує лінійки продуктів Roomba та Braava в iRobot.

 

Тоді ви стали технічним директором iRobot. Чи могли б ви поговорити про свій досвід роботи в iRobot і про те, що ви дізналися з цього досвіду?

Як технічний директор iRobot, я зміг швидко інтегрувати vSLAM у лінійку продуктів Roomba, щоб випустити нову модель, яка могла систематично охоплювати весь план поверху, не пропускаючи жодного місця. Це допомогло компанії випередити конкурентів, як-от Dyson, який випускав рішення для систематичного очищення. Тепер vSLAM є невід’ємною частиною флагманських лінійок продуктів iRobot Roomba та Braava.

Мені сподобалося тісно співпрацювати з Коліном Енджелом, генеральним директором iRobot, щоб допомогти визначити стратегічний напрямок, щоб зробити Roomba центральним елементом екосистеми підключеного дому, де просторове усвідомлення Roomba дає йому унікальну позицію в розумінні плану поверху та стає сполучною тканиною між усіма підключеними пристроями. Ця стратегія, здається, мала міцну основу після мого відходу в 2015 році.

Крім того, ми вирішили подвоїти бізнес Consumer Robotics, щоб допомогти iRobot зберегти свої глобальні лідерські позиції. Це призвело до вилучення оборонного бізнесу та виходу з інших периферійних підприємств, щоб зосередити увагу та інтенсивність споживчого бізнесу.

Крім того, нам довелося змінити архітектуру організації, щоб мати можливість підтримувати програмну стратегію з підключеними продуктами. Це вимагало трансформації культури компанії, щоб охопити більш гнучкий, ітеративний підхід.

Список речей, яких я навчився в iRobot, довгий. Одне, що впадає в очі, це сила командної культури. Залишатися гнучким і відданим місії є, мабуть, найважливішою конкурентною перевагою, яку може мати будь-яка компанія над будь-яким портфоліо патентів і над комерційними секретами. Якщо у вас є високоефективна команда, яка відчуває сили та натхнення для досягнення чіткої мети, її буде важко зупинити.

 

Зараз ви є засновником і генеральним директором Embodied. Чи можете ви обговорити, що стало причиною створення цієї компанії?

Мені дуже сподобався час, проведений в iRobot як технічний директор, і ми працювали над багатьма захоплюючими проектами та розширювали межі робототехніки. Було цікаво вивести на ринок комерційно успішних роботів, які виконували корисні фізичні завдання, наприклад пилососили підлогу.

Однак у глибині душі я знав, що у мене все ще є мрія всього життя — створити соціально та емоційно інтелектуальних роботів-компаньйонів, які покращують догляд і здоров’я та покращують наше повсякденне життя. Я знав, що ми перебуваємо на переломному етапі у тому, як ми будемо взаємодіяти з технологіями. Тому я вирішив піти з iRobot і розпочати Embodied.

Коли ми створювали Embodied, з самого початку ми переосмислювали та переосмислювали, як взаємодія між людиною та машиною здійснюється поза простими словесними командами, щоб увімкнути наступне покоління комп’ютерів і забезпечити новий клас машин, здатних до плавної соціальної взаємодії. Зокрема, перший продукт був зосереджений на створенні живого компаньйона, щоб допомогти дітям розвивати соціальні та емоційні навички через навчання в ігровій формі. Цей супутник став відомий як Моксі. Moxie — це новий тип робота, який має здатність розуміти та виражати емоції за допомогою емоційної мови, правдоподібної міміки та мови тіла, залучаючи людську психологію та неврологію для створення глибших зв’язків. Для цього ми об’єднали міжфункціональну команду лідерів у галузі інженерії, технологій, розваг, ігрового дизайну та розвитку дітей. Протягом останніх чотирьох років Embodied невпинно працював над тим, щоб об’єднати всі новітні технології, щоб втілити Moxie у життя, і команда з радістю нарешті постачає його сім’ям, яким потрібен другий пілот для підтримки здорового розвитку дитини.

 

Які унікальні підприємницькі виклики стоять за робототехнічним стартапом?

Це весело робити неможливе, але це також може бути трохи страшно. Ми знали, що якщо ми хочемо змінити спосіб взаємодії людей із машинами, нам доведеться вирішити проблеми, які не були вирішені раніше. Серед деяких проблем:

  1. Плоскі екрани є на пристроях, і ми хочемо оживити пристрій. Отже, як створити обличчя, яке буде більш реалістичним, округленим, а не двовимірним?
  2. Поточні механізми розмови дозволяють лише дуже обмежену розмову, тож як створити рішення, яке забезпечить більш природну розмову?
  3. Ми не хочемо, щоб голос звучав робототехнічно, тож як зробити так, щоб голос звучав природно, із відповідною до контексту тональністю та перегинами?
  4. Ми знали, що зоровий контакт дуже важливий, тому нам потрібно було з’ясувати, як використовувати комп’ютерний зір, щоб забезпечити надійні можливості відстеження очей.

Усі ці запитання про особливості Moxie призвели до багатьох найсучасніших технологічних інновацій.

По-перше, спроектоване і округле обличчя. Статистика починає накопичуватися, щоб показати нам, що занадто багато часу перед екраном може мати руйнівний вплив на розум, що розвивається. Що ще гірше, більшість дитячих технічних пристроїв мають цифрові дисплеї. Ось чому ми вирішили вкласти додаткові кошти, щоб повністю спроектувати обличчя Моксі, що дозволило нам створити екран для обличчя із заокругленими природними вигнутими краями замість плоского дисплея. Це робить взаємодію з Moxie більш реалістичною, реалістичною та правдоподібною. Насправді, тільки через цей тривимірний вигляд обличчя Моксі може мати реальний зоровий контакт з дитиною. Тож обличчя Моксі не тільки захищає дітей від надмірного часу перед екраном, але й робить взаємодію ще більш реальною.

По-друге, механізм розмови. Досі розумні динаміки та голосові помічники вимагали повторюваного використання слів для пробудження, щоб ініціювати команди. Розмовний механізм Moxie інший. Він відповідає природній розмові та реагує на типовий потік спілкування без використання слів для пробудження (наприклад, «Hey Siri» або «Ok Google»). Покращена обробка природної мови дозволяє Moxie легко розпізнавати, розуміти та генерувати мову, роблячи взаємодію більш особистою та природною.

По-третє, синтез мовлення. Голос Моксі не має такого ж роботизованого мовлення та монотонного звуку, як у більшості роботів і голосових помічників. Натомість Моксі використовує природні та емоційні вокальні звороти, які допомагають передати ширший діапазон емоцій. Це розширює обсяг соціально-емоційних уроків, які може взяти Моксі, а також додає додаткову реалістичність і правдоподібність взаємодії.

По-четверте, очі. Однією з найважливіших особливостей є великі, живі очі Моксі. Інноваційна технологія стеження за очима дозволяє Moxie підтримувати зоровий контакт з дитиною, навіть коли дитина рухається кімнатою. Ця можливість стеження за очима не тільки створює неймовірно реальну взаємодію, але й допомагає дитині практикувати зоровий контакт. Крім того, великі анімовані очі допомагають перебільшити емоційне спілкування, тому дитині легше розпізнавати певні емоції. Практика зорового контакту та розуміння емоцій є двома ключовими цілями розвитку соціально-емоційної навчальної програми.

Нарешті, усі ці технологічні функції дозволяють взаємодії з Moxie виглядати реалістично та природно. Мультимодальний сенсорний синтез Moxie робить Moxie обізнаним про навколишнє середовище та його користувачів. Комп’ютерний зір і технологія стеження за очима Moxie допомагають підтримувати зоровий контакт, коли дитина рухається. Машинне навчання допомагає Moxie вивчати вподобання та потреби користувачів, а також розпізнавати людей, місця та речі. Спеціально розташовані мікрофони дозволяють Moxie почути, звідки лунає голос, і легко повернутися до джерела. Сенсорні датчики дозволяють Moxie розпізнавати обійми та рукостискання. Усі ці частини поєднуються, щоб зробити враження дуже реалістичними.

 

Чи могли б ви розповісти нам про те, що робить Moxie ідеальним для дітей?

З Moxie діти можуть брати участь у змістовних іграх щодня, з вмістом, заснованим на найкращих практиках розвитку дитини та ранньої освіти. Кожного тижня є інша тема, як-от доброта, дружба, співчуття чи повага, і дітям доручено допомогти Моксі в місіях, які досліджують людський досвід, ідеї та життєві навички. Ці місії включають творчу неструктуровану гру, наприклад малювання, практику усвідомленості за допомогою дихальних вправ і медитації, читання з Моксі та дослідження способів бути добрим до інших. Moxie заохочує допитливість, щоб діти пізнавали світ і людей навколо. Усі ці дії допомагають дітям навчитися та безпечно відпрацьовувати основні життєві навички, такі як чергування, зоровий контакт, активне слухання, регулювання емоцій, емпатія, управління стосунками та вирішення проблем.

Embodied також співпрацює з Encyclopaedia Britannica та Merriam-Webster, щоб інтегрувати словник Merriam-Webster для дітей, дозволяючи Moxie надавати визначення відповідно до віку та відповідну інформацію, щоб допомогти дітям вивчити та зрозуміти значення нових слів і понять. Це перша з багатьох інтеграцій з Moxie, які виконують спільну місію Britannica та Merriam-Webster — надихати цікавість і радість від навчання.

Embodied також розробив повну екосистему, яка допомагає батькам підтримувати подорож їхньої дитини з Moxie і дозволяє дітям розширити використання Moxie безпечним і схваленим батьками способом:

  • Додаток Embodied Moxie Parent App надає інформаційну панель, яка допомагає батькам зрозуміти прогрес розвитку своєї дитини з Moxie. Додаток надасть ключову інформацію про соціальний, емоційний і когнітивний розвиток дитини через її заняття з Moxie. Додаток також надає цінні пропозиції та підказки батькам, щоб покращити досвід і прогрес дитини з Moxie.
  • Дитячий інтернет-портал (іменований Глобальною робототехнічною лабораторією або GRL) пропонує додаткові дії, ігри та історії, які покращать досвід роботи з Moxie.
  • Щомісячні пакети місій Moxie – це розсилки, призначені для того, щоб залучити дітей до нових занять з Moxie, а також надати цікаві предмети, як-от колекційні картки та наклейки.

З часом Moxie дізнається більше про дитину, щоб краще персоналізувати її вміст, щоб допомогти досягти індивідуальних цілей розвитку кожної дитини. Компанія Embodied вжила обережних заходів, щоб гарантувати, що інформація, надана дітьми та сім’ями, обробляється з дотриманням високих стандартів конфіденційності та безпеки. Ми плануємо, щоб Moxie повністю пройшла сертифікацію Safe Harbor COPPA (Закон про захист конфіденційності дітей в Інтернеті), щоб батьки могли почуватися в безпеці, знаючи, що Moxie використовує передові процедури цілісності даних і безпеки, а також що його системи регулярно перевіряються на повну відповідність. Крім того, особисті дані та конфіденційна інформація зашифровані з найвищим рівнем безпеки та можуть бути розшифровані лише за допомогою унікального ключа, до якого має доступ лише батько.

 

З якими проблемами стикається Moxie під час обробки природної мови?

У Embodied ми прагнемо переосмислити те, як люди взаємодіють із машинами, особливо під час розмови за допомогою обробки природної мови. Отже, ми вирішили створити SocialXTM, яка є платформою, яка дозволяє дітям взаємодіяти з Moxie через природну взаємодію (тобто міміку, розмову, мову тіла тощо), викликаючи довіру, співчуття та мотивацію, а також глибшу взаємодію для просування розвиваючі навички. З SocialXTM Embodied представляє абсолютно нову категорію роботів: анімованих компаньйонів. «Animate» означає оживити, а SocialXTM дозволяє Moxie втілити найкраще від людства в новій передовій формі технології, яка може стимулювати нові способи навчання.

Обробка природної мови є основою нашої природної системи розмов, і в системі розмов є багато унікальних функцій, над створенням яких ми невтомно працювали.

Ключовою особливістю, над якою ми працювали, була здатність Moxie зосереджувати розмову з одним користувачем і відокремлювати фонові розмови та звуки, тому Moxie відповідає лише користувачеві. Це забезпечує більш цілеспрямовану та особисту взаємодію. Це рішення того, що багато хто називає «проблемою коктейльної вечірки». Коли ви перебуваєте на коктейльній вечірці, і навколо вас багато людей, які розмовляють у кімнаті, а ви намагаєтесь залишитися в розмові з однією людиною, людям це не дуже важко. Для комп'ютера це неймовірно складно. Як ми переконаємось, що Moxie реагує лише на те, що говорить один користувач, і його не відштовхують від фонових шумів, розмов, телевізора тощо. Існує багато способів підходу до вирішення цієї проблеми.

  1. Ми використовуємо нашу систему зору, щоб визначити, хто дивиться на Моксі та стоїть перед ним.
  2. У нас є кілька мікрофонів у передній частині Moxie, які повідомляють нам, звідки йде цей звук.
  3. Потім ми можемо використовувати машинне навчання, щоб підібрати звук до того, хто говорить перед Моксі. Це дозволяє нам відфільтрувати інші розмови та зосередитися на одному користувачеві.

Як правило, оператори розмови на ринку уникали «проблеми коктейльної вечірки», використовуючи слова для пробудження, наприклад «Гей (пристрій, після якого йде запитання)». Це пробуджувальне слово дозволяє агенту розмови прослуховувати пробуджувальне слово та відповідати лише тоді, коли воно промовляється. Однак, оскільки Moxie може зосередитися на одному користувачеві, Moxie не потрібно мати слова пробудження, щоб активувати відповідь.

Ми хотіли переконатися, що механізм розмови Moxie настільки складний, що він контекстно обізнаний про розмовні відповіді. Це дозволяє вести більш тонку розмову. Наприклад, Моксі може зрозуміти різні значення за словами «я не знаю» і «ні».

 

Чи є ще щось, чим ви хотіли б поділитися про Moxie або Embodied?

Ми працювали над цим проектом протягом чотирьох років із відданою командою, яка невпинно працювала над створенням дивовижних винаходів, необхідних для втілення Moxie у життя. Тепер ми раді нарешті представити Моксі сім’ям, щоб допомогти їхнім дітям у соціально-емоційному розвитку. Тож, чекаємо з нетерпінням у подорож!

Дякую за інтерв’ю, мені було приємно почути, як ви спочатку надихнулися короткометражним фільмом Pixar і як з того часу ви переслідували своє життєве захоплення. Читачі, які бажають дізнатися більше або замовити Moxie, повинні відвідати Embodied, Inc.