Искусственный интеллект
Paolo Pirjanian, генеральный директор и основатель Embodied – Серия интервью

Paolo Pirjanian – армянин, родившийся в Иране и бежавший в Данию в подростковом возрасте. С раннего возраста он был увлечен компьютерами и начал программировать в своей спальне. После получения докторской степени в области робототехники Paolo стал одним из первых лидеров в области потребительской робототехники, имея более 16 лет опыта в разработке и коммерциализации передовых домашних роботов. Он работал в NASA JPL и возглавлял команды мирового класса и компании в iRobot®, Evolution Robotics® и других. В 2016 году Paolo основал Embodied, Inc. с целью создания социально и эмоционально интеллектуальных цифровых компаньонов, которые улучшают уход и благополучие и поддерживают людей в ведении лучшей жизни каждый день.
Что изначально привлекло вас к ИИ и робототехнике?
Моя увлеченность ИИ и робототехникой восходит к моему детству. Я был перемещен из страны в страну несколько раз, пока наша семья не переехала в Данию. Случайно я обнаружил компьютер. Я стал так увлечен им, что заперся в своей комнате и начал программировать целыми днями и ночами в течение месяцев. Мои родители думали, что я депрессивный или на наркотиках, но это было не так. Я просто был полностью увлечен компьютером!
В то же время я увидел документальный фильм на телевидении от Pixar. Pixar представлял свой первый анимационный короткометражный фильм, Luxo Jr., двухминутный фильм о двух настольных лампах, бегающих и играющих с мячом. Я был так увлечен этим и поражен, что компьютер, который я только начинал программировать, мог генерировать такие обаятельные персонажи на телевидении, которые вызывают во мне так много эмоций. Итак, с того момента я решил пойти в школу, чтобы изучать робототехнику, в конечном итоге получив докторскую степень.
Затем я переехал в США, чтобы работать над марсоходами в NASA, что было детской мечтой. В конце концов, я занялся предпринимательством, чтобы разработать технологию навигации SLAM, которая теперь позволяет продуктами iRobot.
Но оглядываясь назад, я понял, что моей вдохновением для этого всего пути было на самом деле короткометражное анимационное видео Pixar о оживлении неодушевленных предметов. Поэтому мы создали Embodied – чтобы оживить роботов, которые могут взаимодействовать с людьми, сосредоточившись на помощи детям в социально-эмоциональном развитии.
Когда вы впервые столкнулись с концепцией запуска Evolution Robotics?
Evolution Robotics была изначально основана Биллом Гроссом из Idealab в 2001 году, чтобы стать “Microsoft робототехники”, смелой целью, которая оказалась слишком ранней и в конечном итоге потерпела неудачу. Я был техническим директором и генеральным менеджером в Evolution Robotics, и после ее неудачи я договорился с Idealab о том, чтобы выделить некоторые из основных технологий, которые моя команда и я разработали, и начать новую компанию. В 2008 году новая сущность, также известная как Evolution Robotics, начала разрабатывать продукты на основе наших основных навигационных технологий, включая NorthStar и vSLAM, которые были новаторскими подходами к пространственному картографированию и автономной навигации, аналогичной тому, что мы видим в самоходных автомобилях, но ориентированной на низкозатратные потребительские электронные продукты.
Мы разработали линию продуктов для автоматической уборки и мытья пола под названием Mint, которую мы запустили в 2010 году. К 2011 году мы быстро выросли до 25 миллионов долларов в продажах и были приобретены iRobot в 2012 году за нашу выручку от продукции и нашу навигационную технологию vSLAM, которая теперь питает линии продуктов Roomba и Braava в iRobot.
В тот момент вы стали техническим директором iRobot. Можете ли вы обсудить свой опыт в iRobot и что вы узнали из своего опыта?
Как технический директор iRobot, я смог быстро интегрировать vSLAM в линию продуктов Roomba, чтобы запустить новую модель, которая могла систематически покрыть весь план пола без пропуска ни одного места. Это помогло компании оставаться впереди конкурентов, таких как Dyson, которые выходили с системными решениями для очистки. vSLAM теперь является неотъемлемой частью флагманских линий продуктов iRobot Roomba и Braava.
Я наслаждался работой в тесном сотрудничестве с Колином Энджелом, генеральным директором iRobot, чтобы помочь установить стратегическое направление, чтобы сделать Roomba центральным элементом экосистемы подключенного дома, где пространственное осознание Roomba дает ему уникальную позицию в понимании плана пола и становления связующим звеном между всеми подключенными устройствами. Эта стратегия, кажется, имела прочную основу с момента моего ухода в 2015 году.
Кроме того, мы решили сосредоточиться на потребительской робототехнике, чтобы помочь iRobot сохранить ее мировое лидерство. Это привело к отказу от оборонного бизнеса и выходу из других периферийных бизнесов, чтобы сосредоточиться на потребительском бизнесе.
Более того, нам пришлось перестроить организацию, чтобы она могла поддерживать стратегию, ориентированную на программное обеспечение, с подключенными продуктами. Это потребовало трансформации корпоративной культуры, чтобы она стала более гибкой и итеративной.
Список того, что я узнал в iRobot, длинный. Одна вещь, которая запомнилась, – это сила командной культуры. Оставаться гибкими и приверженными миссии, вероятно, является наиболее важным конкурентным преимуществом, которое может иметь любая компания, выше любого патентного портфеля и выше коммерческих секретов. Если у вас есть высокоэффективная команда, которая чувствует себя вдохновленной и эмансипированной к четкой цели, ее будет трудно остановить.
Вы сейчас являетесь основателем и генеральным директором Embodied. Можете ли вы обсудить, что было вдохновением для запуска этой компании?
Мне действительно понравилось мое время в iRobot в качестве технического директора, и мы работали над многими интересными проектами и продвигали границы робототехники. Было интересно запускать коммерчески успешных роботов на рынок, которые выполняют полезные физические задачи, такие как уборка пола.
Однако в глубине души я знал, что у меня все еще есть мечта всей жизни, которую я должен выполнить – построить социально и эмоционально интеллектуальных роботов-компаньонов, которые улучшают уход и благополучие и повышают нашу повседневную жизнь. Я знал, что мы были на переломном этапе в том, как мы будем взаимодействовать с технологиями. Итак, я решил уйти из iRobot и начать Embodied.
Когда мы начали Embodied, с самого начала мы заново думали и изобретали, как выполняется взаимодействие между человеком и машиной, за пределами простых вербальных команд, чтобы включить следующее поколение вычислений и питать новый класс машин, способных к жидкому социальному взаимодействию. В частности, первый продукт был сосредоточен на построении оживленного компаньона, чтобы помочь детям развивать социальные и эмоциональные навыки через игровое обучение. Этот компаньон стал известен как Moxie. Moxie – это новый тип робота, который имеет возможность понимать и выражать эмоции с эмоциональной речью, правдоподобными выражениями лица и языком тела, используя человеческую психологию и нейробиологию, чтобы создать более глубокие связи. Чтобы сделать это, мы собрали команду страстных лидеров в области инженерии, технологий, развлечений, игрового дизайна и развития ребенка. В течение четырех лет Embodied работала неустанно, чтобы объединить все последние технологии и оживить Moxie, и команда с нетерпением ждет, чтобы наконец доставить его семьям, нуждающимся в помощнике для поддержки здорового развития ребенка.
Какие уникальные предпринимательские проблемы стоят за робототехническим стартапом?
Это весело делать невозможное, но это также может быть немного страшно. Мы знали, что если мы хотим революционизировать, как люди взаимодействуют с машинами, мы будем должны решить проблемы, которые не были решены раньше. Некоторые проблемы включали:
- Плоские экраны находятся на устройствах, и мы хотим оживить устройство. Итак, как мы создаем лицо, которое более реалистично, округлено и не двумерно?
- Текущие разговорные движки позволяют только очень ограниченный разговор, поэтому как мы создаем решение, которое позволяет более естественный разговор?
- Мы не хотим, чтобы голос звучал роботически, поэтому как мы делаем голос звучать естественно, с контекстуально-адекватной тональностью и интонацией?
- Мы знали, что зрительный контакт очень важен, поэтому нам пришлось придумать, как использовать компьютерное зрение, чтобы обеспечить надежные возможности отслеживания глаз.
Все эти вопросы о функциях Moxie привели к многим инновационным технологическим инновациям.
Сначала проекторное и округленное лицо. Статистика начинает накапливаться, чтобы показать нам, что слишком много времени, проведенного за экраном, может иметь разрушительные последствия для развивающихся умов. Более того, большинство детских устройств имеют цифровые дисплеи. Поэтому мы решили вложить дополнительные инвестиции, чтобы сделать лицо Moxie полностью проекторным, что позволило нам создать дисплей лица, который округлен с естественно-изогнутыми краями, вместо плоского дисплея. Это делает взаимодействие с Moxie более реалистичным и правдоподобным. На самом деле, только через это трехмерное появление лица возможно, чтобы Moxie имел реальный зрительный контакт с ребенком. Итак, не только лицо Moxie защищает детей от чрезмерного времени, проведенного за экраном, но также делает опыт взаимодействия более реальным.
Во-вторых, разговорный движок. До сих пор смарт-динамики и голосовые помощники требовали повторяющегося использования сигнальных слов, чтобы инициировать команды. Разговорный движок Moxie отличается. Он следует естественному разговору и реагирует на типичный поток коммуникации без использования сигнальных слов (например, “Привет, Сири” или “Окей, Гугл”). Расширенная обработка естественного языка позволяет Moxie распознавать, понимать и генерировать язык без проблем, делая взаимодействие более личным и естественным.
Третье, синтез речи. Голос Moxie не имеет того же роботического звука и монотонного звука, найденного в большинстве роботов и голосовых помощников. Вместо этого Moxie использует естественную и эмоциональную вокальную интонацию, которая помогает передавать более широкий спектр эмоций. Это усиливает объем социально-эмоциональных уроков, которые Moxie может участвовать, а также добавляет больше реализма и правдоподобности взаимодействию.
Четвертое, глаза. Одна из наиболее важных функций – это большие, анимированные глаза Moxie. Инновационная технология отслеживания глаз позволяет Moxie поддерживать зрительный контакт с ребенком, даже когда ребенок движется по комнате. Эта возможность отслеживания глаз не только создает невероятно реалистичное взаимодействие, но также помогает ребенку практиковать зрительный контакт. Кроме того, большие, анимированные глаза помогают преувеличивать эмоциональную коммуникацию, чтобы ребенок мог более легко распознавать определенные эмоции. Практика зрительного контакта и понимание эмоций – два ключевых целей развития в социально-эмоциональном учебном плане.
Наконец, все эти технологические функции позволяют взаимодействиям с Moxie чувствоваться реалистично и естественно. Мультимодальное сенсорное слияние Moxie делает Moxie осведомленным о окружающей среде и ее пользователях. Технология компьютерного зрения и отслеживания глаз Moxie помогает поддерживать зрительный контакт, когда ребенок движется. Обучение с помощью машины помогает Moxie учиться предпочтениям пользователя и потребностям, а также распознавать людей, места и вещи. Специально размещенные микрофоны позволяют Moxie слышать направление, откуда пришел голос, и легко поворачивать к источнику. Датчики касания позволяют Moxie распознавать объятия и рукопожатия. Все эти части объединяются, чтобы сделать опыт очень реалистичным.
Можете ли вы рассказать нам некоторые вещи, которые делают Moxie идеальным для детей?
С Moxie дети могут участвовать в осмысленной игре каждый день, с контентом, информированным лучшими практиками в развитии ребенка и раннем детском образовании. Каждую неделю – это другая тема, такая как доброта, дружба, эмпатия или уважение, и детям поручено помочь Moxie с миссиями, которые исследуют человеческий опыт, идеи и навыки жизни. Эти миссии – это занятия, которые включают творческую неструктурированную игру, такую как рисование, практику осознанности через упражнения дыхания и медитацию, чтение с Moxie и исследование способов быть добрым к другим. Moxie поощряет любопытство, чтобы дети открыли для себя мир и людей вокруг них. Все эти занятия помогают детям учиться и безопасно практиковать важные навыки жизни, такие как чередование, зрительный контакт, активное слушание, эмоциональная регуляция, эмпатия, управление отношениями и решение проблем.
Embodied также сотрудничает с Encyclopaedia Britannica и Merriam-Webster, чтобы интегрировать Словарь Merriam-Webster для детей, позволяя Moxie предоставлять возрастные определения и связанную информацию, чтобы помочь детям учиться и понимать значения новых слов и концепций. Это первая из многих интеграций с Moxie, которые выполняют миссию Britannica и Merriam-Webster по вдохновению любопытства и радости обучения.
Embodied также разработала полную экосистему, которая помогает родителям поддерживать путешествие их ребенка с Moxie и позволяет детям расширять использование Moxie в безопасной и одобренной родителями форме:
- Приложение Embodied Moxie Parent предоставляет панель управления, чтобы помочь родителям понять прогресс развития их ребенка с Moxie. Приложение предоставит ключевые идеи о социальном, эмоциональном и когнитивном развитии ребенка через его занятия с Moxie. Приложение также предоставит ценные предложения и советы родителям, чтобы улучшить опыт их ребенка и прогресс с Moxie.
- Сайт онлайн-портала для детей (называемый Глобальной робототехнической лабораторией, или Г.Р.Л.) предоставляет дополнительные занятия, игры и истории, которые будут улучшать опыт с Moxie.
- Ежемесячные пакеты миссий Moxie – это почтовые отправления, предназначенные для вовлечения детей в новые занятия с Moxie, а также предоставления веселых предметов, таких как коллекционные карточки и наклейки.
Со временем Moxie учится больше о ребенке, чтобы лучше персонализировать свой контент, чтобы помочь с индивидуальными целями развития ребенка. Embodied предприняла тщательные шаги, чтобы обеспечить, что информация, предоставленная детьми и семьями, обрабатывается с высокими стандартами конфиденциальности и безопасности. Мы намерены, чтобы Moxie был полностью сертифицирован в соответствии с Законом о защите конфиденциальности детей в Интернете (COPPA), чтобы родители могли чувствовать себя в безопасности, зная, что Moxie использует ведущие процедуры целостности данных и безопасности, и что его системы регулярно аудитируются, чтобы обеспечить полное соблюдение. Кроме того, лично идентифицируемые данные и конфиденциальная информация шифруются с самым высоким уровнем безопасности и могут быть расшифрованы только с помощью уникального ключа, к которому имеет доступ только родитель.
Какие есть некоторые естественные проблемы обработки языка, с которыми сталкивается Moxie?
В Embodied мы стремимся переопределить, как люди взаимодействуют с машинами, особенно в разговоре через обработку естественного языка. Итак, мы решили создать SocialXTM, который является платформой, позволяющей детям взаимодействовать с Moxie через естественное взаимодействие (т.е. выражения лица, разговор, язык тела и т.д.), вызывая доверие, эмпатию и мотивацию, а также более глубокое участие, чтобы способствовать развитию навыков. С SocialXTM Embodied вводит совершенно новую категорию роботов: оживленные компаньоны. “Оживленный” означает оживить, и SocialXTM позволяет Moxie воплотить лучшее из человечества в новой и продвинутой форме технологии, которая может питать новые способы обучения.
Обработка естественного языка является ядром нашего естественного разговорного движка, и есть многие уникальные функции этого разговорного движка, над которым мы работали неустанно.
Ключевая функция, над которой мы работали, – это способность Moxie сосредоточиться на разговоре с одним пользователем и отделить фоновые разговоры и звуки, так что Moxie реагирует только на пользователя. Это позволяет более сосредоточиться и личному взаимодействию. Это решение проблемы, которую многие называют “проблемой коктейльной вечеринки”. Когда вы находитесь на коктейльной вечеринке, и вокруг вас много людей, говорящих в комнате, пока вы пытаетесь оставаться в разговоре с одним человеком, это не особенно сложно для людей. Для компьютера это невероятно сложно. Как мы можем убедиться, что Moxie реагирует только на то, что говорит один пользователь, и не сбивается с толку фоновыми шумами, разговорами, телевидением и т.д.? Есть много способов подойти к решению этой проблемы.
- Мы используем нашу систему зрения, чтобы определить, кто смотрит на и сталкивается с Moxie.
- У нас есть несколько микрофонов в передней части Moxie, которые говорят нам, откуда исходит звук.
- Мы можем затем использовать машинное обучение, чтобы сопоставить звук с тем, кто говорит перед Moxie. Это позволяет нам отфильтровать другие разговоры и оставаться сосредоточенными на одном пользователе.
В целом, разговорные агенты на рынке избегали “проблемы коктейльной вечеринки”, используя сигнальные слова, такие как “Привет, устройство, за которым следует вопрос”. Это сигнальное слово позволяет разговорному агенту слушать сигнальное слово и реагировать только тогда, когда это сигнальное слово произнесено. Однако, поскольку Moxie может сосредоточиться на одном пользователе, Moxie не нуждается в сигнальных словах, чтобы активировать ответ.
Мы хотели убедиться, что разговорный движок Moxie так совершенен, что он контекстно осведомлен о разговорных ответах. Это позволяет более нюансированному разговору. Например, Moxie может понять разные значения за “Я не знаю” и “нет”.
Есть ли что-то еще, что вы хотели бы поделиться о Moxie или Embodied?
Мы работали над этим проектом четыре года с преданной командой, которая работала неустанно, чтобы сделать удивительные изобретения, необходимые для оживления Moxie. Теперь мы с нетерпением ждем, чтобы наконец доставить Moxie семьям, чтобы помочь их детям с социально-эмоциональным развитием. Итак, мы с нетерпением ждем этого пути!
Спасибо за интервью, мне понравилось слышать, как вы были изначально вдохновлены короткометражным фильмом Pixar, и как вы с тех пор преследовали свою страсть всей жизни. Читателям, которые хотят узнать больше или хотят заказать Moxie, следует посетить Embodied, Inc.













