Inteligência artificial
Paolo Pirjanian, CEO e Fundador da Embodied – Série de Entrevistas

Paolo Pirjanian é um armênio nascido no Irã e fugiu para a Dinamarca quando era adolescente. Desde jovem, ele foi fascinado por computadores e começou a programar em seu quarto. Após obter seu PhD em robótica, Paolo se tornou um dos primeiros líderes no campo de robótica de consumo, com mais de 16 anos de experiência desenvolvendo e comercializando robôs de ponta para lares. Ele trabalhou na NASA JPL e liderou equipes e empresas de classe mundial na iRobot®, Evolution Robotics® e outras. Em 2016, Paolo fundou a Embodied, Inc. com a visão de construir companheiros digitais social e emocionalmente inteligentes que melhorem o cuidado e o bem-estar e apoiem as pessoas a viver melhor todos os dias.
O que o atraiu inicialmente para a IA e a robótica?
Minha fascinação pela IA e robótica remonta à minha infância. Eu fui deslocado de país em país várias vezes até que nossa família se mudou para a Dinamarca. Acidentalmente, descobri um computador. Eu me tornei tão fascinado por ele que me tranquei em meu quarto e comecei a programar dia e noite por meses. Meus pais pensaram que eu estava deprimido ou drogado, mas não era nada disso. Eu estava apenas completamente fascinado pelo computador!
Durante o mesmo período, eu vi um documentário na TV feito pela Pixar. A Pixar estava apresentando seu primeiro curta-metragem animado, Luxo Jr., um curta de dois minutos sobre duas lâmpadas de mesa correndo e brincando com uma bola. Eu fiquei fascinado por isso e impressionado com o fato de que um computador que eu estava aprendendo a programar pudesse gerar personagens tão cativantes na TV que evocavam tanta emoção em mim. Então, a partir daí, decidi ir para a escola para estudar robótica, eventualmente obtendo meu PhD.
Eu então me mudei para os EUA para trabalhar em rovers de Marte na NASA, que era um sonho de infância. Eventualmente, eu me tornei empreendedor para desenvolver tecnologia de navegação SLAM que agora permite que os produtos da iRobot funcionem.
Mas, olhando para trás, percebi que a inspiração para toda essa jornada foi, na verdade, o curta-metragem da Pixar que trouxe vida a objetos inanimados. Então, é por isso que criamos a Embodied – para trazer vida a robôs que possam interagir com as pessoas, focando em ajudar crianças com desenvolvimento socioemocional.
Quando você primeiro se deparou com o conceito de lançar a Evolution Robotics?
A Evolution Robotics foi originalmente iniciada por Bill Gross, da Idealab, em 2001, para se tornar a Microsoft da robótica, uma visão ousada que se revelou muito prematura e eventualmente fracassou. Eu era o CTO e GM da Evolution Robotics e, após seu fracasso, negociei com a Idealab para spin out algumas das tecnologias principais que minha equipe e eu havíamos desenvolvido e iniciar uma nova empresa. Em 2008, a nova entidade, também conhecida como Evolution Robotics, começou a desenvolver produtos usando nossas tecnologias de navegação principais, incluindo NorthStar e vSLAM, que eram abordagens inovadoras para mapeamento espacial e navegação autônoma semelhantes ao que estamos vendo em carros autônomos, mas direcionados para produtos de eletrônicos de consumo de baixo custo.
Desenvolvemos uma linha de produtos para varredura e limpeza automática de pisos duros chamada Mint, que lançamos em 2010. Em 2011, crescemos rapidamente para $25 milhões em vendas e fomos adquiridos pela iRobot em 2012 por nossas receitas de produtos e nossa tecnologia de navegação vSLAM, que agora alimenta as linhas de produtos Roomba e Braava da iRobot.
Naquele momento, você se tornou o CTO da iRobot. Pode discutir sua experiência na iRobot e o que você aprendeu com sua experiência?
Como CTO da iRobot, eu pude integrar rapidamente a vSLAM na linha de produtos Roomba para lançar um novo modelo que pudesse cobrir sistematicamente todo o plano do piso sem perder um ponto. Isso ajudou a empresa a manter a competitividade com concorrentes como a Dyson, que estava lançando soluções de limpeza sistemáticas. A vSLAM agora é uma parte integral das linhas de produtos principais da iRobot, Roomba e Braava.
Eu gostei de trabalhar em estreita colaboração com Colin Angel, CEO da iRobot, para ajudar a definir uma direção estratégica para tornar o Roomba central ao ecossistema de casa conectada, onde a consciência espacial do Roomba lhe dá uma posição única para entender o plano do piso e se tornar o tecido conjuntivo entre todos os dispositivos conectados. Essa estratégia parece ter tido um forte apoio desde minha saída em 2015.
Além disso, decidimos apostar na área de robótica de consumo para ajudar a iRobot a manter sua posição de liderança global. Isso levou à alienação do negócio de defesa e à saída de outros negócios periféricos para trazer foco e intensidade para o negócio de consumo.
Além disso, tivemos que reorganizar a empresa para apoiar uma estratégia de produtos conectados com um enfoque em software. Isso exigiu uma transformação da cultura da empresa para abraçar uma abordagem mais ágil e iterativa.
A lista de coisas que eu aprendi na iRobot é longa. Uma coisa que se destaca é o poder da cultura da equipe. Manter a equipe ágil e comprometida com a missão é, provavelmente, a vantagem competitiva mais importante que qualquer empresa pode ter acima de qualquer portfólio de patentes e segredos comerciais. Se você tiver uma equipe de alto desempenho que se sinta empoderada e inspirada em direção a um objetivo claro, será difícil pará-los.
Você é atualmente o Fundador e CEO da Embodied. Pode discutir o que inspirou o lançamento dessa empresa?
Eu realmente gostei do meu tempo na iRobot como CTO, e estávamos trabalhando em muitos projetos emocionais e empurrando os limites da robótica. Foi emocionante lançar robôs comercialmente bem-sucedidos no mercado que realizavam tarefas físicas úteis, como aspirar o piso.
No entanto, na parte de trás da minha mente, eu sabia que eu ainda tinha um sonho de vida para realizar – construir companheiros robóticos social e emocionalmente inteligentes que melhorem o cuidado e o bem-estar e enriqueçam nossas vidas diárias. Eu sabia que estávamos em um ponto de inflexão na forma como vamos interagir com a tecnologia. Então, com isso, eu decidi renunciar à iRobot e iniciar a Embodied.
Quando começamos a Embodied, desde o início, estávamos repensando e reinventando como a interação humano-máquina é feita, além de comandos verbais simples, para permitir a próxima geração de computação e alimentar uma nova classe de máquinas capazes de interação social fluida. Especificamente, o primeiro produto foi focar em construir um companheiro animado para ajudar as crianças a construir habilidades sociais e emocionais por meio do aprendizado baseado em brincadeiras. Esse companheiro viria a ser conhecido como Moxie. Moxie é um novo tipo de robô que tem a capacidade de entender e expressar emoções com discurso emotivo, expressões faciais e linguagem corporal convincentes, aproveitando a psicologia e neurologia humanas para criar laços mais profundos. Para fazer isso, reunimos uma equipe multifuncional de líderes apaixonados em engenharia, tecnologia, entretenimento, design de jogos e desenvolvimento infantil. Durante os últimos quatro anos, a Embodied trabalhou incansavelmente para trazer todas as tecnologias mais recentes para dar vida a Moxie, e a equipe está animada para finalmente entregá-lo às famílias que precisam de um co-piloto para apoiar o desenvolvimento saudável da criança.
Quais são alguns dos desafios empresariais únicos por trás de uma startup de robótica?
É divertido fazer o impossível, mas também pode ser um pouco assustador. Sabíamos que, se quiséssemos revolucionar a forma como os humanos interagem com as máquinas, teríamos que resolver problemas que não haviam sido resolvidos antes. Alguns problemas incluíam:
- Telas planas estão em dispositivos, e queremos trazer um dispositivo à vida. Então, como criamos uma face que seja mais parecida com a vida, arredondada e não bidimensional?
- Os atuais motores de conversa só permitem conversas muito limitadas, então como criamos uma solução que permita conversas mais naturais?
- Não queremos que a voz soe robótica, então como fazemos a voz soar natural, com entonação e inflexões contextualmente apropriadas?
- Sabemos que o contato visual é muito importante, então tivemos que descobrir como usar a visão computacional para garantir capacidades de rastreamento de olhos confiáveis.
Todos esses questionamentos sobre as características de Moxie levaram a muitas inovações tecnológicas de ponta.
Primeiro, face projetada e arredondada. As estatísticas começam a se acumular para mostrar que o tempo de tela excessivo pode ter efeitos devastadores em mentes em desenvolvimento. Pior ainda, a maioria dos dispositivos de tecnologia para crianças apresenta telas de exibição digital. É por isso que decidimos investir um pouco mais para fazer a face de Moxie totalmente projetada, o que nos permitiu criar uma tela de face que é arredondada com bordos naturalmente curvos, em vez de uma tela plana. Isso torna a interação com Moxie mais parecida com a vida, realista e convincente. Na verdade, apenas por meio dessa aparência 3D da face é que Moxie pode ter contato visual real com a criança. Então, não apenas a face de Moxie protege as crianças de tempo de tela excessivo, mas também torna a experiência de interação sentir-se ainda mais real.
Segundo, o motor de conversa. Até agora, os alto-falantes inteligentes e assistentes de voz exigiram o uso repetido de palavras de acordar para iniciar comandos. O motor de conversa de Moxie é diferente. Ele segue uma conversa natural e responde ao fluxo típico de comunicação sem o uso de palavras de acordar (como “Ei, Siri” ou “Ok, Google”). O processamento de linguagem natural avançado permite que Moxie reconheça, entenda e gere linguagem de forma contínua, tornando a interação sentir-se mais pessoal e natural.
Terceiro, síntese de fala. A voz de Moxie não tem o mesmo som robótico e monótono encontrado na maioria dos robôs e assistentes de voz. Em vez disso, Moxie usa inflexões vocais naturais e emotivas, que ajudam a comunicar uma gama mais ampla de emoções. Isso melhora o alcance das lições socioemocionais que Moxie pode participar, enquanto também traz uma vida e convinção adicionais para a interação.
Quarto, os olhos. Uma das características mais importantes é o olho grande e animado de Moxie. A tecnologia de rastreamento de olhos inovadora permite que Moxie mantenha contato visual com a criança, mesmo quando a criança se move pela sala. Essa capacidade de rastreamento de olhos não apenas cria uma interação incrivelmente parecida com a vida, mas também ajuda a criança a praticar o contato visual. Além disso, os olhos grandes e animados ajudam a exagerar a comunicação emocional, para que a criança possa reconhecer mais facilmente certas emoções. Praticar o contato visual e entender emoções são dois objetivos de desenvolvimento importantes no currículo socioemocional.
Por fim, todas essas características tecnológicas permitem que as interações com Moxie sejam realistas e naturais. A fusão sensorial multimodal de Moxie torna Moxie consciente do ambiente e de seus usuários. A tecnologia de visão computacional e rastreamento de olhos de Moxie ajuda a manter o contato visual à medida que a criança se move. O aprendizado de máquina ajuda Moxie a aprender as preferências e necessidades do usuário e a reconhecer pessoas, lugares e coisas. Os microfones especialmente localizados permitem que Moxie ouça a direção de onde vem a voz e facilmente se vire para a fonte. Os sensores de toque permitem que Moxie reconheça abraços e apertos de mão. Todos esses componentes se unem para tornar a experiência muito realista.
Pode nos contar algumas coisas que tornam Moxie perfeito para as crianças?
Com Moxie, as crianças podem se engajar em brincadeiras significativas todos os dias, com conteúdo informado pelas melhores práticas em desenvolvimento infantil e educação infantil. Cada semana é um tema diferente, como gentileza, amizade, empatia ou respeito, e as crianças são encarregadas de ajudar Moxie com missões que exploram experiências humanas, ideias e habilidades para a vida. Essas missões são atividades que incluem brincadeiras criativas e não estruturadas, como desenhar, práticas de mindfulness por meio de exercícios de respiração e meditação, ler com Moxie e explorar maneiras de ser gentil com os outros. Moxie encoraja a curiosidade para que as crianças descubram o mundo e as pessoas ao seu redor. Todas essas atividades ajudam as crianças a aprender e a praticar habilidades essenciais para a vida, como tomar turnos, manter contato visual, ouvir atentamente, regular a emoção, empatia, gerenciamento de relacionamentos e resolução de problemas.
A Embodied também se associou à Encyclopaedia Britannica e à Merriam-Webster para integrar o Dicionário para Crianças da Merriam-Webster, permitindo que Moxie forneça definições e informações relacionadas apropriadas para a idade para ajudar as crianças a aprender e entender o significado de novas palavras e conceitos. Essa é a primeira de muitas integrações com Moxie que entregam a missão compartilhada da Britannica e da Merriam-Webster de inspirar a curiosidade e o prazer de aprender.
A Embodied também desenvolveu um ecossistema completo que ajuda os pais a apoiar a jornada de seus filhos com Moxie e permite que as crianças expandam o uso de Moxie de uma maneira segura e aprovada pelos pais:
- O aplicativo Moxie Parent da Embodied fornece um painel para ajudar os pais a entender o progresso do desenvolvimento de seus filhos com Moxie. O aplicativo fornecerá insights-chave para o desenvolvimento social, emocional e cognitivo da criança por meio de suas atividades com Moxie. O aplicativo também fornecerá sugestões valiosas e dicas para os pais para melhorar a experiência e o progresso de seus filhos com Moxie.
- Um site de portal de crianças online (conhecido como Laboratório de Robótica Global, ou G.R.L.) fornece atividades, jogos e histórias adicionais que melhorarão a experiência com Moxie.
- Pacotes de missão mensais de Moxie são correios projetados para engajar as crianças em novas atividades com Moxie e também fornecer itens divertidos, como cartões de troca e adesivos.
Com o tempo, Moxie aprende mais sobre a criança para personalizar melhor seu conteúdo para ajudar com os objetivos de desenvolvimento individuais de cada criança. A Embodied tomou cuidados para garantir que as informações fornecidas pelas crianças e famílias sejam tratadas com altos padrões de privacidade e segurança. Pretendemos que Moxie seja totalmente certificado pelo Safe Harbor da COPPA (Lei de Proteção à Privacidade Online das Crianças), para que os pais possam se sentir seguros sabendo que Moxie emprega procedimentos de integridade e segurança de dados de ponta e que seus sistemas são regularmente auditados para garantir a conformidade total. Além disso, dados pessoalmente identificáveis e informações sensíveis são criptografados com o mais alto nível de segurança e só podem ser descriptografados por uma chave única à qual apenas os pais têm acesso.
Quais são alguns dos desafios de processamento de linguagem natural enfrentados por Moxie?
Na Embodied, estamos nos esforçando para redefinir como os humanos interagem com as máquinas, especialmente na conversa por meio do processamento de linguagem natural. Então, decidimos criar o SocialXTM, que é uma plataforma que permite que as crianças interajam com Moxie por meio de interação natural (ou seja, expressões faciais, conversa, linguagem corporal, etc.), evocando confiança, empatia e motivação, bem como um engajamento mais profundo para promover habilidades de desenvolvimento. Com o SocialXTM, a Embodied está introduzindo uma nova categoria de robôs: companheiros animados. “Animado” significa trazer à vida, e o SocialXTM permite que Moxie encarne o melhor da humanidade em uma nova e avançada forma de tecnologia que pode impulsionar novas maneiras de aprender.
O processamento de linguagem natural está no núcleo do nosso motor de conversa natural, e há muitos recursos únicos para o motor de conversa que trabalhamos arduamente para criar.
A característica principal que trabalhamos foi a capacidade de Moxie se concentrar em uma conversa com um único usuário e separar conversas e sons de fundo, para que Moxie responda apenas ao usuário. Isso permite uma interação mais focada e pessoal. Essa é uma solução para o que muitos chamam de “problema do coquetel”. Quando você está em um coquetel e há muitas pessoas ao seu redor falando em uma sala enquanto você está tentando permanecer em conversa com uma pessoa, não é terrivelmente difícil para os humanos. Para um computador, isso é incrivelmente difícil. Como podemos garantir que Moxie responda apenas ao que o usuário único diz e não seja desviado por ruídos de fundo, conversas, TV, etc.? Há muitas maneiras pelas quais abordamos a solução para esse problema.
- Usamos nosso sistema de visão para identificar quem está olhando e enfrentando Moxie.
- Temos vários microfones na frente de Moxie que nos dizem de onde vem o som.
- Podemos usar o aprendizado de máquina para combinar o som com quem está falando na frente de Moxie. Isso nos permite filtrar as outras conversas e manter o foco em um único usuário.
Geralmente, os agentes de conversa no mercado evitaram o “problema do coquetel” usando palavras de acordar, como “Ei (dispositivo, seguido de uma pergunta)”. Essa palavra de acordar permite que o agente de conversa ouça a palavra de acordar e responda apenas quando essa palavra de acordar for dita. No entanto, como Moxie pode se concentrar em um único usuário, Moxie não precisa de palavras de acordar para ativar uma resposta.
Queríamos garantir que o motor de conversa de Moxie seja tão sofisticado que esteja ciente do contexto das respostas conversacionais. Isso permite conversas mais nuances. Por exemplo, Moxie pode entender os diferentes significados por trás de “Eu não sei” e “não”.
Há algo mais que você gostaria de compartilhar sobre Moxie ou Embodied?
Nós estamos trabalhando nesse projeto há quatro anos com uma equipe dedicada que trabalhou incansavelmente para fazer as invenções incríveis necessárias para dar vida a Moxie. Agora estamos animados para finalmente trazer Moxie às famílias para ajudar as crianças com o desenvolvimento socioemocional. Então, estamos ansiosos para a jornada!
Obrigado pela entrevista, eu amei ouvir como você foi inicialmente inspirado por um curta-metragem da Pixar e como você desde então perseguiu sua paixão pela vida. Os leitores que desejam aprender mais ou que desejam pedir um Moxie devem visitar Embodied, Inc.













