Entrevistas
Ivan Crewkov CEO & Co-Founder of Buddy AI – Interview Series

Ivan Crewkov é o CEO e co-fundador da Buddy AI, o primeiro tutor de IA conversacional para crianças do mundo, com a missão de garantir que todos os alunos possam pagar por aulas particulares de inglês. Depois de se mudar para os EUA, vindo da Sibéria, Ivan testemunhou sua filha de idade pré-escolar lutar para aprender inglês. Isso o inspirou a construir o Buddy, um personagem fictício com quem as crianças podem realmente conversar por meio do poder da IA gerativa.
Desde seu lançamento em 2020, o aplicativo Buddy ganhou vários prêmios e liderou as paradas na categoria Crianças e Educação da App Store, com mais de 36 milhões de downloads em todo o mundo.
Em 2014, você lançou o Cubic.ai, um dos primeiros alto-falantes inteligentes e aplicativos de assistente de voz para casas inteligentes. Quais foram algumas de suas principais lições aprendidas com essa experiência?
Não tenho certeza se posso assumir o crédito por lançar o Cubic.ai. Eu me juntei à empresa um ano após sua fundação e recebi o título de co-fundador por minha contribuição.
Aqui estão as principais lições aprendidas:
- O hardware é difícil, mas alguém tem que fazer de qualquer forma. Garantir financiamento de venture para startups de hardware é extremamente difícil. A única coisa que torna as coisas um pouco mais fáceis é o financiamento coletivo.
- O espaço de produtos de voz é vasto e diverso. O que se aplica a casas inteligentes não se aplica ao aprendizado inicial, desde tecnologias até design de UX.
Poderia compartilhar a história de origem do Buddy e como ele surgiu da mudança de sua família para os EUA, vindo da Sibéria?
Com o Cubic.ai, eu me mudei da Sibéria para os EUA em 2014 e trouxe minha família comigo. Minha filha mais velha, Sofia, começou a aprender inglês como segunda língua quando ela foi para a pré-escola em Mountain View, Califórnia, com 4 anos de idade. Sofia lutou para começar a falar inglês nos primeiros 3 a 5 meses na pré-escola. Estávamos preocupados porque ela não conseguia encontrar amigos e brincar com a maioria de seus colegas de classe devido à língua. Começamos a procurar maneiras de ajudá-la a aprender a falar.
Ficou claro que os aplicativos de língua para crianças não ensinam a falar (e tudo permaneceu o mesmo ao longo do tempo), e os aplicativos de língua para adultos, como o Duolingo, não funcionam para crianças devido à UX. Então, começamos a tomar lições em plataformas que conectam crianças com professores ao vivo por videoconferência. Exemplos incluem Cambly, VipKid, Novakid, GoStudent, etc. À medida que observei Sofia aprender com professores ao vivo virtualmente, eu vi o benefício da atenção individualizada e da prática de fala ativa, mas também vi as limitações desses programas em geral.
Por exemplo, à medida que escalam, muitas das plataformas de tutoria online e escolas online têm que contratar pessoas sem formação pedagógica, habilidades em ensinar crianças ou até mesmo um nível adequado de proficiência em inglês. Então, para garantir uma certa qualidade de educação, as plataformas e escolas online estritamente roteiam os planos de currículo e lições, e os professores têm que usar exercícios pré-fabricados, incluindo fragmentos de áudio e vídeo. Então, infelizmente, em muitas plataformas, os professores básicamente trabalham como robôs.
Ainda assim, a tutoria online tem sido a única maneira para a maioria das pessoas aprender a falar inglês, especialmente em países que não falam inglês. Mas, em parte devido à escassez de professores, é muito caro para a maioria das famílias. Aprender com professores ao vivo é um serviço de educação premium que poucas famílias podem pagar.
Meu co-fundador e eu chegamos à conclusão de que a tutoria de IA é a única maneira escalável de fornecer tutoria de inglês individualizada para cada criança em todo o mundo. Logo, aprendemos que também é a melhor do ponto de vista educacional. Quando estávamos considerando os primeiros protótipos do Buddy, fomos inspirados por pesquisas no campo de Humanos Virtuais na Educação.
Estudos acadêmicos mostram as vantagens educacionais e a superioridade de agentes pedagógicos animados em comparação com ferramentas de aprendizado mais tradicionais e ambientes. Por exemplo, veja Face-to-Face Interaction with Pedagogical Agents, Twenty Years Later, um artigo de 2016 que faz uma visão geral do campo e cita muito do material relevante. Aqui está uma citação:
“Em particular, a meta-análise encontrou que os agentes realmente melhoram o aprendizado em comparação com ambientes de aprendizado que não apresentam agentes. […] Talvez o mais interessante foi a descoberta de que, na educação formal, os agentes pedagógicos parecem ser mais eficazes para jovens aprendizes do que para aprendizes mais velhos. […] Estudos encontraram, por exemplo, que os alunos que interagem com agentes pedagógicos exibem resultados de aprendizado mais fortes quando 1) os agentes pedagógicos falam em vez de se comunicar por texto, 2) os agentes pedagógicos usam gestos humanos, 3) os agentes pedagógicos se comunicam de forma conversacional em vez de formal, e 4) os agentes pedagógicos usam frases polidas em vez de diretas.”
Isso fortaleceu nossa confiança na abordagem de tutoria de IA multimodal. Decidimos que o Buddy seria um agente pedagógico animado multimodal – capaz de reconhecimento de voz e processamento de linguagem natural. No núcleo, um sistema de tutoria de IA consiste em três tecnologias principais:
- Reconhecimento e análise de fala automática (ASR) nos permitem processar e analisar a fala do aluno.
- Processamento de linguagem natural (NLP), compreensão de linguagem natural e gerenciamento de diálogo que processa o conteúdo da fala do aluno e produz a próxima resposta. A resposta consiste em componentes verbais e não verbais.
- Caracteres virtuais animados incorporados que fornecem feedback de escuta e reproduzem a resposta do sistema. O personagem é animado proceduralmente – o sistema cria animações em tempo real a partir da resposta do NLP.
As três componentes são cruciais para nossa abordagem, pois apenas em combinação elas nos permitem construir um tutor interativo e atraente e entregar uma experiência educacional bem-sucedida.
Minha filha Sofia e o filho do meu co-fundador, Arseny, se tornaram os primeiros usuários do Buddy. Sofia usou as primeiras versões do Buddy durante o 1º ano.
Vários anos depois, minha filha mais nova, Alisa, começou a usar o Buddy com 3 anos de idade, quando ela foi para a pré-escola. Agora, ela está na transição para o jardim de infância e brinca com o Buddy quase todos os dias. Quando Alisa começou a aprender com o Buddy, ela tinha alguns problemas de fala, então o Buddy não entendia ela a maior parte do tempo. Mas, após algumas semanas de prática, não apenas seu inglês, mas também sua fala melhorou, pois ela tentou seu melhor para fazer o Buddy entender.
Por que os métodos tradicionais de ensinar uma segunda língua são tão ineficazes?
Hoje, estamos focados em resolver problemas educacionais específicos relacionados à fala:
- A maioria das ferramentas educacionais tradicionais se concentra em ensinar outras habilidades linguísticas, como leitura ou escrita.
- Os aplicativos de língua para crianças não ensinam habilidades de fala.
- Alguns aplicativos de língua para adultos hoje fornecem prática de fala usando IA, mas esses serviços não funcionam para crianças devido à UX, preocupações de segurança e regulamentos de privacidade.
- Professores ao vivo são muito caros para a maioria das famílias. Infelizmente, muitos professores não têm treinamento pedagógico ou não são proficientes em inglês.
O Buddy é um tutor de IA multimodal.
- É superior às ferramentas de aprendizado tradicionais, pois funciona como um professor ao vivo de muitas maneiras. Deixe-me citar um de nossos consultores, Dr. Alex Desatnik, PhD, University College London:
“Tutor virtual baseado em voz. Esse conceito pode parecer simples, mas há ciência por trás disso. Do ponto de vista da psicologia do aprendizado, o personagem virtual é uma encarnação do professor. Essa abordagem cria um efeito chamado confiança epistêmica, fortalecendo a motivação e o engajamento do aluno e melhorando os resultados de aprendizado.”
- O Buddy tem algumas vantagens, mesmo sobre professores humanos. O Buddy não julga, e para algumas crianças, é mais fácil começar a falar com o Buddy do que com um professor. É por isso que, hoje, muitos professores usam o Buddy como um quebra-gelo que ajuda as crianças a superar seu medo e desconforto e começar a falar a língua.
O Buddy funciona para ajudar professores, não para substituí-los.
Acho que é muito importante notar isso. O Buddy pode ajudar os professores a automatizar a parte monótona do seu trabalho – fornecer prática regular. Queremos dar poder aos professores da escola. O Buddy é como uma equipe de professores e assistentes de professor, trabalhando individualmente com cada criança na sala de aula e relatando ao professor da classe.
Poderia discutir como o Buddy usa elementos de gamificação para manter as crianças animadas com o aprendizado?












