toco Pavel Osokin, cofundador e CEO da AMAI - série de entrevistas - Unite.AI
Entre em contato

Entrevistas

Pavel Osokin, co-fundador e CEO da AMAI – série de entrevistas

mm

Publicado

 on

Pavel Osokin é o co-fundador e CEO da AMAI, uma startup sediada em São Francisco que produz mecanismos de voz de IA. Pavel lidera a operação e a estratégia da Amai com a ambição profissional de instalar sua tecnologia de voz em todos os telefones do mundo. Na AMAI, eles desenvolveram uma voz de IA que não podia ser distinguida de uma fala humana real por 97% dos usuários.

Você foi um empreendedor ao longo da vida tendo lançado sua primeira empresa aos 13 anos, qual foi sua primeira tentativa de negócio e o que você acha que motivou essa mentalidade empreendedora?

Na verdade, não chamei de empresa, mas ganhei meu primeiro dinheiro revendendo algumas coisas ou apenas lavando carros na rua com um balde. Minha motivação era que eu queria uma Coca-Cola ou um Snickers, e meus pais não tinham dinheiro. Eu poderia esperar que o dinheiro aparecesse ou ganhá-lo sozinho. Esperar não me atrai.

Você poderia compartilhar a história da gênese por trás do AMAI?

Perguntei ao meu sócio: “Do que as empresas ao redor do mundo precisam?” Nessa conversa, percebi que todo negócio está em busca de uma “venda”. Começamos a fazer robôs que podiam se corresponder com os clientes e vender produtos por correio e mensageiros. Por outro lado, não era algo particularmente novo, pois existem muitos chatbots disponíveis. Então, pensamos que se esses robôs também pudessem fazer ligações, seria legal. Como havia poucas soluções boas no mercado, criamos um protótipo de nossa própria voz sintetizada e, após as primeiras vendas, abandonamos o robô e focamos no TTS.

O que significa AMAI especificamente? 

Isso significa I'm AI (sou inteligência artificial).

Você poderia discutir alguns dos desafios por trás do design da tecnologia de conversão de texto em fala de última geração?

Projetar TTS de última geração oferece vários desafios. O primeiro é coletar conjuntos de dados. Treinar uma rede neural requer vozes femininas e masculinas de diversas idades e, quanto mais, melhor. Em segundo lugar, você precisa conseguir uma semelhança muito próxima com uma voz natural. O melhor método é testar diferentes modelos de aprendizado de máquina e experimentar constantemente diferentes casos de uso de voz: em particular, você precisa encontrar a amostra mais problemática e processá-la separadamente. Falando em desafios a longo prazo, pode ser difícil avaliar se a voz melhorou ou piorou e em que direção deveria ser melhorada.

Quais são alguns dos desafios por trás do reconhecimento de fala quando se trata de humanos interagindo com a IA de voz AMAI?

Existem centenas de empresas trabalhando em reconhecimento de voz porque é mais fácil de desenvolver. O problema que atualmente não tem solução é o reconhecimento da voz de uma criança. As crianças têm muitas características de fala desde tenra idade, por isso é difícil levar todas elas em consideração. No entanto, estamos trabalhando em uma solução para esse problema e estamos muito perto de anunciar o resultado – em breve, nossa IA não terá problemas para interagir não apenas com adultos, mas também com crianças.

Quais são alguns casos de uso populares para AMAI?

No momento, é dublagem de audiobook e uso corporativo em call centers.

Quais idiomas são oferecidos atualmente e quais idiomas estão sendo trabalhados atualmente?

Nosso sistema de alto-falantes inclui dois idiomas, russo e inglês. A ideia é que uma voz criada em um idioma possa falar todos os outros idiomas em nosso modelo também. Atualmente, estamos coletando dados para mais 40 idiomas e muito em breve teremos 42.

Qual é a sua visão para o futuro dos assistentes de voz AI?

Acredito que os assistentes de voz entrarão no metaverso e estamos estudando essas oportunidades agora. Se você integrar o assistente com alto-falantes inteligentes ou navegador da Web, mais pessoas usarão a pesquisa por voz e interagirão com o assistente todos os dias. Você pode falar com sua geladeira ou TV.

Há mais alguma coisa que você gostaria de compartilhar sobre a AMAI?

A AMAI usa apenas suas próprias tecnologias proprietárias.

Obrigado pela entrevista, os leitores que quiserem saber mais devem visitar AMAI.

Sócio fundador da unite.AI e membro do Conselho de Tecnologia da Forbes, Antoine é um futurista que é apaixonado pelo futuro da IA ​​e da robótica.

Ele também é o fundador da Valores Mobiliários.io, um site que foca em investir em tecnologia disruptiva.