toco James Kaplan, CEO e cofundador do MeetKai Metaverse - Série de entrevistas - Unite.AI
Entre em contato

Entrevistas

James Kaplan, CEO e co-fundador da MeetKai Metaverse – série de entrevistas

mm

Publicado

 on

James Kaplan, é o CEO e co-fundador da Conheça Kai uma empresa de inteligência artificial, RV e pesquisa conversacional com sede em Los Angeles, Califórnia, atualmente liderando a corrida de fala de IA com recursos nunca antes vistos. Sua IA conversacional pode entender falas mais complexas e dar resultados personalizados em uma conversa natural sobre diversos assuntos, em diferentes realidades. A tecnologia da MeetKai é implantada globalmente por meio do iOS, Google Play e AppGallery.

Você se apaixonou por IA desde os 6 anos de idade, como conheceu essa tecnologia?

Minha introdução à IA veio dos videogames. Primeiro, foi tentando entender como a IA funcionava no jogo Oregon Trail - não tão inteligente, mas ainda assim uma forma de IA. A partir daí, meu interesse por IA cresceu ainda mais quando entrei nos MMORPGs. Eu realmente gostava de jogar jogos online, mas odiava ficar procurando itens. Por isso, comecei a escrever Bots.

Quais foram alguns dos primeiros aplicativos de IA que você codificou?

Escrever bots para MMOs foi realmente a primeira incursão que fiz no desenvolvimento de uma forma específica de IA. No começo, meus bots eram bem simples e mais próximos de macros do que de inteligência artificial. Mas, à medida que envelheci e a detecção de bots melhorou em muitos jogos, isso começou a exigir que os bots se parecessem cada vez mais com um jogador. Sempre gostei de escrever bots - acabei escrevendo um bot para ganhar um concurso da Taylor Swift enquanto estava na escola (e ela realmente veio se apresentar!). Da mesma forma, também escrevi o primeiro bot Pokémon Go e, infelizmente, muitas pessoas foram banidas quando perdi o interesse em evitar a detecção.

Você lançou o MeetKai em 2018 depois de ficar frustrado com os atuais assistentes de voz de IA. Por que a maioria dos assistentes de IA oferece uma experiência sem brilho?

O cerne da questão é que a maioria dos assistentes de IA depende demais de APIs externas para atendimento. Mesmo quando controlam o atendimento, como Alexa para busca de e-commerce, sofrem dos mesmos problemas. Simplificando, como você pode esperar que um assistente de voz seja inteligente quando tudo o que ele faz é transformar fala em texto e colocar esse texto em um mecanismo de pesquisa baseado em texto? Começamos o MeetKai com a ideia de que poderíamos fornecer um assistente de IA "salto", controlando todo o pipeline de processamento de ponta a ponta que compõe um assistente de voz. Desenvolvemos um mecanismo de pesquisa conversacional em vez de um baseado em palavras-chave para oferecer suporte a consultas e conversas mais complicadas. Outros assistentes estão presos a experiências medíocres porque não podem criar suporte a conversas em vários turnos além de tais fatores limitantes. Embora nosso objetivo seja chegar lá, ainda estamos no estágio inicial de expandir nossa tecnologia para atender ao mesmo número de domínios que os players existentes.

Quais são alguns dos desafios de compreensão e processamento de linguagem natural por trás da construção de uma experiência de assistente de voz de última geração?

Um dos principais desafios do NLU de última geração é ir além das intenções e entidades. A maioria dos NLU está focada em ter uma abordagem muito tradicional para a compreensão da linguagem. Cada expressão de entrada é classificada em intenção e, em seguida, os tokens são rotulados em entidades usando um modelo de rotulagem de sequência. Eu poderia enumerar dezenas de problemas com essa abordagem padrão. No entanto, os mais críticos são:

  1. Uma classificação de intenção que é livre de contexto não consegue lidar com uma conversa de vários turnos. A maioria das abordagens se preocupa apenas com o texto bruto que foi transcrito. Eles não se importam com o contexto - nem com quem é o usuário, nem com o que o usuário gosta, apenas com o que acabaram de perguntar. Isso é particularmente importante quando o usuário diz algo conciso em verso. Por exemplo, se alguém disser cosmopolita, pode significar a bebida ou a revista e é altamente dependente da pessoa.
  2. Os modelos de reconhecimento de entidade fazem um trabalho ruim de qualquer coisa que não seja um valor categórico. Modelos de linguagem grandes não são capazes de se adaptar com rapidez suficiente a novas entidades que estão à solta porque não estão no conjunto de dados. A IA precisa ter uma maneira muito mais sofisticada de reconhecer entidades, considerando um contexto muito mais profundo. Por exemplo, a localização de um usuário deve influenciar fortemente se algo é o nome de um restaurante em vez de outra coisa.
  3. Os relacionamentos entre entidades não são bem considerados. Meu exemplo favorito é a frequência com que a maioria dos mecanismos de pesquisa falha quando se trata de negação. Tente procurar um filme sem romance em outros assistentes de voz e você entenderá o que quero dizer.

Atualmente, a maioria dos assistentes de voz simplesmente traduz a voz em texto e realiza uma pesquisa no Google. Como o MeetKai AI opera de maneira diferente?

A principal diferença entre o MeetKai e o Google quando se trata de pesquisa é que utilizamos um modelo de compreensão de linguagem muito mais rico para pesquisar itens em si, em vez de apenas páginas da web. Quando você pesquisa “filmes de Tom Cruise sem ação”, o Google está procurando por páginas que tenham esse conjunto de tokens exibidos na página (Tom Cruise, filmes, ação). No MeetKai, entendemos corretamente que Tom Cruise é um ator, os filmes são a classe de mídia que eles procuram e que a ação é o gênero indesejado. Com isso, podemos realizar buscas muito mais inteligentes.

Meetkai lançou recentemente seu primeiro mundo VR de estilo de vida: MeetKai Metaverse. Você poderia discutir o que este aplicativo é especificamente?

A maioria das empresas no espaço do metaverso está trabalhando na interação pessoa <> pessoa. Além disso, o conteúdo também é em grande parte caricatural ou apenas um vídeo em 360°. Nosso objetivo com o MeetKai Metaverse é focar em um ângulo totalmente diferente - pessoa<>IA. Estamos desenvolvendo um metaverso onde os personagens com os quais você está interagindo são todos alimentados por nossa IA de conversação de ponta. Além disso, estamos trabalhando para realizar a geração processual do ambiente para torná-lo muito mais realista e imersivo quando comparado a outras empresas no espaço. Os dois mundos iniciais disponíveis para explorar em nosso metaverso são para dois casos de uso iniciais: meditação e museus. No primeiro, digitalizamos um especialista em Wing Chun e, pela primeira vez, criamos um personagem de IA capaz de instruir os usuários sobre como usar técnicas revolucionárias de meditação para entrar em estado de relaxamento. Neste último, criamos um museu de arte em constante crescimento e fornecemos um curador alimentado por IA capaz de responder a perguntas sobre a arte no espaço e fornecer passeios.

Quais são alguns exemplos de como a IA é usada neste metaverso?

Utilizamos IA em três locais:

  1. Potencializar as capacidades de conversação de cada personagem em nosso metaverso.
  2. Para criar dinamicamente o conteúdo que é disponibilizado ao usuário por meio de orientação por voz. Exemplos disso incluem sessões de meditação e visitas a galerias de arte em nossas duas experiências iniciais.
  3. Para criar o espaço 3D processualmente, em vez de exigir um layout manual.

Qual é a sua visão para o futuro dos assistentes de voz?

Para que os assistentes de voz tenham futuro, eles precisam evoluir para algo muito mais do que um sistema baseado em comandos. Isso significa obter profundo conhecimento e capacidades em muitos domínios específicos. Acho que reunir diferentes assistentes de voz específicos de domínio será a chave para criar um metaassistente totalmente inteligente. Isso contrasta fortemente com as tentativas de “fazer tudo de uma vez” que vimos desde que os assistentes de voz entraram no espaço pela primeira vez.

Há mais alguma coisa que você gostaria de compartilhar sobre o MeetKai ou o MeetKai Metaverse?

Ainda estamos no início do roteiro do nosso metaverso. Nosso objetivo final é sermos capazes de replicar qualquer experiência que você tenha no mundo real com o metaverso e depois ir além dele. Isso significa que queremos eliminar os fatores proibitivos de custo e tempo que limitam essas mesmas experiências na realidade. O metaverso pode nos permitir viver vidas muito mais ricas, não substituí-las. Temos vários desafios técnicos que ainda precisam ser resolvidos, no entanto, temos um conjunto claro de marcos que podem ser alcançados, desde que o hardware continue a melhorar. Estamos trabalhando em estreita colaboração com parceiros de hardware para garantir que o espaço VR avance rapidamente. Além de apenas VR, queremos tornar nossa experiência de metaverso possível fora da RV. Anunciaremos mais informações sobre isso nos próximos meses.

Obrigado pela ótima entrevista, estou ansioso para acompanhar seu progresso em sua versão do metaverso. Os leitores que desejam saber mais devem visitar Conheça Kai.

Sócio fundador da unite.AI e membro do Conselho de Tecnologia da Forbes, Antoine é um futurista que é apaixonado pelo futuro da IA ​​e da robótica.

Ele também é o fundador da Valores Mobiliários.io, um site que foca em investir em tecnologia disruptiva.