Connect with us

James Kaplan, CEO y Co-Fundador de MeetKai Metaverse – Serie de Entrevistas

Entrevistas

James Kaplan, CEO y Co-Fundador de MeetKai Metaverse – Serie de Entrevistas

mm

James Kaplan, es el CEO y Co-Fundador de MeetKai una empresa de Inteligencia Artificial, VR y Búsqueda Conversacional con sede en Los Ángeles, California, que actualmente lidera la carrera de habla de IA con características nunca antes vistas. Su IA conversacional puede entender un habla más compleja y dar resultados personalizados en una conversación natural sobre muchos temas, en diferentes realidades. La tecnología de MeetKai se despliega a nivel global a través de iOS, Google Play y AppGallery.

Tu pasión por la IA comenzó a una edad temprana de 6 años, ¿cómo te introdujiste a esta tecnología?

Mi introducción a la IA vino de los videojuegos. Primero, fue al tratar de entender cómo funcionaba la IA en el juego Oregon Trail, no que fuera muy inteligente, pero aún así era una forma de IA. A partir de ahí, mi interés en la IA creció aún más cuando me metí en los MMORPG. Me gustaba jugar juegos en línea, pero odiaba buscar objetos. Por lo tanto, me metí en escribir Bots.

¿Cuáles fueron algunas de las primeras aplicaciones de IA que codificaste?

Escribir bots para MMOs fue realmente mi primera incursión en el desarrollo de una forma específica de IA. Al principio, mis bots eran bastante simples y más cercanos a macros que a inteligencia artificial. Pero a medida que crecí y la detección de bots mejoró en muchos juegos, esto comenzó a requerir que los bots se parecieran cada vez más a un jugador. Siempre me ha gustado escribir bots, terminé escribiendo un bot para ganar un concurso de Taylor Swift mientras estaba en la escuela (y ella incluso vino a actuar). De manera similar, también escribí el primer bot de Pokémon Go y, lamentablemente, muchos usuarios fueron prohibidos cuando perdí interés en evadir la detección.

Lanzaste MeetKai en 2018 después de frustrarte con los asistentes de voz de IA actuales. ¿Por qué la mayoría de los asistentes de IA ofrecen una experiencia mediocre?

La esencia del problema es que la mayoría de los asistentes de IA dependen demasiado de APIs externas para su cumplimiento. Incluso cuando controlan el cumplimiento, como Alexa para la búsqueda de comercio electrónico, sufren de los mismos problemas. Simplemente, ¿cómo puedes esperar que un asistente de voz sea inteligente cuando todo lo que hace es convertir el habla en texto y poner ese texto en un motor de búsqueda de texto? Comenzamos MeetKai con la idea de que podríamos proporcionar un asistente de IA “de salto” al controlar toda la cadena de procesamiento de extremo a extremo que constituye un asistente de voz. Desarrollamos un motor de búsqueda conversacional en lugar de uno basado en palabras clave para admitir consultas y conversaciones más complicadas. Otros asistentes están estancados con experiencias mediocres porque no pueden construir un soporte de conversación de varios giros sobre factores tan limitantes. Aunque nuestro objetivo es llegar allí, todavía estamos en una etapa muy temprana de escalar nuestra tecnología para cumplir con el mismo número de dominios que los actores existentes.

¿Cuáles son algunos de los desafíos de comprensión del lenguaje natural y procesamiento del lenguaje natural detrás de la construcción de una experiencia de asistente de voz de última generación?

Uno de los principales desafíos con la NLU de próxima generación es ir más allá de las intenciones y las entidades. La mayoría de la NLU se centra en tener un enfoque muy tradicional para la comprensión del lenguaje. Cada entrada de habla se clasifica en intención, y luego los tokens dentro se etiquetan en entidades utilizando un modelo de etiquetado de secuencia. Podría enumerar docenas de problemas con este enfoque estándar. Sin embargo, los más críticos son:

  1. Una clasificación de intención que es independiente del contexto no puede manejar una conversación de varios giros. La mayoría de los enfoques solo se preocupan por el texto bruto que se transcribió. No se preocupan por el contexto, no quién es el usuario, no lo que le gusta al usuario, solo lo que acaba de preguntar. Esto es particularmente importante cuando el usuario dice algo muy breve. Por ejemplo, si alguien dice “cosmopolitan”, puede significar la bebida o la revista y depende mucho de la persona.
  2. Los modelos de reconocimiento de entidades hacen un mal trabajo con cualquier cosa que no sea un valor categórico. Los grandes modelos de lenguaje no pueden adaptarse lo suficientemente rápido a nuevas entidades que están en la naturaleza porque no están en el conjunto de datos. La IA necesita tener una forma mucho más sofisticada de reconocer entidades considerando un contexto mucho más profundo. Por ejemplo, la ubicación del usuario debería influir en gran medida si algo es un nombre de restaurante en lugar de algo más.
  3. Las relaciones entre entidades no se consideran bien. Mi ejemplo favorito es cuán a menudo la mayoría de los motores de búsqueda fallan cuando se trata de la negación. Intente buscar una película sin romance en otros asistentes de voz y verá a qué me refiero.

Actualmente, la mayoría de los asistentes de voz simplemente traducen la voz a texto y realizan una búsqueda de Google. ¿Cómo opera MeetKai AI de manera diferente a esto?

La principal diferencia entre MeetKai y Google en cuanto a la búsqueda es que utilizamos un modelo de comprensión del lenguaje mucho más rico para buscar artículos en sí mismos en lugar de solo páginas web. Cuando busca “películas de Tom Cruise sin acción”, Google está buscando páginas que tengan ese conjunto de tokens que aparecen en la página (Tom Cruise, películas, acción). En MeetKai, entendemos correctamente que Tom Cruise es un actor, las películas son la clase de medio que están buscando y que la acción es el género no deseado. Con esto, podemos realizar búsquedas mucho más inteligentes.

Meetkai lanzó recientemente su primer mundo de realidad virtual de estilo de vida: MeetKai Metaverse. ¿Podrías hablar sobre esta aplicación en particular?

La mayoría de las empresas en el espacio de metaverso están trabajando en interacción persona a persona. Más allá de eso, el contenido también es en gran medidaEither caricaturesco o es solo un video de 360°. Nuestro objetivo con MeetKai Metaverse es centrarnos en un ángulo completamente diferente, persona a IA. Estamos desarrollando un metaverso donde los personajes con los que interactúas están todos impulsados por nuestra IA conversacional de vanguardia. Además, estamos trabajando para realizar una generación procedural del entorno para que sea mucho más realista y envolvente en comparación con otras empresas en el espacio. Los dos mundos iniciales disponibles para explorar en nuestro metaverso son para dos casos de uso iniciales: meditación y museos. En el primero, hemos digitalizado a un experto en Wing Chun y, por primera vez, creamos un personaje de IA capaz de instruir a los usuarios sobre cómo utilizar técnicas de meditación revolucionarias para entrar en un estado de relajación. En el segundo, hemos creado un museo de arte en constante crecimiento y proporcionado un curador impulsado por IA capaz de responder preguntas sobre el arte en el espacio y brindar recorridos.

¿Cuáles son algunos ejemplos de cómo se utiliza la IA en este Metaverse?

Utilizamos la IA en tres lugares:

  1. Para impulsar las capacidades conversacionales de cada personaje en nuestro metaverso.
  2. Para crear dinámicamente el contenido que se pone a disposición del usuario a través de la guía de voz. Ejemplos de esto incluyen sesiones de meditación y recorridos por la galería de arte en nuestras dos primeras experiencias.
  3. Para crear el espacio 3D de forma procedural en lugar de requerir un diseño manual.

¿Cuál es tu visión para el futuro de los asistentes de voz?

Para que los asistentes de voz tengan un futuro, necesitan evolucionar hacia algo mucho más que un sistema basado en comandos. Esto significa obtener una gran experiencia y capacidades en muchos dominios específicos. Creo que reunir diferentes asistentes de voz específicos del dominio será la clave para construir un asistente meta inteligente. Esto es en marcado contraste con los intentos de “hacerlo todo de una vez” que hemos visto desde que los asistentes de voz ingresaron al espacio.

¿Hay algo más que te gustaría compartir sobre MeetKai o MeetKai Metaverse?

Todavía estamos al comienzo de nuestra hoja de ruta del metaverso. Nuestro objetivo final es que queremos poder replicar cualquier experiencia que tengas en el mundo real con el metaverso, y luego ir más allá. Esto significa que queremos eliminar los factores de costo y tiempo que limitan esas mismas experiencias en la realidad. El metaverso puede permitirnos vivir vidas mucho más ricas, no reemplazarlas. Tenemos varios desafíos técnicos que aún deben resolverse, sin embargo, tenemos un conjunto claro de hitos que son alcanzables asumiendo que el hardware continúa mejorando. Estamos trabajando en estrecha colaboración con socios de hardware para garantizar que el espacio de RV avance rápidamente. Más allá del RV, queremos hacer que nuestra experiencia de metaverso sea posible fuera del RV. Anunciaremos más información sobre esto en los próximos meses.

Gracias por la gran entrevista, espero seguir tu progreso en tu versión del metaverso. Los lectores que deseen obtener más información deben visitar MeetKai.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.