talón Los desarrolladores de juegos recurren a Voice AI para nuevas oportunidades creativas - Unite.AI
Contáctanos

Inteligencia artificial

Los desarrolladores de juegos recurren a Voice AI para nuevas oportunidades creativas

mm
Actualizado on

La tecnología de síntesis de sonido, en particular la síntesis de voz, se ha vuelto mucho más sofisticada en los últimos años. Si bien la tecnología de texto a voz ha existido durante décadas, la tecnología se ha convertido en un sonido mucho más natural. Los algoritmos recientes pueden tomar solo unas pocas horas de audio y sintetizar muestras de audio muy realistas. A medida que avanza la tecnología, se abren más aplicaciones, incluidas posibilidades en medios creativos. Recientemente,  según lo informado por VentureBeat, las empresas de videojuegos han comenzado a investigar el uso de la generación de voz de IA para producir diálogos para videojuegos.

Una compania, Juegos de Leviatán, ha comenzado a implementar IA de voz en los juegos que están desarrollando actualmente. Wyeth Ridgway, el propietario de Leviathan Games, explicó que la IA de voz podría cambiar el diseño del juego de manera espectacular. Ridgway explicó que el uso de voz AI en el diseño de juegos es una tendencia emergente y lo comparó con la forma en que el software de animación 3D ha cambiado en el transcurso de la última década, con compañías como Pixar creando software patentado destinado a facilitar la animación y el modelado.

Los métodos tradicionales para generar voz funcionan agregando archivos de sonido pregrabados sobre la marcha, uniendo oraciones a partir de palabras y frases previamente existentes. Este método de generación de voz requiere la grabación de cientos de horas de diálogo y el etiquetado manual de clips de sonido. También suena algo antinatural ya que la inflexión y el énfasis tienden a cambiar entre palabras. En comparación, la IA de voz de última generación suena significativamente más natural y funciona de manera diferente.

Voice AI se basa en redes neuronales profundas. WaveNet fue una de las primeras IA que pudo generar muestras de audio convincentes y con un sonido natural. Dado que las muestras de sonido se generan desde cero, no es necesario pregrabar cientos de horas de diálogo, siempre que haya suficientes datos de entrenamiento disponibles. Los modelos GAN y LSTM optimizados pueden generar audio después de entrenarse con solo unas pocas horas de audio etiquetado. Los resultados pueden ser extraordinariamente convincentes, como cuando el experimento Dúplex de Google llamó a una peluquería para programar una cita.

A medida que estas tecnologías se vuelven más poderosas, estandarizadas y fácilmente accesibles a través de la computación en la nube, es probable que más desarrolladores de juegos recurran a la IA de voz para reducir el tiempo y los costos de producción. Algunas empresas ya están creando modelos que potencialmente pueden ser utilizados por los desarrolladores de juegos. Estudios de réplica se especializa en tecnología de voz AI, y algunas muestras de audio generadas por su tecnología se pueden escuchar en los enlaces esta página y esta página.

Es poco probable que los desarrolladores de juegos opten por renunciar al uso de actores de voz en lugar de IA. De hecho, la IA de voz podría abrir más oportunidades para los actores de voz. En la actualidad, muchas empresas de desarrollo de juegos omiten con frecuencia tener diálogos de voz debido a la inversión de tiempo y los costos asociados con la creación de diálogos de voz. Los actores de voz a menudo necesitan regresar para más sesiones de grabación si hay cambios en el guión o si los directores de juegos quieren un tipo diferente de actuación. Voice AI podría usarse para experimentar con/prototipar diálogos, teniendo una idea de qué tipo de cambios y revisiones de guión deben realizarse antes de llamar a un actor de voz profesional para grabar el guión. Esto podría llevar a que más empresas tengan los recursos para invertir en la creación de un diálogo expresado.

Los modelos de voz de IA podrían incluso entrenarse con la voz de un actor de voz específico, y la IA se usa para generar clips de diálogo triviales, siempre que se pague al actor por el uso de su voz. Según lo informado por VentureBeat, actores de voz como Simon J. Smith, son optimistas sobre el uso cada vez mayor de modelos de IA de voz y su potencial para abrir nuevas oportunidades de actuación de voz.

Más allá del uso de la IA de voz para crear prototipos de guiones o crear líneas de voz para personajes secundarios, los desarrolladores de juegos también podrían usar la IA de voz para brindar a los jugadores más opciones de personalización para los videojuegos de rol. Actualmente, incluso los juegos que permiten a los jugadores elegir una voz para sus avatares suelen tener solo unas pocas opciones. Con el uso de voz AI, las opciones podrían ser funcionalmente ilimitadas.