Líderes de opinión
Cómo utilizar voces de IA generativas de manera ética para empresas en 2023

El final de 2022 llegó en el momento en que las tecnologías de IA experimentaban una adopción generalizada debido a la asombrosa popularidad de OpenAI y ChatGPT. Por primera vez, la IA logró un atractivo en el mercado masivo al demostrar su utilidad y valor en la creación de resultados comerciales exitosos.
Muchas tecnologías de IA que parecen una revolución para la gente común en 2023 han estado en uso activo por parte de grandes empresas y medios de comunicación durante varios años. Únete a mí mientras examino más de cerca la tecnología que impulsa estas soluciones, en particular, los sistemas de IA generativos para la clonación de voces, sus beneficios comerciales y los enfoques éticos para utilizar la IA.
¿Cómo funciona la clonación de voces?
En resumen, la clonación de voces permite que una persona hable con la voz de otra persona.
Utiliza la tecnología de IA generativa para crear grabaciones de la voz de una persona y usarlas para generar nuevo contenido de audio con la misma voz de esa persona. En esencia, permite que la gente escuche lo que alguien habría dicho, incluso si no lo dijo ellos mismos.
En el lado técnico, las cosas no parecen ser muy complicadas. Pero si se sumerge un poco más, hay algunos requisitos mínimos para empezar:
- Necesita al menos 5 minutos de audio grabado de alta calidad de la voz fuente para clonarla. Estas grabaciones deben ser claras y libres de ruido de fondo o otras distorsiones, ya que cualquier imperfección podría afectar la precisión de la salida del modelo.
- Después de eso, alimente estas grabaciones a un modelo de IA generativa para crear un “avatar de voz”.
- Luego, entrenar el modelo para reproducir patrones de habla en pitch y temporización de manera precisa.
- Una vez completado, este modelo entrenado puede generar contenido ilimitado utilizando la voz fuente de cualquier otra persona, convirtiéndose en una herramienta efectiva para crear voces réplica que suenan realistas.
Este es el punto en el que muchos plantean preocupaciones éticas. ¿Qué sucede cuando podemos insertar cualquier texto en la boca de otra persona y es imposible determinar si esas palabras son reales o falsas?
Sí, esta posibilidad ya se ha convertido en una realidad. Al igual que en el caso de OpenAI y ChatGPT, actualmente nos enfrentamos a una serie de problemas éticos que no se pueden ignorar.
Estándares éticos en IA
Al igual que con muchas otras tecnologías novedosas en sus etapas iniciales de adopción, la principal amenaza es crear un estigma negativo alrededor de la tecnología en lugar de reconocer las amenazas como una fuente de discusión y conocimiento valioso. Lo que es importante es exponer los métodos que los actores maliciosos utilizan para abusar de la tecnología y sus productos, aplicar herramientas de mitigación y seguir aprendiendo.
Hoy en día tenemos tres capas de marcos para estándares éticos relacionados con el uso de IA generativa. Las capas regulatorias nacionales y supranacionales están en su etapa inicial de desarrollo. El mundo de las políticas puede no mantener el ritmo del desarrollo de la tecnología emergente, pero ya podemos observar a la UE liderando con la Propuesta de la UE sobre la regulación de la IA y El Código de práctica de 2022 sobre desinformación que describe las expectativas para que las grandes empresas tecnológicas aborden la difusión de contenido manipulado por IA. En los niveles nacionales, vemos los primeros pasos regulatorios de EE. UU. y el Reino Unido para abordar el problema con la Fuerza de tarea nacional de deepfakes y proveniencia digital de EE. UU. y la Ley de seguridad en línea del Reino Unido.
La capa de la industria tecnológica se está moviendo más rápido, ya que las empresas y los tecnólogos están aceptando esta nueva realidad en lo que respecta a las tecnologías emergentes y su impacto en la seguridad y la privacidad sociales. El diálogo sobre la ética de la IA generativa es vibrante y ha liderado el camino hacia el desarrollo de iniciativas de la industria para Códigos de conducta sobre el uso de IA generativa (por ejemplo, El Código de conducta de medios sintéticos de la Asociación de IA) y declaraciones éticas publicadas por diferentes empresas. La pregunta es, ¿cómo hacer que la conducta sea práctica? Y, ¿pueden afectar productos, características específicas y procedimientos de equipos?
Después de haber trabajado en este problema con una serie de comunidades diferentes de medios y entretenimiento, ciberseguridad y ética de la IA, he formulado algunos principios prácticos para lidiar con contenido y voces de IA en particular:
- Los propietarios de derechos de autor y la empresa que utiliza la voz clonada pueden evitar muchas de las posibles complicaciones asociadas con el uso de voces originales firmando acuerdos legales.
- Los propietarios de proyectos deben divulgar públicamente el uso de una voz clonada para que los oyentes no sean engañados.
- Las empresas que trabajan en tecnología de IA para voz deben asignar un porcentaje de recursos para desarrollar tecnología capaz de detectar y identificar contenido generado por IA.
- Etiquetar el contenido generado por IA con marcas de agua permite la autenticación de voz.
- Cada proveedor de servicios de IA debe revisar cada proyecto de su impacto (niveles sociales, comerciales y de privacidad) antes de aceptar trabajar en él.
Por supuesto, los principios de ética en la IA no afectarán la difusión de deepfakes caseros en línea. Sin embargo, empujarán cualquier proyecto en el gris fuera del alcance del mercado público.
En 2021-22, las voces de IA se utilizaron en diferentes proyectos de corriente principal que introdujeron implicaciones sustanciales para la ética y la sociedad. Estos incluyeron clonar la voz de un joven Luke Skywalker para la serie Mandaloriano, voz de IA para God of War 2, y la voz de Richard Nixon para el histórico ‘En caso de desastre lunar’.
La confianza en la tecnología está creciendo más allá de los medios y el entretenimiento. Las empresas tradicionales en muchas industrias están utilizando voces clonadas en sus proyectos. A continuación, se presentan algunos de los casos de uso más destacados.
Casos de uso en la industria
En 2023, la clonación de voces continuará su ascenso junto con varias empresas que están a punto de cosechar sus numerosos beneficios. Desde la atención médica y el marketing hasta el servicio al cliente y la industria publicitaria, la clonación de voces está revolucionando la forma en que las organizaciones establecen relaciones con sus clientes y optimizan sus flujos de trabajo.
La clonación de voces beneficia a los profesionales de la salud y a los trabajadores sociales que trabajan en un entorno en línea. Los avatares digitales con la misma voz que los profesionales médicos fomentan vínculos más fuertes entre ellos y sus pacientes, aumentando la confianza y reteniendo a los clientes.
Las posibles aplicaciones de la clonación de voces en la industria del cine y el entretenimiento son vastas. Doblar contenido a múltiples idiomas, diálogo adicional de niños y adultos (ADR) y una casi infinita variedad de opciones de personalización son todos posibles gracias a esta tecnología.
De manera similar, en el sector de operaciones, la clonación de voces impulsada por IA puede producir resultados excelentes para las marcas que necesitan soluciones rentables para sistemas de respuesta de voz interactiva o videos de capacitación corporativa. Con la tecnología de síntesis de voz, los actores pueden ampliar su alcance mientras aumentan su capacidad para ganar regalías de grabaciones.
Finalmente, en los estudios de producción publicitaria, el surgimiento de la clonación de voces ha ayudado significativamente a reducir los costos y el número de horas asociados con la producción de comerciales. Siempre que haya una grabación de alta calidad disponible para clonar (incluso de actores no disponibles), los anuncios se pueden producir rápidamente y de manera más creativa que nunca antes.
Es interesante que las empresas y las pequeñas y medianas empresas (SMB) puedan aprovechar la clonación de voces para crear algo único para sus marcas. Los proyectos grandes pueden realizar sus planes más ambiciosos, mientras que las pequeñas empresas pueden acceder a modelos de escala que anteriormente eran prohibitivos en términos de costo. Eso es lo que significa la verdadera democratización.
Resumen
La clonación de voces de IA ofrece a las empresas beneficios innovadores, como la creación de experiencias únicas para los clientes, la integración de capacidades de procesamiento de lenguaje natural en sus productos y servicios, y la generación de imitaciones de voces muy precisas que suenan completamente reales.
Las empresas que buscan mantener su ventaja competitiva en 2023 deben investigar la clonación de voces de IA. Las empresas pueden utilizar esta tecnología para desbloquear una variedad de nuevas posibilidades para ganar participación de mercado y retener a los clientes, mientras lo hacen de una manera éticamente responsable.












