talón Cómo usar voces generativas de IA de manera ética para los negocios en 2023 - Unite.AI
Contáctanos

Líderes del pensamiento

Cómo usar voces generativas de IA de manera ética para los negocios en 2023

mm
Actualizado on

El final de 2022 llegó inmediatamente después de que las tecnologías de IA experimentaran una adopción generalizada debido a la asombrosa popularidad de OpenAI y ChatGPT. Por primera vez, AI logró el atractivo del mercado masivo al demostrar su utilidad y valor en la creación de resultados comerciales exitosos.

Muchas tecnologías de IA que parecen una revolución para la gente común en 2023 en realidad han estado en uso activo por parte de grandes empresas y medios durante varios años. Únase a mí mientras observo más de cerca la tecnología que impulsa estas soluciones, en particular, los sistemas generativos de IA para la clonación de voz, sus beneficios comerciales y los enfoques éticos para usar la IA.

¿Cómo funciona la clonación de voz?

En resumen, la clonación de voz permite que una persona hable usando la voz de otra persona.

Utiliza tecnología de IA generativa para crear grabaciones de la voz de una persona y usarlas para generar nuevo contenido de audio con la voz de esa misma persona. Esencialmente, permite que las personas escuchen lo que alguien habría dicho, incluso si no lo dijeron ellos mismos.

En el aspecto técnico, las cosas no parecen ser muy complicadas. Pero si profundiza un poco más, hay algunos requisitos mínimos para comenzar:

  1. Necesita al menos 5 minutos de audio grabado de alta calidad de la voz de origen para clonarlo. Estas grabaciones deben ser claras y libres de ruido de fondo u otras distorsiones, ya que cualquier imperfección podría afectar la precisión de la salida del modelo.
  2. Después de eso, introduzca estas grabaciones en un modelo generativo de IA para crear un "avatar de voz".
  3. Luego, entrene al modelo para que reproduzca con precisión los patrones de voz en tono y tiempo.
  4. Una vez completado, este modelo entrenado puede generar contenido ilimitado utilizando la voz de origen de cualquier otra persona, convirtiéndose en una herramienta eficaz para crear réplicas de voces con un sonido realista.

Este es el punto en el que muchos plantean preocupaciones éticas. ¿Qué sucede cuando podemos insertar cualquier texto en la boca de otra persona y es imposible saber si esas palabras son reales o falsas?

Sí, esta posibilidad hace tiempo que se ha convertido en realidad. Como en el caso de OpenAI y ChatGPT, actualmente nos enfrentamos a una serie de problemas éticos que no se pueden ignorar.

Normas éticas en IA

Al igual que con muchas otras tecnologías novedosas en sus etapas iniciales de adopción, la principal amenaza es crear un estigma negativo en torno a la tecnología en lugar de reconocer las amenazas como fuente de debate y conocimiento valioso. Lo importante es exponer los métodos que utilizan los malos actores para abusar de la tecnología y sus productos, aplicar herramientas de mitigación y continuar aprendiendo. 

Hoy tenemos tres capas de marcos para estándares éticos relacionados con el uso de IA generativa. Los niveles regulatorios nacionales y supranacionales se encuentran en su etapa inicial de desarrollo. Es posible que el mundo de las políticas no se mantenga al día con la velocidad del desarrollo de la tecnología emergente, pero ya podemos observar que la UE lidera con la Propuesta de la UE sobre el Reglamento de IA y El Código de buenas prácticas sobre desinformación de 2022 que describe las expectativas de las grandes empresas tecnológicas para abordar la difusión de contenido malicioso manipulado por IA. A nivel nacional, vemos los primeros pasos regulatorios de los EE. UU. y el Reino Unido para abordar el problema con los EE. UU. Grupo de Trabajo Nacional de Deepfake y Procedencia Digital y del Reino Unido Proyecto de ley de seguridad en línea

La capa de la industria de la tecnología se mueve más rápido a medida que las empresas y los tecnólogos aceptan esta nueva realidad en lo que respecta a las tecnologías emergentes y su impacto en la seguridad y la privacidad de la sociedad. El diálogo sobre la ética de la IA generativa es vibrante y ha abierto el camino hacia el desarrollo de iniciativas industriales para códigos de conducta en torno al uso de la IA generativa (es decir, Código de Conducta de la Asociación sobre Medios Sintéticos de IA) y declaraciones éticas emitidas por diferentes empresas. La pregunta es, ¿cómo hacer práctica la conducta? Y, ¿pueden afectar los productos, las características específicas y los procedimientos de los equipos? 

Después de haber trabajado en este problema con una serie de diferentes comunidades de medios y entretenimiento, ciberseguridad y ética de la IA, he formulado algunos principios prácticos para tratar el contenido y las voces de la IA en particular: 

  1. Los propietarios de IP y la empresa que usa la voz clonada pueden evitar muchas de las posibles complicaciones asociadas con el uso de voces originales mediante la firma de acuerdos legales.
  2. Los propietarios de proyectos deben divulgar públicamente el uso de una voz clonada para que los oyentes no sean engañados.
  3. Las empresas que trabajan en tecnología de IA para voz deben asignar un porcentaje de recursos al desarrollo de tecnología que sea capaz de detectar e identificar contenido generado por IA.
  4. Etiquetar el contenido generado por IA con marcas de agua permite la autenticación por voz.
  5. Cada proveedor de servicios de IA debe revisar el impacto de cada proyecto (niveles sociales, comerciales y de privacidad) antes de aceptar trabajar en él.

Por supuesto, los principios de ética en la IA no afectarán la difusión de falsificaciones profundas caseras en línea. Sin embargo, empujarán cualquier proyecto en gris fuera del alcance del mercado público.

En 2021-22, las voces de IA se utilizaron en diferentes proyectos principales que introdujeron importantes implicaciones para la ética y la sociedad. Estos incluidos clonar la voz del joven Luke Skywalker para la serie mandaloriana, Voz de IA para God of War 2y La voz de Richard Nixon para la histórica 'In Event of Moon Disaster'.

La confianza en la tecnología está creciendo más allá de los medios y el entretenimiento. Las empresas tradicionales de muchas industrias utilizan voces clonadas en sus proyectos. Estos son algunos de los casos de uso más destacados.

Casos de uso de la industria

En 2023, la clonación de voz continuará su ascenso junto con varias empresas preparadas para cosechar sus numerosos beneficios. Desde la atención médica y el marketing hasta el servicio al cliente y la industria de la publicidad, la clonación de voz está revolucionando la forma en que las organizaciones construyen relaciones con sus clientes y optimizan sus flujos de trabajo.

La clonación de voz beneficia a los profesionales de la salud y los trabajadores sociales que trabajan en un entorno en línea. Los avatares digitales con la misma voz que los profesionales médicos fomentan lazos más fuertes entre ellos y sus pacientes, aumentando la confianza y reteniendo a los clientes.

Las aplicaciones potenciales de la clonación de voz en la industria del cine y el entretenimiento son amplias. Esta tecnología hace posible el doblaje de contenido a varios idiomas, el reemplazo de diálogo adicional (ADR) para niños y adultos y una variedad casi infinita de opciones de personalización.

De manera similar, en el sector de operaciones, la clonación de voz impulsada por IA puede generar excelentes resultados para las marcas que necesitan soluciones rentables para sistemas de respuesta de voz interactivos o videos de capacitación corporativa. Con la tecnología de síntesis de voz, los actores pueden ampliar su alcance al mismo tiempo que aumentan su capacidad para obtener ingresos residuales de las grabaciones.

Finalmente, en los estudios de producción publicitaria, la aparición de la clonación de voz ha ayudado a reducir significativamente los costos y la cantidad de horas asociadas con la producción comercial. Siempre que haya una grabación de alta calidad disponible para la clonación (incluso de actores no disponibles), los anuncios se pueden producir de forma más rápida y creativa que nunca.

Curiosamente, las empresas y las PYMES pueden aprovechar la clonación de voz para crear algo único para sus marcas. Los grandes proyectos pueden realizar sus planes más ambiciosos, mientras que las pequeñas empresas pueden acceder a modelos a escala que anteriormente tenían un costo prohibitivo. Eso es lo que significa la verdadera democratización.

Terminando

La clonación de voz con IA ofrece a las empresas beneficios revolucionarios, como la creación de experiencias únicas para los clientes, la integración de capacidades de procesamiento del lenguaje natural en sus productos y servicios y la generación de imitaciones altamente precisas de voces que suenan completamente reales.

Las empresas que buscan mantener su ventaja competitiva en 2023 deberían considerar la clonación de voz de IA. Las empresas pueden usar esta tecnología para desbloquear una variedad de nuevas posibilidades para ganar participación de mercado y retener clientes mientras lo hacen de una manera éticamente responsable.

Anna es Directora de Ética y Asociaciones en Respeecher, una tecnología de clonación de voz galardonada con un Emmy con sede en Ucrania. Anna es ex asesora de políticas en Reface, una aplicación de medios sintéticos impulsada por IA y cofundadora tecnológica de la herramienta contra la desinformación Cappture financiada por el programa acelerador Startup Wise Guys. Anna tiene 11 años de experiencia en políticas de seguridad y defensa, tecnologías y desarrollo de resiliencia. Es exinvestigadora del Centro Internacional para la Defensa y la Seguridad de Tallin y del Instituto de Estudios de Seguridad de Praga. También ha estado asesorando a las principales empresas ucranianas sobre el desarrollo de la resiliencia como parte del Grupo de trabajo de guerra híbrida en la Escuela de Economía de Kiev.