Connect with us

Comment utiliser les voix de l’IA générative de manière éthique pour les entreprises en 2023

Leaders d’opinion

Comment utiliser les voix de l’IA générative de manière éthique pour les entreprises en 2023

mm

La fin de 2022 est arrivée sur les talons de l’adoption généralisée des technologies de l’IA en raison de la popularité éblouissante d’OpenAI et de ChatGPT. Pour la première fois, l’IA a atteint un attrait pour le marché de masse en prouvant son utilité et sa valeur dans la création de résultats commerciaux réussis.

De nombreuses technologies de l’IA qui semblent être une révolution pour les gens du quotidien en 2023 ont en fait été utilisées activement par les grandes entreprises et les médias pendant plusieurs années. Rejoignez-moi pour examiner de plus près la technologie qui alimente ces solutions, en particulier les systèmes d’IA générative pour le clonage de voix, ses avantages commerciaux et les approches éthiques pour utiliser l’IA.

Comment fonctionne le clonage de voix ?

En résumé, le clonage de voix permet à une personne de parler avec la voix d’une autre personne.

Il utilise la technologie d’IA générative pour créer des enregistrements de la voix d’une personne et les utiliser pour générer de nouveaux contenus audio avec la même voix. Il permet essentiellement aux gens d’entendre ce que quelqu’un aurait dit, même s’ils ne l’ont pas dit eux-mêmes.

Du point de vue technique, les choses ne semblent pas très compliquées. Mais si vous plongez un peu plus profond, il y a des exigences minimales pour commencer :

  1. Vous avez besoin d’au moins 5 minutes d’enregistrement audio de haute qualité de la voix source pour la cloner. Ces enregistrements doivent être clairs et exempt de bruit de fond ou d’autres distorsions, car les imperfections pourraient affecter la précision de la sortie du modèle.
  2. Après cela, alimentez ces enregistrements dans un modèle d’IA générative pour créer un « avatar de voix ».
  3. Ensuite, formez le modèle pour reproduire avec précision les modèles de parole en hauteur et en chronométrage.
  4. Une fois terminé, ce modèle formé peut générer un contenu illimité en utilisant la voix source de toute autre personne, devenant un outil efficace pour créer des voix réalistes.

C’est à ce stade que de nombreuses personnes soulèvent des préoccupations éthiques. Que se passe-t-il lorsque nous pouvons insérer n’importe quel texte dans la bouche de quelqu’un d’autre et qu’il est impossible de savoir si ces mots sont réels ou faux ?

Oui, cette possibilité est devenue réalité depuis longtemps. Comme dans le cas d’OpenAI et de ChatGPT, nous sommes actuellement confrontés à un certain nombre de problèmes éthiques qui ne peuvent être ignorés.

Normes éthiques dans l’IA

Comme pour de nombreuses autres technologies nouvelles à leurs débuts, la principale menace est de créer une stigmatisation négative autour de la technologie plutôt que de reconnaître les menaces comme une source de discussion et de connaissances précieuses. Ce qui est important, c’est d’exposer les méthodes que les mauvais acteurs utilisent pour abuser de la technologie et de ses produits, d’appliquer des outils d’atténuation et de continuer à apprendre. 

Aujourd’hui, nous avons trois couches de cadres pour les normes éthiques relatives à l’utilisation de l’IA générative. Les couches réglementaires nationales et supranationales sont à leur stade initial de développement. Le monde des politiques peut ne pas suivre le rythme du développement de la technologie émergente, mais nous pouvons déjà observer l’UE à la pointe avec la Proposition de l’UE sur la réglementation de l’IA et Le code de pratique de 2022 sur la désinformation qui détaille les attentes pour les grandes entreprises technologiques pour lutter contre la diffusion de contenus manipulés par l’IA. Aux niveaux nationaux, nous voyons les premiers pas réglementaires des États-Unis et du Royaume-Uni pour aborder le problème avec la Force opérationnelle nationale sur les deepfakes et la preuve numérique des États-Unis et la Loi sur la sécurité en ligne du Royaume-Uni. 

La couche de l’industrie technologique avance plus rapidement car les entreprises et les technologistes acceptent cette nouvelle réalité dans la mesure où elle concerne les technologies émergentes et leur impact sur la sécurité et la vie privée sociétales. Le dialogue sur l’éthique de l’IA générative est vibrant et a ouvert la voie au développement d’initiatives industrielles pour les codes de conduite sur l’utilisation de l’IA générative (par exemple, Le code de conduite de l’IA synthétique du partenariat sur l’IA) et les déclarations éthiques publiées par différentes entreprises. La question est, comment rendre la conduite pratique ? Et, sont-elles en mesure d’affecter les produits, les fonctionnalités spécifiques et les procédures des équipes ? 

Ayant travaillé sur ce problème avec un certain nombre de médias et de divertissement, de communautés de cybersécurité et d’éthique de l’IA, j’ai formulé quelques principes pratiques pour traiter le contenu et les voix de l’IA en particulier : 

  1. Les propriétaires de propriété intellectuelle et l’entreprise qui utilise la voix clonée peuvent éviter de nombreuses complications potentielles associées à l’utilisation de voix originales en signant des accords juridiques.
  2. Les propriétaires de projet doivent rendre public l’utilisation d’une voix clonée afin que les auditeurs ne soient pas induits en erreur.
  3. Les entreprises qui travaillent sur la technologie de l’IA pour la voix doivent allouer un pourcentage de ressources au développement de technologies capables de détecter et d’identifier le contenu généré par l’IA.
  4. L’étiquetage du contenu généré par l’IA avec des filigranes permet l’authentification de la voix.
  5. Chaque fournisseur de services d’IA doit examiner chaque projet de son impact (niveaux sociétaux, commerciaux et de confidentialité) avant d’accepter de travailler dessus.

Bien sûr, les principes de l’éthique dans l’IA n’affecteront pas la diffusion de faux contenus maison en ligne. Cependant, ils pousseront tous les projets dans la zone grise hors de portée du marché public.

En 2021-22, les voix de l’IA ont été utilisées dans différents projets de premier plan qui ont introduit d’importantes implications pour l’éthique et la société. Ceux-ci comprenaient le clonage de la voix de jeune Luke Skywalker pour la série Mandalorian, la voix de l’IA pour God of War 2, et la voix de Richard Nixon pour le discours historique « En cas de désastre lunaire ».

La confiance dans la technologie grandit au-delà des médias et du divertissement. Les entreprises traditionnelles de nombreux secteurs utilisent des voix clonées dans leurs projets. Voici quelques-uns des cas d’utilisation les plus importants.

Cas d’utilisation dans l’industrie

En 2023, le clonage de voix continuera de progresser aux côtés de diverses entreprises qui devraient en tirer de nombreux avantages. Des soins de santé et du marketing au service client et à l’industrie de la publicité, le clonage de voix révolutionne la façon dont les organisations construisent des relations avec leurs clients et rationalisent leurs flux de travail.

Le clonage de voix profite aux professionnels de la santé et aux travailleurs sociaux qui travaillent dans un environnement en ligne. Les avatars numériques dotés de la même voix que les professionnels de la santé favorisent des liens plus solides entre eux et leurs patients, renforçant la confiance et retenant les clients.

Les applications potentielles du clonage de voix dans l’industrie du cinéma et du divertissement sont vastes. Le doublage de contenus dans plusieurs langues, les dialogues supplémentaires pour les enfants et les adultes, ainsi que des options de personnalisation quasi infinies sont tous rendus possibles par cette technologie.

De même, dans le secteur des opérations, le clonage de voix à base d’IA peut produire d’excellents résultats pour les marques qui ont besoin de solutions rentables pour les systèmes de réponse vocale interactive ou les vidéos de formation d’entreprise. Avec la technologie de synthèse vocale, les acteurs peuvent étendre leur portée tout en augmentant leur capacité à gagner des redevances sur les enregistrements.

Enfin, dans les studios de production publicitaire, l’émergence du clonage de voix a considérablement réduit les coûts et le nombre d’heures associés à la production de publicités. Tant qu’il y a un enregistrement de haute qualité disponible pour le clonage (même à partir d’acteurs indisponibles), les publicités peuvent être produites rapidement et de manière plus créative que jamais auparavant.

Il est intéressant de noter que les entreprises et les PME peuvent tirer parti du clonage de voix pour créer quelque chose de unique pour leurs marques. Les grands projets peuvent réaliser leurs plans les plus ambitieux, tandis que les petites entreprises peuvent accéder à des modèles à grande échelle qui étaient auparavant inabordables. C’est ce que signifie vraiment la démocratisation.

Conclusion

Le clonage de voix de l’IA offre aux entreprises des avantages qui changent la donne, tels que la création d’expériences client uniques, l’intégration de capacités de traitement du langage naturel dans leurs produits et services, et la génération d’imitations de voix très précises qui semblent complètement réelles.

Les entreprises qui cherchent à maintenir leur avance concurrentielle en 2023 devraient examiner le clonage de voix de l’IA. Les entreprises peuvent utiliser cette technologie pour débloquer une variété de nouvelles possibilités pour gagner des parts de marché et retenir les clients tout en agissant de manière responsable sur le plan éthique.

Anna est responsable de l'éthique et des partenariats chez Respeecher, une technologie de clonage vocal primée aux Emmy basée en Ukraine. Anna est une ancienne conseillère en politique chez Reface, une application de média synthétique alimentée par l'IA et une co-fondatrice technique de l'outil de lutte contre la désinformation Cappture financé par le programme d'accélérateur Startup Wise Guys. Anna a 11 ans d'expérience dans les politiques, les technologies et la construction de résilience en matière de sécurité et de défense. Elle est une ancienne chercheuse au Centre international de défense et de sécurité de Tallinn et à l'Institut d'études de sécurité de Prague. Elle a également conseillé des grandes entreprises ukrainiennes sur la construction de la résilience dans le cadre de la force opérationnelle de la guerre hybride à l'École d'économie de Kyiv.