Suivez nous sur

Comment utiliser les voix de l'IA générative de manière éthique pour les entreprises en 2023

Des leaders d'opinion

Comment utiliser les voix de l'IA générative de manière éthique pour les entreprises en 2023

mm

La fin de 2022 est arrivée dans la foulée des technologies d'IA qui ont été largement adoptées en raison de la popularité étonnante d'OpenAI et de ChatGPT. Pour la première fois, l'IA a atteint un attrait sur le marché de masse en prouvant son utilité et sa valeur dans la création de résultats commerciaux réussis.

De nombreuses technologies d'IA qui semblent être une révolution pour les gens ordinaires en 2023 sont en fait utilisées activement par les grandes entreprises et les médias depuis plusieurs années. Rejoignez-moi pour examiner de plus près la technologie qui alimente ces solutions, en particulier les systèmes d'IA générative pour le clonage de la voix, ses avantages commerciaux et les approches éthiques de l'utilisation de l'IA.

Comment fonctionne le clonage vocal ?

En bref, le clonage de la voix permet Ă  une personne de parler en utilisant la voix d'une autre personne.

Il utilise une technologie d'IA générative pour créer des enregistrements de la voix d'une personne et les utiliser pour générer du nouveau contenu audio avec cette même voix. Il permet ainsi d'entendre ce que quelqu'un aurait dit, même s'il ne l'a pas dit lui-même.

Côté technique, les choses ne semblent pas très compliquées. Mais si vous plongez un peu plus profondément, il y a quelques exigences minimales pour commencer :

  1. Vous avez besoin d'au moins 5 minutes d'enregistrement audio de haute qualité de la voix source pour la cloner. Ces enregistrements doivent être clairs et exempts de bruit de fond ou d'autres distorsions, car toute imperfection pourrait affecter la précision de la sortie du modèle.
  2. Ensuite, introduisez ces enregistrements dans un modèle d'IA gĂ©nĂ©ratif pour crĂ©er un « avatar vocal Â».
  3. Ensuite, entraînez le modèle à reproduire avec précision les modèles de parole en termes de hauteur et de synchronisation.
  4. Une fois terminé, ce modèle formé peut générer un contenu illimité en utilisant la voix source de toute autre personne, devenant ainsi un outil efficace pour créer des répliques de voix réalistes.

C'est lĂ  que beaucoup soulèvent des questions Ă©thiques. Que se passe-t-il lorsqu'on peut insĂ©rer n'importe quel texte dans la bouche d'une autre personne sans pouvoir dĂ©terminer si ces mots sont vrais ou faux ?

Oui, cette possibilité est depuis longtemps devenue une réalité. Comme dans le cas d'OpenAI et de ChatGPT, nous sommes actuellement confrontés à un certain nombre de problèmes éthiques qui ne peuvent être ignorés.

Normes éthiques en IA

Comme pour de nombreuses autres nouvelles technologies dans leurs premières Ă©tapes d'adoption, la principale menace est de crĂ©er une stigmatisation nĂ©gative autour de la technologie plutĂ´t que de reconnaĂ®tre les menaces comme une source de discussion et de connaissances prĂ©cieuses. Ce qui est important, c'est d'exposer les mĂ©thodes que les mauvais acteurs utilisent pour abuser de la technologie et de ses produits, appliquer des outils d'attĂ©nuation et continuer Ă  apprendre. 

Aujourd'hui, nous avons trois couches de cadres pour les normes éthiques relatives à l'utilisation de l'IA générative. Les couches réglementaires nationales et supranationales sont dans leur phase initiale de développement. Le monde politique ne suit peut-être pas la vitesse de développement des technologies émergentes, mais nous pouvons déjà observer l'UE en tête avec le Proposition de l'UE sur la réglementation de l'IA et Le code de bonnes pratiques 2022 sur la désinformation qui décrit les attentes des grandes entreprises technologiques pour lutter contre la diffusion de contenu malveillant manipulé par l'IA. Au niveau national, nous voyons les premières mesures réglementaires des États-Unis et du Royaume-Uni pour résoudre le problème avec les États-Unis Groupe de travail national Deepfake et provenance numérique et du Royaume-Uni Projet de loi sur la sécurité en ligne

La couche de l'industrie technologique Ă©volue plus rapidement Ă  mesure que les entreprises et les technologues acceptent cette nouvelle rĂ©alitĂ© en ce qui concerne les technologies Ă©mergentes et leur impact sur la sĂ©curitĂ© et la confidentialitĂ© de la sociĂ©tĂ©. Le dialogue sur l'Ă©thique de l'IA gĂ©nĂ©rative est dynamique et a ouvert la voie Ă  l'Ă©laboration d'initiatives industrielles pour des codes de conduite autour de l'utilisation de l'IA gĂ©nĂ©rative (c'est-Ă -dire Code de conduite sur les mĂ©dias synthĂ©tiques du Partenariat sur l'IA) et les dĂ©clarations Ă©thiques publiĂ©es par diffĂ©rentes entreprises. La question est, comment rendre la conduite pratique ? Et sont-ils capables d'affecter les produits, les fonctionnalitĂ©s spĂ©cifiques et les procĂ©dures des Ă©quipes ? 

Ayant travaillĂ© sur ce problème avec un certain nombre de communautĂ©s diffĂ©rentes de mĂ©dias et de divertissement, de cybersĂ©curitĂ© et d'Ă©thique de l'IA, j'ai formulĂ© quelques principes pratiques pour traiter le contenu et les voix de l'IA en particulier : 

  1. Les propriétaires de propriété intellectuelle et l'entreprise qui utilise la voix clonée peuvent éviter bon nombre des complications potentielles associées à l'utilisation de voix originales en signant des accords juridiques.
  2. Les propriétaires de projet doivent divulguer publiquement l'utilisation d'une voix clonée afin que les auditeurs ne soient pas induits en erreur.
  3. Les entreprises travaillant sur la technologie de l'IA pour la voix devraient allouer un pourcentage de leurs ressources au développement d'une technologie capable de détecter et d'identifier le contenu généré par l'IA.
  4. L'étiquetage du contenu généré par l'IA avec des filigranes permet l'authentification vocale.
  5. Chaque fournisseur de services d'IA doit examiner chaque projet de son impact (niveaux sociétal, commercial et de confidentialité) avant d'accepter d'y travailler.

Bien sûr, les principes éthiques de l'IA n'empêcheront pas la propagation de deep fakes artisanaux en ligne. Cependant, ils rendront tout projet en suspens inaccessible au marché public.

En 2021-22, les voix de l'IA ont Ă©tĂ© utilisĂ©es dans diffĂ©rents projets grand public qui ont introduit de lourdes implications pour l'Ă©thique et la sociĂ©tĂ©. Ceux-ci comprenaient clonage de la voix du jeune Luke Skywalker pour la sĂ©rie Mandalorian, Voix IA pour God of War 2bauen La voix de Richard Nixon pour l'historique « En cas de catastrophe lunaire Â».

La confiance dans la technologie se développe au-delà des médias et du divertissement. Les entreprises traditionnelles de nombreux secteurs utilisent des voix clonées dans leurs projets. Voici quelques-uns des cas d'utilisation les plus importants.

Cas d'utilisation de l'industrie

En 2023, le clonage de voix poursuivra son essor aux côtés de diverses entreprises prêtes à récolter ses nombreux avantages. De la santé et du marketing au service client et à l'industrie de la publicité, le clonage vocal révolutionne la façon dont les organisations établissent des relations avec leurs clients et rationalisent leurs flux de travail.

Le clonage de la voix profite aux professionnels de la santé et aux travailleurs sociaux qui travaillent dans un environnement en ligne. Les avatars numériques avec la même voix que les professionnels de la santé favorisent des liens plus forts entre eux et leurs patients, renforçant la confiance et fidélisant les clients.

Les applications potentielles du clonage de voix dans l'industrie du cinéma et du divertissement sont vastes. Le doublage de contenu dans plusieurs langues, le remplacement des dialogues supplémentaires pour les enfants et les adultes (ADR) et une gamme presque infinie d'options de personnalisation sont tous rendus possibles par cette technologie.

De même, dans le secteur des opérations, le clonage vocal basé sur l'IA peut donner d'excellents résultats pour les marques qui ont besoin de solutions rentables pour les systèmes de réponse vocale interactifs ou les vidéos de formation d'entreprise. Grâce à la technologie de synthèse vocale, les acteurs peuvent étendre leur portée tout en augmentant leur capacité à gagner des résidus à partir d'enregistrements.

Enfin, dans les studios de production publicitaire, l'émergence du clonage vocal a permis de réduire considérablement les coûts et le nombre d'heures nécessaires à la production commerciale. Dès lors qu'un enregistrement de haute qualité est disponible pour le clonage (même celui d'acteurs indisponibles), les publicités peuvent être produites plus rapidement et avec plus de créativité que jamais.

Il est intéressant de noter que les entreprises et les PME peuvent tirer parti du clonage vocal pour créer un produit unique pour leurs marques. Les grands projets peuvent concrétiser leurs projets les plus ambitieux, tandis que les petites entreprises peuvent accéder à des modèles réduits jusqu'alors prohibitifs. C'est ce que signifie la véritable démocratisation.

Emballage en place

Le clonage vocal IA offre aux entreprises des avantages révolutionnaires, tels que la création d'expériences client uniques, l'intégration de capacités de traitement du langage naturel dans leurs produits et services et la génération d'imitations très précises de voix qui semblent tout à fait réelles.

Les entreprises qui cherchent à maintenir leur avantage concurrentiel en 2023 devraient se pencher sur le clonage de voix par IA. Les entreprises peuvent utiliser cette technologie pour débloquer une variété de nouvelles possibilités pour gagner des parts de marché et fidéliser leurs clients tout en le faisant de manière éthiquement responsable.

Anna est responsable de l'éthique et des partenariats chez Respeecher, une technologie de clonage de voix récompensée par un Emmy et basée en Ukraine. Anna est une ancienne conseillère politique chez Reface, une application de médias synthétiques alimentée par l'IA et co-fondatrice technologique de l'outil de contre-désinformation Cappture financé par le programme d'accélération Startup Wise Guys. Anna a 11 ans d'expérience dans les politiques de sécurité et de défense, les technologies et le renforcement de la résilience. Elle a été chercheuse au Centre international pour la défense et la sécurité de Tallinn et à l'Institut d'études de sécurité de Prague. Elle a également conseillé de grandes entreprises ukrainiennes sur le renforcement de la résilience dans le cadre du groupe de travail sur la guerre hybride à la Kyiv School of Economics.