stomp Hoe generatieve AI-stemmen ethisch te gebruiken voor bedrijven in 2023 - Unite.AI
Verbind je met ons

Gedachte leiders

Hoe generatieve AI-stemmen ethisch te gebruiken voor bedrijven in 2023

mm
Bijgewerkt on

Het einde van 2022 kwam op de hielen van AI-technologieën die wijdverbreid werden toegepast vanwege de verbluffende populariteit van OpenAI en ChatGPT. Voor het eerst bereikte AI aantrekkingskracht op de massamarkt door het nut en de waarde ervan te bewijzen bij het creëren van succesvolle bedrijfsresultaten.

Veel AI-technologieën die in 2023 voor gewone mensen een revolutie lijken, worden al enkele jaren actief gebruikt door grote bedrijven en media. Ga met me mee als ik de technologie achter deze oplossingen nader bekijk, in het bijzonder generatieve AI-systemen voor het klonen van stemmen, de zakelijke voordelen ervan en ethische benaderingen van het gebruik van AI.

Hoe werkt het klonen van stemmen?

Kortom, met het klonen van stemmen kan een persoon spreken met de stem van een andere persoon.

Het maakt gebruik van generatieve AI-technologie om opnames van de stem van een persoon te maken en deze te gebruiken om nieuwe audio-inhoud te genereren met de stem van diezelfde persoon. Het stelt mensen in wezen in staat om te horen wat iemand zou hebben gezegd, zelfs als ze het zelf niet hebben gezegd.

Aan de technische kant lijken de dingen niet erg ingewikkeld te zijn. Maar als je wat dieper duikt, zijn er enkele minimale vereisten om aan de slag te gaan:

  1. U hebt ten minste 5 minuten opgenomen audio van hoge kwaliteit van de bronstem nodig om deze te klonen. Deze opnamen moeten helder zijn en vrij van achtergrondruis of andere vervormingen, aangezien onvolkomenheden de nauwkeurigheid van de uitvoer van het model kunnen beïnvloeden.
  2. Voer deze opnames daarna in een generatief AI-model om een ​​'stemavatar' te maken.
  3. Train vervolgens het model om spraakpatronen in toonhoogte en timing nauwkeurig te reproduceren.
  4. Eenmaal voltooid, kan dit getrainde model onbeperkte inhoud genereren met behulp van de bronstem van een andere persoon, en wordt het een effectief hulpmiddel voor het creëren van realistisch klinkende replicastemmen.

Dit is het punt waarop velen ethische zorgen uiten. Wat gebeurt er als we een willekeurige tekst in iemands mond kunnen stoppen en het onmogelijk is om te zeggen of die woorden echt of nep zijn?

Ja, deze mogelijkheid is allang werkelijkheid geworden. Net als bij OpenAI en ChatGPT worden we momenteel geconfronteerd met een aantal ethische kwesties die niet kunnen worden genegeerd.

Ethische normen in AI

Zoals met veel andere nieuwe technologieën in de beginfase van acceptatie, is de grootste bedreiging het creëren van een negatief stigma rond de technologie in plaats van de bedreigingen te erkennen als een bron voor discussie en waardevolle kennis. Wat belangrijk is, is het blootleggen van de methoden die kwaadwillenden gebruiken om de technologie en haar producten te misbruiken, mitigatietools toe te passen en door te gaan met leren. 

Vandaag hebben we drie lagen van kaders voor ethische normen met betrekking tot het gebruik van generatieve AI. De nationale en supranationale regelgevingslagen bevinden zich in de beginfase van ontwikkeling. De beleidswereld kan de snelheid van de ontwikkeling van opkomende technologie misschien niet bijhouden, maar we zien nu al dat de EU voorop loopt met de EU-voorstel over AI-verordening en De praktijkcode voor desinformatie uit 2022 dat schetst de verwachtingen van grote technologiebedrijven om de verspreiding van kwaadaardige, door AI gemanipuleerde inhoud aan te pakken. Op nationaal niveau zien we regelgevende eerste stappen van de VS en het VK om het probleem met de VS aan te pakken Nationale Deepfake en Digital Provenance Task Force en UK's Online veiligheidsrekening

De laag van de technische industrie gaat sneller naarmate bedrijven en technologen deze nieuwe realiteit accepteren met betrekking tot opkomende technologieën en hun impact op maatschappelijke veiligheid en privacy. De dialoog over de ethiek van generatieve AI is levendig en heeft geleid tot de ontwikkeling van branche-initiatieven voor gedragscodes rond het gebruik van generatieve AI (dwz De gedragscode voor partnerschap op het gebied van synthetische media voor synthetische media) en ethische verklaringen uitgegeven door verschillende bedrijven. De vraag is, hoe het gedrag praktisch te maken? En zijn ze in staat producten, specifieke kenmerken en de procedures van teams te beïnvloeden? 

Nadat ik aan dit probleem heb gewerkt met een aantal verschillende media- en entertainment-, cyberbeveiligings- en AI-ethiekgemeenschappen, heb ik een paar praktische principes geformuleerd voor het omgaan met AI-inhoud en stemmen in het bijzonder: 

  1. IP-eigenaren en het bedrijf dat de gekloonde stem gebruikt, kunnen veel van de mogelijke complicaties die gepaard gaan met het gebruik van originele stemmen vermijden door juridische overeenkomsten te ondertekenen.
  2. Projecteigenaren moeten het gebruik van een gekloonde stem openbaar maken, zodat luisteraars niet worden misleid.
  3. Bedrijven die werken aan AI-technologie voor spraak zouden een percentage van de middelen moeten toewijzen aan het ontwikkelen van technologie die door AI gegenereerde inhoud kan detecteren en identificeren.
  4. Het labelen van door AI gegenereerde inhoud met watermerken maakt spraakauthenticatie mogelijk.
  5. Elke AI-serviceprovider moet elk project beoordelen op de impact (maatschappelijk, zakelijk en privacyniveau) voordat hij ermee instemt eraan te werken.

Natuurlijk hebben de principes van ethiek in AI geen invloed op de verspreiding van zelfgemaakte deep fakes online. Ze zullen projecten in het grijs echter buiten het bereik van de openbare markt duwen.

In 2021-22 werden AI-stemmen gebruikt in verschillende reguliere projecten die grote implicaties voor ethiek en samenleving met zich meebrachten. Deze inbegrepen de stem van de jonge Luke Skywalker klonen voor de Mandalorian-serie, AI-stem voor God of War 2 en Richard Nixons stem voor het historische 'In Event of Moon Disaster'.

Het vertrouwen in technologie groeit verder dan media en entertainment. Traditionele bedrijven in vele sectoren gebruiken gekloonde stemmen in hun projecten. Hier zijn enkele van de meest prominente use-cases.

Gebruiksscenario's in de sector

In 2023 zal het klonen van stemmen blijven stijgen, samen met verschillende bedrijven die de vruchten zullen plukken. Van gezondheidszorg en marketing tot klantenservice en de advertentie-industrie, het klonen van stemmen zorgt voor een revolutie in de manier waarop organisaties relaties met hun klanten opbouwen en hun workflows stroomlijnen.

Het klonen van stemmen komt ten goede aan zorgprofessionals en maatschappelijk werkers die in een online omgeving werken. Digitale avatars met dezelfde stem als medische professionals bevorderen een sterkere band tussen hen en hun patiënten, wekken vertrouwen en behouden klanten.

De potentiële toepassingen van het klonen van stemmen in de film- en entertainmentindustrie zijn enorm. Het nasynchroniseren van inhoud in meerdere talen, aanvullende dialoogvervanging voor kinderen en volwassenen (ADR) en een bijna oneindige reeks aanpassingsopties worden allemaal mogelijk gemaakt door deze technologie.

Evenzo kan in de operationele sector AI-gestuurde spraakklonen uitstekende resultaten opleveren voor merken die behoefte hebben aan kostenefficiënte oplossingen voor interactieve spraakresponssystemen of trainingsvideo's voor bedrijven. Met stemsynthesetechnologie kunnen acteurs hun bereik vergroten en tegelijkertijd hun vermogen vergroten om restanten van opnames te verdienen.

Ten slotte heeft de opkomst van het klonen van stemmen in studio's voor reclameproductie ertoe bijgedragen dat de kosten en het aantal uren dat gepaard gaat met commerciële productie aanzienlijk zijn gedaald. Zolang er een opname van hoge kwaliteit beschikbaar is om te klonen (zelfs van niet-beschikbare acteurs), kunnen advertenties snel en creatiever dan ooit worden geproduceerd.

Interessant genoeg kunnen ondernemingen en het MKB profiteren van het klonen van stemmen om iets unieks voor hun merken te creëren. Grote projecten kunnen hun meest ambitieuze plannen realiseren, terwijl kleine bedrijven toegang hebben tot voorheen onbetaalbare schaalmodellen. Dat is wat echte democratisering betekent.

Afsluiten

AI-stemklonen biedt bedrijven baanbrekende voordelen, zoals het creëren van unieke klantervaringen, het integreren van natuurlijke taalverwerkingsmogelijkheden in hun producten en diensten, en het genereren van zeer nauwkeurige nabootsingen van stemmen die volkomen echt klinken.

Bedrijven die hun concurrentievoordeel in 2023 willen behouden, moeten kijken naar het klonen van AI-stemmen. Bedrijven kunnen deze technologie gebruiken om allerlei nieuwe mogelijkheden te ontsluiten om marktaandeel te winnen en klanten te behouden terwijl ze dit op een ethisch verantwoorde manier doen.

Anna is hoofd ethiek en partnerschappen bij Respeecher, een met een Emmy bekroonde technologie voor het klonen van stemmen in Oekraïne. Anna is een voormalig beleidsadviseur bij Reface, een door AI aangedreven synthetische media-app en een technische mede-oprichter van de anti-desinformatie-tool Cappture, gefinancierd door het Startup Wise Guys-acceleratorprogramma. Anna heeft 11 jaar ervaring op het gebied van veiligheids- en defensiebeleid, technologieën en het opbouwen van veerkracht. Ze is een voormalig Research Fellow bij het International Centre for Defence and Security in Tallinn en het Prague Security Studies Institute. Ze heeft ook grote Oekraïense bedrijven geadviseerd over het opbouwen van veerkracht als onderdeel van de Hybrid Warfare Task Force aan de Kyiv School of Economics.