Thought leaders
Hoe Generatieve AI-Stemmen Ethisch te Gebruiken voor Bedrijven in 2023

Het einde van 2022 kwam op de hielen van AI-technologieën die breed werden geadopteerd vanwege de verbluffende populariteit van OpenAI en ChatGPT. Voor het eerst bereikte AI een massamarkt door zijn nut en waarde te bewijzen bij het creëren van succesvolle bedrijfsresultaten.
Veel AI-technologieën die voor gewone mensen in 2023 een revolutie lijken, zijn eigenlijk al enkele jaren actief gebruikt door grote bedrijven en media. Sluit je bij me aan als ik een nadere blik werp op de technologie achter deze oplossingen, met name generatieve AI-systemen voor stemkloning, de voordelen voor bedrijven en ethische benaderingen voor het gebruik van AI.
Hoe werkt stemkloning?
Kort gezegd, stemkloning stelt één persoon in staat om te spreken met de stem van een andere persoon.
Het gebruikt generatieve AI-technologie om opnames van iemands stem te maken en deze te gebruiken om nieuwe audio-inhoud te genereren met dezelfde stem. Het stelt mensen in staat om te horen wat iemand zou hebben gezegd, zelfs als ze het zelf niet hebben gezegd.
Aan de technische kant lijken de dingen niet zo ingewikkeld. Maar als je een beetje dieper duikt, zijn er enkele minimale vereisten om te beginnen:
- Je hebt minstens 5 minuten hoogwaardige opgenomen audio van de bronstem nodig om deze te klonen. Deze opnames moeten helder zijn en vrij van achtergrondruis of andere storingen, omdat eventuele imperfecties de nauwkeurigheid van de uitvoer van het model kunnen beïnvloeden.
- Daarna voer je deze opnames in een generatief AI-model in om een “stemavatar” te maken.
- Vervolgens train je het model om spraakpatronen in toonhoogte en timing nauwkeurig te reproduceren.
- Zodra dit is voltooid, kan het getrainde model onbeperkte inhoud genereren met de bronstem van elke andere persoon, waardoor het een effectief hulpmiddel wordt voor het maken van realistisch klinkende replica-stemmen.
Dit is het punt waarop veel mensen ethische bezwaren aanvoeren. Wat gebeurt er als we elke tekst in de mond van een andere persoon kunnen stoppen en het onmogelijk is om te bepalen of die woorden echt of nep zijn?
Ja, deze mogelijkheid is al lang realiteit. Net als in het geval van OpenAI en ChatGPT, worden we momenteel geconfronteerd met een aantal ethische problemen die niet genegeerd kunnen worden.
Ethische normen in AI
Net als bij veel andere nieuwe technologieën in hun eerste fasen van adoptie, is de belangrijkste bedreiging het creëren van een negatieve stigma rond de technologie, in plaats van de bedreigingen te erkennen als een bron voor discussie en waardevolle kennis. Wat belangrijk is, is het blootleggen van de methoden die slechte actoren gebruiken om de technologie en haar producten te misbruiken, mitigatiemiddelen toepassen en blijven leren.
Vandaag hebben we drie lagen van kaders voor ethische normen met betrekking tot het gebruik van generatieve AI. De nationale en bovennationale regelgevende lagen zijn in hun eerste stadium van ontwikkeling. De beleidsmakers kunnen de snelheid van ontwikkeling van opkomende technologie niet bijhouden, maar we kunnen al zien dat de EU de leiding neemt met de EU-voorstel voor AI-regulering en De 2022-Code van praktijk voor desinformatie die de verwachtingen uiteenzet voor grote technologiebedrijven om de verspreiding van kwaadwillige AI-gemanipuleerde inhoud aan te pakken. Op nationaal niveau zien we de eerste regelgevingsstappen door de VS en het VK om het probleem aan te pakken met de National Deepfake and Digital Provenance Task Force en het Online Safety Bill.
De laag van de technologie-industrie beweegt zich sneller, omdat bedrijven en technologieën deze nieuwe realiteit accepteren zoals deze zich verhoudt tot opkomende technologieën en hun impact op de veiligheid en privacy van de samenleving. Het gesprek over de ethiek van generatieve AI is levendig en heeft de weg vrijgemaakt voor het ontwikkelen van industrie-initiatieven voor codes van gedrag met betrekking tot het gebruik van generatieve AI (bijv. De Partnership on AI Synthetic Media Code of Conduct) en ethische verklaringen die zijn uitgegeven door verschillende bedrijven. De vraag is, hoe maak je het gedrag praktisch? En, zijn ze in staat om producten, specifieke functies en procedures van teams te beïnvloeden?
Ik heb, na aan dit probleem te hebben gewerkt met een aantal verschillende media- en entertainment-, cybersecurity- en AI-ethiek-gemeenschappen, een aantal praktische principes geformuleerd voor het omgaan met AI-inhoud en -stemmen in het bijzonder:
- IP-eigenaren en het bedrijf dat de gekloonde stem gebruikt, kunnen veel van de potentiële complicaties die verband houden met het gebruik van originele stemmen vermijden door juridische overeenkomsten te ondertekenen.
- Projecteigenaren moeten het gebruik van een gekloonde stem openbaar maken, zodat luisteraars niet worden misleid.
- Bedrijven die werken aan AI-technologie voor stemmen, moeten een percentage van hun middelen toewijzen aan het ontwikkelen van technologie die in staat is om AI-gegenereerde inhoud te detecteren en te identificeren.
- Het labelen van AI-gegenereerde inhoud met watermerken maakt stemverificatie mogelijk.
- Elke AI-serviceprovider moet elk project van zijn impact (op sociaal, bedrijfs- en privacy-niveau) beoordelen voordat hij ermee instemt te werken.
Natuurlijk zullen de principes van ethiek in AI de verspreiding van zelfgemaakte diepe vervalsingen online niet beïnvloeden. Echter, ze zullen alle projecten in het grijs buiten het bereik van de openbare markt duwen.
In 2021-22 werden AI-stemmen gebruikt in verschillende mainstream-projecten die forse implicaties hadden voor ethiek en samenleving. Deze omvatten het klonen van de stem van jonge Luke Skywalker voor de serie The Mandalorian, AI-stem voor God of War 2, en de stem van Richard Nixon voor de historische ‘In Event of Moon Disaster’.
Het vertrouwen in technologie groeit verder dan media en entertainment. Traditionele bedrijven in veel branches gebruiken gekloonde stemmen in hun projecten. Hier zijn enkele van de meest prominente use cases.
Branchetoepassingen
In 2023 zal stemkloning zijn opkomst voortzetten, samen met verschillende bedrijven die zijn talrijke voordelen zullen plukken. Van zorg en marketing tot klantenservice en de reclame-industrie, verandert stemkloning de manier waarop organisaties relaties opbouwen met hun klanten en hun workflows stroomlijnen.
Stemkloning heeft voordelen voor zorgverleners en sociaal werkers die in een online omgeving werken. Digitale avatars met dezelfde stem als medische professionals versterken de banden tussen hen en hun patiënten, waardoor vertrouwen wordt gewonnen en klanten worden behouden.
De potentiële toepassingen van stemkloning in de film- en entertainmentindustrie zijn uitgebreid. Het nasynchroniseren van inhoud in meerdere talen, kinderen en volwassenen die extra dialoog vervangen (ADR), en een bijna oneindig aantal aanpassingsmogelijkheden zijn allemaal mogelijk gemaakt door deze technologie.
Evenzo kan AI-gestuurde stemkloning in de operationele sector uitstekende resultaten opleveren voor merken die efficiënte oplossingen nodig hebben voor interactieve spraakrespons-systemen of bedrijfsvideo’s. Met stem-synthesetechnologie kunnen acteurs hun bereik uitbreiden en hun vermogen om royalty’s te verdienen van opnames vergroten.
Ten slotte heeft de opkomst van stemkloning in reclameproductiestudio’s geholpen om de kosten en het aantal uren dat nodig is voor commerciële productie aanzienlijk te verlagen. Zolang er een hoogwaardige opname beschikbaar is voor kloning (zelfs van onbeschikbare acteurs), kunnen reclameboodschappen snel en creatiever dan ooit tevoren worden geproduceerd.
Interessant genoeg kunnen ondernemingen en kleine en middelgrote ondernemingen profiteren van stemkloning om iets unieks voor hun merken te creëren. Grote projecten kunnen hun meest ambitieuze plannen realiseren, terwijl kleine bedrijven toegang krijgen tot eerder onbetaalbare schaalmodellen. Dat is wat echte democratisering betekent.
Samenvatting
AI-stemkloning biedt bedrijven baanbrekende voordelen, zoals het creëren van unieke klantervaringen, het integreren van natuurlijke taalverwerking in hun producten en diensten, en het genereren van zeer nauwkeurige imitaties van stemmen die volledig echt klinken.
Bedrijven die hun concurrentievoordeel in 2023 willen behouden, moeten naar AI-stemkloning kijken. Bedrijven kunnen deze technologie gebruiken om een verscheidenheid aan nieuwe mogelijkheden te ontgrendelen om marktaandeel te winnen en klanten te behouden, terwijl ze dit op een ethisch verantwoorde manier doen.












