Tankeledere
Hvordan bruke generative AI-stemmer etisk i bedrifter i 2023

Slutten av 2022 kom på hælene av AI-teknologier som opplevde vidstrakt tilpasning på grunn av den slående populariteten til OpenAI og ChatGPT. For første gang oppnådde AI massemarkedets appell ved å bevise sin nytte og verdi i å skape suksessfulle forretningsresultater.
Mange AI-teknologier som synes å være en revolusjon for vanlige mennesker i 2023, har faktisk vært i aktiv bruk av store bedrifter og media i flere år. Bli med meg mens jeg tar en nærmere titt på teknologien som driver disse løsningene, spesielt generative AI-systemer for stemme-kloning, dens forretningsfordeler og etiske tilnærminger til å bruke AI.
Hvordan fungerer stemme-kloning?
For å si det kort, gjør stemme-kloning det mulig for en person å snakke med en annen persons stemme.
Det bruker generative AI-teknologi til å lage opptak av en persons stemme og bruke dem til å generere ny lydinnhold med samme persons stemme. Det lar essensielt mennesker høre hva noen ville ha sagt, selv om de ikke sa det selv.
På den tekniske siden, ser ting ikke ut til å være svært kompliserte. Men hvis du dykker litt dyptere, er det noen minimumskrav for å komme i gang:
- Du trenger minst 5 minutter med høykvalitetsopptak av kildestemmen for å klonere den. Disse opptakene bør være klare og fri for bakgrunnsstøy eller andre forvrengninger, da eventuelle feil kan påvirke nøyaktigheten av modellens utdata.
- Deretter måler du disse opptakene inn i en generativ AI-modell for å lage en “stemme-avatarmodell”.
- Deretter trener du modellen til å gjenskape tale-mønster i tone og timing.
- Når dette er fullført, kan den trente modellen generere ubegrenset innhold med kildestemmen til en annen person, og bli et effektivt verktøy for å skape realistisk-lydende replika-stemmer.
Dette er punktet hvor mange reiser etiske bekymringer. Hva skjer når vi kan sette inn hvilken som helst tekst i en annen persons munn og det er umulig å si om disse ordene er ekte eller falske?
Ja, denne muligheten har lenge vært en realitet. Som i tilfelle med OpenAI og ChatGPT, står vi nå overfor en rekke etiske problemer som ikke kan ignoreres.
Etiske standarder i AI
Som med mange andre nye teknologier i deres innledende stadier av tilpasning, er den største trusselen å skape en negativ stigma rundt teknologien, i stedet for å anerkjenne truslene som en kilde til diskusjon og verdifull kunnskap. Hva som er viktig, er å avsløre metodene som dårlige aktører bruker til å misbruke teknologien og dens produkter, anvende mitigasjon-verktøy og fortsette å lære.
I dag har vi tre lag med rammer for etiske standarder i forhold til bruk av generative AI. De nasjonale og supranasjonale reguleringslagene er i deres innledende stadium av utvikling. Politikken kan ikke holde tritt med utviklingstakten til nye teknologier, men vi kan allerede observere EU som leder med EU-forslag om AI-regulering og 2022-kodeksen for praksis om desinformasjon som fastsetter forventningene til store teknologiselskaper for å takle spredningen av skadelig AI-manipulert innhold. På nasjonalt nivå ser vi reguleringens første skritt av USA og Storbritannia i å håndtere problemet med USAs Nasjonale Deepfake og Digital Provenance Task Force og Storbritannias Online Safety Bill.
Teknologibransjens lag beveger seg raskere, da selskaper og teknologer aksepterer denne nye virkeligheten som det gjelder nye teknologier og deres innvirkning på samfunnssikkerhet og personvern. Dialogen om etikken til generative AI er livlig og har ledet veien mot å utvikle bransje-initiativer for kodeks om bruk av generative AI (f.eks. The Partnership on AI Synthetic Media Code of Conduct) og etiske uttalelser utgitt av ulike selskaper. Spørsmålet er, hvordan kan vi gjøre oppførselen praktisk? Og, kan de påvirke produkter, spesifikke funksjoner og prosedyrer for team?
Etter å ha arbeidet med dette problemet med en rekke ulike medie- og underholdnings-, cybersikkerhets- og AI-etiske samfunn, har jeg formulert noen praktiske prinsipper for å håndtere AI-innhold og stemmer, spesielt:
- Eierne av IP og selskapet som bruker den klonede stemmen kan unngå mange av de potensielle komplikasjonene forbundet med å bruke originale stemmer ved å signere juridiske avtaler.
- Prosjekteierne bør offentliggjøre bruken av en klonet stemme, så lytterne ikke blir bedratt.
- Selskaper som arbeider med AI-teknologi for stemme, bør allokerer en prosentdel av ressurser til å utvikle teknologi som er i stand til å oppdage og identifisere AI-generert innhold.
- Merkning av AI-generert innhold med vannmerker muliggjør stemme-autentisering.
- Hver AI-tjeneste-leverandør bør gjennomgå hver prosjektets innvirkning (sosial, forretnings- og personvern-nivå) før de samtykker til å arbeide på det.
Selvfølgelig vil prinsippene for etikk i AI ikke påvirke spredningen av hjemmelagde deep fakes på nettet. Men de vil skyve alle prosjekter i gråsonen ut av rekkevidde for det offentlige markedet.
I 2021-22, ble AI-stemmer brukt i ulike mainstream-prosjekter som introduserte betydelige implikasjoner for etikk og samfunn. Disse inkluderte kloning av unge Luke Skywalkers stemme for Mandalorian-serien, AI-stemme for God of War 2 og Richard Nixons stemme for det historiske ‘In Event of Moon Disaster’.
Tilliten til teknologien vokser utover media og underholdning. Tradisjonelle bedrifter over mange bransjer bruker klonede stemmer i sine prosjekter. Her er noen av de mest fremtredende brukstilfellene.
Bransje-brukstilfeller
I 2023, vil stemme-kloning fortsette sin oppgang sammen med ulike bedrifter som skal høste dens tallrike fordeler. Fra helse og markedsføring til kundeservice og reklameindustrien, er stemme-kloning i ferd med å revolusjonere hvordan organisasjoner bygger relasjoner med sine kunder og strømlinjeformer sine arbeidsflyter.
Stemme-kloning gir fordeler for helsepersonell og sosialarbeidere som arbeider i en nettbasert miljø. Digitale avatarer med samme stemme som medisinske fagfolk fremmer sterkere bånd mellom dem og deres pasienter, øker tillit og beholder kunder.
De potensielle anvendelsene av stemme-kloning i film- og underholdningsindustrien er enorme. Dubbing av innhold til flere språk, barn og voksen tilleggsdialog-erstatning (ADR) og en nesten ubegrenset rekke av tilpasningsmuligheter er alle mulig med denne teknologien.
Tilsvarende, i operasjonssektoren, kan AI-drevet stemme-kloning gi utmerkede resultater for merker som trenger kostnadseffektive løsninger for interaktive tale-svar-systemer eller korporative opplæringsvideoer. Med stemme-synteseteknologi, kan skuespillere utvide sin rekkevidde og øke sin evne til å tjene royalties fra opptak.
Til slutt, i reklameproduksjonsstudioer, har fremveksten av stemme-kloning hjulpet betydelig til å redusere kostnadene og antall timer forbundet med reklameproduksjon. Så lenge det finnes en høykvalitetsopptak tilgjengelig for kloning (selv fra utilgjengelige skuespillere), kan reklamer produseres raskt og mer kreativt enn noensinne før.
Interessant nok, kan bedrifter og SMB-er dra nytte av stemme-kloning til å skape noe unikt for sine merker. Store prosjekter kan realisere sine mest ambisiøse planer, mens små bedrifter kan få tilgang til tidligere kostbare skalamodeller. Det er hva sant demokratisering betyr.
Avslutning
AI-stemme-kloning tilbyr bedrifter spill-endrende fordeler, som å skape unike kundeopplevelser, integrere naturlig språkbehandling i sine produkter og tjenester, og generere høyaktige etterligninger av stemmer som høres helt ekte ut.
Bedrifter som søker å opprettholde sin konkurransefordel i 2023, bør se på AI-stemme-kloning. Selskaper kan bruke denne teknologien til å låse opp en rekke nye muligheter til å vinne markedsshare og beholde kunder, samtidig som de gjør det på en etisk ansvarlig måte.












