stub Hur man använder generativa AI-röster etiskt för företag 2023 - Unite.AI
Anslut dig till vårt nätverk!

Tanke ledare

Hur man använder generativa AI-röster etiskt för företag 2023

mm
Uppdaterad on

Slutet av 2022 kom i hälarna på AI-tekniker som upplevde utbredd användning på grund av den fantastiska populariteten för OpenAI och ChatGPT. För första gången uppnådde AI massmarknadskraft genom att bevisa dess användbarhet och värde för att skapa framgångsrika affärsresultat.

Många AI-tekniker som verkar vara en revolution för vanliga människor 2023 har faktiskt använts aktivt av stora företag och media i flera år. Följ med mig när jag tittar närmare på tekniken som driver dessa lösningar, i synnerhet generativa AI-system för röstkloning, dess affärsfördelar och etiska tillvägagångssätt för att använda AI.

Hur fungerar röstkloning?

Kort sagt, röstkloning gör det möjligt för en person att tala med en annan persons röst.

Den använder generativ AI-teknik för att skapa inspelningar av en persons röst och använda dem för att generera nytt ljudinnehåll med samma persons röst. Det låter i princip människor höra vad någon skulle ha sagt, även om de inte sa det själva.

På den tekniska sidan verkar saker och ting inte vara särskilt komplicerade. Men om du dyker lite djupare finns det några minimikrav för att komma igång:

  1. Du behöver minst 5 minuter av högkvalitativt inspelat ljud av källrösten för att klona den. Dessa inspelningar bör vara tydliga och fria från bakgrundsbrus eller andra förvrängningar, eftersom eventuella brister kan påverka noggrannheten i modellens utdata.
  2. Efter det, mata in dessa inspelningar till en generativ AI-modell för att skapa en "röstavatar."
  3. Träna sedan modellen att exakt återge talmönster i tonhöjd och timing.
  4. När den är färdig kan den här tränade modellen generera obegränsat innehåll med hjälp av källrösten från vilken annan person som helst, och bli ett effektivt verktyg för att skapa realistiskt klingande replikaröster.

Detta är den punkt där många tar upp etiska problem. Vad händer när vi kan infoga vilken text som helst i en annan persons mun och det är omöjligt att avgöra om de orden är verkliga eller falska?

Ja, denna möjlighet har för länge sedan blivit verklighet. Precis som i fallet med OpenAI och ChatGPT, står vi för närvarande inför ett antal etiska frågor som inte kan ignoreras.

Etiska standarder inom AI

Som med många andra nya teknologier i deras inledande stadier av adoption, är det största hotet att skapa ett negativt stigma kring tekniken snarare än att erkänna hoten som en källa för diskussion och värdefull kunskap. Det som är viktigt är att avslöja metoderna som dåliga aktörer använder för att missbruka tekniken och dess produkter, tillämpa begränsningsverktyg och fortsätta lära sig. 

Idag har vi tre lager av ramverk för etiska standarder för användningen av generativ AI. De nationella och övernationella regleringsskikten befinner sig i sitt inledande utvecklingsskede. Politikvärlden kanske inte hänger med i hastigheten på utvecklingen av framväxande teknologi, men vi kan redan se att EU leder med EU-förslag om AI-förordning och 2022 års uppförandekod för desinformation som beskriver förväntningarna på stora teknikföretag att ta itu med spridningen av skadligt AI-manipulerat innehåll. På nationell nivå ser vi lagstadgade första steg från USA och Storbritannien för att ta itu med problemet med USA:s Nationell Deepfake and Digital Provenance Task Force och Storbritannien Online säkerhetsräkning

Teknikbranschens lager rör sig snabbare när företag och teknologer accepterar denna nya verklighet när det gäller framväxande teknologier och deras inverkan på samhällelig säkerhet och integritet. Dialogen om generativ AIs etik är levande och har lett vägen mot att utveckla branschinitiativ för uppförandekoder kring användningen av generativ AI (dvs. The Partnership on AI Synthetic Media Code of Conduct) och etiska uttalanden som släppts av olika företag. Frågan är hur man gör uppförandet praktiskt? Och kan de påverka produkter, specifika funktioner och teams procedurer? 

Efter att ha arbetat med detta problem med ett antal olika media- och underhållnings-, cybersäkerhets- och AI-etikgemenskaper har jag formulerat några praktiska principer för att hantera AI-innehåll och röster i synnerhet: 

  1. IP-ägare och företaget som använder den klonade rösten kan undvika många av de potentiella komplikationerna i samband med att använda originalröster genom att underteckna juridiska avtal.
  2. Projektägare bör offentligt avslöja användningen av en klonad röst så att lyssnarna inte blir vilseledda.
  3. Företag som arbetar med AI-teknik för röst bör allokera en procentandel av resurserna till att utveckla teknik som kan upptäcka och identifiera AI-genererat innehåll.
  4. Att märka AI-genererat innehåll med vattenstämplar möjliggör röstautentisering.
  5. Varje AI-tjänsteleverantör bör granska varje projekt av dess inverkan (samhälleliga, affärsmässiga och integritetsnivåer) innan de går med på att arbeta med det.

Naturligtvis kommer de etiska principerna inom AI inte att påverka spridningen av hemgjorda djupa förfalskningar online. Däremot kommer de att driva alla projekt i det grå utom räckhåll för den offentliga marknaden.

Under 2021-22 användes AI-röster i olika vanliga projekt som introducerade rejäla konsekvenser för etik och samhälle. Dessa inkluderade klona den unge Luke Skywalkers röst för Mandalorian-serien, AI-röst för God of War 2och Richard Nixons röst för det historiska "In Event of Moon Disaster".

Förtroendet för tekniken växer bortom media och underhållning. Traditionella företag inom många branscher använder klonade röster i sina projekt. Här är några av de mest framträdande användningsfallen.

Användningsfall för industrin

Under 2023 kommer röstkloning att fortsätta att öka tillsammans med olika företag som kommer att skörda dess många fördelar. Från sjukvård och marknadsföring till kundservice och reklambranschen revolutionerar röstkloning hur organisationer bygger relationer med sina kunder och effektiviserar sina arbetsflöden.

Röstkloning gynnar vårdpersonal och socialarbetare som arbetar i en onlinemiljö. Digitala avatarer med samma röst som läkare skapar starkare band mellan dem och deras patienter, höjer förtroendet och behåller kunderna.

De potentiella tillämpningarna för röstkloning inom film- och underhållningsindustrin är enorma. Dubbning av innehåll till flera språk, barn- och extradialogersättning för barn och vuxna (ADR) och en nästan oändlig mängd anpassningsalternativ är alla möjliga tack vare denna teknik.

På liknande sätt, inom operationssektorn, kan AI-driven röstkloning ge utmärkta resultat för varumärken som behöver kostnadseffektiva lösningar för interaktiva röstsvarssystem eller företagsutbildningsvideor. Med röstsyntesteknik kan skådespelare utöka sin räckvidd samtidigt som de ökar sin förmåga att tjäna rester från inspelningar.

Slutligen, i reklamproduktionsstudior har framväxten av röstkloning bidragit till att avsevärt minska kostnaderna och antalet timmar i samband med kommersiell produktion. Så länge det finns en högkvalitativ inspelning tillgänglig för kloning (även från otillgängliga skådespelare), kan annonser produceras snabbt och mer kreativt än någonsin tidigare.

Intressant nog kan företag och små och medelstora företag dra fördel av röstkloning för att skapa något unikt för sina varumärken. Stora projekt kan förverkliga sina mest ambitiösa planer, medan små företag kan få tillgång till tidigare kostsamma skalmodeller. Det är vad sann demokratisering innebär.

Inslagning upp

AI-röstkloning erbjuder företag spelförändrande fördelar som att skapa unika kundupplevelser, integrera naturliga språkbehandlingsfunktioner i sina produkter och tjänster och generera mycket exakta imitationer av röster som låter helt verkliga.

Företag som vill behålla sin konkurrensfördel 2023 bör undersöka AI-röstkloning. Företag kan använda denna teknik för att låsa upp en mängd nya möjligheter att vinna marknadsandelar och behålla kunder samtidigt som de gör det på ett etiskt ansvarsfullt sätt.

Anna är chef för etik och partnerskap på respekterare, en Emmy-belönad teknik för röstkloning baserad i Ukraina. Anna är en tidigare policyrådgivare på Reface, en AI-driven syntetisk medieapp och en teknisk medgrundare av verktyget mot desinformation Cappture som finansieras av acceleratorprogrammet Startup Wise Guys. Anna har 11 års erfarenhet av säkerhets- och försvarspolitik, teknik och motståndskraftsbyggande. Hon är tidigare forskare vid International Centre for Defense and Security i Tallinn och Prag Security Studies Institute. Hon har också ge råd till stora ukrainska företag om att bygga upp motståndskraft som en del av Hybrid Warfare Task Force vid Kyiv School of Economics.