ciot Cum să utilizați vocile AI generative în mod etic pentru afaceri în 2023 - Unite.AI
Conectează-te cu noi

Liderii gândirii

Cum să utilizați vocile AI generative în mod etic pentru afaceri în 2023

mm
Actualizat on

Sfârșitul anului 2022 a venit în urma tehnologiilor AI care au cunoscut o adoptare pe scară largă datorită popularității uimitoare a OpenAI și ChatGPT. Pentru prima dată, AI a obținut atractivitate pe piața de masă, demonstrându-și utilitatea și valoarea în crearea rezultatelor de afaceri de succes.

Multe tehnologii AI care par a fi o revoluție pentru oamenii obișnuiți în 2023 au fost de fapt utilizate activ de marile companii și mass-media de câțiva ani. Vino alături de mine în timp ce arunc o privire mai atentă asupra tehnologiei care alimentează aceste soluții, în special, sistemele AI generative pentru clonarea vocii, beneficiile sale de afaceri și abordările etice ale utilizării AI.

Cum funcționează clonarea vocii?

Pe scurt, clonarea vocii permite unei persoane să vorbească folosind vocea altei persoane.

Utilizează tehnologia AI generativă pentru a crea înregistrări ale vocii unei persoane și le folosește pentru a genera conținut audio nou cu vocea aceleiași persoane. În esență, le permite oamenilor să audă ce ar fi spus cineva, chiar dacă ei nu au spus-o ei înșiși.

Din punct de vedere tehnic, lucrurile nu par a fi foarte complicate. Dar dacă vă scufundați puțin mai adânc, există câteva cerințe minime pentru a începe:

  1. Aveți nevoie de cel puțin 5 minute de înregistrare audio de înaltă calitate a vocii sursei pentru a o clona. Aceste înregistrări trebuie să fie clare și fără zgomot de fundal sau alte distorsiuni, deoarece orice imperfecțiuni ar putea afecta acuratețea rezultatului modelului.
  2. După aceea, introduceți aceste înregistrări într-un model AI generativ pentru a crea un „avatar vocal”.
  3. Apoi, antrenați modelul să reproducă cu acuratețe modelele de vorbire în ton și sincronizare.
  4. Odată finalizat, acest model antrenat poate genera conținut nelimitat folosind vocea sursă a oricărei alte persoane, devenind un instrument eficient pentru a crea voci replici cu sunet realist.

Acesta este punctul în care mulți își ridică preocupări etice. Ce se întâmplă când putem introduce orice text în gura unei alte persoane și este imposibil să spunem dacă acele cuvinte sunt reale sau false?

Da, această posibilitate a devenit de mult o realitate. Ca și în cazul OpenAI și ChatGPT, în prezent ne confruntăm cu o serie de probleme etice care nu pot fi ignorate.

Standarde etice în IA

Ca și în cazul multor alte tehnologii noi în stadiile inițiale de adoptare, principala amenințare este crearea unui stigmat negativ în jurul tehnologiei, mai degrabă decât recunoașterea amenințărilor ca sursă de discuții și cunoștințe valoroase. Ceea ce este important este dezvăluirea metodelor pe care actorii răi le folosesc pentru a abuza de tehnologie și de produsele acesteia, de a aplica instrumente de atenuare și de a continua să învețe. 

Astăzi avem trei straturi de cadre pentru standardele etice referitoare la utilizarea IA generativă. Nivelurile de reglementare naționale și supranaționale sunt în stadiul inițial de dezvoltare. Este posibil ca lumea politicilor să nu țină pasul cu viteza de dezvoltare a tehnologiei emergente, dar putem observa deja că UE conduce cu Propunerea UE privind regulamentul AI și Codul de practici privind dezinformarea din 2022 care subliniază așteptările pentru marile companii tehnologice de a aborda diseminarea conținutului manipulat AI rău intenționat. La nivel național, vedem primii pași de reglementare din partea SUA și Regatul Unit în abordarea problemei cu Grupul operativ național de deepfake și proveniență digitală și Marea Britanie Proiectul de lege privind siguranța online

Nivelul industriei tehnologice se mișcă mai rapid pe măsură ce companiile și tehnologii acceptă această nouă realitate în ceea ce privește tehnologiile emergente și impactul acestora asupra securității și confidențialității societății. Dialogul privind etica IA generativă este vibrant și a condus la dezvoltarea inițiativelor din industrie pentru coduri de conduită în jurul utilizării AI generative (de exemplu Codul de conduită al parteneriatului pentru AI sintetice media) și declarații etice emise de diferite companii. Întrebarea este cum să facem comportamentul practic? Și sunt capabili să afecteze produsele, caracteristicile specifice și procedurile echipelor? 

După ce am lucrat la această problemă cu o serie de diferite comunități media și de divertisment, securitate cibernetică și etică AI, am formulat câteva principii practice pentru a trata conținutul și vocile AI în special: 

  1. Proprietarii de IP și compania care utilizează vocea clonată pot evita multe dintre potențialele complicații asociate cu utilizarea vocilor originale prin semnarea acordurilor legale.
  2. Proprietarii de proiecte ar trebui să dezvăluie public utilizarea unei voci clonate, astfel încât ascultătorii să nu fie induși în eroare.
  3. Companiile care lucrează la tehnologia AI pentru voce ar trebui să aloce un procent din resurse dezvoltării unei tehnologii capabile să detecteze și să identifice conținutul generat de AI.
  4. Etichetarea conținutului generat de AI cu filigrane permite autentificarea vocală.
  5. Fiecare furnizor de servicii de inteligență artificială ar trebui să revizuiască fiecare proiect cu privire la impactul său (nivelul societal, al afacerilor și al confidențialității) înainte de a accepta să lucreze la el.

Desigur, principiile eticii în inteligența artificială nu vor afecta răspândirea online a falsurilor profunde făcute în casă. Cu toate acestea, ei vor împinge orice proiecte în gri la îndemâna pieței publice.

În 2021-22, vocile AI au fost folosite în diferite proiecte principale care au introdus implicații importante pentru etică și societate. Acestea au inclus clonând vocea tânărului Luke Skywalker pentru seria Mandalorian, Voce AI pentru God of War 2, și Vocea lui Richard Nixon pentru istoricul „In Event of Moon Disaster”.

Încrederea în tehnologie crește dincolo de media și divertisment. Afacerile tradiționale din multe industrii folosesc voci clonate în proiectele lor. Iată câteva dintre cele mai importante cazuri de utilizare.

Cazuri de utilizare în industrie

În 2023, clonarea vocii își va continua ascensiunea alături de diverse companii care vor beneficia de numeroasele sale beneficii. De la asistență medicală și marketing la servicii pentru clienți și industria de publicitate, clonarea vocii revoluționează modul în care organizațiile își construiesc relații cu clienții și își simplifică fluxurile de lucru.

Clonarea vocii aduce beneficii profesioniștilor din domeniul sănătății și asistenților sociali care lucrează într-un mediu online. Avatarurile digitale care prezintă aceeași voce ca profesioniștii din domeniul medical promovează legături mai puternice între aceștia și pacienții lor, sporind încrederea și păstrând clienții.

Aplicațiile potențiale ale clonării vocii în industria filmului și a divertismentului sunt vaste. Dublarea conținutului în mai multe limbi, înlocuirea dialogului suplimentar pentru copii și adulți (ADR) și o gamă aproape infinită de opțiuni de personalizare sunt toate posibile de această tehnologie.

În mod similar, în sectorul operațiunilor, clonarea vocii bazată pe inteligență artificială poate oferi rezultate excelente pentru mărcile care au nevoie de soluții eficiente din punct de vedere al costurilor pentru sisteme interactive de răspuns vocal sau videoclipuri de formare corporativă. Cu tehnologia de sinteză a vocii, actorii își pot extinde acoperirea în timp ce își măresc capacitatea de a câștiga reziduuri din înregistrări.

În cele din urmă, în studiourile de producție publicitară, apariția clonării vocii a contribuit la reducerea semnificativă a costurilor și a numărului de ore asociate producției comerciale. Atâta timp cât există o înregistrare de înaltă calitate disponibilă pentru clonare (chiar și de la actori indisponibili), reclamele pot fi produse rapid și mai creativ decât oricând.

Destul de interesant, întreprinderile și IMM-urile pot profita de clonarea vocii pentru a crea ceva unic pentru mărcile lor. Proiectele mari își pot realiza cele mai ambițioase planuri, în timp ce întreprinderile mici pot accesa modele la scară anterior cu costuri prohibitive. Asta înseamnă adevărata democratizare.

La finalul

Clonarea vocii cu inteligență artificială oferă companiilor beneficii care schimbă jocul, cum ar fi crearea de experiențe unice pentru clienți, integrarea capabilităților de procesare a limbajului natural în produsele și serviciile lor și generarea de imitații foarte precise ale vocilor care sună complet reale.

Companiile care doresc să-și mențină avantajul competitiv în 2023 ar trebui să se uite la clonarea vocii AI. Companiile pot folosi această tehnologie pentru a debloca o varietate de noi posibilități de a câștiga cote de piață și de a păstra clienții, făcând acest lucru într-un mod responsabil din punct de vedere etic.

Anna este șeful departamentului de etică și parteneriate la Vorbitor, o tehnologie de clonare a vocii premiată de Emmy cu sediul în Ucraina. Anna este fostă consilieră de politici la Reface, o aplicație media sintetică alimentată cu inteligență artificială și co-fondatoare tehnologică a instrumentului de contra dezinformare Cappture, finanțat de programul de accelerare Startup Wise Guys. Anna are 11 ani de experiență în politici de securitate și apărare, tehnologii și consolidarea rezistenței. Este fostă cercetătoare la Centrul Internațional pentru Apărare și Securitate din Tallinn și Institutul de Studii de Securitate din Praga. De asemenea, ea a consiliat mari companii ucrainene cu privire la construirea rezilienței, ca parte a Grupului operativ de război hibrid de la Școala de Economie din Kiev.