Leader di pensiero

Come utilizzare le voci generative AI in modo etico per le aziende nel 2023

Pubblicato il 31 gennaio 2023

Aggiornato il 23 maggio 2026

Anna Bulakh

La fine del 2022 è arrivata all’indomani dell’adozione generalizzata delle tecnologie AI, grazie alla popolarità straordinaria di OpenAI e ChatGPT. Per la prima volta, l’AI ha raggiunto un appeal di massa dimostrando la sua utilità e il suo valore nella creazione di risultati aziendali di successo.

Molte tecnologie AI che sembrano una rivoluzione per le persone comuni nel 2023 sono in realtà state utilizzate attivamente da grandi aziende e media per diversi anni. Unitevi a me mentre prendo uno sguardo più da vicino alla tecnologia che alimenta queste soluzioni, in particolare i sistemi di intelligenza artificiale generativa per la clonazione vocale, i suoi benefici aziendali e gli approcci etici all’utilizzo dell’AI.

Come funziona la clonazione vocale?

In breve, la clonazione vocale consente a una persona di parlare utilizzando la voce di un’altra persona.

Utilizza la tecnologia di intelligenza artificiale generativa per creare registrazioni della voce di una persona e utilizzarle per generare nuovo contenuto audio con la stessa voce di quella persona. Consente essenzialmente alle persone di ascoltare cosa qualcuno avrebbe detto, anche se non l’ha detto loro stessi.

Dal lato tecnico, le cose non sembrano essere molto complicate. Ma se si scende un po’ più in profondità, ci sono alcuni requisiti minimi per iniziare:

È necessario disporre di almeno 5 minuti di registrazione audio ad alta qualità della voce sorgente da clonare. Queste registrazioni dovrebbero essere chiare e prive di rumori di fondo o altre distorsioni, poiché qualsiasi imperfezione potrebbe influire sull’accuratezza dell’output del modello.
Dopo di che, alimentare queste registrazioni in un modello di intelligenza artificiale generativa per creare un “avatar vocale”.
Quindi, addestrare il modello per riprodurre con precisione i modelli di discorso in pitch e temporizzazione.
Una volta completato, questo modello addestrato può generare contenuto illimitato utilizzando la voce sorgente di qualsiasi altra persona, diventando uno strumento efficace per la creazione di voci replica realistici.

Questo è il punto in cui molti sollevano preoccupazioni etiche. Cosa succede quando possiamo inserire qualsiasi testo nella bocca di un’altra persona e non è possibile capire se quelle parole sono vere o false?

Sì, questa possibilità è ormai una realtà. Come nel caso di OpenAI e ChatGPT, ci troviamo attualmente di fronte a una serie di questioni etiche che non possono essere ignorate.

Standard etici nell’AI

Come per molte altre tecnologie innovative nelle loro fasi iniziali di adozione, la principale minaccia è creare una stigmatizzazione negativa intorno alla tecnologia piuttosto che riconoscere le minacce come una fonte di discussione e conoscenza preziosa. Ciò che è importante è esporre i metodi che gli attori malintenzionati utilizzano per abusare della tecnologia e dei suoi prodotti, applicare strumenti di mitigazione e continuare ad imparare.

Oggi abbiamo tre livelli di quadri per gli standard etici relativi all’utilizzo dell’intelligenza artificiale generativa. I livelli regolatori nazionali e sovranazionali sono nella loro fase iniziale di sviluppo. Il mondo della politica potrebbe non stare al passo con la velocità di sviluppo della tecnologia emergente, ma possiamo già osservare l’UE guidare con la Proposta dell’UE sulla regolamentazione dell’AI e Il Codice di pratica del 2022 sulla disinformazione che definisce le aspettative per le grandi aziende tecnologiche per affrontare la diffusione di contenuti manipolati dall’AI in modo malintenzionato. A livello nazionale, vediamo i primi passi regolatori degli Stati Uniti e del Regno Unito nell’affrontare la questione con il Gruppo di lavoro nazionale sulla contraffazione digitale e sulla provenienza degli Stati Uniti e il Disegno di legge sulla sicurezza online del Regno Unito.

Il livello dell’industria tecnologica si sta muovendo più velocemente poiché le aziende e i tecnologi stanno accettando questa nuova realtà in quanto si riferisce alle tecnologie emergenti e al loro impatto sulla sicurezza e sulla privacy della società. Il dialogo sull’etica dell’intelligenza artificiale generativa è vivace e ha guidato lo sviluppo di iniziative industriali per i codici di condotta sull’utilizzo dell’intelligenza artificiale generativa (ad es. Il codice di condotta del partenariato sull’AI per i media sintetici) e dichiarazioni etiche rilasciate da diverse aziende. La domanda è, come rendere la condotta pratica? E, sono in grado di influenzare prodotti, funzionalità specifiche e procedure di squadra?

Avendo lavorato su questo problema con diverse comunità di media ed intrattenimento, cybersecurity e etica dell’AI, ho formulato alcuni principi pratici per affrontare il contenuto e le voci dell’AI in particolare:

I proprietari di diritti e l’azienda che utilizza la voce clonata possono evitare molte delle potenziali complicazioni associate all’utilizzo di voci originali firmando accordi legali.
I proprietari di progetti dovrebbero rendere pubblica l’utilizzo di una voce clonata in modo che gli ascoltatori non siano fuorviati.
Le aziende che lavorano sulla tecnologia AI per la voce dovrebbero allocare una percentuale di risorse per lo sviluppo di tecnologie in grado di rilevare e identificare contenuti generati dall’AI.
L’etichettatura dei contenuti generati dall’AI con filigrane consente l’autenticazione della voce.
Ogni fornitore di servizi AI dovrebbe esaminare ogni progetto del suo impatto (livelli sociali, aziendali e di privacy) prima di accettare di lavorarci.

Naturalmente, i principi dell’etica nell’AI non influenzeranno la diffusione di deep fake fatti in casa online. Tuttavia, spingeranno qualsiasi progetto nella zona grigia fuori dalla portata del mercato pubblico.

Nel 2021-22, le voci AI sono state utilizzate in diversi progetti mainstream che hanno introdotto implicazioni sostanziali per l’etica e la società. Questi includevano la clonazione della voce di Luke Skywalker giovane per la serie The Mandalorian, la voce AI per God of War 2, e la voce di Richard Nixon per l’istorico ‘In Event of Moon Disaster’.

La fiducia nella tecnologia sta crescendo oltre i media e l’intrattenimento. Le aziende tradizionali in molti settori stanno utilizzando voci clonate nei loro progetti. Ecco alcuni dei casi d’uso più prominenti.

Casi d’uso aziendali

Nel 2023, la clonazione vocale continuerà a crescere insieme a diverse aziende pronte a raccoglierne i numerosi benefici. Dalla sanità al marketing, dal servizio clienti all’industria pubblicitaria, la clonazione vocale sta rivoluzionando il modo in cui le organizzazioni costruiscono relazioni con i loro clienti e ottimizzano i loro flussi di lavoro.

I professionisti sanitari e i lavoratori sociali che lavorano in un ambiente online traggono beneficio dalla clonazione vocale. Gli avatar digitali con la stessa voce dei professionisti sanitari favoriscono legami più forti tra loro e i loro pazienti, aumentando la fiducia e mantenendo i clienti.

Le potenziali applicazioni della clonazione vocale nell’industria cinematografica e dell’intrattenimento sono vaste. La doppiatura di contenuti in più lingue, la sostituzione di dialoghi aggiuntivi per bambini e adulti (ADR) e un’ampia gamma di opzioni di personalizzazione sono tutte rese possibili da questa tecnologia.

Allo stesso modo, nel settore operativo, la clonazione vocale guidata dall’AI può produrre risultati eccellenti per i marchi che hanno bisogno di soluzioni efficienti in termini di costi per i sistemi di risposta vocale interattiva o i video di formazione aziendale. Con la tecnologia di sintesi vocale, gli attori possono ampliare la loro portata e aumentare la loro capacità di guadagnare royalties dalle registrazioni.

Infine, negli studi di produzione pubblicitaria, l’emergere della clonazione vocale ha aiutato a ridurre notevolmente i costi e il numero di ore associati alla produzione di spot pubblicitari. Finché c’è una registrazione di alta qualità disponibile per la clonazione (anche di attori non disponibili), gli spot possono essere prodotti rapidamente e in modo più creativo che mai.

È interessante notare che le imprese e le PMI possono trarre vantaggio dalla clonazione vocale per creare qualcosa di unico per i loro marchi. I grandi progetti possono realizzare i loro piani più ambiziosi, mentre le piccole aziende possono accedere a modelli di scala precedentemente proibitivi in termini di costi. Questo è ciò che significa vera democratizzazione.

Riepilogo

La clonazione vocale AI offre alle aziende vantaggi che possono cambiare il gioco, come la creazione di esperienze clienti uniche, l’integrazione di capacità di elaborazione del linguaggio naturale nei loro prodotti e servizi e la generazione di impersonazioni di voci che suonano completamente reali.

Le aziende che cercano di mantenere il loro vantaggio competitivo nel 2023 dovrebbero esaminare la clonazione vocale AI. Le aziende possono utilizzare questa tecnologia per sbloccare una varietà di nuove possibilità per conquistare quote di mercato e mantenere i clienti, facendolo in modo eticamente responsabile.

Anna Bulakh

Anna è a capo dell'Etica e delle Partnership presso Respeecher, una tecnologia di clonazione vocale vincitrice di un Emmy con sede in Ucraina. Anna è un'ex consigliera politica presso Reface, un'app di media sintetica alimentata da intelligenza artificiale e co-fondatrice tecnica dello strumento di contrasto alle disinformazioni Cappture finanziato dal programma di accelerazione Startup Wise Guys. Anna ha 11 anni di esperienza nelle politiche di sicurezza e difesa, tecnologie e costruzione di resilienza. È un'ex fellow di ricerca presso il Centro internazionale per la difesa e la sicurezza di Tallinn e l'Istituto di studi sulla sicurezza di Praga. Ha anche consigliato importanti aziende ucraine sulla costruzione di resilienza come parte della Task Force sulla guerra ibrida presso la Scuola di economia di Kyiv.

Unite.AI

Come utilizzare le voci generative AI in modo etico per le aziende nel 2023

Come funziona la clonazione vocale?

Standard etici nell’AI

Casi d’uso aziendali

Riepilogo

Scopri di più