Leader di pensiero
Come utilizzare le voci dell’AI generativa in modo etico per le aziende nel 2023

La fine del 2022 è arrivata all’indomani dell’adozione generalizzata delle tecnologie AI, grazie alla popolarità straordinaria di OpenAI e ChatGPT. Per la prima volta, l’AI ha raggiunto un appeal di massa dimostrando la sua utilità e il suo valore nella creazione di risultati aziendali di successo.
Molte tecnologie AI che sembrano una rivoluzione per le persone comuni nel 2023 sono in realtà già in uso attivo da parte di grandi aziende e media da diversi anni. Unitevi a me mentre prendo un’attenta visione della tecnologia che alimenta queste soluzioni, in particolare i sistemi di AI generativa per il cloning vocale, i suoi benefici per le aziende e gli approcci etici all’utilizzo dell’AI.
Come funziona il cloning vocale?
In breve, il cloning vocale consente a una persona di parlare con la voce di un’altra persona.
Utilizza la tecnologia AI generativa per creare registrazioni della voce di una persona e utilizzarle per generare nuovo contenuto audio con la stessa voce di quella persona. Consente essenzialmente alle persone di ascoltare cosa qualcuno avrebbe detto, anche se non l’ha detto loro stessi.
Sul lato tecnico, le cose non sembrano essere molto complicate. Ma se si scende un po’ più in profondità, ci sono alcuni requisiti minimi per iniziare:
- È necessario avere almeno 5 minuti di registrazione audio ad alta qualità della voce sorgente per clonarla. Queste registrazioni dovrebbero essere chiare e prive di rumore di fondo o altre distorsioni, poiché qualsiasi imperfezione potrebbe influire sull’accuratezza dell’output del modello.
- Dopo di che, alimentare queste registrazioni in un modello di AI generativa per creare un “avatar vocale”.
- Quindi, addestrare il modello per riprodurre con precisione i modelli di discorso in pitch e timing.
- Una volta completato, questo modello addestrato può generare contenuto illimitato utilizzando la voce sorgente di qualsiasi altra persona, diventando uno strumento efficace per creare voci replica che suonano realistiche.
Questo è il punto in cui molti sollevano preoccupazioni etiche. Cosa succede quando possiamo inserire qualsiasi testo nella bocca di un’altra persona e è impossibile dire se quelle parole sono reali o false?
Sì, questa possibilità è già diventata realtà. Come nel caso di OpenAI e ChatGPT, stiamo attualmente affrontando una serie di problemi etici che non possono essere ignorati.
Standard etici nell’AI
Come per molte altre tecnologie innovative nelle loro fasi iniziali di adozione, la minaccia principale è creare una stigma negativa attorno alla tecnologia piuttosto che riconoscere le minacce come una fonte di discussione e conoscenza preziosa. Quello che è importante è esporre i metodi che gli attori malintenzionati utilizzano per abusare della tecnologia e dei suoi prodotti, applicare strumenti di mitigazione e continuare a imparare.
Oggi abbiamo tre livelli di quadri per gli standard etici relativi all’utilizzo dell’AI generativa. I livelli di regolamentazione nazionale e sovranazionale sono nella loro fase iniziale di sviluppo. Il mondo della politica potrebbe non tenere il passo con la velocità di sviluppo della tecnologia emergente, ma possiamo già osservare l’UE che guida con la Proposta dell’UE sulla regolamentazione dell’AI e Il Codice di pratica del 2022 sulla disinformazione che delinea le aspettative per le grandi aziende tecnologiche per affrontare la diffusione di contenuti manipolati dall’AI. A livello nazionale, vediamo i primi passi regolamentari degli Stati Uniti e del Regno Unito nell’affrontare il problema con il Gruppo di lavoro nazionale sui deepfake e la provenienza digitale degli Stati Uniti e il Disegno di legge sulla sicurezza online del Regno Unito.
Il livello dell’industria tecnologica si sta muovendo più velocemente poiché le aziende e i tecnologi stanno accettando questa nuova realtà in quanto si riferisce alle tecnologie emergenti e al loro impatto sulla sicurezza e sulla privacy della società. Il dialogo sull’etica dell’AI generativa è vivace e ha guidato il cammino verso lo sviluppo di iniziative industriali per i Codici di condotta sull’utilizzo dell’AI generativa (ad es. Il Codice di condotta per i media sintetici della Partnership on AI) e dichiarazioni etiche rilasciate da diverse aziende. La domanda è, come rendere la condotta pratica? E, sono in grado di influenzare i prodotti, le funzionalità specifiche e le procedure dei team?
Avendo lavorato su questo problema con diverse comunità di media e intrattenimento, cybersecurity e etica dell’AI, ho formulato alcuni principi pratici per affrontare il contenuto e le voci dell’AI in particolare:
- I proprietari di IP e l’azienda che utilizza la voce clonata possono evitare molte delle potenziali complicazioni associate all’utilizzo di voci originali firmando accordi legali.
- I proprietari di progetto dovrebbero rendere pubblica l’utilizzo di una voce clonata in modo che gli ascoltatori non siano fuorviati.
- Le aziende che lavorano sulla tecnologia AI per la voce dovrebbero allocare una percentuale di risorse per sviluppare tecnologie in grado di rilevare e identificare contenuti generati dall’AI.
- L’etichettatura dei contenuti generati dall’AI con filigrane consente l’autenticazione vocale.
- Ogni fornitore di servizi AI dovrebbe esaminare ogni progetto del suo impatto (a livello sociale, aziendale e di privacy) prima di accettare di lavorarci.
Naturalmente, i principi dell’etica nell’AI non influenzeranno la diffusione di deep fake fatti in casa online. Tuttavia, spingeranno qualsiasi progetto nella zona grigia fuori dalla portata del mercato pubblico.
Nel 2021-22, le voci AI sono state utilizzate in diversi progetti mainstream che hanno introdotto implicazioni sostanziali per l’etica e la società. Tra questi, il cloning della voce di Luke Skywalker giovane per la serie The Mandalorian, la voce AI per God of War 2 e la voce di Richard Nixon per il discorso storico ‘In Event of Moon Disaster’.
La fiducia nella tecnologia sta crescendo oltre i media e l’intrattenimento. Le aziende tradizionali in molti settori stanno utilizzando voci clonate nei loro progetti. Ecco alcuni dei casi d’uso più prominenti.
Casi d’uso nell’industria
Nel 2023, il cloning vocale continuerà la sua ascesa insieme a diverse aziende pronte a raccogliere i suoi numerosi benefici. Dalla sanità e dal marketing al servizio clienti e all’industria pubblicitaria, il cloning vocale sta rivoluzionando il modo in cui le organizzazioni costruiscono relazioni con i loro clienti e ottimizzano i loro flussi di lavoro.
Il cloning vocale beneficia i professionisti sanitari e i lavoratori sociali che lavorano in un ambiente online. Gli avatar digitali con la stessa voce dei professionisti sanitari favoriscono legami più forti tra loro e i loro pazienti, aumentando la fiducia e mantenendo i clienti.
Le potenziali applicazioni del cloning vocale nell’industria cinematografica e dell’intrattenimento sono vastissime. La doppiatura di contenuti in più lingue, la sostituzione di dialoghi aggiuntivi per bambini e adulti e un’ampia gamma di opzioni di personalizzazione sono tutte rese possibili da questa tecnologia.
Allo stesso modo, nel settore operativo, il cloning vocale guidato dall’AI può produrre risultati eccellenti per i marchi che necessitano di soluzioni efficienti in termini di costi per i sistemi di risposta vocale interattiva o i video di formazione aziendale. Con la tecnologia di sintesi vocale, gli attori possono ampliare la loro portata e aumentare la loro capacità di guadagnare royalties dalle registrazioni.
Infine, negli studi di produzione pubblicitaria, l’emergere del cloning vocale ha aiutato a ridurre notevolmente i costi e il numero di ore associate alla produzione di spot pubblicitari. Finché c’è una registrazione ad alta qualità disponibile per il cloning (anche di attori non disponibili), gli spot possono essere prodotti rapidamente e in modo più creativo che mai.
È interessante notare che le imprese e le piccole e medie imprese possono trarre vantaggio dal cloning vocale per creare qualcosa di unico per i loro marchi. I grandi progetti possono realizzare i loro piani più ambiziosi, mentre le piccole aziende possono accedere a modelli di scala precedentemente proibitivi in termini di costi. Questo è ciò che significa vera democratizzazione.
Riepilogo
Il cloning vocale dell’AI offre alle aziende benefici che possono cambiare il gioco, come la creazione di esperienze clienti uniche, l’integrazione di capacità di elaborazione del linguaggio naturale nei loro prodotti e servizi e la generazione di impersonazioni di voci altamente accurate che suonano completamente reali.
Le aziende che cercano di mantenere il loro vantaggio competitivo nel 2023 dovrebbero esaminare il cloning vocale dell’AI. Le aziende possono utilizzare questa tecnologia per sbloccare una varietà di nuove possibilità per conquistare la quota di mercato e mantenere i clienti, facendolo in modo eticamente responsabile.












