mozzicone Come utilizzare le voci dell'IA generativa in modo etico per le aziende nel 2023 - Unite.AI
Seguici sui social

Leader del pensiero

Come utilizzare eticamente le voci dell'IA generativa per le aziende nel 2023

mm
aggiornato on

La fine del 2022 è arrivata sulla scia delle tecnologie AI che hanno subito un'adozione diffusa grazie alla straordinaria popolarità di OpenAI e ChatGPT. Per la prima volta, l'intelligenza artificiale ha raggiunto l'attrattiva del mercato di massa dimostrando la sua utilità e il suo valore nella creazione di risultati aziendali di successo.

Molte tecnologie di intelligenza artificiale che sembrano una rivoluzione per le persone comuni nel 2023 sono in realtà utilizzate attivamente da grandi aziende e media da diversi anni. Unisciti a me mentre esamino più da vicino la tecnologia alla base di queste soluzioni, in particolare i sistemi di intelligenza artificiale generativa per la clonazione vocale, i suoi vantaggi aziendali e gli approcci etici all'utilizzo dell'IA.

Come funziona la clonazione vocale?

In breve, la clonazione vocale consente a una persona di parlare utilizzando la voce di un'altra persona.

Utilizza la tecnologia di intelligenza artificiale generativa per creare registrazioni della voce di una persona e utilizzarle per generare nuovi contenuti audio con la voce di quella stessa persona. In sostanza, consente alle persone di ascoltare ciò che qualcuno avrebbe detto, anche se non l'avessero detto loro stessi.

Dal punto di vista tecnico, le cose non sembrano essere molto complicate. Ma se ti immergi un po' più a fondo, ci sono alcuni requisiti minimi per iniziare:

  1. Sono necessari almeno 5 minuti di audio registrato di alta qualità della voce sorgente per clonarla. Queste registrazioni devono essere chiare e prive di rumore di fondo o altre distorsioni, in quanto eventuali imperfezioni potrebbero influire sulla precisione dell'output del modello.
  2. Successivamente, inserisci queste registrazioni in un modello di intelligenza artificiale generativa per creare un "avatar vocale".
  3. Quindi, addestra il modello per riprodurre accuratamente i modelli vocali in tono e tempo.
  4. Una volta completato, questo modello addestrato può generare contenuti illimitati utilizzando la voce sorgente di qualsiasi altra persona, diventando uno strumento efficace per creare voci di replica dal suono realistico.

Questo è il punto in cui molti sollevano preoccupazioni etiche. Cosa succede quando possiamo inserire qualsiasi testo nella bocca di un'altra persona ed è impossibile dire se quelle parole sono vere o false?

Sì, questa possibilità è diventata da tempo una realtà. Come nel caso di OpenAI e ChatGPT, attualmente stiamo affrontando una serie di questioni etiche che non possono essere ignorate.

Standard etici nell'IA

Come per molte altre nuove tecnologie nelle loro fasi iniziali di adozione, la minaccia principale è creare uno stigma negativo attorno alla tecnologia piuttosto che riconoscere le minacce come fonte di discussione e conoscenza preziosa. Ciò che è importante è esporre i metodi utilizzati dai malintenzionati per abusare della tecnologia e dei suoi prodotti, applicare strumenti di mitigazione e continuare a imparare. 

Oggi abbiamo tre livelli di framework per gli standard etici relativi all'uso dell'IA generativa. Gli strati normativi nazionali e sovranazionali sono nella loro fase iniziale di sviluppo. Il mondo della politica potrebbe non tenere il passo con la velocità di sviluppo della tecnologia emergente, ma possiamo già osservare l'UE in testa con il Proposta dell'UE sul regolamento sull'IA ed Il Codice di condotta 2022 sulla disinformazione che delinea le aspettative per le grandi aziende tecnologiche per affrontare la diffusione di contenuti manipolati dall'IA dannosi. A livello nazionale, vediamo i primi passi normativi da parte degli Stati Uniti e del Regno Unito nell'affrontare il problema con gli Stati Uniti Task force nazionale per il deepfake e la provenienza digitale e del Regno Unito Bolletta di sicurezza online

Il livello dell'industria tecnologica si sta muovendo più velocemente poiché le aziende e i tecnologi stanno accettando questa nuova realtà in quanto riguarda le tecnologie emergenti e il loro impatto sulla sicurezza e sulla privacy della società. Il dialogo sull'etica dell'IA generativa è vivace e ha aperto la strada allo sviluppo di iniziative del settore per i codici di condotta sull'uso dell'IA generativa (ad es. Codice di condotta della partnership sull'IA per i media sintetici) e dichiarazioni etiche rilasciate da diverse aziende. La domanda è: come rendere pratica la condotta? E sono in grado di influenzare i prodotti, le caratteristiche specifiche e le procedure dei team? 

Avendo lavorato su questo problema con una serie di diverse comunità di media e intrattenimento, sicurezza informatica e etica dell'IA, ho formulato alcuni principi pratici per trattare in particolare i contenuti e le voci dell'IA: 

  1. I proprietari di IP e l'azienda che utilizza la voce clonata possono evitare molte delle potenziali complicazioni associate all'utilizzo di voci originali firmando accordi legali.
  2. I proprietari del progetto dovrebbero divulgare pubblicamente l'uso di una voce clonata in modo che gli ascoltatori non vengano fuorviati.
  3. Le aziende che lavorano sulla tecnologia IA per la voce dovrebbero destinare una percentuale delle risorse allo sviluppo di una tecnologia in grado di rilevare e identificare i contenuti generati dall'IA.
  4. L'etichettatura dei contenuti generati dall'intelligenza artificiale con filigrane consente l'autenticazione vocale.
  5. Ogni fornitore di servizi di intelligenza artificiale dovrebbe esaminare ogni progetto in merito al suo impatto (a livello di società, business e privacy) prima di accettare di lavorarci.

Naturalmente, i principi etici dell'intelligenza artificiale non influiranno sulla diffusione di deep fake fatti in casa online. Tuttavia, spingeranno tutti i progetti nel grigio fuori dalla portata del mercato pubblico.

Nel 2021-22, le voci AI sono state utilizzate in diversi progetti tradizionali che hanno introdotto pesanti implicazioni per l'etica e la società. Questi inclusi clonando la voce del giovane Luke Skywalker per la serie Mandaloriana, Voce AI per God of War 2e La voce di Richard Nixon per la storica 'In Event of Moon Disaster'.

La fiducia nella tecnologia sta crescendo oltre i media e l'intrattenimento. Le aziende tradizionali in molti settori utilizzano voci clonate nei loro progetti. Ecco alcuni dei casi d'uso più importanti.

Casi d'uso del settore

Nel 2023, la clonazione vocale continuerà la sua ascesa insieme a varie aziende destinate a trarne i numerosi vantaggi. Dalla sanità e dal marketing al servizio clienti e al settore pubblicitario, la clonazione vocale sta rivoluzionando il modo in cui le organizzazioni costruiscono relazioni con i propri clienti e semplificano i flussi di lavoro.

La clonazione vocale avvantaggia gli operatori sanitari e gli assistenti sociali che lavorano in un ambiente online. Gli avatar digitali con la stessa voce dei professionisti medici favoriscono legami più forti tra loro e i loro pazienti, aumentando la fiducia e fidelizzando i clienti.

Le potenziali applicazioni della clonazione vocale nell'industria cinematografica e dell'intrattenimento sono vaste. Doppiaggio di contenuti in più lingue, sostituzione di dialoghi aggiuntivi per bambini e adulti (ADR) e una gamma quasi infinita di opzioni di personalizzazione sono tutti resi possibili da questa tecnologia.

Allo stesso modo, nel settore delle operazioni, la clonazione vocale guidata dall'intelligenza artificiale può produrre risultati eccellenti per i marchi che necessitano di soluzioni convenienti per sistemi di risposta vocale interattivi o video di formazione aziendale. Con la tecnologia di sintesi vocale, gli attori possono espandere la loro portata aumentando la loro capacità di guadagnare residui dalle registrazioni.

Infine, negli studi di produzione pubblicitaria, l'emergere della clonazione vocale ha contribuito a ridurre notevolmente i costi e il numero di ore associati alla produzione commerciale. Finché è disponibile una registrazione di alta qualità per la clonazione (anche da attori non disponibili), gli annunci possono essere prodotti rapidamente e in modo più creativo che mai.

È interessante notare che le aziende e le PMI possono trarre vantaggio dalla clonazione vocale per creare qualcosa di unico per i loro marchi. I grandi progetti possono realizzare i loro piani più ambiziosi, mentre le piccole imprese possono accedere a modelli in scala precedentemente proibitivi. Questo è ciò che significa vera democratizzazione.

Concludendo

La clonazione vocale basata sull’intelligenza artificiale offre alle aziende vantaggi rivoluzionari, come la creazione di esperienze cliente uniche, l’integrazione di capacità di elaborazione del linguaggio naturale nei loro prodotti e servizi e la generazione di imitazioni di voci altamente accurate che suonano completamente reali.

Le aziende che cercano di mantenere il loro vantaggio competitivo nel 2023 dovrebbero esaminare la clonazione vocale AI. Le aziende possono utilizzare questa tecnologia per sbloccare una varietà di nuove possibilità per conquistare quote di mercato e fidelizzare i clienti, facendolo in modo eticamente responsabile.

Anna è Head of Ethics and Partnerships presso risponditore, una tecnologia di clonazione vocale premiata con un Emmy con sede in Ucraina. Anna è un'ex consulente per le politiche presso Reface, un'app di media sintetici alimentata dall'intelligenza artificiale e co-fondatrice tecnologica dello strumento di contro la disinformazione Cappture finanziato dal programma di accelerazione Startup Wise Guys. Anna ha 11 anni di esperienza in politiche di sicurezza e difesa, tecnologie e sviluppo della resilienza. È stata ricercatrice presso il Centro internazionale per la difesa e la sicurezza di Tallinn e l'Istituto di studi sulla sicurezza di Praga. Ha anche fornito consulenza alle principali aziende ucraine sulla costruzione della resilienza come parte della Task Force per la guerra ibrida presso la Kyiv School of Economics.