ciot Dezvoltatorii de jocuri caută AI vocal pentru noi oportunități creative - Unite.AI
Conectează-te cu noi

Inteligenta Artificiala

Dezvoltatorii de jocuri caută AI vocal pentru noi oportunități creative

mm
Actualizat on

Tehnologia de sinteză a sunetului, în special sinteza vorbirii, a devenit mult mai sofisticată în ultimii ani. În timp ce tehnologia text-to-speech există de zeci de ani, tehnologia a devenit mult mai naturală. Algoritmii recenti pot lua doar câteva ore de sunet și pot sintetiza mostre audio extrem de realiste. Pe măsură ce tehnologia avansează, se deschid mai multe aplicații, inclusiv posibilități în mediile creative. Recent,  după cum a raportat VentureBeat, companiile de jocuri video au început să investigheze utilizarea generării vocii AI pentru a produce dialog pentru jocurile video.

O companie, Jocuri cu Leviatan, a început să implementeze AI vocal în jocurile pe care le dezvoltă în prezent. Wyeth Ridgway, proprietarul Leviathan Games, a explicat că AI vocal ar putea schimba designul jocului în moduri dramatice. Ridgway a explicat că utilizarea IA vocală în proiectarea jocurilor este o tendință emergentă și a comparat-o cu modul în care software-ul de animație 3D s-a schimbat în decursul ultimului deceniu, companii precum Pixar creând software proprietar menit să faciliteze animația și modelarea.

Metodele tradiționale de generare a vorbirii funcționează prin atașarea fișierelor de sunet preînregistrate împreună din mers, împletind propoziții din cuvinte și fraze existente anterior. Această metodă de generare a vorbirii necesită înregistrarea a sute de ore de dialog și etichetarea manuală a clipurilor audio. De asemenea, sună oarecum nefiresc, deoarece inflexiunea și accentul tind să se schimbe între cuvinte. Prin comparație, AI vocal de ultimă generație sună mult mai natural și funcționează într-un mod diferit.

Voice AI se bazează pe rețele neuronale profunde. WaveNet a fost unul dintre primele AI care a putut genera mostre audio convingătoare, cu sunet natural. Deoarece mostrele de sunet sunt generate de la zero, nu este nevoie să preînregistrați sute de ore de dialog, atâta timp cât sunt disponibile suficiente date de antrenament. Modelele optimizate GAN și LSTM pot genera sunet după ce au fost antrenate doar pentru câteva ore de sunet etichetat. Rezultatele pot fi extraordinar de convingătoare, cum ar fi atunci când experimentul Google Duplex a sunat la un salon de coafură pentru a stabili o întâlnire.

Pe măsură ce aceste tehnologii devin mai puternice, standardizate și ușor accesibile prin cloud computing, este probabil ca mai mulți dezvoltatori de jocuri să apeleze la AI vocal pentru a reduce timpul și costurile de producție. Unele companii creează deja modele care pot fi folosite de dezvoltatorii de jocuri. Studiouri Replica este specializată în tehnologia vocală AI, iar unele mostre audio generate de tehnologia lor pot fi auzite la linkuri aici și aici.

Este puțin probabil ca dezvoltatorii de jocuri să aleagă să renunțe la utilizarea actorilor vocali în detrimentul AI. De fapt, IA vocală ar putea deschide mai multe oportunități pentru actorii vocali. În prezent, multe companii de dezvoltare de jocuri omit frecvent dialogul vocal din cauza investiției de timp și a costurilor asociate cu crearea dialogului vocal. Adesea, actorii vocali trebuie aduși înapoi pentru mai multe sesiuni de înregistrare dacă există modificări ale scenariului sau dacă directorii de joc doresc un alt tip de performanță. Voice AI ar putea fi folosit pentru a experimenta dialogul/prototip, pentru a avea o idee despre ce fel de modificări și revizuiri de scenariu trebuie făcute înainte de a chema un actor vocal profesionist pentru a înregistra scenariul. Acest lucru ar putea duce la ca mai multe companii să aibă resursele necesare pentru a investi în crearea unui dialog vocal.

Modelele de voce AI ar putea fi chiar antrenate pe vocea unui anumit actor vocal, iar AI-ul folosit pentru a genera clipuri de dialog banale, atâta timp cât actorul este plătit pentru utilizarea vocii lor. După cum a raportat VentureBeat, actori vocali precum Simon J. Smith, sunt optimiști cu privire la utilizarea din ce în ce mai mare a modelelor de IA vocală și potențialul lor de a deschide noi oportunități de actorie vocală.

Dincolo de utilizarea AI vocală pentru a prototipa scripturi sau a crea linii vocale pentru personaje minore, dezvoltatorii de jocuri ar putea folosi și AI vocal pentru a oferi jucătorilor mai multe opțiuni de personalizare pentru jocurile video de rol. În prezent, chiar și jocurile care permit jucătorilor să aleagă o voce pentru avatarurile lor au de obicei doar o mână de opțiuni. Cu ajutorul AI vocal, opțiunile ar putea fi nelimitate din punct de vedere funcțional.