škrbina Razvojni programeri igara gledaju na Voice AI za nove kreativne mogućnosti - Unite.AI
Povežite se s nama

Umjetna inteligencija

Razvojni programeri igara gledaju na Voice AI za nove kreativne mogućnosti

mm
Ažurirano on

Tehnologija sinteze zvuka, posebice sinteze govora, postala je mnogo sofisticiranija posljednjih godina. Iako je tehnologija pretvaranja teksta u govor prisutna desetljećima, tehnologija je postala mnogo prirodnija. Najnoviji algoritmi mogu uzeti samo nekoliko sati zvuka i sintetizirati visoko realistične audio uzorke. Kako tehnologija napreduje, otvara se više aplikacija, uključujući mogućnosti u kreativnim medijima. Nedavno,  kako prenosi VentureBeat, tvrtke za videoigre počele su istraživati ​​korištenje AI generiranja glasa za stvaranje dijaloga za videoigre.

Jedna tvrtka, Igre Levijatan, počeo je implementirati glasovnu umjetnu inteligenciju unutar igara koje trenutno razvijaju. Wyeth Ridgway, vlasnik Leviathan Gamesa, objasnio je da glasovna umjetna inteligencija može dramatično promijeniti dizajn igre. Ridgway je objasnio da je korištenje glasovne umjetne inteligencije u dizajnu igara trend u nastajanju i usporedio ga s načinom na koji se softver za 3D animaciju promijenio tijekom prošlog desetljeća, s tvrtkama poput Pixara koje su stvorile vlasnički softver namijenjen olakšavanju animacije i modeliranja.

Tradicionalne metode generiranja govora funkcioniraju dodavanjem unaprijed snimljenih zvučnih datoteka u hodu, spajanjem rečenica od prethodno postojećih riječi i fraza. Ova metoda generiranja govora zahtijeva snimanje stotina sati dijaloga i ručno označavanje zvučnih zapisa. Također zvuči pomalo neprirodno jer se infleksija i naglasak pomiču između riječi. Za usporedbu, najsuvremenija glasovna umjetna inteligencija zvuči znatno prirodnije i djeluje na drugačiji način.

Glasovna umjetna inteligencija temelji se na dubokim neuronskim mrežama. WaveNet bio je jedan od prvih AI-a koji je mogao generirati uvjerljive audio uzorke prirodnog zvuka. Budući da se zvučni uzorci generiraju od nule, nema potrebe unaprijed snimati stotine sati dijaloga, sve dok je dostupno dovoljno podataka za obuku. Optimizirani GAN i LSTM modeli mogu generirati zvuk nakon što su obučeni na samo nekoliko sati označenog zvuka. Rezultati mogu biti iznimno uvjerljivi, kao što je Googleov Duplex eksperiment nazvala frizerski salon da dogovorimo termin.

Kako ove tehnologije postaju snažnije, standardizirane i lako dostupne putem računalstva u oblaku, vjerojatno će se više programera igara okrenuti glasovnoj umjetnoj inteligenciji kako bi smanjili vrijeme i troškove proizvodnje. Neke tvrtke već stvaraju modele koje potencijalno mogu koristiti programeri igara. Replika studija specijalizirao se za AI glasovnu tehnologiju, a neke audio uzorke generirane njihovom tehnologijom možete čuti na poveznicama ovdje i ovdje.

Malo je vjerojatno da će se razvijači igara odlučiti odreći upotrebe glasovnih glumaca umjesto umjetne inteligencije. Zapravo, glasovna umjetna inteligencija mogla bi otvoriti više mogućnosti glasovnim glumcima. Trenutno mnoge tvrtke za razvoj igara često preskaču glasovni dijalog zbog ulaganja vremena i troškova povezanih sa stvaranjem glasovnog dijaloga. Glasovne glumce često treba vratiti na više sesija snimanja ako postoje promjene u scenariju ili ako redatelji igre žele drugačiju vrstu izvedbe. Glasovni AI mogao bi se koristiti za eksperimentiranje s/prototipom dijaloga, stjecanje osjećaja za to kakve promjene i revizije scenarija treba napraviti prije nego što se pozove profesionalni glasovni glumac da snimi scenarij. To bi moglo dovesti do toga da više tvrtki ima resurse za ulaganje u stvaranje glasovnog dijaloga.

AI glasovni modeli mogli bi se čak trenirati na glasu određenog glasovnog glumca, a AI se koristio za generiranje trivijalnih isječaka dijaloga, sve dok je glumac plaćen za korištenje svog glasa. Kako javlja VentureBeat, glasovni glumci poput Simona J. Smitha optimistični su glede sve veće upotrebe glasovnih AI modela i njihovog potencijala za otvaranje novih mogućnosti glasovne glume.

Osim upotrebe glasovne umjetne inteligencije za izradu prototipa skripti ili stvaranje glasovnih rečenica za sporedne likove, programeri igara također bi mogli koristiti glasovnu umjetnu inteligenciju kako bi igračima dali više mogućnosti prilagodbe za igranje uloga. Trenutačno čak i igre koje igračima omogućuju odabir glasa za svoje avatare obično imaju samo nekoliko opcija. Uz korištenje glasovne umjetne inteligencije, mogućnosti bi mogle biti funkcionalno neograničene.