Connect with us

Tekoäly

Pelinkehittäjät katsovat ääni-AI: hen uusia luovia mahdollisuuksia

mm

Äänen synteesiteknologia, erityisesti puheen synteesi, on kehittynyt paljon viime vuosina. Vaikka teksti-puhe-tekniikka on ollut olemassa jo vuosikymmeniä, tekniikka on muuttunut paljon luonnollisemmaksi. Viimeaikaiset algoritmit voivat ottaa vain muutaman tunnin ääntä ja syntetisoida erittäin realistisia ääninäytteitä. Teknologian edetessä, avautuu enemmän sovelluksia, mukaan lukien mahdollisuuksia luovassa mediassa. Hiljattain, kuten VentureBeat raportoi, videopeliyhtiöt ovat alkaneet tutkia ääni-AI:n käyttöä videopelien dialogin tuottamiseen.

Yksi yhtiö, Leviathan Games, on aloittanut ääni-AI:n käytön peleissä, joita he kehittävät parhaillaan. Wyeth Ridgway, Leviathan Gamesin omistaja, selitti, että ääni-AI voi muuttaa pelisuunnittelua dramaattisesti. Ridgway selitti, että ääni-AI:n käyttö pelisuunnittelussa on uusi suuntaus, ja vertasi sitä siihen, miten 3D-animointiohjelmisto on kehittynyt viime vuosikymmenen aikana, ja yhtiöt kuten Pixar ovat luoneet omia ohjelmistoja animoinnin ja mallinnuksen helpottamiseksi.

Perinteiset menetelmät puheen generoimiseen toimivat liittämällä ennalta äänitettyjä äänitiedostoja yhteen lennossa, ompelemalla lauseita yhteen aiemmin olemassa olevista sanoista ja lauseista. Tämä puheen generoimisen menetelmä vaatii satojen tuntien äänittämisen ja ääniklippien manuaalisen merkinnän. Se kuulostaa myös jonkin verran epäluonnolliselta, koska sävy ja painotus taipuvat vaihtelevan sanojen yli. Vertailussa, viimeisimmän ääni-AI:n ääni kuulostaa merkittävästi luonnollisemmalta ja toimii eri tavalla.

Ääni-AI perustuu syvään neuroverkkoihin. WaveNet oli yksi ensimmäisistä tekoälyistä, jotka pystyivät generoimaan vakuuttavia, luonnollisen kuuloisia ääninäytteitä. Koska ääninäytteet generoidaan alusta alkaen, ei ole tarpeen ennalta äänittää satoja tunteja dialogia, kunhan riittävästi koulutusdataa on saatavilla. Optimoidut GAN:t ja LSTM-mallit voivat generoida ääntä vain muutaman tunnin merkittyä ääntä kouluttamalla. Tulokset voivat olla erittäin vakuuttavia, kuten kun Google Duplex -koe soitti hiustenleikkaajaan ajanvarauksen tekemiseksi.

Kun nämä teknologiat tulevat entistä voimakkaammaksi, standardoiduksi ja helpommin saataville pilvilaskennan kautta, on todennäköistä, että enemmän pelinkehittäjiä kääntyy ääni-AI:hen tuotannon ajan ja kustannusten vähentämiseksi. Joitakin yhtiöitä on jo luomassa malleja, joita pelinkehittäjät voivat potentiaalisesti käyttää. Replica Studios erikoistuu ääni-AI-teknologiaan, ja joitakin heidän teknologiansa generoimia ääninäytteitä voidaan kuulla linkeistä tässä ja tässä.

On epätodennäköistä, että pelinkehittäjät valitsevat ääni-AI:n sijaan ääninäyttelijöiden käytön. Itse asiassa, ääni-AI voi avata enemmän mahdollisuuksia ääninäyttelijöille. Tällä hetkellä monet pelinkehittämisyritykset usein jättävät äänidialogin pois ajan ja kustannusten vuoksi, jotka liittyvät äänidialogin luomiseen. Ääninäyttelijöiden on usein palattava äänityssessioihin, jos käsikirjoitukseen tehdään muutoksia tai jos peliohjaajat haluavat erilaisen esityksen. Ääni-AI voidaan käyttää kokeilemaan/prototyyppiä dialogia, saadakseen tietyn käsikirjoituksen muutosten ja revisioiden, ennen kuin ammattimainen ääninäyttelijä kutsutaan äänittämään käsikirjoitusta. Tämä voi johtaa siihen, että enemmän yhtiöillä on varaa investoida äänidialogin luomiseen.

Ääni-AI-malleja voidaan jopa kouluttaa tietyn ääninäyttelijän äänellä, ja tekoälyä voidaan käyttää generoimaan triviaaleja dialogipätkiä, kunhan näyttelijä saa korvausta äänensä käytöstä. Kuten VentureBeat raportoi, ääninäyttelijät kuten Simon J. Smith, ovat optimistisia ääni-AI-mallien kasvavan käytön ja uusien ääninäyttelemismahdollisuuksien avaamisesta.

Ääni-AI:n käytön lisäksi skriptien prototyyppiin tai äänikappaleiden luomiseen vähäpätöisille hahmoille, pelinkehittäjät voivat myös käyttää ääni-AI:ta antamaan pelaajille enemmän mukautusvaihtoehtoja roolipeleihin. Tällä hetkellä, jopa pelit, jotka sallivat pelaajien valita äänen heidän hahmoilleen, usein vain muutaman vaihtoehdon. Ääni-AI:n avulla vaihtoehtojen määrä voi olla käytännössä rajaton.

Blogger ja ohjelmoija, jolla on erityisalat Machine Learning ja Deep Learning -aiheissa. Daniel toivoo pystyvänsä auttamaan muita käyttämään tekoälyn voimaa sosiaaliseen hyvään.