stubs Džeimss Bošs, Voicemod izpilddirektors — interviju sērija — Unite.AI
Savienoties ar mums

Intervijas

Jaime Bosch, Voicemod izpilddirektors — interviju sērija

mm

Izdots

 on

Džeimss Bošs ir uzņēmuma izpilddirektors Balss mod bezmaksas balss maiņas programmatūra spēlētājiem, satura veidotājiem un spēlētājiem.

Vai jūs varētu dalīties stāstā par Voicemod rašanos?

Būdams astotais no 8 bērniem, es uzaugu vidē, kurā jau no mazotnes varēju pilnībā izpaust savu uzņēmējdarbības garu, jo vienmēr bija atbalsts no līdzīgi domājošiem brāļiem un māsām.

Tas bija tikai laika jautājums, ka divi no maniem brāļiem un es, kuriem visiem ir dziļa mīlestība pret tehnoloģijām un mūziku, spēlējāmies ar ideju izveidot lietotni, kas apvieno mūsu intereses. Tāpēc 2009. gadā mēs to darījām un izveidojām B2C mūzikas lietotni, kas būtu blakus studijas biznesam, kuru vadījām kā mūsu pamatnodarbošanos.

Tā kā tas bija blakus projekts, mēs daudz eksperimentējām ar tādām lietām kā balss modulācija, kas mūs iedvesmoja radīt kaut ko pilnīgi jaunu un jaunu. Rezultātā mēs nosaucām “Voicemod Experience” — pilnīgi jaunu veidu, kā izjust savu balsi, kas kļuva par lietotnes evolūcijas dzinējspēku. Neatkarīgi no tā, kurš izmēģināja mūsu programmatūru, mēs pastāvīgi sastapāmies ar tādu pašu reakciju no cilvēkiem, kuri izmantoja lietotni: smieklus un izbrīnu, dzirdot sevi pavisam citā veidā.

Tas liek mums pārveidot savu redzējumu par produktu par kaut ko tādu, kas galu galā ar skaņas starpniecību varētu attīstīt cilvēku saikni. Tāpēc mēs pārnesām pieredzi no mobilajām ierīcēm uz personālo datoru, kur to uzreiz ieguva sprādzienbīstamā spēļu un straumēšanas aina, un pārējais, kā saka, ir “vēsture”.

Voicemod sākotnēji bija blakus projekts — kad sapratāt, ka vēlaties spēlēt all-in?

Sākotnēji mums ar brāļiem bija kopīga studija ar nosaukumu 2taptap. Kad mums radās ideja izveidot Voicemod, tas sākotnēji bija tikai jautrs blakus projekts, taču, laikam ejot, mēs redzējām, kā cilvēki ar to mijiedarbojas, un tehnoloģiju potenciālu. Līdz tam laikam lielākā daļa balss maiņas tehnoloģiju bija asinhronas, tāpēc iespēja pieredzēt, ka esat kāds cits reāllaika vidē, daudziem cilvēkiem bija jaunums. Tomēr noteicošais brīdis mums bija apziņa, ka cilvēki izmanto mūsu tehnoloģiju, lai ne tikai izklaidētos, bet arī veidotu visu veidu, kā izpausties tiešsaistē. Tas ir tad, kad mēs sapratām, ka veidojam kaut ko, kas nav tikai izklaide, bet, iespējams, nākamais solis sociālās audio pieredzes nākotnē.

Vai jūs varētu apspriest dažas balss atpazīšanas tehnoloģijas?

Izmantojot mūsu katalogā esošo balsu mainītāju klāstu, tiek veikti procesi, lai iegūtu parasto cilvēka balsi un pārveidotu to par kaut ko jaunu. Protams, ir arī tādi aspekti, kas ir jāņem vērā, piemēram, vecums, dzimums, emocijas un tikai vienkāršas runas variācijas.

Šīs variācijas ietekmē to, kā kāds var izklausīties, un ietekmē piemērotās izmaiņas. Mēs izmantojam elementus no modernākajām balss atpazīšanas tehnoloģijām, lai pēc iespējas precīzāk atvieglotu balss pārveidošanu un pārveidošanu, un nepārtraukti pilnveidojam šo procesu. Mēs vēlamies sniegt cilvēkiem iespēju strukturēt to, kā viņi tiek uztverti, izklausīt tā, kā viņi vēlas, lai mūs sadzird, un sniegt auditorijai lielisku klausīšanās pieredzi.

Kāpēc ir svarīgi palīdzēt cilvēkiem izteikties ar skaņas palīdzību?

Kopš piedzimšanas brīža un bērna pirmā kliedziena skaņa ir dabiskais veids, kā mēs mācāmies izteikt sevi. Kļūstot vecākiem, audio saziņas nozīme turpina pieaugt, jo mēs mācāmies veidot skaņu valodā un izmantot savas balsis, lai izteiktos vārdos emocijas un nianses. Paaugstinot balss augstumu, mēs varam signalizēt par sajūsmu vai izmantot skaņas efektus, piemēram, nopūtas vai vaidus, lai īpaši uzsvērtu vēlamās lietas.

Dažiem patiesi talantīgiem cilvēkiem balss ir instruments neierobežotai izteiksmei, jo viņi var radīt neierobežotu daudzumu skaņas efektu vai balsu. Tomēr lielākajai daļai no mums nav tik paveicies, un viņi jūtas neērti ar savām balsīm (īpaši, kad dzirdam tās ierakstītas). Daži no mūsu lietotājiem runā par nervozitāti, runājot svešinieku priekšā, un ir sarūgtināti par nespēju pareizi izteikties tā, kā viņi vēlētos.

Šeit mēs redzam milzīgu iespēju palīdzēt cilvēkiem. Izmantojot mūsu balss identitātes, lietotāji var veidot savas balsis tā, lai tās justos ērti, vai pat konkrētās situācijās izmantot dažādas balsis. Mēs arī vēlamies dot viņiem iespēju izmantot skaņas efektus, mūzikas klipus vai audio emocijzīmes, lai radītu gaisotni, nodotu kontekstu vai ieviestu komiskus efektus — līdzīgi kā grafiskās emocijzīmes ir palīdzējušas veidot teksta saziņu.

Jūs aprakstījāt Voicemod kā attīstošu cilvēka saikni caur skaņu, vai jūs varētu to pastāstīt sīkāk?

Papildus runātāja atbrīvošanai un noteikta garīgā bloka noņemšanai, kas neļauj cilvēkiem runāt, mēs arī strādājam, lai padarītu šo savienojumu dziļāku. Piemēram, mūsu skaņu dēlis pārņem komunikāciju un paaugstina to uz nākamo līmeni — uzskatiet to par "audio emocijzīmi". Vai varat iedomāties cilvēkus, kas jaunāki par 35 gadiem, tērzēt, neizmantojot emocijzīmes? Lai gan šī tehnoloģija ir pastāvējusi jau sen, kā šķiet, tā patiešām ir dziļi iestrādāta mūsu saziņā tikai kopš aptuveni 2010. gada. Mēs novērojām līdzīgu tendenci ar uzlīmēm uz ziņojumapmaiņas platformām, balss ziņojumapmaiņas un balss piezīmju skaita pieaugumu, kā arī tagad arvien plašāku izmantošanu. GIF un Giphy. Palielinoties pasaules audio sakaru apjomam, pieaug nozīme tam, kā mēs izmantojam skaņu. Audioreakciju nosūtīšana uz drauga joku var pastāstīt daudz vairāk par jūsu neapstrādāto, godīgo reakciju, nekā vienkārši ierakstot teikumu. Iedomājieties atšķirību starp kriketa skaņas dzirdi un ba dum tss! Viņiem visiem ir ļoti dažādas nozīmes un jūtas, ko varat viegli sazināties ar vienu klikšķi.

Mēs vēlamies, lai lietotāji varētu pēc iespējas vienkāršāk izmantot balsis, balss efektus un audio emocijzīmes, lai veidotu saistošākas audio sarunas ar draugiem, ģimeni vai svešiniekiem.

Kādas ir mašīnmācīšanās tehnoloģijas, kas slēpjas lietotnē Voicemod, tostarp ļauj lietotājiem skanēt labāk un pielāgot savu balsi, balstoties uz viņu īsto balsi?

Mašīnmācība ir vairuma jauno Voicemod funkciju pamatā.

Kas attiecas uz radošo pusi, Voicemod's Voicelab ir izveidojis tirgū pirmo reāllaika balss konvertēšanas tehnoloģiju, kas ļaus lietotājiem izvēlēties savu skaņas identitāti, radot katram personiskas balsis.

Ar mūsu jauno, progresīvo tehnoloģiju, kas drīzumā tiks izlaista, mēs radām vēl nedzirdētas balsis ar unikālām īpašībām, kas palīdzēs aizsargāt lietotāju privātumu un drošību, vienlaikus ļaujot viņiem radīt vēlamo personību ar skaņas palīdzību.

Mēs esam arī novērojuši, ka pēdējos gados ir parādījušās uz datiem balstītas dziļas mācīšanās metodoloģijas. Tie ļauj mums apgūt abstraktas slēptās struktūras runas signālos, kas attiecas uz balss uztveres īpašībām, piemēram, fonoloģiju, saturu, identitāti, nodomu un noskaņojumu. Izmantojot šīs tehnoloģijas, mēs varam kontrolēt un modificēt signāla uztveres aspektus. Tas ļauj mums izstrādāt tehnoloģijas, kas lietotājiem sniedz lielāku kontroli pār viņu uztverto balss identitāti tādā veidā, kas iepriekš nebija iespējams.

Kādi ir daži no Voicemod lietotnes lietošanas gadījumiem?

Voicemod lieliskā lieta ir tā, ka tā rīki apkalpo dažādas vajadzības un scenārijus. visizplatītākās situācijas ir satura izveide, spēles ar draugiem, tērzēšana ar ģimeni vai draugiem, ieskaujošas lomu spēles vides izveide vai pat darbs un bizness, kur lietotāji galvenokārt izmanto mūsu trokšņu slāpēšanas un audio uzlabošanas rīkus.

Vai jūs varētu apspriest dažus izaicinājumus un priekšrocības, uzsākot jaunuzņēmumu ar brāļiem un māsām?

Godīgi sakot, es labprāt to darītu, un es zinu, ka, protams, katrs savā ziņā saskaras ar izaicinājumiem, bet patiesībā es neatceros daudzus mūsu gadījumā. Iemesls tam, ka mēs nākam no ļoti lielas ģimenes. Mēs vienmēr kaut ko darījām kopā, sākot no bērnības projektiem līdz muzicēšanai un radīšanai. Tas bija tikai dabiski, ka mēs galu galā strādāsim kopā. Maniem brāļiem Fernando un Huanam, kuri, kā jau minēju, kopā ar mani nodibināja Voicemod, jau bija kopā vairāki uzņēmumi, tāpēc viņiem bija liela pieredze šajā jomā. Es viņiem pievienojos 2010. gadā viņu uzņēmumā, kas bija 2taptap, tāpēc arī es to sajutu. Tas nozīmē, ka, veidojot Voicemod, mēs to darījām pilnībā atbilstoši tam, ko vēlamies paveikt, un vēl svarīgāk, kā mēs to vēlamies paveikt. Kā tāds tas patiešām ir palīdzējis Voicemod ieviest ļoti spēcīgu saskaņotu vērtību kultūru, kas ir bijusi patiesa mūsu panākumu atslēga.

Vai ir vēl kaut kas, ko vēlaties dalīties par Voicemod?

Aizkulisēs notiek daudz kas, taču tas atbilst mūsu vēlmei attīstīt skaņu visi, mēs pašlaik strādājam pie kaut kā, lai padarītu mūsu tehnoloģiju vēl pieejamāku. Veids, kā jebkurš izstrādātājs var izmantot mūsu tehnoloģiju savā produktā

Mēs zinām, ka cilvēki lielāko daļu sava nomoda laika pavada tiešsaistē, pieslēgti elektrotīklam, izpaužot sevi dažādās platformās un lietojumprogrammās. Tiešsaistes vidē jūsu “iemiesojums” ir visa jūsu pašpārstāvība. Un tiešām, kas ir tas cilvēks bez balss?

Reāllaika balss maiņas tehnoloģijas izveide un pilnībā pielāgojamu skaņas izteiksmju sistēmas izstrāde ir liels darbs. Mūsu komanda ir spērusi šo soli ārpus vienādojuma, izstrādājot visu komplektu, ko izstrādātāji var viegli integrēt jebkurā vietā. Mēs esam ļoti priecīgi, ka varam padarīt mūsu tehnoloģiju pieejamu izstrādātājiem un lietotājiem visā pasaulē, jo mēs turpinām veidot sociālo audio pieredzes nākotni!

Paldies par lielisko interviju, lasītājiem, kuri vēlas uzzināt vairāk, vajadzētu apmeklēt Balss mod

Unite.AI dibinātājs un biedrs Forbes tehnoloģiju padome, Antuāns ir a futūrists kurš aizraujas ar AI un robotikas nākotni.

Viņš ir arī dibinātājs Vērtspapīri.io, vietne, kas koncentrējas uz ieguldījumiem traucējošās tehnoloģijās.