škrbina Pavel Osokin, soustanovitelj in izvršni direktor AMAI - serija intervjujev - Unite.AI
Povežite se z nami

Intervjuji

Pavel Osokin, soustanovitelj in izvršni direktor AMAI – Interview Series

mm

objavljeno

 on

Pavel Osokin je soustanovitelj in izvršni direktor AMAI, zagonsko podjetje s sedežem v San Franciscu, ki proizvaja glasovne motorje AI. Pavel vodi delovanje in strategijo podjetja Amai s profesionalno ambicijo, da svojo glasovno tehnologijo vgradi v vsak telefon na svetu. V AMAI so razvili AI glas, ki ga 97% uporabnikov ne more razločiti od pravega človeškega govora.

Bili ste podjetnik vse življenje, svoje prvo podjetje ste ustanovili pri 13 letih, kaj je bil vaš prvi poskus poslovanja in kaj vas motivira za to podjetniško miselnost?

Temu res nisem rekel podjetje, sem pa prvi denar zaslužil s preprodajo nekaterih stvari ali pa samo s pranjem avtomobilov na ulici z vedrom. Moja motivacija je bila, da sem si želel kokakolo ali snickers, moji starši pa niso imeli denarja. Lahko bi počakal, da se denar pojavi, ali pa bi ga zaslužil sam. Čakanje me ne mika.

Ali lahko delite zgodbo o nastanku AMAI?

Svojega partnerja sem vprašal: "Kaj potrebujejo podjetja po vsem svetu?" V tem pogovoru sem ugotovil, da vsako podjetje išče »prodajo«. Začeli smo izdelovati robote, ki so si lahko dopisovali s strankami in prodajali izdelke po pošti in messengerjih. Po drugi strani pa ni bilo nekaj posebnega novega, saj je na voljo veliko chatbotov. Zato smo mislili, da bi bilo kul, če bi ti roboti lahko tudi klicali. Ker je bilo dobrih rešitev na trgu malo, smo izdelali prototip lastnega sintetiziranega glasu, po prvi prodaji pa smo robota opustili in se usmerili v TTS.

Kaj konkretno predstavlja AMAI? 

To pomeni I'm AI (sem umetna inteligenca).

Ali lahko razpravljate o nekaterih izzivih, ki stojijo za oblikovanjem najsodobnejše tehnologije pretvorbe besedila v govor?

Oblikovanje najsodobnejšega TTS ponuja več izzivov. Prvi je zbiranje naborov podatkov. Usposabljanje nevronske mreže zahteva ženske in moške glasove različnih starosti in več jih je, bolje je. Drugič, doseči morate zelo podobnost z naravnim glasom. Najboljša metoda je preizkušanje različnih modelov strojnega učenja in nenehno eksperimentiranje z različnimi primeri uporabe glasu: predvsem morate poiskati najbolj problematičen vzorec in ga ločeno obdelati. Ko govorimo o dolgoročnih izzivih, je lahko težko oceniti, ali je glas postal boljši ali slabši in v katero smer bi ga bilo treba izboljšati.

Kakšni so nekateri izzivi za prepoznavanje govora, ko gre za interakcijo ljudi z glasovno umetno inteligenco AMAI?

Na stotine podjetij se ukvarja s prepoznavanjem glasu, ker ga je lažje razviti. Težava, ki trenutno nima rešitve, je prepoznavanje otrokovega glasu. Otroci imajo v mladosti številne značilnosti govora, zato jih je težko vse upoštevati. Kljub temu delamo na rešitvi te težave in smo zelo blizu objavi rezultata – tako da kmalu naša umetna inteligenca ne bo imela nobenih težav pri interakciji ne samo z odraslimi, ampak tudi z otroki.

Kateri so nekateri priljubljeni primeri uporabe za AMAI?

Trenutno je to sinhronizacija zvočnih knjig in podjetniška uporaba v klicnih centrih.

Kateri jeziki so trenutno na voljo in na katerih jezikih se trenutno dela?

Naš sistem z več zvočniki vključuje dva jezika, ruščino in angleščino. Ideja je, da lahko glas, ustvarjen v enem jeziku, govori tudi vse druge jezike v našem modelu. Trenutno zbiramo podatke še za 40 jezikov in zelo kmalu jih bomo imeli 42.

Kakšna je vaša vizija za prihodnost glasovnih pomočnikov z umetno inteligenco?

Prepričan sem, da se bodo glasovni pomočniki preselili v metaverzum, in zdaj preučujemo te priložnosti. Če pomočnika integrirate s pametnimi zvočniki ali spletnim brskalnikom, bo več ljudi vsak dan uporabljalo glasovno iskanje in komuniciralo s pomočnikom. Lahko se pogovarjate s svojim hladilnikom ali televizijo.

Ali želite še kaj povedati o AMAI?

AMAI uporablja samo lastne tehnologije.

Hvala za intervju, bralci, ki želite izvedeti več, naj ga obiščejo AMAI.

Ustanovni partner unite.AI in član Forbesov tehnološki svet, Antoine je a futurist ki je navdušen nad prihodnostjo umetne inteligence in robotike.

Je tudi ustanovitelj Securities.io, spletno mesto, ki se osredotoča na vlaganje v prelomno tehnologijo.