ciot Pavel Osokin, co-fondator și CEO al AMAI - Seria de interviuri - Unite.AI
Conectează-te cu noi

interviuri

Pavel Osokin, co-fondator și CEO al AMAI – Seria de interviuri

mm

Publicat

 on

Pavel Osokin este co-fondator și CEO al Amai, un startup din San Francisco care produce motoare de voce AI. Pavel conduce operațiunile și strategia Amai cu o ambiție profesională de a instala tehnologia sa de voce în fiecare telefon din lume. În AMAI, au dezvoltat o voce AI care nu a putut fi deslușită dintr-un discurs uman real de către 97% dintre utilizatori.

Ai fost un antreprenor de-a lungul vieții și ai lansat prima ta companie la vârsta de 13 ani, care a fost prima ta încercare de a face afaceri și ce crezi că ai motivat această mentalitate antreprenorială?

Nu i-am numit chiar o companie, dar primii bani mi-am făcut revând unele lucruri sau doar spălând mașini pe stradă cu o găleată. Motivația mea a fost că îmi doream o Cola sau un Snickers, iar părinții mei nu aveau bani. Aș putea fie să aștept să apară banii, fie să-i câștig eu. Așteptarea nu mă atrage.

Ați putea împărtăși povestea genezei din spatele AMAI?

Mi-am întrebat partenerul: „De ce au nevoie companiile din întreaga lume?” În acea conversație, mi-am dat seama că fiecare companie caută o „vânzare”. Am început să facem roboți care să poată coresponde cu clienții și să vândă produse prin poștă și mesagerie. Pe de altă parte, nu a fost ceva deosebit de nou, deoarece există mulți chatboți disponibili. Așadar, ne-am gândit că dacă acești roboți ar putea efectua și apeluri, ar fi grozav. Întrucât erau puține soluții bune pe piață, am creat un prototip al propriei voci sintetizate, iar după primele vânzări, am abandonat robotul și ne-am concentrat pe TTS.

Ce înseamnă în mod specific AMAI? 

Aceasta înseamnă I'm AI (sunt inteligență artificială).

Ați putea discuta unele dintre provocările din spatele proiectării tehnologiei de ultimă oră Text-to-speech?

Proiectarea TTS de ultimă generație oferă mai multe provocări. Prima este colectarea seturilor de date. Antrenarea unei rețele neuronale necesită voci feminine și masculine de diferite vârste și cu cât mai multe, cu atât mai bine. În al doilea rând, trebuie să obțineți o asemănare foarte apropiată cu o voce naturală. Cea mai bună metodă este să testați diferite modele de învățare automată și să experimentați în mod constant cu diferite cazuri de utilizare a vocii: în special, trebuie să găsiți eșantionul cel mai problematic și să îl procesați separat. Vorbind despre provocările pe termen lung, poate fi dificil de evaluat dacă vocea a devenit mai bună sau mai proastă și în ce direcție ar trebui îmbunătățită.

Care sunt unele dintre provocările din spatele recunoașterii vorbirii atunci când vine vorba de interacțiunea oamenilor cu AI vocal AMAI?

Există sute de companii care lucrează la recunoașterea vocii, deoarece este mai ușor de dezvoltat. Problema care în prezent nu are soluție este recunoașterea vocii unui copil. Copiii au multe caracteristici ale vorbirii la o vârstă fragedă, așa că este greu să ținem cont de toate. Cu toate acestea, am lucrat la o soluție la această problemă și suntem foarte aproape de a anunța rezultatul – așa că, în curând, AI-ul nostru nu va avea probleme de interacțiune nu doar cu adulții, ci și cu copiii.

Care sunt unele cazuri de utilizare populare pentru AMAI?

În momentul de față, este vorba de dublarea cărților audio și de utilizare în întreprinderi în centrele de apeluri.

Ce limbi sunt oferite în prezent și ce limbi se lucrează în prezent?

Sistemul nostru cu mai multe vorbitoare include două limbi, rusă și engleză. Ideea este că o voce creată într-o limbă poate vorbi și toate celelalte limbi din modelul nostru. În prezent, colectăm date pentru încă 40 de limbi și foarte curând vom avea 42.

Care este viziunea ta pentru viitorul asistenților vocali AI?

Cred că asistenții vocali se vor muta în metavers și studiem aceste oportunități acum. Dacă integrați asistentul cu difuzoare inteligente sau cu browserul web, mai mulți oameni vor folosi căutarea vocală și vor interacționa cu asistentul în fiecare zi. Puteți vorbi cu frigiderul sau televizorul dvs.

Mai există ceva pe care ați dori să împărtășiți despre AMAI?

AMAI folosește doar propriile tehnologii proprietare.

Mulțumim pentru interviu, cititorii care doresc să afle mai multe ar trebui să viziteze Amai.

Un partener fondator al unit.AI și un membru al Consiliul Tehnologic Forbes, Antoine este un futurist care este pasionat de viitorul AI și al roboticii.

El este, de asemenea, fondatorul Securities.io, un site web care se concentrează pe investițiile în tehnologie disruptivă.