Stumm Pavel Osokin, Co-Founder & CEO vun AMAI - Interview Series - Unite.AI
Connect mat eis

Interviewen

Pavel Osokin, Co-Founder & CEO vun AMAI - Interview Series

mm

publizéiert

 on

De Pavel Osokin ass de Co-Founder & CEO vun AMAI, aa San Francisco-baséiert Startup déi AI Stëmmmotoren produzéiert. De Pavel féiert d'Operatioun an d'Strategie vum Amai mat enger professioneller Ambitioun fir seng Stëmmtechnologie an all Telefon op der Welt z'installéieren. Am AMAI hunn se eng AI Stëmm entwéckelt déi net vun enger richteger mënschlecher Ried vun 97% vun de Benotzer z'erkennen konnt ginn.

Dir waart e liewenslaangen Entrepreneur, deen Är éischt Firma mat 13 Joer lancéiert hutt, wat war Ären éischte Versuch am Geschäft a wat fillt Dir Iech motivéiert dësen Entrepreneursgeescht?

Ech hunn et net wierklech eng Firma genannt, mee ech hunn meng éischt Sue verdéngt andeems ech e puer Saache weiderverkaaft hunn oder just Autoen op der Strooss mat engem Eemer wäschen. Meng Motivatioun war, datt ech eng Cola oder e Snickers wollt, a meng Elteren hu keng Sue. Ech kéint entweder waarden op d'Suen erschéngen oder se selwer verdéngen. Waarden appelléiert mech net.

Kënnt Dir d'Genesisgeschicht hannert AMAI deelen?

Ech hunn mäi Partner gefrot: "Wat brauche Firmen ronderëm d'Welt?" An deem Gespréich hunn ech gemierkt datt all Geschäft no engem "Verkaf" sicht. Mir hunn ugefaang Roboteren ze maachen déi mat Clienten korrespondéiere kënnen a Produkter iwwer Mail a Messenger verkafen. Op der anerer Säit war et net eppes besonnesch Neies well et vill Chatbots verfügbar sinn. Also hu mir geduecht datt wann dës Roboter och kënnen Uruff maachen, et wier cool. Well et wéineg gutt Léisungen um Maart waren, hu mir e Prototyp vun eiser eegener synthetiséierter Stëmm erstallt, an no den éischte Verkaf de Roboter opginn an op TTS konzentréiert.

Wat steet AMAI fir spezifesch? 

Dëst steet fir Ech sinn AI (ech sinn kënschtlech Intelligenz).

Kënnt Dir e puer vun den Erausfuerderunge hannert dem Design vun der moderner Text-to-Speech Technologie diskutéieren?

Den modernsten TTS designen bitt verschidden Erausfuerderungen. Déi éischt ass d'Sammelen vun Datesätz. Ausbildung vun engem neurale Netzwierk erfuerdert weiblech a männlech Stëmme vu variéierend Alter, a wat méi, wat besser. Zweetens, Dir musst eng ganz enk Ähnlechkeet mat enger natierlecher Stëmm erreechen. Déi bescht Method ass verschidde Maschinnléiermodeller ze testen a stänneg mat verschiddene Fäll vu Stëmmverbrauch ze experimentéieren: besonnesch musst Dir déi problemateschst Probe fannen an se separat veraarbecht. Apropos laangfristeg Erausfuerderunge kann et schwéier sinn ze bewäerten ob d'Stëmm besser oder méi schlecht ginn ass, a wéi eng Richtung se soll verbessert ginn.

Wat sinn e puer vun den Erausfuerderunge hannert Riederkennung wann et ëm Mënschen kënnt, déi mat der AMAI Stëmm AI interagéieren?

Et ginn Honnerte vu Firmen déi u Stëmmerkennung schaffen, well et méi einfach ass ze entwéckelen. De Problem deen den Ament keng Léisung huet ass d'Unerkennung vun der Stëmm vun engem Kand. Kanner hu vill Charakteristiken vun Ried an engem jonken Alter, also et ass schwéier all vun hinnen Rechnung ze huelen. Trotzdem hu mir un enger Léisung fir dëse Problem geschafft, a mir si ganz no fir d'Resultat unzekënnegen - sou séier wäert eis AI keng Probleemer hunn net nëmme mat Erwuessener, awer och mat Kanner.

Wat sinn e puer populär Benotzungsfäll fir AMAI?

De Moment ass et Audiobook Dubbing an Enterprise Notzung an Call Centers.

Wéi eng Sprooche ginn am Moment ugebueden, a wéi eng Sprooche gëtt am Moment geschafft?

Eise Multi-Speaker System enthält zwou Sproochen, Russesch an Englesch. D'Iddi ass datt eng Stëmm, déi an enger Sprooch geschafe gëtt, och all déi aner Sproochen an eisem Modell schwätze kann. De Moment sammele mir Daten fir 40 méi Sproochen, a ganz geschwënn wäerte mir 42 hunn.

Wat ass Är Visioun fir d'Zukunft vun AI Stëmmassistenten?

Et ass meng Iwwerzeegung datt Stëmmassistenten an de Metaverse wäerte plënneren, a mir studéieren dës Méiglechkeeten elo. Wann Dir den Assistent mat Smart Spriecher oder de Webbrowser integréiert, wäerte méi Leit Stëmm Sich benotzen an all Dag mam Assistent interagéieren. Dir kënnt mat Ärem Frigo oder TV schwätzen.

Gëtt et nach eppes wat Dir iwwer AMAI deele wëllt?

AMAI benotzt nëmmen seng eege propriétaire Technologien.

Merci fir den Interview, Lieser déi méi gewuer ginn solle besichen AMAI.

A founding partner of unite.AI & e Member vun der Forbes Technology Council, Den Antoine ass a futuristesch déi passionéiert ass iwwer d'Zukunft vun AI & Robotik.

Hien ass och de Grënner vun Securities.io, eng Websäit déi sech op d'Investitioun an d'Stéierungstechnologie konzentréiert.