Connect with us

Pavel Osokin, Co-Fondator & CEO al AMAI – Seria de interviuri

Interviuri

Pavel Osokin, Co-Fondator & CEO al AMAI – Seria de interviuri

mm

Pavel Osokin este Co-Fondator & CEO al AMAI, o companie startup din San Francisco care produce motoare de voce AI. Pavel conduce operațiunile și strategia AMAI, cu o ambiție profesională de a instala tehnologia de voce în fiecare telefon din lume. La AMAI, ei au dezvoltat o voce AI care nu poate fi deosebită de vorbirea umană reală de 97% dintre utilizatori.

Ai fost un întreprinzător toată viața, lansând prima ta companie la vârsta de 13 ani, care a fost prima ta încercare de a face afaceri și ce te-a motivat să ai o mentalitate antreprenorială?

Nu am numit-o realmente o companie, dar am câștigat primii mei bani vânzând diverse lucruri sau spălând mașini pe stradă cu un găleată. Motivația mea a fost că voiam o Coca-Cola sau un Snickers, iar părinții mei nu aveau bani. Aș fi putut aștepta până când banii să apară sau să-i câștig singur. Așteptarea nu mă atrage.

Poți să ne spui povestea de origine a AMAI?

I-am întrebat partenerul meu: “Ce au nevoie companiile din întreaga lume?” În acea conversație, am realizat că fiecare afacere caută o “vânzare”. Am început să construim roboți care puteau coresponda cu clienții și vinde produse prin poștă și mesagerie. Pe de altă parte, nu a fost ceva nou, deoarece există multe chatbot-uri disponibile. Așa că am considerat că, dacă acești roboți ar putea face și apeluri, ar fi cool. Deoarece existau puține soluții bune pe piață, am creat un prototip al vocii noastre sintetizate, iar după primele vânzări, am abandonat robotul și ne-am concentrat pe TTS.

Ce reprezintă AMAI, în special?

Acesta înseamnă “Sunt AI” (Sunt inteligență artificială).

Poți să discuți despre unele dintre provocările din spatele proiectării tehnologiei Text-to-speech de ultimă generație?

Proiectarea tehnologiei TTS de ultimă generație oferă mai multe provocări. Prima dintre ele este colectarea seturilor de date. Antrenarea unei rețele neuronale necesită voci feminine și masculine de diferite vârste, și cu cât mai multe, cu atât mai bine. A doua, trebuie să obțineți o asemănare foarte strânsă cu o voce naturală. Cea mai bună metodă este de a testa diferite modele de învățare automată și de a experimenta constant cu diferite cazuri de utilizare a vocii: în special, trebuie să găsiți cel mai problematic exemplu și să-l procesați separat. Vorbind despre provocările pe termen lung, poate fi dificil să evaluați dacă vocea a devenit mai bună sau mai rea și în ce direcție ar trebui să fie îmbunătățită.

Ce sunt unele dintre provocările din spatele recunoașterii vorbirii atunci când vine vorba de interacțiunea oamenilor cu vocea AI AMAI?

Există sute de companii care lucrează la recunoașterea vocii, deoarece este mai ușor de dezvoltat. Problema care în prezent nu are soluție este recunoașterea vocii unui copil. Copiii au multe caracteristici ale vorbirii la o vârstă fragedă, așa că este greu să luați în considerare toate acestea. Cu toate acestea, am lucrat la o soluție pentru această problemă și suntem foarte aproape de a anunța rezultatul – așa că, în curând, AI-ul nostru nu va avea nicio problemă în a interacționa nu numai cu adulții, ci și cu copiii.

Ce sunt unele dintre cazurile de utilizare populare pentru AMAI?

În prezent, este vorba de dublarea cărților audio și utilizarea în centrele de apeluri pentru întreprinderi.

Care sunt limbile care sunt oferite în prezent și care sunt limbile care sunt în lucru?

Sistemul nostru multi-vorbitor include două limbi, rusă și engleză. Ideea este că o voce creată într-o limbă poate vorbi toate celelalte limbi din modelul nostru. În prezent, colectăm date pentru încă 40 de limbi și foarte curând vom avea 42.

Care este viziunea ta pentru viitorul asistenților vocali AI?

Este convingerea mea că asistenții vocali se vor muta în metavers și studiem aceste oportunități în prezent. Dacă integrați asistentul cu difuzoare inteligente sau browserul web, mai multe persoane vor utiliza căutarea vocală și vor interacționa cu asistentul în fiecare zi. Puteți vorbi cu frigiderul sau televizorul dvs.

Este ceva ce ai vrea să mai împărtășești despre AMAI?

AMAI utilizează doar tehnologii proprii.

Mulțumim pentru interviu, cititorii care doresc să afle mai multe despre AMAI ar trebui să viziteze site-ul.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.