заглушки Павло Осокін, співзасновник і генеральний директор AMAI - Серія інтерв'ю - Unite.AI
Зв'язатися з нами

інтерв'ю

Павло Осокін, співзасновник та генеральний директор AMAI – Серія інтерв’ю

mm

опублікований

 on

Павло Осокін є співзасновником і генеральним директором компанії AMAI, стартап із Сан-Франциско, який виробляє голосові механізми ШІ. Павло керує діяльністю та стратегією Amai з професійним прагненням встановити свою голосову технологію в кожен телефон у світі. В AMAI вони розробили голос ШІ, який не могли відрізнити від реальної людської мови 97% користувачів.

Ви були підприємцем протягом усього життя, заснувавши свою першу компанію у віці 13 років, якою була ваша перша спроба в бізнесі та що, на вашу думку, мотивувало таке підприємницьке мислення?

Я не зовсім назвав це компанією, але перші гроші я заробив, перепродуючи якісь речі або просто миючи машини на вулиці з відром. Моєю мотивацією було те, що я хотів кока-колу чи снікерс, а у батьків не було грошей. Я міг або дочекатися появи грошей, або заробити їх сам. Очікування мене не приваблює.

Не могли б ви поділитися історією генезису AMAI?

Я запитав свого партнера: «Що потрібно компаніям у всьому світі?» У тій розмові я зрозумів, що кожен бізнес шукає «продажу». Ми почали створювати роботів, які могли б листуватися з клієнтами та продавати товари через пошту та месенджери. З іншого боку, це не було чимось особливо новим, оскільки доступно багато чат-ботів. Тож ми подумали, що якби ці роботи також могли дзвонити, це було б круто. Оскільки хороших рішень на ринку було небагато, ми створили прототип власного синтезованого голосу, а після перших продажів відмовилися від робота і зосередилися на TTS.

Що конкретно означає AMAI? 

Це розшифровується як I'm AI (я - штучний інтелект).

Чи могли б ви обговорити деякі проблеми, пов’язані з розробкою найсучаснішої технології синтезу мовлення?

Розробка найсучаснішого TTS пов’язана з кількома проблемами. Перший – це збір наборів даних. Для навчання нейронної мережі потрібні жіночі та чоловічі голоси різного віку, і чим більше, тим краще. По-друге, потрібно досягти дуже близької схожості з природним голосом. Найкращий метод — тестувати різні моделі машинного навчання і постійно експериментувати з різними випадками використання голосу: зокрема, потрібно знайти найбільш проблемний зразок і опрацювати його окремо. Говорячи про довгострокові виклики, може бути важко оцінити, чи став голос кращим чи гіршим, і в якому напрямку його слід покращувати.

З якими проблемами пов’язано розпізнавання мовлення, коли мова заходить про взаємодію людей із голосовим ШІ AMAI?

Існують сотні компаній, які працюють над розпізнаванням голосу, тому що це легше розвивати. Проблема, яка наразі не має вирішення, – розпізнавання голосу дитини. Діти мають багато особливостей мовлення в молодшому віці, тому врахувати їх усі важко. Тим не менш, ми працюємо над вирішенням цієї проблеми, і ми дуже близькі до оголошення результату – тож незабаром наш ШІ не матиме жодних проблем у взаємодії не лише з дорослими, а й з дітьми.

Які популярні варіанти використання AMAI?

Зараз це дубляж аудіокниг і корпоративне використання в кол-центрах.

Які мови зараз пропонуються та над якими мовами зараз ведеться робота?

Наша багатомовна система включає дві мови, російську та англійську. Ідея полягає в тому, що голос, створений однією мовою, також може розмовляти всіма іншими мовами в нашій моделі. Наразі ми збираємо дані ще для 40 мов, і незабаром у нас буде 42.

Яке ваше бачення майбутнього голосових помічників AI?

Я вірю, що голосові помічники перемістяться в метавсесвіт, і ми зараз вивчаємо ці можливості. Якщо ви інтегруєте помічника з розумними колонками або веб-браузером, більше людей щодня використовуватимуть голосовий пошук і взаємодіятимуть з помічником. Ви можете розмовляти зі своїм холодильником або телевізором.

Чи є ще щось, чим ви хотіли б поділитися про AMAI?

AMAI використовує тільки власні запатентовані технології.

Дякую за інтерв’ю, читачі, які хочуть дізнатися більше, повинні відвідати AMAI.

Партнер-засновник unite.AI і член Технологічна рада Forbes, Антуан - це а футурист який захоплений майбутнім ШІ та робототехніки.

Він також є засновником Securities.io, веб-сайт, який зосереджується на інвестиціях у революційні технології.