Connect with us

Pavel Osokin, AMAIの共同創設者&CEO – インタビュー・シリーズ

インタビュー

Pavel Osokin, AMAIの共同創設者&CEO – インタビュー・シリーズ

mm

Pavel Osokinは、AMAIの共同創設者&CEOです。AMAIは、サンフランシスコを拠点とするスタートアップで、AI音声エンジンを開発しています。Pavelは、専門的な野心を持って、AMAIの音声技術を世界中のすべての電話に導入することを目指し、運営と戦略をリードしています。AMAIでは、97%のユーザーが人間のスピーチと区別できないAI音声を開発しました。

あなたは13歳の時に最初の会社を立ち上げて以来、生涯の起業家です。最初のビジネスは何でしたか?また、起業家精神を мотивироватьするものは何ですか?

私は本当に会社と呼ぶことはありませんでしたが、物を売ったり、街の中でバケツで車を洗ったりして、最初の金を稼ぎました。私の動機は、コーラやスニッカーズが欲しかったのですが、両親にはお金がありませんでした。私はお金が現れるのを待つか、自分で稼ぐか選択できました。待つことは私にとって魅力的ではありません。

AMAIの創設ストーリーを共有してください。

私はパートナーに、「世界中の会社は何を探しているのか?」と聞きました。その会話の中で、私は毎回、ビジネスは「売上」を探していることを実感しました。私たちは、顧客と製品を売ることができるロボットを作り始めました。ただし、チャットボットはすでに多くありました。そこで、私たちは、これらのロボットが電話をかけることができたら、面白いと思いました。市場には良いソリューションが少なかったので、私たちは独自の合成音声のプロトタイプを作成し、最初の売上後、ロボットを放棄し、TTSに集中しました。

AMAIは具体的に何を表していますか?

これは、I’m AI(私は人工知能)を表しています。

最先端のテキスト・トゥ・スピーチ技術を設計する際の課題について議論してください。

最先端のTTSを設計するには、いくつかの課題があります。第一に、データセットの収集が必要です。ニューラルネットワークのトレーニングには、さまざまな年齢の男女の声が必要で、量が多いほど良いでしょう。第二に、自然な声に非常に近い声が必要です。最も良い方法は、さまざまなマシンラーニングモデルをテストし、さまざまな声の使用ケースを不断に実験することです。特に、最も問題のあるサンプルを見つけて、それを個別に処理する必要があります。長期的な課題については、声が改善されたか、悪化したか、またどの方向に改善するべきかを判断することが難しいことがあります。

AMAIの音声AIと人間が対話する際の音声認識の課題について説明してください。

音声認識を開発している会社は数百あります。現在、解決策のない問題は、子供の声の認識です。子供は幼い頃から多くの発声特徴を持っているため、それらすべてを考慮することは難しいです。ただし、私たちはこの問題の解決策に取り組んでおり、すぐに結果を発表する予定です。したがって、私たちのAIは、成人だけでなく子供とも問題なく対話できるようになります。

AMAIの一般的なユースケースについて説明してください。

現在、オーディオブックの吹き替えやコールセンターでのエンタープライズ使用が主なユースケースです。

現在提供されている言語と、開発中の言語について教えてください。

私たちのマルチスピーカーシステムには、ロシア語と英語の2つの言語が含まれます。アイデアは、1つの言語で作成された声が、私たちのモデル内の他のすべての言語でも話すことができるということです。現在、40以上の言語のデータを収集しており、すぐに42言語をサポートする予定です。

AI音声アシスタントの将来のビジョンについて教えてください。

私の信念は、音声アシスタントがメタバースに移行することです。現在、これらの機会を研究中です。スマートスピーカーまたはウェブブラウザとアシスタントを統合すると、より多くの人が毎日音声検索を使用し、アシスタントと対話するようになります。冷蔵庫やテレビと話すことができます。

AMAIについてさらに何か共有したいことがありますか?

AMAIは、独自のプロプライエタリ技術のみを使用しています。

インタビューありがとうございます。詳細については、AMAIを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。