Connect with us

James Kaplan, CEO & Co-Founder of MeetKai Metaverse – Interview Series

インタビュー

James Kaplan, CEO & Co-Founder of MeetKai Metaverse – Interview Series

mm

James Kaplan, は、MeetKai のCEOおよび共同創設者です。MeetKaiは、ロサンゼルス、カリフォルニアに拠点を置く、人工知能、VR、会話検索会社で、現在、未曾有の機能でAIスピーチレースをリードしています。MeetKaiの会話AIは、より複雑なスピーチを理解し、多くのテーマについて自然な会話でパーソナライズされた結果を提供できます。MeetKaiのテクノロジーは、iOS、Google Play、AppGalleryを通じて世界中に展開されています。

あなたは6歳の時にAIに情熱を持っていました。どうやってこのテクノロジーに最初に触れたのですか?

私はビデオゲームからAIに触れました。最初は、ゲーム「Oregon Trail」のAIがどのように機能するかを理解しようとしました。そこはまだ賢くないAIでしたが、AIの一種ではありました。そこから、私のAIへの興味はMMORPGsに興味を持つにつれてさらに深まりました。私はオンラインゲームを楽しんでいましたが、アイテムを集めるのが嫌でした。そこで、ボットを作成することに興味を持つようになりました。

あなたが最初にコード化したAIアプリケーションは何でしたか?

MMORPGs用のボットを作成することは、実際に開発した特定のAIの一種でした。初期の私のボットは非常にシンプルで、マクロに近いものでした。ただし、私が年をとるにつれて、ボットの検出が多くのゲームで改善されました。これは、ボットがよりプレイヤーのように見える必要があることを意味しました。私はボットの作成を楽しんでいました。学校に通っている間、テイラー・スウィフトのコンテストに勝つためのボットを作成しました(そして彼女は実際に演奏するために来ました!)。同様に、私は最初のポケモンGoボットも作成しましたが、検出を避けることに興味を失ったとき、多くの人を禁止しました。

あなたは2018年に、現在のAIボイスアシスタントに不満を感じてMeetKaiを立ち上げました。ほとんどのAIアシスタントは、不十分な体験を提供するのはなぜですか?

問題の核心は、ほとんどのAIアシスタントが外部APIに依存しすぎていることです。たとえAlexaのようなeコマース検索でフルフィルメントを制御する場合でも、同じ問題に苦労しています。単純に言えば、音声からテキストへの変換とテキストをテキストベースの検索エンジンに挿入するだけのボイスアシスタントが賢いと期待することはできないのです。私たちは、会話検索エンジンではなく、キーワードベースの検索エンジンを作成することで、MeetKaiを立ち上げました。複雑なクエリと会話をサポートするために、会話検索エンジンを作成しました。他のアシスタントは、多ターン会話のサポートをこれらの制限要因の上に構築できないため、不十分な体験に苦労しています。私たちの目標はそこに到達することですが、まだ私たちのテクノロジーをスケールアウトして、既存のプレイヤーと同じ数のドメインを満たすために、非常に初期段階にあります。

最先端のボイスアシスタント体験を構築するための自然言語理解と自然言語処理の課題は何ですか?

次世代のNLUの1つの主な課題は、意図とエンティティを超えることです。ほとんどのNLUは、非常に伝統的な言語理解のアプローチをしています。各入力発言は、意図に分類され、トークンはシーケンスラベル付けモデルを使用してエンティティにラベル付けされます。私はこの標準アプローチの問題を数十個列挙できます。ただし、最も重要なものは:

  1. コンテキストのない意図分類は、多ターン会話を処理できない。ほとんどのアプローチは、単にトランスクリプトされた生のテキストだけに興味があります。ユーザーが誰であるか、ユーザーが何を好きかは興味がありません。ただし、ユーザーが何について尋ねたかだけに興味があります。これは、ユーザーが簡潔なことしか言わない場合に特に重要です。たとえば、誰かが「コスモポリタン」と言ったとき、それは飲み物または雑誌を意味する可能性があり、ユーザーに大きく依存します。
  2. エンティティ認識モデルは、カテゴリ値以外のものをうまく処理できません。大規模な言語モデルは、データセットにない新しいエンティティに十分に迅速に適応できません。AIには、エンティティを認識するための、コンテキストを考慮するための、はるかに洗練された方法が必要です。たとえば、ユーザーのロケーションは、レストラン名か何か他のものかを判断する上で大きな影響を与えるべきです。
  3. エンティティ関係は、十分に考慮されていません。私の好きな例は、否定についてほとんどの検索エンジンが失敗する頻度です。他のボイスアシスタントで「ロマンスのない映画」を検索してみてください。

現在、ほとんどのボイスアシスタントは、音声をテキストに変換し、Google検索を実行します。MeetKai AIは、この方法とどのように異なりますか?

MeetKaiとGoogleの主な違いは、MeetKaiがWebページではなく、アイテム自体を検索するために、より豊かな言語理解モデルを使用していることです。たとえば、「トム・クルーズのアクションのない映画」と検索した場合、Googleはページにそのセットのトークンが表示されるページを検索します(トム・クルーズ、映画、アクション)。MeetKaiでは、トム・クルーズが俳優であること、映画が探しているメディアのクラスであること、アクションが望ましくないジャンルであることを正しく理解します。MeetKaiは、より賢い検索を実行できます。

MeetKaiは最近、最初のライフスタイルVRワールド「MeetKai Metaverse」を立ち上げました。このアプリケーションについて説明してください。

メタバース空間のほとんどの会社は、人と人との相互作用に取り組んでいます。そのほか、コンテンツはほとんどカートゥーンのようなものか、360°ビデオです。MeetKai Metaverseの目標は、まったく別の角度に焦点を当てることです。人とAIです。私たちは、会話AIによって動かされるキャラクターと相互作用するメタバースを開発しています。さらに、環境をよりリアルにし、他の会社よりも没入感のあるものにするために、環境の手順的生成に取り組んでいます。メタバースで利用可能な2つの初期ワールドは、2つの初期ユースケース用です。最初は瞑想、2番目は博物館です。前者では、ウィング・チョン専門家をデジタル化し、革命的な瞑想テクニックを使用してリラックス状態に入る方法をユーザーに指示できるAIキャラクターを作成しました。後者では、成長する美術館を作成し、美術館のAIパワードキュレーターが美術館についての質問に答え、ツアーを提供できるようにしました。

MeetKai Metaverseでは、AIはどのように使用されていますか?

私たちは、3つの場所でAIを使用しています:

  1. メタバースの各キャラクターの会話機能を動かすために。
  2. ユーザーに利用可能なコンテンツを、音声ガイダンスを通じて、動的に作成するために。最初の2つの体験の例として、瞑想セッションや美術館ツアーがあります。
  3. 手作業のレイアウトを必要とせずに、3D空間を手順的に作成するために。

ボイスアシスタントの将来についてのあなたのビジョンは何ですか?

ボイスアシスタントが将来を有するには、コマンドベースのシステム以上のものに進化する必要があります。これは、多くの特定のドメインで深い専門知識と能力を取得することを意味します。私は、ドメイン固有のボイスアシスタントを組み合わせて、全知能メタアシスタントを構築することが、ボイスアシスタントの空間で見られた「一度にすべてを実行する」試みとは対照的に、ボイスアシスタントを構築するための鍵になることを考えています。

MeetKaiまたはMeetKai Metaverseについて、他に共有したいことはありますか?

私たちはまだメタバースロードマップの初期段階にあります。私たちの最終的な目標は、現実世界で体験できるものをメタバースで再現し、それを超えることです。これは、現実世界での同じ体験を制限するコストと時間の制限要因を排除することを意味します。メタバースは、より豊かな生活を送ることができるように私たちに許可する可能性がありますが、それらを置き換えるのではありません。私たちはまだ、技術的な課題を解決する必要があります。ただし、ハードウェアが改善し続けるという前提で、達成可能な一連のマイルストーンがあります。私たちは、VR空間が迅速に進化するように、ハードウェアパートナーと密接に協力しています。VR以外にも、メタバース体験を可能にすることを目指しています。詳細については、近い将来発表予定です。

素晴らしいインタビュー、ありがとうございます。私たちのメタバースバージョンの進捗状況を追跡することを楽しみにしています。詳細については、MeetKaiを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。