Connect with us

Johan Wadenholt Vrethem, Voxo の CEO – インタビュー シリーズ

インタビュー

Johan Wadenholt Vrethem, Voxo の CEO – インタビュー シリーズ

mm

Johan Wadenholt Vrethem は、テクノロジーとビジネスの交差点で 20 年以上の経験を持ち、組織が運営され、顧客と関わる方法を AI で変革することに焦点を当てています。CGI で銀行および金融部門の主要なデジタル イニシアチブとクライアント プログラムを率いた後、会話分析とイベント テクノロジーにおけるイノベーションを推進するために Voxo を共同設立しました。

Voxo AI で、Johan は、イベントやカンファレンスでのライブ ディスカッションからリアルタイムで AI パワード インテリジェンスを提供し、チームがデータからアクションに迅速かつ正確に移行できるようにしています。商業的な影響と社会的な善行に尽力している彼は、オンラインでの児童虐待を防ぐための CSR イニシアチブも率いてきました。

Voxo AI は、カンファレンス、パネル、セッションでのライブ スポークン コミュニケーションを構造化された、使用可能な洞察に変換するイベント インテリジェンス プラットフォームです。リアルタイム オーディオを分析して、瞬時に要約、主要なポイント、イベント後のコンテンツ such as レポートやブランド化されたアセットを生成し、主催者、出席者、スポンサー、スピーカーが手動でのメモ取りやフォローアップ作業なしでディスカッションから持続的な価値を抽出できるようにします。

Voxo を設立する前に、銀行および金融サービスにおける複雑なデジタルおよび AI ドリブンのイニシアチブを CGI で何年も率いてきました。どのような具体的な 苦労やギャップがあって、会話インテリジェンスに焦点を当てた会社を設立することを決意したのですか?

CGI での私の時間は非常に形成的でした。それは、コンサルティングに加えて数百の IP アセットを持つ大きな組織でした。また、複雑なデリバリー環境、ガバナンス、企業の変革をスケールで見ることができました。それはまた、テクノロジー、ステークホルダー、競合する優先順位に分散されていました。

私はビジネス アナリストからディレクターまで 2 年で昇進し、その時点で私は焦点を当てる準備ができていました。共同創設者と出会ったとき、利用可能な最良のテクノロジーを使用して非常に具体的で高価値の問題を解決するための単一のトラックを構築できることがわかりました。多くの人が知らないことですが、私たちは当初、金融顧問での文書化に焦点を当てたフィンテック会社として始めました。そこから会話分析に進化し、最終的に人間の会話から実際の意味を抽出する方法を学んだことを基にイベント インテリジェンスに拡大しました。

初期の段階で、制御された、スクリプト化された入力ではなく、実際の会話を信頼性高く理解できる AI を構築する上での最も難しい技術的または商業的な課題とは何でしたか?

私たちの最も初期のフィンテック製品では、テクノロジーが野心を制限していました。初期の焦点であったノルディック言語の自動音声認識には、70 ~ 80 パーセントの単語エラーレートがありました。そのレベルでは、人間の文書化を置き換える製品を構築することはできません。

同時に、現代の大規模言語モデル機能はまだ存在しませんでした。したがって、信頼性の高い要約を生成することはほぼ不可能でした。後にイベント サービスを立ち上げたとき、風景は変わりました。数年間で深いノウハウを構築し、スケーラブルな方法で基調講演、討論、ラウンドテーブルを理解するための正しい AI ビルディング ブロックを持っていたのです。

Voxo は会話分析から始まり、後に大規模なイベント インテリジェンスに拡大しました。スピーチ AI の次の主要なフロンティアがライブ イベントであることを示す信号とは何でしたか?

興味深いことに、私たちは最初にイベントと協力して、C レベルのエグゼクティブにより迅速にリーチし、会話インテリジェンスの強力さを示す方法として始めました。しかし、スウェーデンの最大のテクノロジー イベントである Techarenan で 10,000 人以上の出席者を対象に提供した後、大きな変化を見ました。

インバウンド デマンドは即時的で非常に明確でした。人々はただ感銘を受けたのではなく、イベント サービスを製品として購入したいと考えていました。那が信号でした。私たちは、最高の品質レベルで世界中に提供するために、時間、焦点、リソースを投資することを決定しました。

システムの観点から見ると、単一の会議のトランスクリプションから、複数日のイベントでの数百の同時セッションの処理に移行するときに、基本的に何が変わりますか?

複雑さは急速に増大します。個々のセッションでの安定性と品質を維持するだけでなく、現実世界の混沌にも対処する必要があります。イベントでのスケジュールの最後の瞬間の変更、スピーカーの交代、プログラムの更新は正常です。

イベント チームに余分な負担を加えずに提供するには、厳格で柔軟性のあるプロセスが必要です。また、分析のための実証済みの方法論が必要です。単に数百時間のオーディオをモデルに投入して面白いレポートを要求することはできません。分単位で高品質の出力を生成するには、複数のモデル、パイプライン、構造の層を組み合わせる必要があります。

多くの AI ツールは、自動化を何よりも優先しています。Voxo のプラットフォームの核心として人間のレビューを含めることを決めた理由は何ですか?

信頼は依然として最大の障壁です。特に HubSpot、GitHub、Intuit のようなエンタープライズ クライアントの場合、不正確なものを公開することへの恐怖は非常に現実的です。そのため、安定したプロセスと AI レビューと人間の品質保証の組み合わせが依然として多くの顧客にとって要件です。

私たちは顧客にコントロールを与えます。要約を配布する前に顧客がレビューして承認できるようにし、そのワークフローを効率的にします。時間の経過とともに、人間のレビューの必要性は減少するでしょう。技術とセーフガードが成熟するまで、その間は何よりも信頼を得ることが重要です。

ニア リアルタイム トランスクリプションと要約は、イベント チームがコンテンツのタイムラインとイベント後の価値について考える方法をどのように変えましたか?

それは基本的にタイムラインをリセットします。コンテンツは、イベントが終了した数週間後に公開されるものではなく、イベントが進行中であり、各セッションの終了後に使用できるものになります。

私たちが見ているのは、顧客が数ヶ月間にわたって関与を維持する材料を持っていることです。出席者やスピーカーも、セッションの直後にコンテンツを共有する可能性が高くなります。ただし、それが簡単で、見た目が良ければです。同じコンテンツが 1 か月後に到着すると、通常、ソーシャル メディアで有意な配布を駆り立てるには遅すぎます。ニア リアルタイムは、コンテンツをライブ エクスペリエンスの延長線上に変え、単なるイベント後のアーカイブではありません。

イベントには、主催者、スピーカー、スポンサー、出席者など、複数のステークホルダーが関与します。Voxo は、インサイトや品質を薄めずにこれらのすべてのステークホルダーにサービスを提供するように設計していますか?

私たちはステークホルダーから外側に設計していますが、同じ根底にある真実を維持しています。すべてのステークホルダーは同じキャプチャされたコンテンツから利益を得ます。次に、出力はステークホルダーの目標に合わせてカスタマイズされます。

出席者はインスタントで共有可能なセッションの要約と、逃したセッションを再訪問する能力を得ます。マーケティング チームは、配布と測定可能な影響のために構築されたスポンサー ブランド化されたアセットを得ます。主催者は、出席者の価値の向上、イベントの勢い、収益の新しい選択肢を得ます。スピーカーは、磨かれた要約を 1 クリックで共有する方法を持ち、主催者はそのネットワーク効果から利益を得ます。

鍵は、品質を薄めないことです。私たちは 1 つの堅固なコンテンツ エンジンを構築し、それを各ステークホルダーにとって実際の価値を生み出すものに基づいて異なる方法でパッケージ化します。

Voxo を使用するイベントは、コンテンツの配信が速くなり、スポンサーの関与が高まっていることを報告しています。コンテンツの配信、構造、洞察の品質の 3 つの中で、どれが影響を与えるのに最も重要です?

それは組み合わせです。速度はコンテンツが構造と品質に欠けている場合には重要ではありません。一方で、最も優れたコンテンツでも遅すぎると価値が低くなります。

実際の利点は、3 つすべてをまとめて提供することです。高品質の洞察が、明確な構造でパッケージ化され、依然として関連性がある速度で配信されます。那がコンテンツを有用で共有可能で商業的に影響力のあるものにします。

AI ドリブンのコンテンツ プラットフォームにとって、将来数年間で「リアルタイム」が本当に何を意味するのか、そして私たちはその現実にどのくらい近いと思いますか?

ある場合には、真のリアルタイムはすでにここにあります。私たちは、NHS と First Sight Media および Lineup Ninja と協力して、例えばマンチェスターで複数のライブ ストリームをまたいだリアルタイム コメントを提供しました。また、2023 年の Techarenan で Al Gore や Steve Wozniak を含むスピーカーと共にリアルタイム エクスペリエンスを紹介しました。

しかし、イベントでは、ニア リアルタイムと真のリアルタイムの両方に余地があります。重要な点は、価値を生み出すことについて意図的であることです。スピーカーの背後でリアルタイムで更新される単語クラウドは、役に立つよりも邪魔になる可能性があります。リアルタイムは、出席者のエクスペリエンスを強化する必要があり、それに干渉する必要はありません。

最後に、企業の顧客と話すときに、AI 生成の要約またはトランスクリプトについて、よく訂正しなければならない一般的な誤解とは何ですか?

最大の誤解は、オーディオ ファイルを転写して ChatGPT に貼り付けるだけで、信頼性が高く一貫性のある高品質の要約を得ることができるということです。人々はすぐに気づきますが、それは時間がかかり、特に多数のセッションがある場合には一貫性を維持するのが難しいことです。また、転写と要約は、私たちが提供するもののわずか 5 パーセントです。実際の仕事は、スピード、構造、コンテキスト、ブランドに準備されたパッケージング、品質保証、エンタープライズ スケールでコンテンツを使用可能で価値のあるものにする配布形式です。

素晴らしいインタビュー、詳細を知りたい読者は Voxo AI を訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。