Connect with us

インタビュー

スティーブン・ミラー、Fyusionの共同創設者兼エンジニアリング担当上級副社長 – インタビュー・シリーズ

mm

スティーブン・ミラーは、Fyusionの共同創設者兼エンジニアリング担当上級副社長です。Fyusionは、3Dイメージングとコンピュータビジョンの会社で、Cox Automotiveグループの一部です。Fyusionを創設する前は、スタンフォード大学でコンピュータサイエンスを学ぶ博士課程の学生でした。また、UCバークレーでの学部時代には、ロボティクスや外科的手術の研究を行っていました。彼は、Google Hertz Fellow、SAPスタンフォード大学院フェロー、NSFフェローです。

Fyusionとは何ですか?また、3Dデータの簡単なキャプチャと視覚化をどのように実現していますか?

Fyusionは、AIドライブの3D顧客体験を提供するコンピュータビジョンの会社です。私たちは、ほとんどのAndroidおよびiOSデバイスで動作するシンプルなスマートフォンアプリを使用して、3D画像をキャプチャすることができます。このアプリには、ステップバイステップのガイダンスが含まれており、誰でも使用できます。キャプチャには1〜2分程度かかります。その後、私たちのAIエンジン、ALISは、3D画像を分析して視覚データを活用可能な情報に変換します。現在、車の外部損傷を診断するために3D画像を使用することに焦点を当てています。

.fyuseファイル形式を使用して、スマートフォンのシングルカメラで3D画像を作成するアルゴリズムを説明してください。

.fyuse形式を写真やビデオと並べて考えることが役立ちます。写真は、特定の時点の静止画を1つの角度から捉え、ビデオは、連続した時系列の静止画を捉えます。一方で、.fyuse画像は、私たちが「空間の中の瞬間」と呼ぶものを捉えます。視聴者は、1つの角度や線形タイムラインに限定されません。何かを1つの側面だけでなく、周囲から見ることができます。

.fyuse画像を作成するには、カメラマンは、携帯電話のカメラで被写体を一方向に回します。あるいは、Fyusionテクノロジーは、固定イメージングソリューションやドローンなどの非伝統的なイメージングソリューションとも互換性があります。

私たちの.fyuseファイル形式は、これらの画像を実現します。軽量で、複雑な多面的なインタラクティビティを可能にします。また、日常的に使用しているラップトップ、タブレット、スマートフォンとも完全に互換性があります。

Fyusionでキャプチャおよび分析されるデータのいくつかについて説明してください。

車の場合、ALISは、車両のすべての部分を認識し、損傷のある場所、損傷のサイズと重大性を判断し、道路から飛んだ埃などの潜在的な誤陽性を排除できます。私たちが開発し特許を取得したテクノロジーは、他の問題も解決できますが、現在はこの問題に焦点を当てています。

AIベースのLightfield Information Suite(ALIS)について説明してください。

ALISは、すべてのFyusion製品のエンジンです。軽量の3Dイメージングと深い視覚的理解を可能にします。ALISは3つの部分で構成されています。キャプチャ、エンジン、ビューアー。キャプチャモジュールでは、モバイルアプリケーションには、ビルトインのチュートリアルとカスタマイズ可能なワークフローが含まれており、ほとんどのスマートフォンで高品質の3D画像をキャプチャできます。Fyusionの画像キャプチャは、DSLR、ドローン、他のデバイスもサポートしています。

2番目のステップであるエンジンでは、ALISは、3D画像を分析して、顧客が要求する損傷の種類などの活用可能な情報に変換します。また、2D画像の作成によって、その発見の裏付けも提供できます。

最後に、ビューアーは.fyuseファイル形式を表示します。.fyuseは特許取得済みで軽量であり、高速なロード時間で没入感のある3D体験を提供します。.fyuseに、オーディオ、ビデオ、2D画像などのさまざまな体験を追加できます。

FyusionはARおよびVRに対応しています。将来的にこれらのアプリケーションがどれほど大きくなるかについて、どのように考えていますか。

拡張現実は、10億ドル規模の業界で、より主流になりつつあります。また、強力な新しいモバイルデバイスや低遅延ネットワークにより、3Dの周囲をキャプチャすることも容易になっています。これらのテクノロジーが主流になると、オンライン体験に対する顧客の期待は、コンテンツクリエイターが跟いつくことができるだけの速さで高まります。

特に自動車業界では、車の購入がオンラインで行われることが増えています。次の数年で、AR、VR、3Dリストの関心が急増することを予想しています。目標は、シンプルな車両詳細ページ(VDP)を車両体験ページ(VEP)に変えることです。これにより、大規模および小規模な自動車ディーラーが繁栄し続けることができます。これには、リストに3Dロゴやリッチメディアタグを追加したり、ショッパーが車のトランクにゴルフクラブを仮想的に配置して、収まるかどうかを確認する機能などがあります。

これらの種類のアプリケーションが主流での使用に移行し始めるのを見て、興奮しています。長くは待たないと思います。

3D画像と2D画像を使用した電子商取引でのクリック率と収益の改善について説明してください。

私は、卸売および小売自動車販売に最も精通しています。3D画像は、オンラインショッパーに対して新しいレベルの信頼を生み出しました。これは、特に車のような大型商品の場合に、特に重要です。

私たちの内部データによると、3D画像は、ユーザーの関与と車両詳細ページでの時間を増やし、それが車の販売を増やすことを示しています。車両のリアルな3D体験を提供することで、ベンダーに対する肯定的な感情を高め、信頼を築くことができます。

Fyusionでは、データをローカルで処理するか、クラウドで処理するか選択できます。各オプションの利点について説明してください。

ローカルでは、エッジAIは、特にモバイルフォンの使用例の場合、開発者に大きな制約を課します。標準的な懸念(ネットワークの最適化、結果の信頼性など)に加えて、実用的な懸念もあります。メモリの圧力、バッテリーの消耗、ユーザーまたはオペレーティングシステムによってプロセスがバックグラウンド化される可能性などです。さらに、比較可能なCPUとGPUがエッジに存在することを前提としています。フラグシップデバイスの場合でも、これはまれにしかありません。

あらゆる可能性のあるコーナーケースを計画する必要があります。一方、クラウドでは、どのソリューションも監視および微調整できます。

しかし、総合的に言えば、エッジAIは、完璧な「オートスケーリング」ソリューションと見なすことができます。新しいユーザーごとに、完全に新しいマシンが利用可能になります。エッジで完全に最適化されたネットワークを実行している場合、2つまたは200万のクライアントを同じようにサービスできます。

クラウドでは、最も強力なハードウェアが存在しますが、データは王です。データが多いほど、生のデータに近いほど、より良くなります。エッジのAIは、生の入力データにアクセスでき、制限はありません。一方、クラウドのAIソリューションの場合、入力データは処理済み(圧縮、部分)であるか、または巨大で、帯域幅が大きな懸念事項になります。

エッジAIはユーザーに最も近いため、クラウドAIでは実現できない多くの可能性が開けます。リアルタイムで実行するように最適化されている場合、リアルタイムでフィードバックを提供できます。つまり、データを処理するだけでなく、ユーザーがより良いデータを提供するソリューションを構築できます。

5Gは、コンピュータビジョンテクノロジーのアプリケーションの急成長をどのように促進しますか。

高速な接続速度により、クラウドでの処理を増やすことができ、さまざまな新しいコンピュータビジョンのアプリケーションの可能性が開けられます。ただし、アプリケーションによっては、採用の範囲が異なります。

5Gは、断片化された影響を与え、デジタル格差を拡大させる可能性があります。世界の一部では、より速い接続速度が利用可能になる一方で、他の地域では、遅い接続速度が続きます。5Gにアクセスできる人々に対象としたアプリケーションは、明らかに利益を得ます。しかし、より広く採用されているアプリケーションについては、時間とお金を費やして、基本的に2つのバージョンのアプリケーションを作成するか、ほとんどの接続で動作するが機能が限定されたバージョンの1つに留まるかという選択を迫られる可能性があります。

Fyusionは、将来的に5Gロールアウトを活用するために、どのようなステップを講じていますか。

Fyusionは、古い携帯電話や帯域幅の制限された接続でのアクセスを可能にするために、多大な時間を費やしています。Manheimのみで、100万台以上の車両を画像化しています。そうでなければ、これを達成できなかっただけです。

ただし、現在見ているものは、処理速度の増加、5G接続、カメラフォンの革命と言えるでしょう。これらすべてを組み合わせると、新しい開発につながります。残念ながら、それについてはまだ話すことができません。

Fyusionについて、他に伝えたいことはありますか。

コンピュータビジョンは、長い間未来のテクノロジーとして話題に上っていた分野ですが、ようやく主流になりつつあります。Fyusionは急成長を遂げており、世界中からコンピュータビジョンの科学者を募集しています。チームメンバーはどこからでも働くことができますが、ポトレロヒルのオフィスにもいつでも歓迎します。

素晴らしいインタビュー、詳しく知りたい読者はFyusionを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。