Connect with us

Yashar Behzadi、Synthesis AIのCEO – インタビュー・シリーズ

インタビュー

Yashar Behzadi、Synthesis AIのCEO – インタビュー・シリーズ

mm

Yashar Behzadi PhDは、Synthesis AIのCEO兼創設者です。彼は、AI、医療技術、IoT市場で変革的なビジネスを築いてきた経験豊富な起業家です。彼は過去14年間、シリコンバレーでデータ中心のテクノロジー企業を構築し、拡大してきました。Yasharには30以上の特許と特許出願があり、UCSDから空間・時間モデリングの分野でPh.D.を取得しています。

Synthesis AIは、ディープラーニングとCGIの交差点に位置するスタートアップで、新しいコンピュータビジョンモデル開発のパラダイムを生み出しています。彼らは、従来の人間によるアノテーションに基づくアプローチの時間とコストの少ない分数で、より優れたモデルを開発できるように顧客をサポートしています。

コンピュータサイエンスとAIに最初に携わるようになったのはどうなりましたか?

2006年にUCSDからコンピュータビジョンと脳イメージングデータの空間・時間モデリングに焦点を当てたPh.D.を取得しました。すると、次の16年間、シリコンバレーでセンサー、データ、機械学習の交差点でさまざまな業界で働きました。私の経歴の中でいくつかの注目すべき技術に取り組む機会に恵まれたことを感謝しています。また、信号処理、機械学習、データサイエンスに関する30以上の特許を出願または発行しています。

Synthesis AIの創設物語を共有してください。

2019年にSynthesis AIを創設する前に、主要なテクノロジー企業向けにコンピュータビジョンモデルを開発するグローバルAIサービス企業を率いていました。会社の規模に関係なく、ラベル付けされたトレーニングデータの品質と量に非常に限界があることがわかりました。会社が地理的に拡大したり、顧客ベースを拡大したり、新しいモデルや新しいハードウェアを開発したりすると、新しいトレーニングデータが必要でした。また、現在の人間によるアノテーションのパラダイムでコンピュータビジョンの将来は成功しないことも明らかになりました。オートノミー、ロボティクス、AR/VR/Metaverseアプリケーションなどの新しいコンピュータビジョンアプリケーションには、人間がラベル付けできない3Dラベル、深度情報、材料特性、詳細なセグメンテーションなど、豊富なラベルセットが必要です。技術的な要因に加えて、モデルバイアスや消費者プライバシーに関する倫理的な問題について、消費者や規制当局からの厳しい追及に直面していました。

Synthesis AIを設立し、コンピュータビジョンのパラダイムを変革することを目的としました。同社のシンセティックデータ生成プラットフォームにより、フォトリアリスティックな画像データをオンデマンドで生成でき、3Dピクセルパーフェクトラベルを拡張できます。私たちの使命は、シンセティックデータ技術を先駆けて、より優れたモデルの倫理的な開発を可能にすることです。

この用語に不明な読者にとって、シンセティックデータを定義してください。

シンセティックデータは、代替の実世界データとして機能するコンピューターゲネレーテッドデータです。シンセティックデータは、実世界で収集または測定するのではなく、シミュレーテッドデジタルワールドで生成されます。視覚効果とCGIの世界からのツールを組み合わせて、Synthesis AIは、コンピュータビジョンモデルをトレーニングするために、多様でフォトリアリスティックなデータを大量にオンデマンドで生成できるように企業をサポートしています。同社のデータ生成プラットフォームは、コストと速度を従来のアプローチと比較して大幅に削減し、プライバシーを維持しています。

シンセティックデータはどのように生成されますか?

シンセティックデータセットは、実世界のデータではなく、人工的に生成されます。視覚効果業界の技術と生成的なニューラルネットワークが組み合わさって、多様でフォトリアリスティックなラベル付けされた画像データを生成します。シンセティックデータにより、従来のアプローチと比較して、トレーニングデータを生成するコストと時間を大幅に削減できます。

シンセティックデータを活用することで、競争上の優位性はどのように生まれるのでしょうか?

現在、ほとんどのAIシステムは、人間が画像の重要な属性をラベル付けし、次にAIアルゴリズムをトレーニングして画像を解釈する「教師あり学習」を使用しています。これは、リソースと時間がかかるプロセスであり、人間が正確にラベル付けできるものに制限されています。さらに、AIの人口統計バイアスや消費者プライバシーに関する懸念が増大し、代表的な人間データを取得することがますます困難になっています。

私たちのアプローチは、シミュレーテッドデジタルワールドで複雑な画像データを生成することです。私たちがデータを生成するので、シーンのすべての情報、オブジェクトの3D位置、および環境との複雑な相互作用について知っています。従来のアプローチでこの量のデータを取得してラベル付けするには、数ヶ月、あるいは数年かかります。この新しいパラダイムにより、効率性とコストが100倍向上し、新しいクラスのより優れたモデルが可能になります。

シンセティックデータは人工的に生成されるため、従来のデータセット収集方法とは多くのバイアスやプライバシーに関する懸念が排除されます。

オンデマンドデータ生成はどのようにスケーリングを加速するのでしょうか?

実世界のデータをキャプチャしてモデルトレーニング用に準備するのは、長くて面倒なプロセスです。オートノミー、ロボティクス、または衛星画像などの複雑なコンピュータビジョンシステムのために必要なハードウェアの展開は、非常に高価になる可能性があります。データをキャプチャした後、人間は重要な機能をラベル付けしてアノテーションします。このプロセスはエラーに敏感で、人間は3D位置などの重要な情報をラベル付けする能力が制限されています。

シンセティックデータは、従来の人間によるアノテーションに基づくアプローチと比較して、はるかに高速で低コストです。シンセティックデータは、さまざまな業界で新しいモデルを展開することを加速し、さらに優れたモデルを可能にします。

シンセティックデータはどのようにAIのバイアスを軽減または防止するのでしょうか?

AIシステムは至る所にありますが、人々に影響を与える可能性のある内在的なバイアスを含む可能性があります。データセットは特定のクラスのデータが不均衡で、人々の特定のグループが過剰または不足しています。人間中心のシステムを構築することは、性別、民族、年齢のバイアスにつながる可能性があります。一方、設計によって生成されたトレーニングデータは適切にバランスがとれており、人間のバイアスがありません。

シンセティックデータは、AIのバイアスの問題を解決するための強力なソリューションになる可能性があります。シンセティックデータは、実世界のイベントまたは現象から測定または抽出されるのではなく、部分的または完全に人工的に生成されます。データセットが多様性に欠けている場合や十分に大きくない場合、AI生成データを使用してギャップを埋め、偏りのないデータセットを作成できます。最も重要な点は、チームがこれらのデータセットを作成するために数ヶ月または数年かかる可能性があることですが、シンセティックデータを使用して設計すると、1晩で完了できます。

コンピュータビジョンの外での将来的なその他の潜在的なシンセティックデータの用途は何ですか?

コンピュータビジョンの用途に加えて、消費者製品、オートノミー、ロボティクス、AR/VR/Metaverseなど、シンセティックデータは他のデータモダリティにも影響を及ぼします。構造化されたタブラーデータ、音声、自然言語処理のためのシンセティックデータアプローチを採用する企業をすでに目撃しています。各モダリティの基本となる技術と生成パイプラインは異なりますが、近い将来、多モーダルシステム(例:ビデオ + 音声)が登場することが予想されます。

Synthesis AIについてさらに共有したいことはありますか?

先月、HumanAPIをリリースしました。これは、Synthesis AIのシンセティックデータ機能を大幅に拡張し、数百万のユニークで高品質の3Dデジタルヒューマンをプログラム的に生成できるようにしました。この発表は、先月、スマートフォン、テレビ会議、自動車、テクノロジー企業向けに1000万以上のラベル付けされた顔画像を提供した、FaceAPIシンセティックデータサービス製品の発売から数ヶ月後に行われました。HumanAPIは、会社が先進的なコンピュータビジョンAIアプリケーションをサポートするための次のステップです。

HumanAPIは、スマートAIアシスタント、仮想フィットネスコーチ、Metaverseアプリケーションの世界など、顧客にとって多くの新しい機会を提供します。

デジタルワールドのデジタルツインを作成することで、Metaverseは、再構想されたソーシャルネットワーク、エンターテイメント体験、テレビ会議、ゲームなど、新しいアプリケーションを可能にします。コンピュータビジョンAIは、実世界がデジタル領域で高忠実度でキャプチャされ、再構築される方法の基本となります。フォトリアリスティックで、表現豊かで、行動的に正確なヒューマンは、将来のコンピュータビジョンアプリケーションの重要なコンポーネントとなります。HumanAPIは、より優れたAIモデルを構築するために、ポーズ推定、感情認識、活動および行動の特性化、顔の再構築など、オンデマンドで大量の完全にラベル付けされた全身データを生成できる最初の製品です。

素晴らしいインタビュー、詳細を知りたい読者は、Synthesis AIを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。