Connect with us

ボビー・サミュエルズ、Protegeの共同創設者兼CEO – インタビュー・シリーズ

インタビュー

ボビー・サミュエルズ、Protegeの共同創設者兼CEO – インタビュー・シリーズ

mm

ボビー・サミュエルズは、Protegeの戦略と実行を製品、市場参入、資本形成の全ての面で牽引しています。彼は2024年にProtegeを共同創設し、設立以来CEOを務めています。彼のリーダーシップの下、Protegeは3,500万ドルの資金を調達し、最初の1年で3,000万ドルのGMVに拡大しました。以前は、Datavantのプライバシーハブのゼネラルマネージャーとして、同社の成長を牽引し、Ciox Healthとの70億ドルの合併により米国の最大の中立的ヘルスデータエコシステムを創設しました。さらに、LiveRampではパートナーシップを牽引し、ニュートラルデータネットワークの構築における専門知識を身に付けました。ボビーは、スタンフォード大学経営大学院のMBAとハーバード大学のABを取得しています。彼は、規制データ交換と複雑なインフラストラクチャをエンタープライズパートナー向けの信頼できるAI実現に翻訳するという分野で深い専門知識を持ちます。

Protegeは、データインフラストラクチャ会社で、高価値の独自データセットの所有者とAIモデルを構築する開発者を結び付け、規制された方法でライセンスされ、プライバシーが優先される大規模なトレーニングデータにアクセスできるようにします。2024年に設立されたこのプラットフォームは、従来、AIチームが取得するのが難しいとされる医療レコード、画像、ビデオ、オーディオなどのマルチモーダルデータの 잠금を解除することに重点を置いています。一方、データ提供者は、プライバシー、コンプライアンス、収益化を完全に制御できます。AI構築者にとって、Protegeは、カタログとデータセットのフィルタリングおよび組み合わせのツールを提供し、ヘルスケア、メディア、その他の分野での開発を加速することで、発見と取得を簡素化します。実質的に、同社はAIの信頼できるデータレイヤーになり、モデルの開発における最大のボトルネックの1つを軽減することを目指しています。

あなたがProtegeを設立したきっかけは何ですか?また、Datavantでのデータ、プライバシー、組織変革イニシアチブのリーダーシップ経験や、LiveRampでの以前の役割は、同社を構築するためのあなたのビジョンをどのように形作りましたか?

Datavantでの経験から、私は大規模なデータの接続の力と複雑さを学びました。Datavantは、患者プライバシーを維持しながら、機密性の高いヘルス情報をリンクするプラットフォームを構築しました。そこで、私は、適切に管理されたデータが巨大な社会的進歩をもたらすことができることを理解しました。しかし、AIが加速するにつれて、同じパターンが繰り返されることに気付きました。コンピュートとAIアーキテクチャに焦点が当てられている一方で、モデルを駆動するデータ自体にはあまり焦点が当てられていません。私たちの仮説は、次の大きなボトルネックは、適切なデータへのアクセスであるということです。私は、データ所有者とAI構築者が安全に、透明性があり、相互に利益のある方法でデータを共有できるデータインフラストラクチャレイヤーを構築したいと思いました。それがProtegeを設立した理由です。

Protegeは「AIデータエコノミーの骨格」を構築していると述べています。このレイヤーをどのように定義しますか?また、実践ではAIのための真のデータインフラストラクチャとは何ですか?

Protegeは、データ所有者とAI開発者が安全に、効率的に協力できるように接続する役割を果たします。AIのための真のデータインフラストラクチャは、単にデータを保存または移動するのではなく、出典を検証し、権限を管理し、すべてのデータセットが倫理的に、同意に基づいて使用されることを保証します。実践では、コンテンツ所有者がデータを自信を持ってライセンスし、適切に補償されるプラットフォームであり、AI構築者が、責任を持ってモデルをトレーニングおよび評価するために必要な、業界、ドメイン、モダリティ、形式のさまざまなデータセットにアクセスできるプラットフォームです。

あなたの主な使命の1つは、モデルがライセンスされた、代表的な、同意に基づいたデータセットでトレーニングされることを保証することです。Protegeは、倫理的なソーシングをどのように大規模に実現していますか?

私たちは、システムを通じて倫理を実現しています。私たちが集約し、配信するすべてのデータおよびコンテンツソースについて、権利所有者が所有権を維持し、明確なライセンス条項とプライバシ保護を維持していることを確認します。

私たちのプラットフォームは、人間の研究指向の専門知識と、権利保護されたデータを配信するデータパイプラインおよびシステムを組み合わせています。また、データを購入する顧客と協力して、データが現実世界の人口と現実世界のユースケースを代表していることを確認します。データ提供者とデータ購入者の両方に一貫性と明確性で対応することで、コンプライアンス、公平性、信頼を維持できます。

AI業界は長年にわたり、「スクラップしてから後で尋ねる」メンタリティによって推進されてきました。透明なデータライセンスは、データ提供者とAI開発者の関係をどのように変えるでしょうか?

透明性は抽出をコラボレーションに変えます。AI企業は、倫理的にデータをライセンスするオプションがあり、データ提供者は収益とコントロールを得ることができ、AI開発者はクリーンで高品質のデータセットを法的および知的財産の問題なしで取得できます。

このシフトは信頼を築き、AI開発のスピードを上げます。組織がAIが責任を持って構築されていることを確認し、データ所有者の同意と補償が明確であることを確認すると、より多くのユースケースとデータニーズが解放されます。これにより、高品質のデータセットに対する需要が増加し、自然なフライホイールが作成されます。最良のデータソースは買い手を引き付け、買い手は高忠実度のデータソースを引き付けます。すべての人が利益を得ます。

合成データは、プライバシーとバイアスの課題に対する解決策として見なされることがよくあります。特にヘルスケアのような厳しく規制された分野で、合成データと現実世界のデータセットの間の適切なバランスはどこにあると思いますか?

合成データはテストと増強に役立ちますが、現実世界の活動が生成するトレーニングデータと評価データの完全なニュアンスと複雑さを完全に置き換えることはできません。特にヘルスケアでは、長期的な患者ケアの歴史とケアアプローチの文脈における結果が重要です。

私たちは、AIが現実世界の全複雑さでトレーニングされていない限り、現実世界を代表する合成データを生成することはできないと根本的に信じています。適切なバランスは、おそらく、現在シロされているが解放される必要がある、高品質のデータソースの大量と、特定のユースケースのためのAI生成の合成データの組み合わせであると考えられます。

Protegeは、機密情報、患者データ、または知的財産を公開せずに、組織が貴重な現実世界のデータを安全に共有することを可能にします。どのようにですか?

セキュリティとプライバシーは、旅の全段階に組み込まれています。内部システムまたはデータ転送のプライバシーとデイダイレーションのパートナーを通じて、データが意図された境界内に留まることを確認します。

ヘルスケアでは、すべてのデータ転送に対してプライバシーとコンプライアンスのフレームワークに従うことを意味します。メディアでは、コンテンツが予定された使用のみにライセンスされ、事前に合意されたライセンス条件と期間に従うことを意味します。

基礎モデルが進化を続けるにつれて、高品質のトレーニングデータパイプラインの次の世代を定義するのは何ですか?

3つの原則が主導します。出典、精度、目的です。

出典とは、完全な出典の追跡可能性を意味します。精度とは、特定のモダリティまたはユースケースではなく、特定のモダリティまたはユースケースのためにキュレーションされたデータセットを意味します。目的とは、モデル選択を実際の結果と一致させることを意味します。

これらすべてが組み合わさって、高品質のデータを使用してより優れたモデルを構築するための道筋を示します。

EU AI法や米国の将来的な規制枠組みなどの新しい規制は、Protegeのコンプライアンスと国境を越えたデータコラボレーションへのアプローチにどのような影響を与えますか?

これらの規制は、私たちが会社を設立したアプローチを検証しています。透明性、出典、リスク管理を強調しています。これらは私たちの製品とプラットフォームにデフォルトで組み込まれています。

私たちは、将来のAIの機会は、権利所有者を保護し、厳格なプライバシーコントロールを維持する必要があると考えています。これらの点を交渉不可能なものとして扱うことで、データパートナーとクライアントがAIの変化する景観で前進する自信と信頼を得ることができます。私たちの目標は、責任あるAI開発を正しいことだけではなく、より簡単なことにすることです。

データの透明性と出典は、AIシステムに対する公衆の信頼を再建する上でどのような役割を果たしますか?

信頼は、追跡可能性から始まります。データがどこから来て、どのように使用されているかがわかっている場合、人々はAIの結果をより信頼する可能性が高くなります。

透明性と出典は、データ所有者、モデル開発者、エンドユーザー間の説明責任を生み出します。これらは、AIをブラックボックスからより理解可能で説明可能なものに変えます。

20倍の成長と2,500万ドルのシリーズAの後、Protegeはどのようにして急速な拡大と倫理およびセキュリティへのコミットメントのバランスをとっていますか?そして、AIモデルを責任を持って構築する方法を形作り続けるにつれて、次のステップは何ですか?

倫理とセキュリティは、私たちが拡大することを可能にする基盤です。新しいプロセス、パートナーシップ、製品はすべて、他の人に見られているかのように運営されているかどうかを基準にして測定されます。他の人に見られているように、私たちがどのように運営し、どのような決定を下したかを知ったとしても、私は彼らが誇りに思うだろうと考えています。

2026年を見据えて、私たちはヘルスケアやメディア以外の新しいドメインエリアにリーチを拡大し、新しいデータ製品 such as ベンチマークのための評価データを開発しています。AI組織は、現実世界のユースケースのためのAIパフォーマンスをよりよく測定するために努力しています。私たちの目標は、現実世界のAIデータと専門知識の信頼できるプラットフォームとなり、長期にわたってAIの進歩を推進することです。

素晴らしいインタビュー、詳しく知りたい読者は、Protegeを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。