インタビュー

グラディエントヘルスCEOジョシュミラー – インタビューシリーズ

mm

ジョシュミラーは、グラディエントヘルスのCEOです。グラディエントヘルスは、ヘルスケアが誰でも手に入れることができるように、自動診断が存在する必要があるという考えに基づいて設立されました。グラディエントヘルスは、組織化された、ラベル付けされた、利用可能なデータで自動化されたAI診断を加速させることを目指しています。

グラディエントヘルスの創設ストーリーを共有してください。

私と共同創設者のオーウェンは、農業で使用される農薬の量を減らすためにコンピュータービジョンを利用した最初のスタートアップ、FarmShotsを離れ、新しい挑戦を探していました。

私たちは、技術で解決できる難しい問題を見つけて、それが世界に良い影響を与えることを目指しています。オーウェンは医療の学位を取得しており、私たちのコンピュータービジョンの経験から、医療画像は自然なフィットでした。乳がんの影響が壊滅的なため、最初のアプリケーションとして乳房X線撮影を選択しました。そこで、私たちは「どこから始めればいいのか。1000枚の乳房X線写真が必要です。どこでそんな規模のデータを手に入れることができるのか」と考えたのです。答えは「どこでもない」でした。すぐに、データを手に入れることが非常に難しいことを実感しました。数ヶ月後、この苛立ちは私たちにとって哲学的な問題になりました。私たちは「この分野で良いことをしようとしている誰もが、命を救うアルゴリズムを構築するために必要なデータを手に入れるために戦い苦労する必要はない」と考えたのです。そこで、私たちは「もしかしたら、それが私たちが解決すべき問題かもしれない」と考えました。

市場における不代表的なデータのリスクについて説明してください。

数多くの研究や実世界の例から、アルゴリズムを西海岸のデータだけを使用して構築し、それを南東に持ち込むと、うまく機能しないことがわかっています。北東部の病院で作成されたAIが他の場所では50%以下の精度でしか機能しないという話を何度も聞きます。

私は、AIの基本的な目的は、ヘルスケアの格差を減らすことであると考えています。目標は、質の高いケアを誰でも手に入れることができるようにすることです。しかし、問題は、データが貧弱な場合、格差がさらに拡大することです。私たちは、ヘルスケアAIの使命を達成に失敗しています。白人男性だけに機能するAIを許してはなりません。代表されていない背景を持つ人々は、さらに差別を受けることになります。

グラディエントヘルスがデータをどのように取得しているかについて説明してください。

はい、世界中のさまざまなヘルスケアシステムと提携しています。彼らのデータは、誰も利用できず、コストを費やしているだけです。私たちは、データを徹底的に匿名化し、研究者に整理します。

グラディエントヘルスがデータを偏りがないように、そして可能な限り多様なデータをどうやって保証しているかについて説明してください。

方法はたくさんあります。たとえば、データを収集する際には、より代表的なデータが多いことが多いコミュニティクリニックを含め、多くのサイトからデータを収集します。また、データを提供するサイトは、地理的に、社会経済的に多様なものを目指しています。つまり、サイトの数が多くても、すべてのサイトがダウンタウンの病院からだけである場合は、代表的なデータではありません。

これを検証するために、すべてのデータセットにわたって統計を実行し、クライアントに、技術と人口統計の両方で多様なデータを提供するようにします。

ロバストなAIアルゴリズムを設計する上で、このレベルのデータ管理が重要な理由について説明してください。

AIが現実世界で遭遇する可能性のある多くの変数があります。私たちの目標は、アルゴリズムを可能な限りロバストにすることです。私たちは、データに5つの重要な変数を考えています。最初の変数は「機器メーカー」です。明らかですが、GEのスキャナーのデータだけを使用してアルゴリズムを構築すると、ヒタチのスキャナーではうまく機能しない可能性があります。

同様に、「機器モデル」変数もあります。これは、ヘルスケアの不平等という観点から面白いものです。大きな研究病院は、最新のスキャナーモデルを持っていることが多いです。彼らが自分の2022年モデルのデータだけを使用してAIを訓練すると、2010年モデルのデータではうまく機能しない可能性があります。これらの古いシステムは、貧しい地域や農村部で見られるものです。したがって、新しいモデルだけのデータを使用することで、間接的にこれらのコミュニティの人々に対する偏見をさらに導入することになります。

その他の重要な変数は、性別、民族、年齢です。私たちは、これらのすべての変数にわたってデータが比例してバランスがとれていることを確認するために多大な努力を払っています。

メドテック企業が直面している規制上の障壁について説明してください。

FDAは、データセットの偏りを調査し始めています。研究者から「FDAは、15%のアフリカ系アメリカ人人口が不足しているため、アルゴリズムを却下しました」という話を聞いたことがあります。開発者が「1%の太平洋ハワイ人を訓練データに含める必要がある」と言われたことも聞いたことがあります。

FDAは、単一の病院で訓練されたAIは現実世界では機能しないことを認識し始めています。事実、CEマークとFDAの承認を得るには、人口を代表するデータセットを提供する必要があります。小規模または代表性のないグループでAIを訓練することは、もはや受け入れられません。

メドテック企業にとってのリスクは、技術を規制承認のためのレベルまで投資するが、承認が得られない場合は収益を上げることができないことです。最終的には、商業化への道と、ヘルスケアに良い影響を与える道は、データの偏りを気にする必要があることを意味します。

データの観点からこれらの障壁を克服するための選択肢について説明してください。

近年、データ管理方法は進化し、AI開発者には以前よりも多くの選択肢が利用可能になりました。データの中間者やパートナー、フェデレーテッドラーニング、合成データなど、新しいアプローチが存在します。どの方法を選択するにせよ、開発者は常に、データが実際に利用される人口を代表するかどうかを考慮するよう奨励しています。これが、データを取得する最も難しい側面です。

グラディエントヘルスが提供するソリューションの1つはグラディエントラベルです。このソリューションは何ですか。また、大規模なデータをラベル付けするにはどう機能しますか。

医療画像AIには、データだけでなく、専門家による注釈も必要です。グラディエントラベルは、企業がこれらの注釈を取得するのを支援します。レジストラントを含む専門家による注釈を提供します。

ヘルスケアにおけるAIとデータの将来のビジョンについて説明してください。

すでに、指の先から足の先まで、すべてを見るAIツールが数千個あります。これは将来も続くと思います。各病状に対して、少なくとも10個のアルゴリズムが存在するでしょう。各アルゴリズムには、競合するツールが複数あり、医療従事者が最良のケアを提供するのを支援するでしょう。

私は、スタートレックのようなトリコーダーが存在する未来を想像しています。トリコーダーは、誰かをスキャンし、頭から足の先まですべての問題を解決するものです。代わりに、各サブセットに特化したアプリケーションが存在するでしょう。

グラディエントヘルスについてさらに共有したいことがありますか。

私は将来を楽しみにしています。ヘルスケアが安価で、平等で、誰でも手に入れることができる場所に向かっていることを私は考えています。グラディエントヘルスがこれを実現する上で重要な役割を果たす機会を得ることを私は願っています。ここにあるチーム全員が真正にこの使命を信じており、会社全体に共通の情熱があるのを私は感じています。私はそれを愛しています!

素晴らしいインタビュー、詳しく知りたい読者はグラディエントヘルスを訪問してください。

アントワーヌは、Unite.AIのビジョナリーレーダーであり共同創設者であり、AIとロボティクスの未来を形作り推進することに尽力しています。シリアルエントレプレナーである彼は、AIが電気と同様に社会に大きな変化をもたらすと信じており、破壊的な技術とAGIの可能性について語ることがよくあります。

彼はフューチャリストとして、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼はSecurities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。