私達と接続

合成データ: 医療データセットのバイアスに対処するために顔画像の人種を変更する

看護師

合成データ: 医療データセットのバイアスに対処するために顔画像の人種を変更する

mm

UCLA の研究者は、多くの一般的なデータセットが被る人種的偏見を是正するために、医療機械学習システムのトレーニングに使用されるデータセット内の顔の見かけの人種を変更する方法を開発しました。

当学校区の 新しい技術 は、フォトリアリスティックで生理学的に正確な合成ビデオをフレームあたり平均 0.005 秒の速度で生成することができ、新型コロナウイルスの制限下で大幅に拡大した分野である遠隔医療診断およびモニタリングのための新しい診断システムの開発を支援することが期待されています。 このシステムは、遠隔光電脈波記録法の適用性を向上させることを目的としています (rPPG)、顔のビデオ コンテンツを評価して血液供給量の変化を非侵襲的に検出するコンピューター ビジョン技術。

出典:https://arxiv.org/pdf/2106.06007.pdf

出典: https://arxiv.org/pdf/2106.06007.pdf。 拡大するにはクリックしてください。

この研究は畳み込みニューラル ネットワーク (CNN) を利用していますが、以前の研究コードが組み込まれています。 公表 2020年に英国のダラム大学によって発表されたこの新しいアプリケーションは、2020年の研究のようにデータの見かけの人種を視覚的に変更するだけではなく、元のテストデータの拍動信号を保存することを目的としています。

人種変革のための CNN

エンコーダ/デコーダ システムの最初の部分では、事前トレーニングされたダーラム レース転送モデルを使用します。 VGGフェイス2、ダーラム調査の以前の白人からアフリカ人コンポーネントを使用してプロキシ ターゲット フレームを生成します。 これにより、人種的特徴が均一に伝達されますが、患者の血流状態の視覚的な生理学的指標を表す色や色調の変化は含まれません。

ダラム大学による 2020 年の研究からの変革パイプライン。その一部は新しい UCLA 研究に組み込まれています。 出典: https://arxiv.org/pdf/2004.08945.pdf

ダラム大学による 2020 年の研究からの変革パイプライン。その一部は新しい UCLA 研究に組み込まれています。 出典: https://arxiv.org/pdf/2004.08945.pdf。 拡大するにはクリックしてください。

PhysResNet (PRN) と呼ばれる XNUMX 番目のネットワークは、rPPG コンポーネントを提供します。 PhysResNet は、視覚的な外観と、皮下の血液量の動きを定義する色の変化の両方を学習するようにトレーニングされています。

左下は2020年のダーラム調査で得られた結果で、PPG情報が欠如している。 中段左、人種変換に組み込まれた PPG 情報。

左下は2020年のダーラム調査で得られた結果で、PPG情報が欠如している。 中段左、人種変換に組み込まれた PPG 情報。 クリックすると拡大します。

UCLA プロジェクトが提案するアーキテクチャは、肌の色を拡張しない場合でも競合する rPPG 技術を上回っており、 MAE と RMSE.

UCLA ネットワークは、血液量と分布情報を適切に保存しています。

UCLA ネットワークは、血液量と分布情報を適切に保存しています。 クリックすると拡大します。

UCLAの研究者らは、今後の研究で、この医療画像分野における人種的偏見を是正するためのより広範な取り組みが行われることを期待しており、また、問題のシステムの解像度が80×80ピクセルに制限されているため、今後のスキームでより高解像度のビデオが出力されることも期待している。 – 遠隔医療の制限にはかなりよく適合していますが、理想的ではありません。

民族的に多様なデータセットの欠如

人種的に多様なデータセットにつながる経済的および現実的な状況は、ここ数年医学研究の障害となってきました。 データは偏狭に生成される傾向があり、多くの要因がデータ主体の白人中心の均一性の原因となっている。これには、研究が行われる都市における少数派の人口構成や、非白人主体の出現範囲に影響を与える可能性のあるその他の社会経済的要因が含まれる研究者らは、よりグローバルに適用できるようにしたいと考えている西側のデータセットに含まれています。

肌の色が濃い人の割合が高い国では、データを収集するために必要な機器やリソースが不足していることがよくあります。

American Journal of Physical Anthropology に掲載された、先住民族の肌色の世界地図。

American Journal of Physical Anthropology に掲載された、先住民族の肌色の世界地図。

現在、rPPG データセットでは肌の色が浅い被験者の割合が著しく低く、この目的で一般的に使用されている 0 つの主要データベースのコンテンツの 5%、10%、XNUMX% に相当します。

均一な白人のデータ

2019年の新たな研究 公表 in 科学 米国の病院ケアに広く普及しているアルゴリズムが、白人の被験者に有利に大きく偏っていることを発見した。 この研究では、黒人はトリアージや入院のより深いレベルで専門的な治療を受ける可能性が低いことが判明した。

同年、マレーシアとオーストラリアの研究者によるさらなる研究が行われた 設立 アジアを含む世界の多くの地域にわたるデータセット生成における「独自の人種バイアス」という一般的な問題。

規模とアーキテクチャの潜在的な制限

民族を限定したデータセットに生じた制限の一部は、本質的に倫理的というよりはむしろ実用的なものです。 寄与するデータの数が広ければ広いほど、そのデータに含まれる被験者全体をよりよく一般化できますが、トレーニング時間の割合が小さいため、トレーニング ルーチンが人種を含むデータの単一の特性内のパターンを直観する可能性は低くなります。データの識別可能なサブセットごとに注意とリソースが利用可能になります。

これにより、データ サイズの制約、バッチ サイズの経済性、限られたハードウェア リソースに応じた潜在スペースの実際的な制限により、モデルは広く適用可能ですが、あまり具体的な結果が得られない可能性があります。

逆に、入力データを民族などのより限定された特性セットに制限することで、効果的で詳細な結果を得ることができますが、その結果は限られたデータに「過剰適合」する可能性が高く、広範囲に適用できない可能性があります。元のデータセットの対象が取得されたのと同じ地理的領域内の未確認の対象全体にわたって。

PPG シミュレーション用の合成アバター

UCLAの論文はまた、2020D画像合成を活用してPPG情報が豊富な顔ビデオを作成する、人種的に柔軟な合成アバターの使用に関するMicrosoft Researchの3年の先行研究についても言及している。

Microsoft の研究によって作成された合成アバター。PPG データを含むレイトレース画像を使用します。 出典: https://arxiv.org/pdf/2010.12949.pdf

Microsoft の研究によって作成された合成アバター。PPG データを含むレイトレース画像を使用します。 出典: https://arxiv.org/pdf/2010.12949.pdf。 拡大するにはクリックしてください。

 

機械学習のライター、人間の画像合成のドメインスペシャリスト。Metaphysic.ai の元研究コンテンツ責任者。
個人サイト: マーティンアンダーソン.ai
お問合せ [メール保護]
Twitter: @manders_ai