Connect with us

ヘルスケア

合成傷害データセットの作成にGenerative Adversarial Networksを使用する

mm

初めて、Generative Adversarial Networkを使用して、傷害画像の合成データセットを作成し、ヘルスケアの機械学習アプリケーションでこの種のコンテンツの多様性とアクセシビリティの欠如を解決するために使用しています。

このシステムは、WG2ANと呼ばれ、Batten College of Engineering & TechnologyとAIヘルスケア会社のeKareとの共同プロジェクトであり、傷害の測定と識別に機械学習手法を適用しています。

GANは、eKareが提供した100-4000枚のラベル付きの立体視慢性傷害画像で訓練されており、圧力、手術、リンパ血管事故、糖尿病、火傷などの原因によるさまざまな傷害タイプの匿名画像が含まれています。画像のサイズは1224×1224から2160×2160まで変化し、すべての画像は医師によって利用可能な光で撮影されています。

モデル訓練アーキテクチャの利用可能な潜在的な空間を収容するために、画像は512×512にリサイズされ、背景から抽出されました。データセットのサイズの影響を調べるために、100、250、500、1000、2000、4000枚の画像のバッチでテストを実行しました。

Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

上の画像は、訓練セットのサイズとエポックの数に応じて、詳細と粒度が増加しています。

The architecture of WG. Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

The architecture of WG2GAN. Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GANは、PyTorchで動作し、8GBのVRAMとGTX 1080 GPUを備えた比較的軽量な消費者向けのセットアップで実行されます。訓練時間は、100-4000枚の画像のデータセットサイズとエポックの数に応じて、4-58時間でした。バッチサイズは64で、精度とパフォーマンスのトレードオフとして設定されました。Adam Optimizerは、最初の半分の訓練で0.0002の学習率で使用され、線形減衰学習率で0の損失まで訓練を続けました。

Above left, segmentation applied to the wound area. Above center, image of the actual wound; above right, a synthetic wound of a type that can be generalized in a dataset, based on the original source. Below, the original wound, and, right, a synthesis of the wound generated by WG2GAN.

Above left, segmentation applied to the wound area. Above center, image of the actual wound; above right, a synthetic wound of a type that can be generalized in a dataset, based on the original source. Below, the original wound, and, right, a synthesis of the wound generated by WG2GAN.

医療データセットでは、ラベリングは避けられないボトルネックです。この場合、研究者は、eKareの以前の研究を利用した半自動ラベリングシステムを使用しました。このシステムでは、Play-Dohで作成された実世界の傷害モデルを使用し、セマンティックコンテキストのために大まかに色付けされました。

eKare Wound models

eKare Wound models

研究者は、訓練の初期段階で、データセットが非常に多様で、重みがランダム化されている場合に発生する問題に注目しました。モデルは「落ち着く」までに長い時間(75エポック)を要します。

データが多様な場合、GANとエンコーダ/デコーダモデルは、初期段階で汎化を得るのに苦労します。上のグラフは、WG2GANの訓練を追跡し、ゼロ損失までの訓練のタイムラインを示しています。

訓練プロセスが特定のイテレーションまたはエポックの特徴や特性に固定されないように、注意が必要です。代わりに、ソースマテリアルを過度に抽象化する結果を生み出すのではなく、汎化された有用な平均損失を生成するように続けます。WG2GANの場合、無制限に、まったく「架空の」傷害を生成するのではなく、特定の傷害タイプ内の変化の正確な範囲を生成することになります。

マシンラーニングデータセットのスコープを制御する

軽量な訓練セットを持つモデルはより速く汎化します。この研究の研究者は、最もリアルな画像は最大設定よりも低い設定で得られる可能性があると主張しています。1000枚の画像データセットを200エポックで訓練することです。

小さいデータセットでは、より短い時間で非常にリアルな画像を達成できるかもしれませんが、生成される画像と傷害タイプの範囲は、必然的により限定されることになります。GANとエンコーダ/デコーダ訓練レジームでは、入力データの量と多様性、生成される画像の忠実度、生成される画像のリアルさとの間には、微妙なバランスが必要です。これは、医療画像合成に限定されていない問題です。

医療データセットのクラス不均衡

一般に、ヘルスケアの機械学習は、データセットの不足だけでなく、クラス不均衡にも悩まされています。特定の疾患に関する重要なデータがホストデータセットの非常に小さな割合を占めるため、外れ値データとして却下されるか、訓練中に汎化プロセスに同化される危険があります。

この問題に対処するために、いくつかの方法が提案されています。たとえば、アンダーサンプリングまたはオーバーサンプリングです。ただし、問題は、単一の医療問題にバインドされた疾患固有のデータセットを開発することで回避されることがよくあります。这种アプローチは、各ケースで有効ですが、医療機械学習研究の分野におけるバルカニゼーションの文化に寄与し、セクター全体の進歩を遅らせる可能性があります。

機械学習に関するライター、ヒューマンイメージシンセシスのドメインスペシャリスト。Metaphysic.aiの研究コンテンツ責任者を務めた。