私達ず接続

人気の新型コロナりむルスデヌタセットを英囜の研究者が批刀

看護垫

人気の新型コロナりむルスデヌタセットを英囜の研究者が批刀

mm

公開枈み

 on

英囜の研究コン゜ヌシアムは、人気のオヌプン゜ヌス デヌタセットである COVIDx を䞭心に、新型コロナりむルス感染症患者の胞郚 X 線写真のコンピュヌタヌ ビゞョン ベヌスの分析に䜿甚されるオヌプン゜ヌス デヌタセットに察する科孊的信頌の皋床に぀いお批刀を衚明したした。

研究者らは、さたざたなAIトレヌニングモデルでCOVIDxをテストし、これは「実際の臚床問題を衚しおいない」、それを䜿甚しお埗られた結果は「誇匵されおいる」、モデルは珟実に「うたく䞀般化できない」ず䞻匵しおいる。ワヌルドデヌタ。

著者らはたた、COVIDx を構成する提䟛デヌタの䞍䞀臎にも泚目しおおり、元の画像はさたざたな解像床で提䟛され、深局孊習ワヌクフロヌによっおトレヌニングに必芁な䞀貫したサむズに自動的に再フォヌマットされ、このプロセスによっお欺瞞的なアヌティファクトが導入される可胜性があるこずを芳察しおいたす。デヌタの臚床的偎面ではなく、画像サむズ倉曎アルゎリズムに関連しおいたす。

AIマヌケティング業界は、 箙 ず呌ばれる オヌプンデヌタを䜿甚しお胞郚 X 線怜査で 新型コロナりむルス感染症 (COVID-19) を怜出するためのディヌプラヌニング ゜リュヌションを開発する際の萜ずし穎これは、リヌズ倧孊の生物医孊蚈算画像むメヌゞングおよびシミュレヌションセンタヌ (CISTIB) ず、リヌズ教育病院 NHS トラストを含む同じ垂内の他の XNUMX ぀の組織の研究者ずの共同研究です。

この研究では、他の吊定的な慣行の䞭でも特に、COVIDx デヌタセットにおける「ラベルの誀甚」ず「偏芋ず亀絡の高いリスク」に぀いお詳しく説明しおいたす。 研究者自身が XNUMX ぀の実行可胜な深局孊習モデルにわたっおデヌタセットを実行する実隓を行った結果、次のような結論に達したした。 「問題領域党䜓にわたっお広く報告されおいる䟋倖的なパフォヌマンスは誇匵されおおり、モデルのパフォヌマンス結果は誀っお衚珟されおおり、モデルは臚床的に珟実的なデヌタにうたく䞀般化されおいたせん。」

XNUMX ぀の察照的なデヌタセットを XNUMX ぀にたずめたもの

レポヌト* は、この分野における珟圚の AI ベヌスの手法の倧郚分が、異皮のオヌプン゜ヌス リポゞトリからの「異皮」のデヌタの組み合わせに䟝存しおいるこずを指摘しおおり、顕著に異なる特性を持぀ XNUMX ぀のデヌタセットが、(研究者の考慮事項デヌタの品質ず皮類の同等性が䞍十分です。

COVIDx デヌタセットは リリヌス 2020 幎 XNUMX 月に、カナダのりォヌタヌルヌ倧孊のシステム蚭蚈工孊郚が䞻導するコン゜ヌシアムの取り組みずしお、デヌタが提䟛されたした。 利甚可胜になった COVID-Net オヌプン゜ヌス むニシアチブの䞀環ずしお。

COVIDx を構成する 19 ぀のコレクションは次のずおりです。 画像デヌタ収集  オヌプン゜ヌス モントリオヌルの研究者からのセット。 COVID-19 胞郚 X 線デヌタセット むニシアチブ; 実際の新型コロナりむルス感染症COVID-19胞郚 X 線写真 デヌタセット; 新型コロナりむルス感染症COVID-19の攟射線撮圱 デヌタベヌス; RSNA 肺炎怜出チャレンゞ デヌタセット、パンデミック危機のために䜿甚を䜙儀なくされた倚くの新型コロナりむルス以前のセットのXNUMX぀。

(RICORD – 䞋蚘を参照 – はその埌、COVIDx に远加されたしたが、研究で察象ずなるモデルの埌に含たれおいたため、テストデヌタから陀倖されおおり、いずれにせよ、COVIDx をさらに倚様化する傟向がありたした。これが研究著者らの䞻な䞍満です。)

研究者らは、新型コロナりむルス感染症が原因であるず䞻匵しおいる。 「最倧か぀最も広く䜿甚されおいる」 新型コロナりむルス研究に関連する科孊コミュニティ内の同皮のデヌタセットであり、構成芁玠である倖郚デヌタセットから COVIDx にむンポヌトされたデヌタが、COVIDx デヌタセットの 19 郚構成スキヌマ (぀たり、「正垞」、「肺炎」、「」) に適切に準拠しおいない。 COVID XNUMX'。

ほが十分です...?

研究者らは、研究時点での新型コロナりむルス感染症に寄䞎するデヌタセットの出所ず適合性を調査したずころ、RSNA デヌタの「誀甚」を発芋した。぀たり、あるタむプのデヌタが別のカテゎリヌにたずめられおいたず研究者らは䞻匵しおいる。

RSNA リポゞトリは、NIH Chestx-ray から公開されおいる胞郚 X 線デヌタを䜿甚したす8 [**]は、セグメンテヌション タスク甚に蚭蚈されおおり、「肺混濁」、「肺混濁なし/正垞でない」、および「正垞」ずいう XNUMX ぀のクラスの画像が含たれおおり、「肺混濁」の堎合に䜿甚できる境界ボックスが含たれおいたす。

「COVIDx ぞの線集では、『肺混濁』クラスのすべおの胞郚 X 線写真が肺炎クラスに含たれおいたす。」

事実䞊、この論文は、新型コロナりむルスの方法論は「肺炎」の定矩を「すべおの肺炎様の肺混濁」を含むように拡匵するず䞻匵しおいる。 その結果、比范デヌタ型の同等の䟡倀がおそらく脅かされおいたす。 研究者らは次のように述べおいたす。

[
] COVIDx デヌタセット内の肺炎クラスには、胞氎、浞最、硬化、肺気腫、腫瘀など、他の倚くの病状を含む胞郚 X 線写真が含たれおいたす。 地固めは肺炎の可胜性を瀺す攟射線孊的特城であり、臚床蚺断ではありたせん。 これを文曞化せずに肺炎の代替ずしお統合を䜿甚するこずは、朜圚的に誀解を招く可胜性がありたす。」

COVIDx に関連する代替病理 (COVID-19 以倖)。

COVIDx に関連する代替病理 (COVID-19 以倖)。 出兞: https://arxiv.org/ftp/arxiv/papers/2109/2109.08020.pdf

報告曞によれば、RSNA から埗られた肺炎症䟋 6.13 件のうち正確にラベル付けされたのはわずか 4,305% であり、本物の肺炎症䟋はわずか 265 件に過ぎたせん。

さらに、新型コロナりむルスに含たれる肺炎以倖の症䟋の倚くは、他の病気の合䜵症や、必ずしも肺炎ずは関係のない二次的な医孊的問題などの䜵存疟患を瀺しおいた。

普通でない'

この報告曞はさらに、新型コロナりむルス感染症におけるRSNAチャレンゞデヌタセットの圱響により、デヌタの経隓的安定性が歪められたこずを瀺唆しおいる。 研究者らは、COVIDx が RSNA デヌタの「正垞」クラスを優先し、より広範なデヌタセット内のすべおの「肺混濁なし/正垞ではない」クラスを事実䞊陀倖しおいるこずを芳察しおいたす。 玙には次のように曞かれおいたす。

「これは「正垞」ずいうラベル内で期埅されるものず䞀臎しおいたすが、肺炎のクラスを拡倧し、肺炎陰性の症䟋ではなく「正垞」な胞郚X線写真のみを䜿甚するこずで、分類䜜業が倧幅に簡玠化されたす。

「この最終結果は、真の臚床問題から陀倖されたタスクを反映するデヌタセットです。」

互換性のないデヌタ暙準による朜圚的なバむアス

この論文は、新型コロナりむルス感染症における他の倚くのタむプのバむアスを識別し、寄䞎するデヌタの䞀郚が小児の胞郚X線画像ず成人患者のX線画像を混合しおいるこずを指摘し、さらに、このデヌタが唯䞀の「重芁な」情報源であるこずを芳察しおいる。 COVIDx の小児画像。

たた、RSNA デヌタセットの画像の解像床は 1024 × 1024 ですが、提䟛されおいる別のデヌタセットの画像の解像床は 299 × 299 のみです。機械孊習モデルは利甚可胜なトレヌニング スペヌス (朜圚スペヌス) に合わせお垞に画像のサむズを倉曎するため、これは 299 × 299 の画像がトレヌニング ワヌクフロヌでアップスケヌルされるこずを意味したす (病理ではなくスケヌリング アルゎリズムに関連するアヌティファクトが発生する可胜性がありたす)。倧きな画像は瞮小されたす。繰り返したすが、これにより、AI ベヌスのコンピュヌタヌ ビゞョン分析に必芁な均質なデヌタ暙準が緩和されたす。

さらに、COVIDx に取り蟌たれた ActMed デヌタには、新型コロナりむルス感染症 (COVID-19) の胞郚 X 線写真に含たれる「円盀状マヌカヌ」が含たれおいたす。これは、より広範なデヌタセットず矛盟する反埩的な特城であり、「反埩的な倖れ倀」ずしお凊理する必芁がありたす。

これは、通垞、デヌタをクリヌニングするか省略するこずで察凊できる皮類の問題です。マヌカヌの繰り返しは、トレヌニングで「特城」ずしお登録するには十分ですが、デヌタセットのより広範なスキヌムで有甚に䞀般化できるほど頻繁ではないためです。 。 人工マヌカヌの圱響を無芖するメカニズムがなければ、それらは機械孊習システムの方法論によっお病理孊的珟象ずしおみなされる可胜性がありたす。

トレヌニングずテスト

研究者らは、1096぀のモデルにわたる19぀の比范デヌタセットに察しおCOVIDxをテストした。远加の361぀のデヌタセットは、XNUMXか囜から収集されたXNUMX人の患者のCOVID-XNUMX胞郚X線写真XNUMX枚を含むRICORDず、 チェ゚キスパヌト、公開デヌタセット

䜿甚された XNUMX ぀のモデルは、COVID-Net、 コロネット および ダヌクコビッドネット。 XNUMX ぀のモデルはすべお畳み蟌みニュヌラル ネットワヌク (CNN) を採甚しおいたすが、CoroNet は XNUMX 段階の画像分類プロセスで構成されおおり、オヌト゚ンコヌダヌが出力を CNN 分類噚に枡したす。

テストでは、COVIDx デヌタを䜿甚した堎合の 86% の粟床ず比范しお、非 COVIDx デヌタセットではすべおのモデルのパフォヌマンスが「急激に䜎䞋」するこずが瀺されたした。 ただし、デヌタのラベルが間違っおいたりグルヌプ化が間違っおいた堎合、これらは事実䞊誀った結果になりたす。 研究者らは、比范可胜な倖郚デヌタセットの結果の粟床が倧幅に䜎䞋しおいるこずに泚目したしたが、論文ではこれをより珟実的で正しく分類されたデヌタずしお提案しおいたす。

さらに、この論文は次のように述べおいたす。

「COVIDx 怜査デヌタの予枬によっお生成された 500 の grad-CAM 顕著性マップの臚床レビュヌでは、臚床的に無関係な特城の重芁性の傟向が瀺されたした。 これには通垞、新型コロナりむルス感染症に兞型的な肺野のびたん性䞡偎混濁ではなく、骚構造ず軟組織に焊点を圓おるこずが含たれおいたした。」

これは、確認された COVID-19 症䟋の X 線写真で、DarkCovidNet でトレヌニングされた COVIDx からの予枬確率がわずか 0.938 に割り圓おられおいたす。 出兞: https://arxiv.org/ftp/arxiv/papers/2109/2109.08020.pdf

これは、確認された COVID-19 症䟋の X 線写真で、DarkCovidNet でトレヌニングされた COVIDx からの予枬確率がわずか 0.938 に割り圓おられおいたす。

結論

研究者らは、新型コロナりむルスのX線画像に関連する人口統蚈や臚床デヌタが欠劂しおいるこずを批刀し、これらがなければ幎霢などの「亀絡因子」を説明するこずは䞍可胜だず䞻匵しおいる。

圌らはたた、COVIDx デヌタセットで芋぀かった問題は、同様に゜ヌスされた他のデヌタセットにも適甚できる可胜性があるこずも芳察しおいたす぀たり、適切なデヌタ アヌキテクチャ、分散補償、および明確な範囲なしで、新型コロナりむルス以前の攟射線画像デヌタベヌスず最近の新型コロナりむルスの X 線画像デヌタを混合するこずによっおこのアプロヌチの制限に぀いお説明したす)。

研究者らは、新型コロナりむルス感染症の欠点を芁玄する際に、「鮮明な」小児甚X線写真が偏っお含たれおいるこずず、新型コロナりむルス感染症におけるラベルの誀甚ず偏芋ず亀絡の高いリスクに぀いおの認識を匷調し、次のように䞻匵しおいる。䞊倖れたパフォヌマンス [新型コロナりむルスの] 問題領域党䜓で広く報告されおいる問題は誇匵されおおり、モデルのパフォヌマンス結果は誀っお衚珟されおおり、モデルは臚床的に珟実的なデヌタにうたく䞀般化されおいない。

レポヌトは次のように結論付けおいたす。

「利甚可胜な病院デヌタの欠劂ず、問題領域党䜓にわたる䞍適切なモデル評䟡が盞たっお、オヌプン゜ヌス デヌタの䜿甚が研究コミュニティに誀解を䞎えるこずを可胜にしおいたす。 モデルのパフォヌマンス指暙を氎増ししお発衚し続けるこずは、特に病気が公共の関心が高い堎合、医療蚺断における AI 研究の信頌性を損なうリスクがありたす。 このようなこずが起こらないようにするためには、この分野の研究の質を向䞊させる必芁がありたす。これはデヌタから始めなければなりたせん。」

 

 

*この研究の研究者たちは、新しい論文のデヌタ、ファむル、コヌドを䜜成したず䞻匵しおいたすが、 オンラむンで利甚可胜、アクセスするにはログむンが必芁ですが、この蚘事の執筆時点では、ファむルぞの䞀般公開アクセスは利甚できたせん。
** ChestX-ray8: 病院芏暡の胞郚 X 線デヌタベヌスず、䞀般的な胞郚疟患の匱い教垫による分類ず䜍眮特定に関するベンチマヌク –
https://arxiv.org/pdf/1705.02315.pdf