رطم إنشاء مجموعات بيانات الجروح الاصطناعية مع شبكات الخصومة التوليدية - اتحدوا
اتصل بنا للحصول على مزيد من المعلومات

الرعاية الصحية

إنشاء مجموعات بيانات الجروح الاصطناعية مع شبكات الخصومة التوليدية

mm

تم النشر

 on

لأول مرة ، أ شبكة الخصومة التوليدية يتم استخدامه لإنشاء مجموعات بيانات تركيبية لصور الجروح، من أجل معالجة النقص الحاد في المحتوى المتنوع والذي يمكن الوصول إليه من هذا النوع في تطبيقات التعلم الآلي للرعاية الصحية.

النظام يسمى WG2AN، هو عبارة عن تعاون بين كلية باتن للهندسة والتكنولوجيا وشركة eKare للذكاء الاصطناعي ، والتي تتخصص في تطبيق منهجيات التعلم الآلي لقياس وتحديد الجروح.

تم تدريب GAN على 100-4000 صورة مجسمة للجرح المزمن المزمن مقدمة من eKare ، بما في ذلك صور مجهولة المصدر لأنواع الإصابات من أسباب مثل الضغط والجراحة والحوادث اللمفاوية والأوعية الدموية والسكري وإصابات الحروق. اختلفت المواد المصدر في الحجم بين 1224 × 1224 إلى 2160 × 2160 ، وكلها مأخوذة تحت الضوء المتاح من قبل الأطباء.

لاستيعاب المساحة الكامنة المتاحة في بنية التدريب النموذجية ، تم تغيير حجم الصور إلى 512 × 512 ، واستخراجها من خلفياتها. لدراسة تأثير حجم مجموعة البيانات ، تم تنفيذ عمليات التشغيل الاختبارية على دفعات من 100 و 250 و 500 و 1000 و 2000 و 4000 صورة.

المصدر: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

المصدر: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

توضح الصورة أعلاه زيادة التفاصيل والتفصيل وفقًا لحجم مجموعة التدريب المساهمة وعدد عهود تشغيل على كل تمريرة.

هندسة WG. المصدر: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

بنية WG2GAN. المصدر: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2يعمل GAN على PyTorch على إعداد بسيط نسبيًا على غرار المستهلك ، مع 8 جيجا بايت من VRAM على وحدة معالجة الرسومات GTX 1080. استغرق التدريب ما بين 4-58 ساعة على مدى أحجام مجموعة البيانات من 100-4000 صورة ، وعلى مدى من العصور ، بحجم دفعة 64 كمقايضة بين الدقة والأداء. يتم استخدام محسن آدم للنصف الأول من التدريب بمعدل تعلم 0.0002 ، وينتهي بمعدل تعلم خطي متحلل حتى الوصول إلى خسارة الصفر.

فوق اليسار ، تم تطبيق تجزئة على منطقة الجرح. فوق المركز صورة الجرح الفعلي ؛ أعلى اليمين ، جرح اصطناعي من النوع الذي يمكن تعميمه في مجموعة بيانات ، بناءً على المصدر الأصلي. أدناه ، الجرح الأصلي ، والحق ، توليف الجرح الناتج عن WG2GAN.

فوق اليسار ، تم تطبيق تجزئة على منطقة الجرح. فوق المركز صورة الجرح الفعلي ؛ أعلى اليمين ، جرح اصطناعي من النوع الذي يمكن تعميمه في مجموعة بيانات ، بناءً على المصدر الأصلي. أدناه ، الجرح الأصلي ، والحق ، توليف الجرح الناتج عن WG2GAN.

في مجموعات البيانات الطبية ، كما هو الحال مع العديد من قطاعات التعلم الآلي الأخرى ، يعد وضع العلامات عنق الزجاجة لا مفر منه. في هذه الحالة ، استخدم الباحثون نظام وضع العلامات شبه الآلي الذي يعزز البحوث السابقة من eKare ، التي استخدمت نماذج من العالم الحقيقي للجروح ، تم إنشاؤها في Play-Doh وملونة تقريبًا للسياق الدلالي.

نماذج الجرح eKare

نماذج الجرح eKare

لاحظ الباحثون مشكلة تحدث كثيرًا في المراحل الأولى من التدريب ، عندما تكون مجموعة البيانات متنوعة تمامًا ويتم اختيار الأوزان بشكل عشوائي - يستغرق النموذج وقتًا طويلاً (75 حقبة) حتى يستقر:

عندما تكون البيانات متنوعة ، يكافح كل من نماذج GAN وجهاز التشفير / وحدة فك التشفير للحصول على التعميم في المراحل السابقة ، كما نرى واضحًا في الرسم البياني أعلاه لتدريب WG2GAN ، الذي يتتبع الجدول الزمني للتدريب من البداية إلى صفر خسارة.

يجب توخي الحذر للتأكد من أن عملية التدريب لا تركز على ميزات أو خصائص أي تكرار أو حقبة واحدة ، بل تستمر في التعميم على خسارة متوسطة قابلة للاستخدام دون إنتاج نتائج تجرد بشكل مفرط مادة المصدر. في حالة WG2GAN ، هذا من شأنه أن يخاطر بإنشاء جروح غير محدودة ، "خيالية" تمامًا ، متسلسلة بين مجموعة واسعة جدًا من أنواع الجروح غير ذات الصلة ، بدلاً من إنتاج نطاق دقيق من الاختلافات داخل نوع جرح معين.

التحكم في النطاق في مجموعة بيانات التعلم الآلي

تُعمم النماذج ذات مجموعات التدريب الأخف بشكل أسرع ، ويؤكد باحثو الورقة أنه يمكن الحصول على الصور الأكثر واقعية بأقل من الحد الأقصى للإعدادات: مجموعة بيانات 1000 صورة تم تدريبها على مدى 200 حقبة.

على الرغم من أن مجموعات البيانات الأصغر قد تحقق صورًا واقعية للغاية في وقت أقل ، إلا أن نطاق الصور وأنواع الجرح المتولدة سيكون بالضرورة محدودًا أيضًا. يوجد توازن دقيق في أنظمة التدريب الخاصة بـ GAN وأنظمة التشفير / وحدة فك التشفير بين حجم وتنوع بيانات الإدخال ، ودقة الصور المنتجة ، وواقعية الصور المنتجة - قضايا النطاق والوزن التي لا تقتصر بالتأكيد على الصورة الطبية توليف.

الاختلالات الطبقية في مجموعات البيانات الطبية

بشكل عام ، لا يتأثر التعلم الآلي للرعاية الصحية بـ a نقص مجموعات البياناتلكن ب الاختلالات الطبقية، حيث تشكل البيانات الأساسية الخاصة بمرض معين نسبة صغيرة جدًا من مجموعة البيانات المضيفة الخاصة به بحيث تخاطر إما أن يتم رفضها على أنها بيانات خارجية ، أو أن يتم استيعابها في عملية التعميم خلال التدريب.

تم اقتراح عدد من الأساليب لمعالجة المشكلة الأخيرة ، مثل أخذ العينات الناقص أو الإفراط في أخذ العينات. ومع ذلك ، غالبًا ما يتم حل المشكلة جنبًا إلى جنب من خلال تطوير مجموعات بيانات خاصة بالأمراض مرتبطة تمامًا بمشكلة طبية واحدة. على الرغم من أن هذا النهج فعال على أساس كل حالة ، إلا أنه يساهم في ثقافة بلقنة في مجال أبحاث التعلم الآلي الطبي ، ويمكن القول إنه يبطئ التقدم العام في هذا القطاع.