الرعاية الصحية
إنشاء مجموعات بيانات جروح اصطناعية باستخدام شبكات العدو المتعلم

لأول مرة، يتم استخدام Generative Adversarial Network لإنشاء مجموعات بيانات اصطناعية لصور الجروح، من أجل معالجة نقص حاد في المحتوى المتنوع والقابل للوصول من هذا النوع في تطبيقات تعلم الآلة الصحية.
النظام، الذي يُسمى WG2AN، هو تعاون بين كلية باتين للهندسة والتكنولوجيا وشركة إيكار للصحة، التي تختص في تطبيق منهجيات تعلم الآلة لقياس وتحديد الجروح.
تم تدريب الشبكة العصبية على 100-4000 صورة مجهرية مجهزة لجروح مزمنة قدمتها إيكار، بما في ذلك صور مجهزة لأنواع الإصابات من أسباب مثل الضغط والجراحة وحوادث الأوعية اللمفاوية والسكري وإصابات الحروق. تباينت المواد المصدر في الحجم بين 1224×1224 إلى 2160×2160، جميعها التقطت في الضوء المتاح من قبل الأطباء.
للوصول إلى الفضاء الكامن المتاح في بنية تدريب النموذج، تم إعادة تحجيم الصور إلى 512×512، وتم استخراجها من خلفياتها. لدراسة تأثير حجم المجموعة، تم تنفيذ تشغيل الاختبار على دفعات من 100 و 250 و 500 و 1000 و 2000 و 4000 صورة.
تُظهر الصورة أعلاه تفاصيل وضخامة متزايدة وفقًا لحجم المجموعة التدريبية، وعدد الepochs التي تم تشغيلها في كل مرة.

The architecture of WG2GAN. Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033
يعمل WG2GAN على PyTorch على إعداد مستهلك متواضع، مع 8GB من VRAM على GTX 1080 GPU. استغرق التدريب بين 4-58 ساعة على مدى حجم المجموعة من 100-4000 صورة، وعلى مدى عدد من الepochs، مع حجم دفعة 64 كترکیب بين الدقة والأداء. يتم استخدام Adam Optimizer في النصف الأول من التدريب بمعدل تعلم 0.0002، وينتهي بمعدل تعلم خطي حتى يتم الوصول إلى خسارة صفر.

Above left, segmentation applied to the wound area. Above center, image of the actual wound; above right, a synthetic wound of a type that can be generalized in a dataset, based on the original source. Below, the original wound, and, right, a synthesis of the wound generated by WG2GAN.
في مجموعات البيانات الطبية، كما هو الحال في العديد من قطاعات تعلم الآلة الأخرى، فإن التسمية هي عائق لا مفر منه. في هذه الحالة، استخدم الباحثون نظامًا شبه آلي للتسمية الذي يستفيد من البحث السابق من إيكار، الذي استخدم نماذج حقيقية من الجروح، تم إنشاؤها في Play-Doh وتم تلوينها بشكل تقريبي للسياق الدلالي.

eKare Wound models
لاحظ الباحثون مشكلة تطرأ في المراحل الأولية من التدريب، عندما تكون المجموعة البيانية متنوعة جدًا والأوزان عشوائية – يستغرق النموذج وقتًا طويلاً (75 epoch) للوصول إلى الاستقرار:

عندما تكون البيانات متنوعة، يجد كلا النموذجين GAN و encoder/decoder صعوبة في الحصول على تعميم في المراحل الأولى، كما هو موضح في الرسم البياني أعلاه لتدريب WG2GAN، الذي يتبع جدول التدريب من البداية إلى خسارة صفر.
يجب اتخاذ الحذر لضمان أن عملية التدريب لا تثبت على ميزات أو خصائص أي تكرار أو epoch واحد، ولكنها تستمر في التعميم إلى متوسط خسارة مفيد دون إنتاج نتائج تتجاوز بشكل مفرط المواد الأصلية. في حالة WG2GAN، قد يخاطر ذلك بإنشاء جروح غير مقيدة تمامًا، ومتشابكة بين مجموعة واسعة من أنواع الجروح غير المرتبطة، بدلاً من إنتاج مجموعة متنوعة من التباين داخل نوع معين من الجروح.
ضبط النطاق في مجموعة بيانات تعلم الآلة
النماذج ذات مجموعات التدريب الخفيفة تتمتع بقدرة تعميم أسرع، ويزعم باحثو الورقة أن الصور الأكثر واقعية يمكن الحصول عليها بأقل من الإعدادات القصوى: مجموعة بيانات من 1000 صورة تم تدريبها على 200 epoch.
على الرغم من أن مجموعات البيانات الأصغر قد تحقق صورًا واقعية جدًا في وقت أقل، فإن نطاق الصور وأنواع الجروح التي تم إنشاؤها سيكون محدودًا أيضًا. هناك توازن دقيق في أنظمة تدريب GAN و encoder/decoder بين حجم وتنوع البيانات المدخلة، ودقة الصور المنتجة، وواقعية الصور المنتجة – مسائل النطاق والوزن التي ليست محصورة بالتأكيد في 합성 الصور الطبية.
التوازنات الطبقية في مجموعات البيانات الطبية
بشكل عام، تعاني تعلم الآلة الصحية ليس فقط من نقص في مجموعات البيانات، ولكن أيضًا من التوازنات الطبقية، حيث يشكل البيانات الأساسية لمرض معين نسبة صغيرة جدًا من مجموعته البيانية بحيث يخاطر بالرفض كبيانات منفردة أو الاندماج في عملية التعميم خلال التدريب.
تم اقتراح عدد من الطرق لمعالجة هذه القضية، مثل التحليل أو العينة الزائدة. ومع ذلك، غالبًا ما يتم تجاوز هذه المشكلة من خلال تطوير مجموعات بيانات محددة بالمرض التي ترتبط تمامًا بمشكلة طبية واحدة. على الرغم من أن هذا النهج فعال في كل حالة على حدة، إلا أنه يساهم في ثقافة البalkanization في مجال أبحاث تعلم الآلة الطبية، ويزعم أنه يبطئ التقدم العام في هذا القطاع.













