Охорона здоров’я

Створення синтетичних наборів даних про рани за допомогою генеративних суперницьких мереж

Published April 22, 2021

Updated April 24, 2026

Martin Anderson

Вперше генеративна суперницька мережа використовується для створення синтетичних наборів даних про рани, щоб виправити критичний дефіцит різноманітного та доступного контенту цього типу в застосунках машинного навчання в галузі охорони здоров’я.

Система, яка називається WG²AN, є спільним проєктом між коледжем інженерії та технологій Баттена та компанії з охорони здоров’я eKare, яка спеціалізується на застосуванні методологій машинного навчання для вимірювання та ідентифікації ран.

Генеративна суперницька мережа навчена на 100-4000 позначених стереоскопічних зображень хронічних ран, наданих компанією eKare, включаючи анонімізовані фотографії типів травм, спричинених такими факторами, як тиск, операції, інциденти, пов’язані з лімфоваскулярними захворюваннями, цукровим діабетом та опіками. Джерельний матеріал різнився за розміром від 1224×1224 до 2160×2160, всі зображення були зроблені під доступним світлом лікарями.

Для розміщення доступного латентного простору в архітектурі навчання моделі зображення були масштабовані до 512×512 та витягнуті з їхніх фонів. Для вивчення впливу розміру набору даних були здійснені тестові запуски на партіях з 100, 250, 500, 1000, 2000 та 4000 зображень.

Джерело: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Зображення вище показує збільшення деталізації та гранулярності згідно з розміром тренувального набору та кількістю епох, виконаних на кожному проході.

Архітектура WG2GAN. Джерело: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG²AN працює на PyTorch на відносно легкій споживчій установці, з 8 ГБ відеопам’яті на GTX 1080 GPU. Навчання тривало від 4 до 58 годин над діапазоном розмірів наборів даних від 100 до 4000 зображень, та над діапазоном епох, на розмірі партії 64 як компроміс між точністю та продуктивністю. Оптимізатор Adam використовується для першої половини навчання при швидкості навчання 0,0002, та завершується лінійним спадом швидкості навчання до досягнення втрат у нуль.

Зверху ліворуч, сегментація, застосована до області рани. Зверху центру, зображення реальної рани; зверху праворуч, синтетична рана типу, який можна узагальнити в наборі даних, на основі оригінального джерела. Знизу, оригінальна рана, та, праворуч, синтез рани, згенерований WG2GAN.

У медичних наборах даних, як і в багатьох інших галузях машинного навчання, позначення є невід’ємною瓶. У цьому випадку дослідники використовували напівавтоматичну систему позначення, яка використовує раніше дослідження компанії eKare, яке застосувало реальні моделі ран, створені з пластиліну та приблизно пофарбовані для семантичного контексту.

Моделі ран компанії eKare

Дослідники відзначили проблему, яка часто виникає на початкових етапах навчання, коли набір даних досить різноманітний, а ваги випадкові – модель потребує тривалого часу (75 епох), щоб “заспокоїтися”:

Коли дані різноманітні, і генеративні суперницькі мережі, і моделі кодувача/декодувача мають труднощі з узагальненням на ранніх етапах, як ми бачимо, свідчать у вищезазначеному графіку навчання WG²GAN, який відстежує хронологію навчання від початку до нульової втрати.

Потрібно бути обережним, щоб забезпечити, щоб процес навчання не фіксувався на особливостях або характеристиках будь-якої однієї ітерації чи епохи, а продовжував узагальнюватися до корисної середньої втрати без виробництва результатів, які надмірно абстрагують джерельний матеріал. У випадку з WG²GAN це ризикує створити необмежені, цілком “вигадані” рани, з’єднані між надто широким діапазоном не пов’язаних типів ран, а не виробництво точного діапазону варіацій у рамках певного типу рани.

Контроль обсягу в наборі даних машинного навчання

Моделі з легкими тренувальними наборами узагальнюють швидше, і дослідники статті стверджують, що найбільш реалістичні зображення можна отримати при менших налаштуваннях: набір даних з 1000 зображень, навчений за 200 епох.

Хоча менші набори даних можуть досягти високої реалістичності зображень за менший час, діапазон зображень і типів ран, згенерованих ними, буде обмеженішим. Існує деликатний баланс у режимах навчання генеративних суперницьких мереж і кодувача/декодувача між об’ємом і різноманіттям вхідних даних, вірогідністю вироблених зображень і реалістичністю вироблених зображень – питання обсягу і ваг, які не обмежуються медичною синтезою зображень.

Несбалансованість класів у медичних наборах даних

Загалом, машинне навчання в галузі охорони здоров’я стикається не тільки з дефіцитом наборів даних, але й з несбалансованістю класів, коли важлива інформація про певне захворювання становить таку малу частку свого набору даних, що ризикує бути відкинутим як аутлієр-дані або бути асимільованим під час узагальнення протягом навчання.

Було запропоновано ряд методів для вирішення цієї проблеми, таких як зниження вибірки або підвищення вибірки. Однак проблема часто обходиться шляхом створення наборів даних, специфічних для певної медичної проблеми. Хоча цей підхід є ефективним у кожному окремому випадку, він сприяє культурі балканізації у сфері досліджень машинного навчання в галузі охорони здоров’я, і, ймовірно, сповільнює загальний прогрес у цій галузі.

Related Topics:GAN GANs health healthcare image classification medical medical images

Martin Anderson

Писатель про машинне навчання, домен-спеціаліст у сфері синтезу зображень людини. Колишній керівник дослідницького контенту в Metaphysic.ai.
Особистий сайт: martinanderson.ai
Контакт: [email protected]

Unite.AI

Створення синтетичних наборів даних про рани за допомогою генеративних суперницьких мереж

Контроль обсягу в наборі даних машинного навчання

Несбалансованість класів у медичних наборах даних

You may like