Salud
Creación de conjuntos de datos sintéticos de heridas con redes adversarias generativas

Por primera vez, se está utilizando una Red Adversaria Generativa para crear conjuntos de datos sintéticos de imágenes de heridas, con el fin de abordar la falta crítica de contenido diverso y accesible de este tipo en las aplicaciones de aprendizaje automático en atención médica.
El sistema, llamado WG2AN, es una colaboración entre la Facultad de Ingeniería y Tecnología Batten y la empresa de salud AI eKare, que se especializa en aplicar metodologías de aprendizaje automático a la medición e identificación de heridas.
La GAN se entrena con 100-4000 imágenes estereoscópicas de heridas crónicas etiquetadas proporcionadas por eKare, incluyendo imágenes anónimas de tipos de lesiones causadas por presión, cirugía, incidentes linfovasculares, diabetes y quemaduras. El material de origen variaba en tamaño entre 1224×1224 y 2160×2160, todas tomadas con luz disponible por médicos.
Para acomodar el espacio latente disponible en la arquitectura de entrenamiento del modelo, las imágenes se redujeron a 512×512 y se extrajeron de sus fondos. Para estudiar el efecto del tamaño del conjunto de datos, se implementaron pruebas en lotes de 100, 250, 500, 1000, 2000 y 4000 imágenes.
La imagen de arriba muestra un aumento en el detalle y la granularidad según el tamaño del conjunto de entrenamiento y el número de épocas ejecutadas en cada pasada.

La arquitectura de WG2GAN. Fuente: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033
WG2AN se ejecuta en PyTorch en un conjunto de consumidor relativamente delgado, con 8GB de VRAM en una GPU GTX 1080. El entrenamiento tomó entre 4-58 horas en el rango de tamaños de conjuntos de datos de 100-4000 imágenes, y en un rango de épocas, en un tamaño de lote de 64 como un compromiso entre precisión y rendimiento. Se utiliza el optimizador Adam para la primera mitad del entrenamiento a una tasa de aprendizaje de 0,0002, y se concluye con una tasa de aprendizaje linealmente decreciente hasta que se alcanza una pérdida de cero.

Arriba a la izquierda, segmentación aplicada al área de la herida. Arriba en el centro, imagen de la herida real; arriba a la derecha, una herida sintética de un tipo que se puede generalizar en un conjunto de datos, basado en la fuente original. Abajo, la herida original, y, a la derecha, una síntesis de la herida generada por WG2GAN.
En los conjuntos de datos médicos, al igual que en muchos otros sectores del aprendizaje automático, la etiquetado es un cuello de botella inevitable. En este caso, los investigadores utilizaron un sistema de etiquetado semi-automatizado que aprovecha investigaciones anteriores de eKare, que emplearon modelos de heridas del mundo real, creados en Play-Doh y coloreados aproximadamente para contexto semántico.

Modelos de heridas de eKare
Los investigadores notaron un problema que ocurre con frecuencia en las etapas iniciales del entrenamiento, cuando un conjunto de datos es muy diverso y los pesos se aleatorizan – el modelo tarda mucho tiempo (75 épocas) en “estabilizarse”:

Donde los datos son variados, tanto los modelos GAN como los modelos codificador/decodificador luchan por obtener generalización en las etapas iniciales, como se puede ver en la gráfica de entrenamiento de WG2GAN, que rastrea la línea de tiempo de entrenamiento desde su inicio hasta la pérdida cero.
Se debe tener cuidado para asegurarse de que el proceso de entrenamiento no se fije en las características o características de una sola iteración o época, sino que continúe generalizando hasta una pérdida media usable sin producir resultados que abstrajen excesivamente el material de origen. En el caso de WG2GAN, eso riesgo a crear heridas completamente “ficticias” y no relacionadas, en lugar de producir una gama precisa de variaciones dentro de un tipo de herida en particular.
Controlar el alcance en un conjunto de datos de aprendizaje automático
Los modelos con conjuntos de entrenamiento más ligeros generalizan más rápido, y los investigadores del documento sostienen que las imágenes más realistas podrían obtenerse con menos de la configuración máxima: un conjunto de datos de 1000 imágenes entrenadas durante 200 épocas.
Aunque los conjuntos de datos más pequeños podrían lograr imágenes muy realistas en menos tiempo, el rango de imágenes y los tipos de heridas generadas necesariamente serán más limitados. Existe un equilibrio delicado en los regímenes de entrenamiento de GAN y codificador/decodificador entre el volumen y la variedad de los datos de entrada, la fidelidad de las imágenes producidas y la realidad de las imágenes producidas — cuestiones de alcance y ponderación que ciertamente no se limitan a la síntesis de imágenes médicas.
Desequilibrios de clase en conjuntos de datos médicos
En general, el aprendizaje automático en atención médica se ve afectado no solo por la falta de conjuntos de datos, sino también por desequilibrios de clase, donde los datos esenciales sobre una enfermedad específica constituyen una pequeña fracción de su conjunto de datos anfitrión, lo que los pone en riesgo de ser descartados como datos de outliers o de ser asimilados en el proceso de generalización durante el entrenamiento.
Se han propuesto varios métodos para abordar este problema, como sub-muestreo o sobre-muestreo. Sin embargo, el problema a menudo se evita desarrollando conjuntos de datos específicos de enfermedades que están completamente vinculados a un solo problema médico. Aunque este enfoque es efectivo en cada caso, contribuye a la cultura de balkanización en la esfera de la investigación de aprendizaje automático en atención médica, y argumenta que ralentiza el progreso general en el sector.













