Saúde

Criação de Conjuntos de Dados Sintéticos de Feridas com Redes Adversárias Generativas

Published April 22, 2021

Updated April 5, 2026

Martin Anderson

Pela primeira vez, uma Rede Adversária Generativa está sendo usada para criar conjuntos de dados sintéticos de imagens de feridas, a fim de remediar a falta crítica de conteúdo diverso e acessível desse tipo em aplicações de aprendizado de máquina em saúde.

O sistema, chamado WG²AN, é uma colaboração entre a Faculdade de Engenharia e Tecnologia Batten e a empresa de saúde AI eKare, que se especializa em aplicar metodologias de aprendizado de máquina à medição e identificação de feridas.

A GAN é treinada em 100-4000 imagens estereoscópicas de feridas crônicas rotuladas fornecidas pela eKare, incluindo fotos anonimizadas de tipos de lesões causadas por pressão, cirurgia, incidentes linfovasculares, diabetes e queimaduras. O material de origem variou em tamanho entre 1224×1224 e 2160×2160, todas tiradas sob luz disponível por médicos.

Para acomodar o espaço latente disponível na arquitetura de treinamento do modelo, as imagens foram redimensionadas para 512×512 e extraídas de seus fundos. Para estudar o efeito do tamanho do conjunto de dados, execuções de teste foram implementadas em lotes de 100, 250, 500, 1000, 2000 e 4000 imagens.

Fonte: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

A imagem acima mostra detalhes e granularidade crescentes de acordo com o tamanho do conjunto de treinamento e o número de épocas executadas em cada passo.

A arquitetura do WG2GAN. Fonte: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG²GAN é executado no PyTorch em um conjunto de consumidor relativamente leve, com 8GB de VRAM em um GPU GTX 1080. O treinamento levou entre 4-58 horas ao longo da faixa de tamanhos de conjuntos de dados de 100-4000 imagens e ao longo de uma faixa de épocas, em um tamanho de lote de 64 como um compromisso entre precisão e desempenho. O Otimizador Adam é usado para a primeira metade do treinamento com uma taxa de aprendizado de 0,0002 e concluído com uma taxa de aprendizado linear decrescente até que uma perda de zero seja alcançada.

Acima à esquerda, segmentação aplicada à área da ferida. Acima ao centro, imagem da ferida real; acima à direita, uma ferida sintética de um tipo que pode ser generalizado em um conjunto de dados, com base na fonte original. Abaixo, a ferida original e, à direita, uma síntese da ferida gerada pelo WG2GAN.

Em conjuntos de dados médicos, como em muitos outros setores de aprendizado de máquina, a rotulagem é um gargalo inevitável. Nesse caso, os pesquisadores usaram um sistema de rotulagem semi-automatizado que aproveita pesquisas anteriores da eKare, que empregaram modelos de feridas do mundo real criados em Play-Doh e aproximadamente coloridos para contexto semântico.

Modelos de feridas da eKare

Os pesquisadores notaram um problema que ocorre frequentemente nas fases iniciais de treinamento, quando um conjunto de dados é muito diverso e os pesos são randomizados – o modelo leva muito tempo (75 épocas) para “se estabilizar”:

Onde os dados são variados, tanto os modelos GAN quanto os modelos codificador/decodificador lutam para obter generalização nas fases iniciais, como podemos ver evidenciado no gráfico acima do treinamento do WG²GAN, que rastreia a linha do tempo do treinamento desde o início até a perda zero.

Cuidado deve ser tomado para garantir que o processo de treinamento não se fixe nas características ou recursos de qualquer iteração ou época, mas continue a generalizar para uma perda média usável sem produzir resultados que abstraiam excessivamente o material de origem. No caso do WG²GAN, isso arriscaria criar feridas inteiramente “fictícias” e não relacionadas, em vez de produzir uma faixa precisa de variações dentro de um tipo de ferida particular.

Controle de Escopo em um Conjunto de Dados de Aprendizado de Máquina

Modelos com conjuntos de treinamento mais leves generalizam mais rapidamente, e os pesquisadores do artigo defendem que as imagens mais realistas poderiam ser obtidas em menos de 1000 imagens, treinadas por 200 épocas.

Embora conjuntos de dados menores possam alcançar imagens altamente realistas em menos tempo, a faixa de imagens e os tipos de feridas geradas serão necessariamente mais limitados. Há um equilíbrio delicado nos regimes de treinamento de GAN e codificador/decodificador entre o volume e a variedade de dados de entrada, a fidelidade das imagens produzidas e a realidade das imagens produzidas — questões de escopo e ponderação que certamente não se limitam à síntese de imagens médicas.

Desequilíbrios de Classe em Conjuntos de Dados Médicos

Em geral, o aprendizado de máquina em saúde é afetado não apenas pela falta de conjuntos de dados, mas também por desequilíbrios de classe, onde dados essenciais sobre uma doença específica constituem uma pequena porcentagem do conjunto de dados hospedeiro, o que os torna vulneráveis a serem descartados como dados de outlier ou a serem assimilados no processo de generalização durante o treinamento.

Vários métodos foram propostos para abordar a última questão, como sub-amostragem ou super-amostragem. No entanto, o problema é frequentemente contornado desenvolvendo conjuntos de dados específicos de doenças que são inteiramente vinculados a um único problema médico. Embora essa abordagem seja eficaz em cada caso, ela contribui para a cultura de balkanização na esfera da pesquisa de aprendizado de máquina em saúde e, argumenta-se, retarda o progresso geral no setor.

Related Topics:GAN GANs health healthcare image classification medical medical images

Martin Anderson

Escritor sobre aprendizado de máquina, especialista em síntese de imagem humana. Ex-chefe de conteúdo de pesquisa da Metaphysic.ai.

Unite.AI

Criação de Conjuntos de Dados Sintéticos de Feridas com Redes Adversárias Generativas

Controle de Escopo em um Conjunto de Dados de Aprendizado de Máquina

Desequilíbrios de Classe em Conjuntos de Dados Médicos

You may like