sơ khai Tạo bộ dữ liệu vết thương tổng hợp với mạng đối thủ tạo - Unite.AI
Kết nối với chúng tôi

Chăm sóc sức khỏe

Tạo bộ dữ liệu vết thương tổng hợp với các mạng đối thủ tạo

mm

Được phát hành

 on

Lần đầu tiên, a Mạng đối thủ sáng tạo đang được sử dụng để tạo các bộ dữ liệu tổng hợp về hình ảnh vết thương, nhằm khắc phục tình trạng thiếu nội dung nghiêm trọng và đa dạng của loại này trong các ứng dụng học máy chăm sóc sức khỏe.

Hệ thống, được gọi là WG2AN, là sự hợp tác giữa Trường Cao đẳng Kỹ thuật & Công nghệ Batten và công ty y tế AI eKare, chuyên áp dụng các phương pháp học máy để đo lường và xác định vết thương.

GAN được đào tạo dựa trên 100-4000 hình ảnh vết thương mãn tính lập thể được dán nhãn do eKare cung cấp, bao gồm các hình ảnh ẩn danh về các loại chấn thương do các nguyên nhân như áp lực, phẫu thuật, sự cố mạch bạch huyết, bệnh tiểu đường và vết thương do bỏng. Vật liệu nguồn có kích thước khác nhau từ 1224×1224 đến 2160×2160, tất cả đều được các bác sĩ chụp dưới ánh sáng sẵn có.

Để phù hợp với không gian tiềm ẩn có sẵn trong kiến ​​trúc đào tạo mô hình, các hình ảnh đã được thay đổi kích thước thành 512×512 và được trích xuất từ ​​nền của chúng. Để nghiên cứu ảnh hưởng của kích thước tập dữ liệu, các lần chạy thử nghiệm đã được thực hiện trên các lô hình ảnh 100, 250, 500, 1000, 2000 và 4000.

Nguồn: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Nguồn: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Hình ảnh trên cho thấy mức độ chi tiết và chi tiết tăng dần theo kích thước của tập huấn luyện đóng góp và số lượng kỷ nguyên chạy trên mỗi đường chuyền.

Kiến trúc của WG. Nguồn: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Kiến trúc của WG2GAN. Nguồn: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN chạy trên PyTorch trên một thiết lập kiểu người tiêu dùng tương đối gọn gàng, với 8GB VRAM trên GPU GTX 1080. Quá trình đào tạo mất từ ​​4-58 giờ trên phạm vi kích thước tập dữ liệu từ 100-4000 hình ảnh và trong một loạt các kỷ nguyên, trên kích thước lô 64 như một sự đánh đổi giữa độ chính xác và hiệu suất. Trình tối ưu hóa Adam được sử dụng cho nửa đầu của quá trình đào tạo với tốc độ học là 0.0002 và kết thúc với tốc độ học phân rã tuyến tính cho đến khi đạt được mức mất bằng XNUMX.

Phía trên bên trái, phân đoạn áp dụng cho khu vực vết thương. Trung tâm phía trên, hình ảnh của vết thương thực tế; phía trên bên phải, một vết thương tổng hợp thuộc loại có thể được khái quát hóa trong tập dữ liệu, dựa trên nguồn ban đầu. Bên dưới, vết thương ban đầu, và bên phải, tổng hợp vết thương do WG2GAN tạo ra.

Phía trên bên trái, phân đoạn áp dụng cho khu vực vết thương. Trung tâm phía trên, hình ảnh của vết thương thực tế; phía trên bên phải, một vết thương tổng hợp thuộc loại có thể được khái quát hóa trong tập dữ liệu, dựa trên nguồn ban đầu. Bên dưới, vết thương ban đầu, và bên phải, tổng hợp vết thương do WG2GAN tạo ra.

Trong các bộ dữ liệu y tế, cũng như rất nhiều lĩnh vực khác của máy học, việc ghi nhãn là một nút cổ chai không thể tránh khỏi. Trong trường hợp này, các nhà nghiên cứu đã sử dụng hệ thống ghi nhãn bán tự động tận dụng nghiên cứu trước đó từ eKare, sử dụng các mô hình vết thương trong thế giới thực, được tạo bằng Play-Doh và được tô màu đại khái cho ngữ cảnh ngữ nghĩa.

Mô hình vết thương eKare

Mô hình vết thương eKare

Các nhà nghiên cứu lưu ý một vấn đề thường xảy ra trong giai đoạn đào tạo ban đầu, khi tập dữ liệu khá đa dạng và trọng số được chọn ngẫu nhiên – mô hình mất nhiều thời gian (75 kỷ nguyên) để 'ổn định':

Khi dữ liệu đa dạng, cả mô hình GAN và bộ mã hóa/giải mã đều gặp khó khăn trong việc đạt được sự khái quát hóa trong các giai đoạn trước, như chúng ta có thể thấy bằng chứng trong biểu đồ trên về quá trình đào tạo WG2GAN, theo dõi lịch trình đào tạo từ khi bắt đầu cho đến khi không thua lỗ.

Phải cẩn thận để đảm bảo rằng quy trình đào tạo không cố định vào các tính năng hoặc đặc điểm của bất kỳ lần lặp lại hoặc kỷ nguyên nào, mà tiếp tục khái quát hóa thành tổn thất trung bình có thể sử dụng được mà không tạo ra kết quả trừu tượng hóa tài liệu nguồn quá mức. Trong trường hợp của WG2GAN, điều đó sẽ có nguy cơ tạo ra các vết thương không có giới hạn, hoàn toàn là 'hư cấu', được kết hợp giữa quá nhiều loại vết thương không liên quan, thay vì tạo ra một loạt các biến thể chính xác trong một loại vết thương cụ thể.

Kiểm soát phạm vi trong bộ dữ liệu học máy

Các mô hình có tập huấn luyện nhẹ hơn sẽ khái quát hóa nhanh hơn và các nhà nghiên cứu của bài báo cho rằng có thể thu được hình ảnh chân thực nhất ở mức thấp hơn cài đặt tối đa: tập dữ liệu 1000 hình ảnh được huấn luyện trong 200 kỷ nguyên.

Mặc dù các bộ dữ liệu nhỏ hơn có thể đạt được hình ảnh chân thực cao trong thời gian ngắn hơn, nhưng phạm vi hình ảnh và loại vết thương được tạo ra nhất thiết cũng sẽ bị hạn chế hơn. Có một sự cân bằng tinh tế trong GAN và các chế độ đào tạo bộ mã hóa/giải mã giữa khối lượng và sự đa dạng của dữ liệu đầu vào, độ trung thực của hình ảnh được tạo ra và tính hiện thực của hình ảnh được tạo ra — các vấn đề về phạm vi và trọng số chắc chắn không chỉ giới hạn trong hình ảnh y tế tổng hợp.

Mất cân bằng lớp trong bộ dữ liệu y tế

Nói chung, học máy chăm sóc sức khỏe không chỉ bị bao vây bởi thiếu bộ dữ liệu, nhưng bởi mất cân bằng giai cấp, trong đó dữ liệu thiết yếu về một bệnh cụ thể chiếm một tỷ lệ phần trăm nhỏ trong tập dữ liệu máy chủ của nó đến mức dữ liệu đó có nguy cơ bị loại bỏ dưới dạng dữ liệu ngoại lệ hoặc bị đồng hóa trong quá trình khái quát hóa trong suốt quá trình đào tạo.

Một số phương pháp đã được đề xuất để giải quyết vấn đề thứ hai, chẳng hạn như lấy mẫu dưới mức hoặc lấy mẫu quá mức. Tuy nhiên, vấn đề thường được giải quyết bằng cách phát triển các bộ dữ liệu dành riêng cho từng loại bệnh hoàn toàn liên quan đến một vấn đề y tế duy nhất. Mặc dù cách tiếp cận này có hiệu quả trên cơ sở từng trường hợp, nhưng nó đóng góp vào văn hóa của Balkan hóa trong lĩnh vực nghiên cứu máy học y tế và được cho là làm chậm tiến độ chung trong lĩnh vực này.