Kesehatan

Data Sintetis: Mengubah Ras dalam Gambar Wajah untuk Mengatasi Bias dalam Dataset Medis

Published June 15, 2021

Updated April 28, 2026

Martin Anderson

Peneliti UCLA telah mengembangkan metode untuk mengubah ras yang tampak dari wajah dalam dataset yang digunakan untuk melatih sistem pembelajaran mesin medis, dalam upaya untuk mengatasi bias rasial yang banyak diderita oleh dataset yang umum.

Teknik baru ini mampu menghasilkan video sintetis yang fotorealistik dan akurat secara fisiologis dengan rata-rata 0,005 detik per frame, dan diharapkan dapat membantu pengembangan sistem diagnostik baru untuk diagnosis dan pemantauan kesehatan jarak jauh – bidang yang telah berkembang pesat di bawah pembatasan COVID. Sistem ini dimaksudkan untuk meningkatkan kemampuan remote photoplethysmography (rPPG), sebuah teknik penglihatan komputer yang mengevaluasi konten video wajah untuk mendeteksi perubahan volumetrik dalam suplai darah secara non-invasif.

Sumber: https://arxiv.org/pdf/2106.06007.pdf. Klik untuk memperbesar.

Meskipun pekerjaan ini, yang menggunakan jaringan neural konvolusi (CNN), menggabungkan kode penelitian sebelumnya diterbitkan oleh Universitas Durham di Inggris pada 2020, aplikasi baru ini dimaksudkan untuk melestarikan sinyal pulsasi dalam data uji asli, bukan hanya mengubah ras yang tampak dari data, seperti yang dilakukan oleh penelitian pada 2020.

CNN untuk Transformasi Ras

Bagian pertama dari sistem encoder-decoder menggunakan model transfer ras Durham, yang telah dilatih sebelumnya pada VGGFace2, untuk menghasilkan frame target proxy dengan komponen Kaukasia-ke-Afrika dari penelitian Durham sebelumnya. Ini menghasilkan transfer ras yang datar, tetapi tidak mengandung variasi warna dan nada yang mewakili indikator fisiologis visual dari keadaan aliran darah pasien.

Pipeline transformasi dari penelitian 2020 oleh Universitas Durham, sebagian dari yang digabungkan ke dalam penelitian UCLA baru. Sumber: https://arxiv.org/pdf/2004.08945.pdf. Klik untuk memperbesar.

Jaringan kedua, disebut PhysResNet (PRN), menyediakan komponen rPPG. PhysResNet dilatih untuk mempelajari baik penampilan visual dan juga variasi warna yang mendefinisikan gerakan volume darah subkutan.

Bawah kiri, hasil yang diperoleh dari penelitian Durham 2020, kekurangan informasi PPG. Tengah kiri, informasi PPG yang digabungkan ke dalam transformasi ras. Klik untuk memperbesar.

Arsitektur yang diusulkan oleh proyek UCLA ini mengungguli teknik rPPG lainnya bahkan dalam ketiadaan augmentasi warna kulit, mewakili perbaikan 31% pada teknik serupa yang dioptimalkan dengan MAE dan RMSE.

Jaringan UCLA berhasil melestarikan informasi volume dan distribusi darah. Klik untuk memperbesar.

Peneliti UCLA berharap bahwa pekerjaan masa depan akan mengambil tantangan yang lebih luas untuk mengatasi bias rasial dalam sektor ini dari penggambaran medis, dan berharap juga bahwa skema yang lebih lanjut akan menghasilkan video dengan resolusi yang lebih tinggi, karena sistem yang bersangkutan terbatas pada resolusi 80×80 piksel – sesuai dengan keterbatasan telehealth, tetapi tidak ideal.

Kurangnya Dataset yang Diversifikasi Etnis

Kondisi ekonomi dan praktis yang menyebabkan dataset yang diversifikasi rasial telah menjadi hambatan bagi penelitian medis selama beberapa tahun. Data cenderung dihasilkan secara lokal, dengan banyak faktor yang menyebabkan homogenitas Kaukasia yang sering terjadi pada subjek data. Ini termasuk komposisi demografi minoritas di kota-kota tempat penelitian dilakukan, dan faktor sosio-ekonomi lain yang dapat mempengaruhi sejauh mana subjek non-putih muncul dalam dataset Barat yang peneliti ingin memiliki aplikasi global.

Di negara-negara dengan proporsi subjek berkulit gelap yang lebih tinggi, peralatan dan sumber daya yang diperlukan untuk mengumpulkan data seringkali tidak tersedia.

Peta warna kulit untuk orang-orang asli, dari American Journal of Physical Anthropology.

Saat ini subjek berkulit gelap sangat kurang terwakili dalam dataset rPPG, mewakili 0%, 5%, dan 10% dari konten tiga database utama yang umum digunakan untuk tujuan ini.

Data Kaukasia Homogen

Pada 2019, penelitian diterbitkan di Science menemukan bahwa algoritma yang banyak digunakan dalam perawatan rumah sakit AS sangat berat sebelah terhadap subjek Kaukasia. Studi tersebut menemukan bahwa orang Afrika-Amerika kurang mungkin dirujuk ke perawatan khusus dalam triase dan tingkat yang lebih dalam dari penerimaan rumah sakit.

Penelitian lebih lanjut pada tahun yang sama dari peneliti di Malaysia dan Australia menetapkan masalah umum ‘Own Race Bias’ untuk generasi dataset di banyak wilayah dunia, termasuk Asia.

Batasan Potensial Skala dan Arsitektur

Beberapa keterbatasan yang telah menyebabkan dataset dengan etnis yang terbatas adalah pragmatis daripada etis. Semakin luas pluralitas data yang berkontribusi, semakin baik generalisasi di seluruh subjek yang ditampilkan dalam data tersebut, tetapi semakin sedikit waktu pelatihan, perhatian, dan sumber daya yang tersedia untuk setiap subset data yang dapat diidentifikasi, termasuk ras.

Ini dapat menyebabkan model yang sangat umum tetapi mendapatkan hasil yang kurang spesifik, karena keterbatasan ukuran data, ekonomi ukuran batch, dan keterbatasan praktis ruang laten sebagai fungsi dari sumber daya perangkat keras yang terbatas.

Di ujung lain, meskipun hasil yang efektif dan rinci dapat diperoleh dengan membatasi data input ke set karakteristik yang lebih terbatas, termasuk etnis, hasilnya kemungkinan akan ‘overfit’ ke data yang terbatas, dan tidak berlaku secara umum, bahkan mungkin tidak berlaku untuk subjek yang tidak terlihat di area geografis yang sama dari mana subjek dataset asli diperoleh.

Avatar Sintetis untuk Simulasi PPG

Makalah UCLA juga mencatat pekerjaan sebelumnya dari Microsoft Research pada 2020 tentang penggunaan avatar sintetis yang dapat diubah rasial, yang menggunakan sintesis gambar 3D untuk membuat video wajah yang kaya akan informasi PPG.

Avatar sintetis yang dibuat oleh penelitian Microsoft, dengan gambar yang dihasilkan sinar yang mengandung data PPG. Sumber: https://arxiv.org/pdf/2010.12949.pdf. Klik untuk memperbesar.