Sağlık hizmeti
Sentetik Veriler: Tıbbi Veri Kümelerindeki Yanlılığı Ele Almak İçin Yüz Görüntülerindeki Irkın Değiştirilmesi

UCLA Araştırmacıları, birçok yaygın veri kümesinin maruz kaldığı ırksal önyargıyı düzeltmek amacıyla, tıbbi makine öğrenimi sistemlerini eğitmek için kullanılan veri kümelerindeki görünür yüz ırkını değiştirmek için bir yöntem geliştirdi.
The yeni teknik kare başına ortalama 0.005 saniye hızında fotogerçekçi ve fizyolojik olarak doğru sentetik video üretebilir ve COVID kısıtlamaları altında büyük ölçüde genişleyen bir alan olan uzaktan sağlık hizmeti teşhisi ve izlemesi için yeni teşhis sistemlerinin geliştirilmesine yardımcı olması umulmaktadır. Sistem, uzaktan fotopletismografinin uygulanabilirliğini geliştirmeyi amaçlamaktadır (rPPG), kan akışındaki hacimsel değişiklikleri invaziv olmayan bir şekilde tespit etmek için yüz video içeriğini değerlendiren bir bilgisayarlı görme tekniğidir.
Evrişimli sinir ağlarını (CNN'ler) kullanan çalışma, önceki araştırma kodunu içeriyor olsa da yayınlanan İngiltere'deki Durham Üniversitesi tarafından 2020 yılında geliştirilen yeni uygulama, 2020 araştırmasının yaptığı gibi yalnızca verilerin görünürdeki ırkını görsel olarak değiştirmek yerine, orijinal test verilerindeki titreşimli sinyalleri korumayı amaçlıyor.
Irk Dönüşümü İçin CNN'ler
Kodlayıcı-kod çözücü sisteminin ilk bölümü, üzerinde önceden eğitilmiş Durham yarış aktarım modelini kullanır. VGGFace2Durham araştırmasının Kafkasyalı-Afrikalı bileşenini kullanarak vekil hedef çerçeveleri oluşturmak. Bu, ırksal özelliklerin düz bir aktarımını sağlar, ancak hastanın kan akışı durumunun görsel fizyolojik göstergelerini temsil eden renk ve ton farklılıklarını içermez.

Bir kısmı yeni UCLA araştırmasına dahil edilen Durham Üniversitesi tarafından 2020 araştırmasından elde edilen dönüşüm hattı. Kaynak: https://arxiv.org/pdf/2004.08945.pdf. Büyütmek için tıklayın.
PhysResNet (PRN) adı verilen ikinci bir ağ, rPPG bileşenini sağlar. PhysResNet, deri altı kan hacmi hareketlerini tanımlayan hem görsel görünümü hem de renk varyasyonlarını öğrenmek için eğitilmiştir.

Sol altta, 2020 Durham araştırması tarafından elde edilen sonuçlar, PPG bilgisi yok. Orta solda, ırksal dönüşüme dahil edilen PPG bilgisi. Büyütmek için tıklayın.
UCLA projesinin önerdiği mimari, ten rengi artırma olmadığında bile rakip rPPG tekniklerinden daha iyi performans gösteriyor; MAE ve RMSE.

UCLA ağı, kan hacmini ve dağıtım bilgilerini başarıyla korur. Büyütmek için tıklayın.
UCLA araştırmacıları, gelecekteki çalışmaların bu tıbbi görüntüleme sektöründeki ırksal önyargıyı gidermek için daha kapsamlı zorlukları üstleneceğini umuyor ve ayrıca söz konusu sistem 80×80 piksel çözünürlükle sınırlı olduğu için sonraki planların daha yüksek çözünürlüklü video çıkaracağını umuyor. – telesağlığın sınırlamalarına oldukça uygundur, ancak ideal değildir.
Etnik Olarak Çeşitli Veri Kümelerinin Eksikliği
Irksal olarak farklı veri kümelerine yol açan ekonomik ve pratik koşullar, birkaç yıldır tıbbi araştırmaların önünde engel teşkil ediyor. Veriler, veri konularının sık sık Kafkas merkezli homojenliğine katkıda bulunan birçok faktörle birlikte dar görüşlü olarak oluşturulma eğilimindedir. Araştırmacıların dilediği batı veri kümelerinde daha küresel bir uygulanabilirliğe sahip olabilir.
Koyu tenli deneklerin daha yüksek oranda olduğu ülkelerde, verileri toplamak için gerekli ekipman ve kaynaklar genellikle eksiktir.

American Journal of Physical Anthropology'den yerli halk için ten rengi bir dünya haritası.
Şu anda koyu tenli kişiler, bu amaç için yaygın olarak kullanılan üç birincil veri tabanının içeriğinin %0, %5 ve %10'unu temsil eden rPPG veri kümelerinde özellikle yetersiz temsil edilmektedir.
Homojen Kafkas Verileri
2019'da yeni araştırma yayınlanan in Bilim ABD hastane bakımında yaygın olarak kullanılan bir algoritmanın, beyaz denekler lehine büyük ölçüde önyargılı olduğunu buldu. Çalışma, siyah insanların triyajda ve daha derin hastane yatış seviyelerinde özel bakıma sevk edilme olasılıklarının daha düşük olduğunu buldu.
O yıl Malezya ve Avustralya'daki araştırmacılardan daha fazla araştırma kurulmuş Asya da dahil olmak üzere dünyanın birçok bölgesinde veri seti oluşturmada 'Kendi Irk Önyargısı' genel sorunu.
Ölçek ve Mimarinin Potansiyel Sınırlamaları
Sınırlı etnik veri kümelerine yol açan bazı sınırlamalar, doğası gereği etik olmaktan çok pragmatiktir. Katkıda bulunan verilerin çoğulluğu ne kadar geniş olursa, o verilerde yer alan denekler arasında o kadar iyi genelleme yapar, ancak eğitim rutininin, ırk da dahil olmak üzere verilerin herhangi bir tek özelliği içindeki kalıpları sezmesi o kadar az olasıdır çünkü eğitim süresinin daha küçük bir yüzdesi, dikkat ve kaynaklar, verilerin tanımlanabilir her bir alt kümesi için mevcuttur.
Bu, veri boyutunun kısıtlamaları, parti boyutunun ekonomisi ve sınırlı donanım kaynaklarının bir fonksiyonu olarak gizli alanın pratik sınırlamaları nedeniyle, yaygın olarak uygulanabilir ancak daha az spesifik sonuçlar elde eden modellere yol açabilir.
Diğer uçta, girdi verilerini etnik köken de dahil olmak üzere daha sınırlı bir özellik kümesiyle sınırlandırarak etkili ve ayrıntılı sonuçlar elde edilebilse de, sonuçların sınırlı verilere 'aşırı uyumlu' olması ve hatta orijinal veri kümesi konularının elde edildiği aynı coğrafi bölgedeki görülmemiş konular arasında bile geniş çapta uygulanabilir olmaması muhtemeldir.
PPG Simülasyonu İçin Sentetik Avatarlar
UCLA belgesi ayrıca, Microsoft Research'ün 2020'de PPG bilgileri açısından zengin yüz videoları oluşturmak için 3D görüntü sentezinden yararlanan ırksal olarak esnek sentetik avatarların kullanımına ilişkin önceki çalışmasına da dikkat çekiyor.

PPG verileri içeren ışın izlemeli görüntülerle Microsoft araştırması tarafından oluşturulan sentetik avatarlar. Kaynak: https://arxiv.org/pdf/2010.12949.pdf. Büyütmek için tıklayın.