stomp Sintetiese data: veranderende ras in gesigsbeelde om vooroordeel in mediese datastelle aan te spreek - Unite.AI
Verbinding met ons

Healthcare

Sintetiese data: veranderende ras in gesigsbeelde om vooroordeel in mediese datastelle aan te spreek

mm
Opgedateer on

UCLA Navorsers het 'n metode ontwikkel om die oënskynlike ras van gesigte te verander in datastelle wat gebruik word om mediese masjienleerstelsels op te lei, in 'n poging om die rassevooroordeel waaraan baie algemene datastelle ly, reg te stel.

Die nuwe tegniek is in staat om fotorealistiese en fisiologies akkurate sintetiese video te produseer teen 'n gemiddelde tempo van 0.005 sekondes per raam, en daar word gehoop om die ontwikkeling van nuwe diagnostiese stelsels vir afgeleë gesondheidsorg diagnose en monitering te help – 'n veld wat baie uitgebrei het onder COVID-beperkings. Die stelsel is bedoel om die toepaslikheid van afstandfotopletismografie (rPPG), 'n rekenaarvisie-tegniek wat gesigvideo-inhoud evalueer om volumetriese veranderinge in bloedtoevoer op 'n nie-indringende wyse op te spoor.

Bron: https://arxiv.org/pdf/2106.06007.pdf

Bron: https://arxiv.org/pdf/2106.06007.pdf. Klik om te vergroot.

Alhoewel die werk, wat gebruik maak van konvolusionele neurale netwerke (CNN's), vorige navorsingskode insluit gepubliseer deur die UK se Durham Universiteit in 2020, is die nuwe toepassing bedoel om pulserende seine in die oorspronklike toetsdata te bewaar, eerder as om net die oënskynlike ras van die data visueel te verander, soos die 2020-navorsing doen.

CNN's vir rassetransformasie

Die eerste deel van die enkodeerder-dekodeerderstelsel gebruik die Durham-renoordragmodel, vooraf opgelei op VGGFace2, om volmagteikenrame te genereer met die vorige Kaukasiese-tot-Afrika-komponent van die Durham-navorsing. Dit lewer 'n plat oordrag van rasseienskappe, maar bevat nie die variasies in kleur en toon wat visuele fisiologiese aanwysers van die pasiënt se bloedvloeitoestand verteenwoordig nie.

Die transformasiepyplyn van die 2020-navorsing deur Durham Universiteit, waarvan 'n deel by die nuwe UCLA-navorsing geïnkorporeer is. Bron: https://arxiv.org/pdf/2004.08945.pdf

Die transformasiepyplyn van die 2020-navorsing deur Durham Universiteit, waarvan 'n deel by die nuwe UCLA-navorsing geïnkorporeer is. Bron: https://arxiv.org/pdf/2004.08945.pdf. Klik om te vergroot.

'n Tweede netwerk, genaamd PhysResNet (PRN), verskaf die rPPG-komponent. PhysResNet is opgelei om beide die visuele voorkoms en ook die kleurvariasies te leer wat die subkutane bloedvolumebewegings definieer.

Links onder, die resultate verkry deur die 2020 Durham-navorsing, sonder PPG-inligting. Middel links, die PPG-inligting wat in die rassetransformasie opgeneem is.

Links onder, die resultate verkry deur die 2020 Durham-navorsing, sonder PPG-inligting. Middel links, die PPG-inligting wat in die rassetransformasie opgeneem is. Klik om te vergroot.

Die argitektuur wat die UCLA-projek voorstel, presteer beter as mededingende rPPG-tegnieke selfs in die afwesigheid van velkleurvergroting, wat 'n verbetering van 31% verteenwoordig op soortgelyke tegnieke wat geoptimaliseer is met MAE en RMSE.

Die UCLA-netwerk bewaar bloedvolume en verspreidingsinligting suksesvol.

Die UCLA-netwerk bewaar bloedvolume en verspreidingsinligting suksesvol. Klik om te vergroot.

Die UCLA-navorsers hoop dat toekomstige werk meer uitgebreide uitdagings sal aanpak om rassevooroordeel in hierdie sektor van mediese beeldvorming reg te stel, en hoop ook dat latere skemas hoër-resolusie video sal uitvoer, aangesien die betrokke stelsel beperk is tot 'n 80 × 80 pixel resolusie – pas redelik goed by die beperkings van telegesondheid, maar nie ideaal nie.

Gebrek aan etnies uiteenlopende datastelle

Die ekonomiese en praktiese omstandighede wat tot ras-diverse datastelle lei, was vir 'n paar jaar 'n struikelblok vir mediese navorsing. Data is geneig om parogiaal gegenereer te word, met baie faktore wat bydra tot 'n gereelde Kaukasies-sentriese homogeniteit van datasubjekte Dit sluit in die samestelling van minderheidsdemografie in stede waar navorsing plaasvind, en ander sosio-ekonomiese faktore wat die mate waarin nie-blanke subjekte voorkom kan beïnvloed in westerse datastelle wat die navorsers wens 'n meer globale toepaslikheid kan hê.

In lande met 'n groter persentasie donker velle proefpersone, ontbreek die nodige toerusting en hulpbronne om die data in te samel dikwels.

'n Velkleurwêreldkaart vir inheemse mense, uit die American Journal of Physical Anthropology.

'n Velkleurwêreldkaart vir inheemse mense, uit die American Journal of Physical Anthropology.

Tans is proefpersone met donker velkleur merkbaar onderverteenwoordig in rPPG-datastelle, wat 0%, 5% en 10% van die inhoud van die drie primêre databasisse wat vir hierdie doel gebruik word, verteenwoordig.

Homogene Kaukasiese data

In 2019 nuwe navorsing gepubliseer in Wetenskap het gevind dat 'n algoritme wat wyd versprei is in Amerikaanse hospitaalsorg sterk bevooroordeeld was ten gunste van Kaukasiese vakke. Die studie het bevind dat swart mense minder geneig is om na gespesialiseerde sorg verwys te word in triage en dieper vlakke van hospitaalopname.

Verdere navorsing in daardie jaar van navorsers in Maleisië en Australië gestig die algemene probleem van 'Eie ras-vooroordeel' vir die generering van datastel oor baie streke van die wêreld, insluitend Asië.

Potensiële beperkings van skaal en argitektuur

Sommige van die beperkings wat tot beperkte etnisiteit-datastelle gelei het, is pragmaties eerder as eties van aard. Hoe wyer die pluraliteit van die bydraende data is, hoe beter veralgemeen dit oor die onderwerpe wat in daardie data verskyn, maar hoe minder sal die oefenroetine waarskynlik patrone binne enige enkele kenmerk van data, insluitend ras, intuit, want 'n kleiner persentasie van oefentyd, aandag en hulpbronne is beskikbaar vir elke identifiseerbare subset van die data.

Dit kan lei tot modelle wat wyd toepaslik is, maar minder spesifieke resultate verkry, as gevolg van die beperkings van datagrootte, die ekonomie van bondelgrootte en praktiese beperkings van die latente ruimte as 'n funksie van beperkte hardeware hulpbronne.

Aan die ander uiterste, alhoewel effektiewe en korrelige resultate verkry kan word deur die insetdata te beperk tot 'n meer beperkte stel kenmerke, insluitend etnisiteit, is die resultate waarskynlik 'oorpas' vir die beperkte data, en nie breed toepaslik nie, miskien selfs oor ongesiene vakke in dieselfde geografiese gebied waaruit die oorspronklike datastel-vakke verkry is.

Sintetiese avatars vir PPG-simulasie

Die UCLA-vraestel neem ook kennis van vorige werk van Microsoft Research in 2020 oor die gebruik van sintetiese avatars wat op rassebasis buigbaar is, wat 3D-beeldsintese gebruik om gesigvideo's ryk aan PPG-inligting te skep.

Sintetiese avatars wat deur Microsoft-navorsing geskep is, met straalgespoorde beelde wat PPG-data bevat. Bron: https://arxiv.org/pdf/2010.12949.pdf

Sintetiese avatars wat deur Microsoft-navorsing geskep is, met straalgespoorde beelde wat PPG-data bevat. Bron: https://arxiv.org/pdf/2010.12949.pdf. Klik om te vergroot.