stub مصنوعی ڈیٹا: میڈیکل ڈیٹاسیٹس میں تعصب کو دور کرنے کے لیے چہرے کی تصویروں میں ریس کو تبدیل کرنا - Unite.AI
ہمارے ساتھ رابطہ

صحت کی دیکھ بھال

مصنوعی ڈیٹا: میڈیکل ڈیٹا سیٹس میں تعصب کو دور کرنے کے لیے چہرے کی تصویروں میں ریس کو تبدیل کرنا

mm
تازہ کاری on

UCLA محققین نے ڈیٹاسیٹس میں چہروں کی ظاہری دوڑ کو تبدیل کرنے کا ایک طریقہ تیار کیا ہے جو طبی مشین سیکھنے کے نظام کو تربیت دینے کے لیے استعمال کیا جاتا ہے، اس نسلی تعصب کو دور کرنے کی کوشش میں جس کا بہت سے عام ڈیٹا سیٹس کا شکار ہیں۔

۔ نئی تکنیک فی فریم 0.005 سیکنڈ کی اوسط شرح سے فوٹو ریئلسٹک اور فزیولوجیکل طور پر درست مصنوعی ویڈیو تیار کرنے کی صلاحیت رکھتا ہے، اور امید ہے کہ دور دراز سے صحت کی دیکھ بھال کی تشخیص اور نگرانی کے لیے نئے تشخیصی نظاموں کی ترقی میں مدد ملے گی – ایک ایسا شعبہ جو COVID پابندیوں کے تحت بہت زیادہ پھیلا ہوا ہے۔ اس نظام کا مقصد ریموٹ فوٹوپلیتھیسموگرافی کے اطلاق کو بہتر بنانا ہے (rPPG)، ایک کمپیوٹر ویژن تکنیک جو غیر حملہ آور انداز میں خون کی فراہمی میں حجمی تبدیلیوں کا پتہ لگانے کے لیے چہرے کے ویڈیو مواد کا جائزہ لیتی ہے۔

ماخذ: https://arxiv.org/pdf/2106.06007.pdf

ماخذ: https://arxiv.org/pdf/2106.06007.pdf۔ بڑا کرنے کے لیے کلک کریں۔

اگرچہ کام، جو کنوولیشنل نیورل نیٹ ورکس (CNNs) کا استعمال کرتا ہے، اس میں پچھلے تحقیقی کوڈ کو شامل کیا گیا ہے۔ شائع 2020 میں برطانیہ کی ڈرہم یونیورسٹی کی طرف سے، نئی ایپلیکیشن کا مقصد اصل ٹیسٹ ڈیٹا میں پلسٹائل سگنلز کو محفوظ کرنا ہے، بجائے اس کے کہ ڈیٹا کی ظاہری دوڑ کو بصری طور پر تبدیل کیا جائے، جیسا کہ 2020 کی تحقیق کرتی ہے۔

نسلی تبدیلی کے لیے CNNs

انکوڈر-ڈیکوڈر سسٹم کا پہلا حصہ ڈرہم ریس ٹرانسفر ماڈل کا استعمال کرتا ہے، پہلے سے تربیت یافتہ VGGFace2، ڈرہم تحقیق کے پہلے کاکیشین تا افریقی جزو کے ساتھ پراکسی ٹارگٹ فریم تیار کرنا۔ یہ نسلی خصوصیات کی فلیٹ منتقلی پیدا کرتا ہے، لیکن اس میں رنگ اور لہجے میں وہ تغیرات شامل نہیں ہیں جو مریض کے خون کے بہاؤ کی حالت کے بصری جسمانی اشارے کی نمائندگی کرتے ہیں۔

ڈرہم یونیورسٹی کی 2020 کی تحقیق سے ٹرانسفارمیشن پائپ لائن، جس کا ایک حصہ نئی UCLA تحقیق میں شامل کیا گیا ہے۔ ماخذ: https://arxiv.org/pdf/2004.08945.pdf

ڈرہم یونیورسٹی کی 2020 کی تحقیق سے ٹرانسفارمیشن پائپ لائن، جس کا ایک حصہ نئی UCLA تحقیق میں شامل کیا گیا ہے۔ ماخذ: https://arxiv.org/pdf/2004.08945.pdf۔ بڑا کرنے کے لیے کلک کریں۔

دوسرا نیٹ ورک، جسے PhysResNet (PRN) کہا جاتا ہے، rPPG جزو فراہم کرتا ہے۔ PhysResNet کو بصری شکل اور رنگ کی مختلف حالتوں کو جاننے کے لیے تربیت دی جاتی ہے جو کہ ذیلی خون کے حجم کی حرکت کی وضاحت کرتی ہے۔

نیچے بائیں طرف، 2020 Durham تحقیق کے حاصل کردہ نتائج، جن میں PPG معلومات کی کمی ہے۔ درمیانی بائیں، PPG معلومات نسلی تبدیلی میں شامل کی گئی ہیں۔

نیچے بائیں طرف، 2020 Durham تحقیق کے حاصل کردہ نتائج، جن میں PPG معلومات کی کمی ہے۔ درمیانی بائیں، PPG معلومات نسلی تبدیلی میں شامل کی گئی ہیں۔ وسعت کے لئے کلک کریں۔

UCLA پروجیکٹ نے جس فن تعمیر کی تجویز پیش کی ہے وہ جلد کے رنگ میں اضافے کی عدم موجودگی میں بھی مسابقتی آر پی پی جی تکنیکوں سے بہتر کارکردگی کا مظاہرہ کرتی ہے، جو کہ اسی طرح کی تکنیکوں میں 31 فیصد بہتری کی نمائندگی کرتی ہے۔ MAE اور RMSE.

UCLA نیٹ ورک خون کے حجم اور تقسیم کی معلومات کو کامیابی سے محفوظ رکھتا ہے۔

UCLA نیٹ ورک خون کے حجم اور تقسیم کی معلومات کو کامیابی سے محفوظ رکھتا ہے۔ وسعت کے لئے کلک کریں۔

UCLA محققین کو امید ہے کہ مستقبل کا کام طبی امیجنگ کے اس شعبے میں نسلی تعصب کو دور کرنے کے لیے مزید وسیع چیلنجز کا سامنا کرے گا، اور یہ بھی امید ہے کہ بعد میں آنے والی اسکیمیں اعلیٰ ریزولیوشن والی ویڈیو آؤٹ پٹ کریں گی، کیونکہ زیر بحث نظام 80×80 پکسل ریزولوشن تک محدود ہے۔ - ٹیلی ہیلتھ کی حدود کے لیے معقول حد تک موزوں ہے، لیکن مثالی نہیں۔

نسلی طور پر متنوع ڈیٹاسیٹس کی کمی

معاشی اور عملی حالات جو نسلی طور پر متنوع ڈیٹاسیٹس کا باعث بنتے ہیں کچھ سالوں سے طبی تحقیق میں رکاوٹ بنے ہوئے ہیں۔ اعداد و شمار پاروکی طور پر تیار کیے جاتے ہیں، بہت سے عوامل کے ساتھ ڈیٹا کے مضامین کی کثرت سے کاکیشین-مرکزی یکسانیت میں حصہ ڈالتے ہیں ان میں ان شہروں میں اقلیتی آبادی کی تشکیل شامل ہے جہاں تحقیق ہوتی ہے، اور دوسرے سماجی اقتصادی عوامل جو اس حد تک اثر انداز ہو سکتے ہیں جس حد تک غیر سفید مضامین ظاہر ہوتے ہیں۔ مغربی ڈیٹاسیٹس میں جو محققین کی خواہش ہے کہ زیادہ عالمی قابل اطلاق ہو سکتا ہے۔

سیاہ فام مضامین کے زیادہ تناسب والے ممالک میں، ڈیٹا اکٹھا کرنے کے لیے درکار آلات اور وسائل کی اکثر کمی ہوتی ہے۔

امریکن جرنل آف فزیکل اینتھروپولوجی سے، مقامی لوگوں کے لیے جلد کے رنگ کا دنیا کا نقشہ۔

امریکن جرنل آف فزیکل اینتھروپولوجی سے، مقامی لوگوں کے لیے جلد کے رنگ کا دنیا کا نقشہ۔

فی الحال سیاہ جلد والے مضامین کو خاص طور پر rPPG ڈیٹاسیٹس میں کم دکھایا گیا ہے، جو اس مقصد کے لیے عام استعمال میں تین بنیادی ڈیٹا بیس کے مواد کے 0%، 5% اور 10% کی نمائندگی کرتے ہیں۔

یکساں کاکیشین ڈیٹا

2019 میں نئی ​​تحقیق شائع in سائنس نے پایا کہ امریکی ہسپتال کی دیکھ بھال میں وسیع پیمانے پر پھیلا ہوا الگورتھم کاکیشین مضامین کے حق میں بہت زیادہ متعصب تھا۔ اس تحقیق سے پتا چلا ہے کہ سیاہ فام لوگوں کو ٹریج اور ہسپتال میں داخلے کی گہری سطح میں خصوصی نگہداشت کے لیے بھیجے جانے کا امکان کم تھا۔

ملائیشیا اور آسٹریلیا کے محققین سے اسی سال مزید تحقیق قائم ایشیا سمیت دنیا کے کئی خطوں میں ڈیٹا سیٹ کی تیاری کے لیے 'اپنی نسل کے تعصب' کا عمومی مسئلہ۔

پیمانے اور فن تعمیر کی ممکنہ حدود

کچھ حدود جن کی وجہ سے محدود نسلی ڈیٹا سیٹس فطرت میں اخلاقی ہونے کے بجائے عملی ہیں۔ تعاون کرنے والے اعداد و شمار کی کثرتیت جتنی وسیع ہوگی، یہ اس ڈیٹا میں شامل تمام مضامین کو اتنا ہی بہتر بناتا ہے، لیکن تربیت کے معمولات میں اعداد و شمار کی کسی ایک خصوصیت، بشمول نسل کے اندر نمونوں کو سمجھنے کا امکان اتنا ہی کم ہوتا ہے، کیونکہ تربیت کے وقت کا ایک چھوٹا فیصد، توجہ اور وسائل ڈیٹا کے ہر قابل شناخت ذیلی سیٹ کے لیے دستیاب ہیں۔

یہ ایسے ماڈلز کا باعث بن سکتا ہے جو وسیع پیمانے پر لاگو ہوتے ہیں لیکن کم مخصوص نتائج حاصل کرتے ہیں، ڈیٹا کے سائز کی رکاوٹوں، بیچ کے سائز کی اقتصادیات، اور محدود ہارڈ ویئر وسائل کے کام کے طور پر پوشیدہ جگہ کی عملی حدود کی وجہ سے۔

دوسری انتہا پر، اگرچہ ان پٹ ڈیٹا کو نسلیت سمیت خصوصیات کے زیادہ محدود سیٹ تک محدود کرکے موثر اور دانے دار نتائج حاصل کیے جاسکتے ہیں، لیکن امکان ہے کہ نتائج محدود ڈیٹا کے لیے 'اوور فٹ' ہوں گے، اور وسیع پیمانے پر لاگو نہیں ہوں گے، شاید یہاں تک کہ اسی جغرافیائی علاقے میں ان دیکھے مضامین میں جہاں سے اصل ڈیٹاسیٹ مضامین حاصل کیے گئے تھے۔

پی پی جی سمولیشن کے لیے مصنوعی اوتار

UCLA پیپر 2020 میں مائیکروسافٹ ریسرچ کی طرف سے نسلی طور پر لچکدار مصنوعی اوتاروں کے استعمال میں پیشگی کام کو بھی نوٹ کرتا ہے، جو PPG معلومات سے بھرپور چہرے کی ویڈیوز بنانے کے لیے 3D امیج کی ترکیب کا فائدہ اٹھاتا ہے۔

مائیکروسافٹ ریسرچ کے ذریعہ تخلیق کردہ مصنوعی اوتار، شعاعوں سے ٹریس شدہ تصاویر کے ساتھ جن میں PPG ڈیٹا ہوتا ہے۔ ماخذ: https://arxiv.org/pdf/2010.12949.pdf

مائیکروسافٹ ریسرچ کے ذریعہ تخلیق کردہ مصنوعی اوتار، شعاعوں سے ٹریس شدہ تصاویر کے ساتھ جن میں PPG ڈیٹا ہوتا ہے۔ ماخذ: https://arxiv.org/pdf/2010.12949.pdf۔ بڑا کرنے کے لیے کلک کریں۔