ہمارے ساتھ رابطہ

صحت کی دیکھ بھال میں انقلاب: طب میں بڑے زبان کے ماڈلز کے اثرات اور مستقبل کی تلاش

صحت کی دیکھ بھال

صحت کی دیکھ بھال میں انقلاب: طب میں بڑے زبان کے ماڈلز کے اثرات اور مستقبل کی تلاش

mm
طب میں بڑے زبان کے ماڈل

طب اور صحت کی دیکھ بھال میں بڑے لینگوئج ماڈلز (LLMs) کا انضمام اور اطلاق اہم دلچسپی اور ترقی کا موضوع رہا ہے۔

جیسا کہ میں ذکر کیا گیا تھا ہیلتھ کیئر انفارمیشن مینجمنٹ اینڈ سسٹمز سوسائٹی عالمی کانفرنس اور دیگر قابل ذکر واقعات، گوگل جیسی کمپنیاں صحت کی دیکھ بھال کے اندر تخلیقی AI کی صلاحیت کو تلاش کرنے میں قیادت کر رہی ہیں۔ ان کے اقدامات، جیسے Med-PaLM 2، AI سے چلنے والے صحت کی دیکھ بھال کے حل کے بدلتے ہوئے منظر نامے کو نمایاں کرتے ہیں، خاص طور پر تشخیص، مریضوں کی دیکھ بھال، اور انتظامی کارکردگی جیسے شعبوں میں۔

Google کے Med-PaLM 2، ہیلتھ کیئر ڈومین میں ایک اہم LLM، نے متاثر کن صلاحیتوں کا مظاہرہ کیا ہے، خاص طور پر یو ایس میڈیکل لائسنسنگ ایگزامینیشن طرز کے سوالات میں "ماہر" کی سطح کو حاصل کرنا۔ یہ ماڈل، اور اس جیسے دوسرے، صحت کی دیکھ بھال کرنے والے پیشہ ور افراد کی معلومات تک رسائی اور استعمال کرنے کے طریقے میں انقلاب لانے کا وعدہ کرتے ہیں، ممکنہ طور پر تشخیصی درستگی اور مریضوں کی دیکھ بھال کی کارکردگی میں اضافہ کرتے ہیں۔

تاہم، ان پیش رفتوں کے ساتھ ساتھ، کلینیکل سیٹنگز میں ان ٹیکنالوجیز کی عملییت اور حفاظت کے بارے میں خدشات بھی اٹھائے گئے ہیں۔ مثال کے طور پر، ماڈل ٹریننگ کے لیے وسیع انٹرنیٹ ڈیٹا کے ذرائع پر انحصار، جبکہ کچھ سیاق و سباق میں فائدہ مند، طبی مقاصد کے لیے ہمیشہ مناسب یا قابل اعتماد نہیں ہو سکتا۔ جیسا کہ نگم شاہ، پی ایچ ڈی، ایم بی بی ایس، چیف ڈیٹا سائنٹسٹ برائے سٹینفورڈ ہیلتھ کیئر، بتاتے ہیں، پوچھنے کے لیے اہم سوالات حقیقی دنیا کی طبی ترتیبات میں ان ماڈلز کی کارکردگی اور مریضوں کی دیکھ بھال اور صحت کی دیکھ بھال کی کارکردگی پر ان کے حقیقی اثرات کے بارے میں ہیں۔

ڈاکٹر شاہ کا نقطہ نظر طب میں ایل ایل ایم کو استعمال کرنے کے لیے مزید موزوں طریقہ کار کی ضرورت پر زور دیتا ہے۔ وسیع انٹرنیٹ ڈیٹا پر تربیت یافتہ عام مقصد کے ماڈلز کے بجائے، وہ ایک زیادہ توجہ مرکوز حکمت عملی تجویز کرتا ہے جہاں ماڈلز کو مخصوص، متعلقہ طبی ڈیٹا پر تربیت دی جاتی ہے۔ یہ نقطہ نظر ایک میڈیکل انٹرن کی تربیت سے مشابہت رکھتا ہے - انہیں مخصوص کام فراہم کرنا، ان کی کارکردگی کی نگرانی کرنا، اور آہستہ آہستہ مزید خود مختاری کی اجازت دینا جب وہ قابلیت کا مظاہرہ کرتے ہیں۔

اس کے ساتھ لائن میں، کی ترقی EPFL محققین کے ذریعہ میڈیٹرون میدان میں ایک دلچسپ پیشرفت پیش کرتا ہے۔ میڈیٹرون، ایک اوپن سورس LLM جو خاص طور پر میڈیکل ایپلی کیشنز کے لیے تیار کیا گیا ہے، ایک اہم قدم کی نمائندگی کرتا ہے۔ PubMed اور طبی رہنما خطوط جیسے معتبر ذرائع سے تیار کردہ طبی ڈیٹا پر تربیت یافتہ، Meditron طبی پریکٹیشنرز کے لیے زیادہ توجہ مرکوز اور ممکنہ طور پر زیادہ قابل اعتماد ٹول پیش کرتا ہے۔ اس کی اوپن سورس نوعیت نہ صرف شفافیت اور تعاون کو فروغ دیتی ہے بلکہ وسیع تر تحقیقی برادری کے ذریعے مسلسل بہتری اور تناؤ کی جانچ کی بھی اجازت دیتی ہے۔

MEDITRON-70B-70.2-پر-USMLE-اسٹائل-سوالات-میں-MedQA-4-اختیارات-ڈیٹا سیٹ-کی-ایک-درستگی حاصل کرتا ہے

MEDITRON-70B-70.2-پر-USMLE-اسٹائل-سوالات-میں-MedQA-4-اختیارات-ڈیٹا سیٹ-کی-ایک-درستگی حاصل کرتا ہے

Meditron، Med-PaLM 2، اور دیگر جیسے آلات کی ترقی صحت کی دیکھ بھال کے شعبے کی انوکھی ضروریات کی بڑھتی ہوئی پہچان کی عکاسی کرتی ہے جب بات AI ایپلی کیشنز کی ہو۔ ان ماڈلز کو متعلقہ، اعلیٰ معیار کے طبی ڈیٹا پر تربیت دینے، اور طبی ترتیبات میں ان کی حفاظت اور وشوسنییتا کو یقینی بنانے پر زور دینا بہت اہم ہے۔

مزید برآں، متنوع ڈیٹا سیٹس کی شمولیت، جیسے کہ انسانی ہمدردی کے حوالے سے انٹرنیشنل کمیٹی آف ریڈ کراس، عالمی صحت کی دیکھ بھال میں مختلف ضروریات اور چیلنجوں کے لیے حساسیت کو ظاہر کرتی ہے۔ یہ نقطہ نظر بہت سے AI تحقیقی مراکز کے وسیع تر مشن کے ساتھ مطابقت رکھتا ہے، جس کا مقصد ایسے AI ٹولز بنانا ہے جو نہ صرف تکنیکی طور پر ترقی یافتہ ہوں بلکہ سماجی طور پر بھی ذمہ دار اور فائدہ مند ہوں۔

کاغذ کا عنوان تھا "بڑے زبان کے ماڈل طبی علم کو انکوڈ کرتے ہیں۔حال ہی میں نیچر میں شائع ہوا، اس بات کی کھوج کرتا ہے کہ بڑے لینگویج ماڈلز (LLMs) کو کلینیکل سیٹنگز میں کس طرح مؤثر طریقے سے استعمال کیا جا سکتا ہے۔ یہ تحقیق میڈیکل ڈومین میں LLMs کی صلاحیتوں اور حدود پر روشنی ڈالتے ہوئے اہم بصیرت اور طریقہ کار پیش کرتی ہے۔

طبی ڈومین اس کی پیچیدگی کی طرف سے خصوصیات ہے، علامات، بیماریوں، اور علاج کی ایک وسیع صف کے ساتھ جو مسلسل تیار ہو رہے ہیں. LLMs کو نہ صرف اس پیچیدگی کو سمجھنا چاہیے بلکہ جدید ترین طبی علم اور رہنما خطوط سے بھی آگاہ رہنا چاہیے۔

اس تحقیق کا مرکز ایک نئے کیوریٹڈ بینچ مارک کے گرد گھومتا ہے جسے MultiMedQA کہتے ہیں۔ یہ بینچ مارک چھ موجودہ طبی سوالوں کے جواب دینے والے ڈیٹاسیٹ کو ایک نئے ڈیٹاسیٹ، HealthSearchQA کے ساتھ ملاتا ہے، جس میں آن لائن اکثر تلاش کیے جانے والے طبی سوالات شامل ہیں۔ اس جامع نقطہ نظر کا مقصد مختلف جہتوں میں LLMs کا جائزہ لینا ہے، بشمول حقیقت، فہم، استدلال، ممکنہ نقصان، اور تعصب، اس طرح سابقہ ​​خودکار تشخیص کی حدود کو دور کرنا جو محدود معیارات پر انحصار کرتی تھیں۔

MultiMedQA، طبی امتحان پر محیط طبی سوالات کے جوابات دینے کا ایک معیار

MultiMedQA، طبی امتحان پر محیط طبی سوالات کے جوابات دینے کا ایک معیار

مطالعہ کی کلید پاتھ ویز لینگویج ماڈل (PaLM)، ایک 540-بلین پیرامیٹر LLM، اور ملٹی میڈ کیو اے پر انسٹرکشن ٹیونڈ ویرینٹ، Flan-PaLM کی تشخیص ہے۔ قابل ذکر بات یہ ہے کہ Flan-PaLM MultiMedQA کے اندر تمام متعدد انتخابی ڈیٹاسیٹس پر جدید ترین درستگی حاصل کرتا ہے، بشمول MedQA پر 67.6% درستگی، جس میں امریکی میڈیکل لائسنسنگ امتحان طرز کے سوالات شامل ہیں۔ یہ کارکردگی پچھلے ماڈلز کے مقابلے میں نمایاں بہتری کی نشاندہی کرتی ہے، جو کہ آرٹ کی سابقہ ​​حالت کو 17 فیصد سے زیادہ پیچھے چھوڑتی ہے۔

میڈ کیو اے

MedQA ڈیٹاسیٹ 3 میں USMLE کے بعد انداز کردہ سوالات شامل ہیں، ہر ایک میں چار یا پانچ جوابات کے اختیارات ہیں۔ اس میں 11,450 سوالات کے ساتھ ایک ترقیاتی سیٹ اور 1,273 سوالات پر مشتمل ایک ٹیسٹ سیٹ شامل ہے۔

Format: question and answer (Q + A), multiple choice, open domain.

Example question: A 65-year-old man with hypertension comes to the physician for a routine health maintenance examination. Current medications include atenolol, lisinopril, and atorvastatin. His pulse is 86 min−1, respirations are 18 min−1, and blood pressure is 145/95 mmHg. Cardiac examination reveals end diastolic murmur. Which of the following is the most likely cause of this physical examination?

Answers (correct answer in bold): (A) Decreased compliance of the left ventricle, (B) Myxomatous degeneration of the mitral valve (C) Inflammation of the pericardium (D) Dilation of the aortic root (E) Thickening of the mitral valve leaflets.

یہ مطالعہ ماڈل کی کارکردگی میں خاص طور پر صارفین کے طبی سوالات کے جوابات میں اہم فرقوں کی نشاندہی کرتا ہے۔ ان مسائل کو حل کرنے کے لیے، محققین ایک طریقہ متعارف کراتے ہیں جسے انسٹرکشن پرامپٹ ٹیوننگ کہا جاتا ہے۔ یہ تکنیک چند مثالوں کا استعمال کرتے ہوئے LLMs کو مؤثر طریقے سے نئے ڈومینز کے ساتھ سیدھ میں لاتی ہے، جس کے نتیجے میں Med-PaLM کی تخلیق ہوتی ہے۔ Med-PaLM ماڈل، اگرچہ یہ حوصلہ افزا کارکردگی کا مظاہرہ کرتا ہے اور فہم، علم کی یاد، اور استدلال میں بہتری کو ظاہر کرتا ہے، پھر بھی ڈاکٹروں کے مقابلے میں کم ہے۔

اس تحقیق کا ایک قابل ذکر پہلو انسانی تشخیص کا تفصیلی فریم ورک ہے۔ یہ فریم ورک سائنسی اتفاق رائے اور ممکنہ نقصان دہ نتائج کے ساتھ معاہدے کے لیے ماڈلز کے جوابات کا جائزہ لیتا ہے۔ مثال کے طور پر، جب کہ Flan-PaLM کے صرف 61.9% طویل فارم کے جوابات سائنسی اتفاق رائے کے ساتھ منسلک ہیں، یہ تعداد Med-PaLM کے لیے 92.6% تک پہنچ گئی، جو کلینشین کے تیار کردہ جوابات کے مقابلے میں ہے۔ اسی طرح، Flan-PaLM کے مقابلے Med-PaLM کے ردعمل میں نقصان دہ نتائج کے امکانات کو نمایاں طور پر کم کیا گیا تھا۔

Med-PaLM کے جوابات کی انسانی تشخیص نے کئی شعبوں میں اس کی مہارت کو اجاگر کیا، کلینشین کے تیار کردہ جوابات کے ساتھ مل کر سیدھ میں لاتے ہوئے۔ یہ طبی ترتیبات میں ایک معاون ٹول کے طور پر Med-PaLM کی صلاحیت کو واضح کرتا ہے۔

اوپر زیر بحث تحقیق طبی ایپلی کیشنز کے لیے بڑے لینگویج ماڈلز (LLMs) کو بڑھانے کی پیچیدگیوں پر روشنی ڈالتی ہے۔ اس مطالعہ کی تکنیکوں اور مشاہدات کو مختلف ڈومینز میں ایل ایل ایم کی صلاحیتوں کو بہتر بنانے کے لیے عام کیا جا سکتا ہے۔ آئیے ان اہم پہلوؤں کو دریافت کریں:

انسٹرکشن ٹیوننگ کارکردگی کو بہتر بناتی ہے۔

  • عمومی درخواست: انسٹرکشن ٹیوننگ، جس میں LLMs کو مخصوص ہدایات یا رہنما خطوط کے ساتھ فائن ٹیوننگ شامل ہے، نے مختلف ڈومینز میں کارکردگی کو نمایاں طور پر بہتر بنایا ہے۔ یہ تکنیک LLM آؤٹ پٹس کی درستگی اور مطابقت کو بڑھانے کے لیے قانونی، مالی، یا تعلیمی ڈومینز جیسے دیگر شعبوں پر لاگو کی جا سکتی ہے۔

اسکیلنگ ماڈل کا سائز

  • وسیع تر مضمرات۔: یہ مشاہدہ کہ ماڈل کے سائز کو پیمانہ کرنے سے کارکردگی بہتر ہوتی ہے صرف طبی سوالوں کے جوابات تک محدود نہیں ہے۔ بڑے ماڈلز، زیادہ پیرامیٹرز کے ساتھ، پروسیس کرنے اور مزید پیچیدہ اور پیچیدہ ردعمل پیدا کرنے کی صلاحیت رکھتے ہیں۔ یہ اسکیلنگ کسٹمر سروس، تخلیقی تحریر، اور تکنیکی مدد جیسے ڈومینز میں فائدہ مند ثابت ہو سکتی ہے، جہاں باریک بینی سے سمجھ بوجھ اور ردعمل پیدا کرنا بہت ضروری ہے۔

چین آف تھاٹ (سی او ٹی) پرامپٹنگ

  • متنوع ڈومینز کا استعمال: COT پرامپٹنگ کا استعمال، اگرچہ میڈیکل ڈیٹا سیٹس میں کارکردگی کو ہمیشہ بہتر نہیں کرتا، دوسرے ڈومینز میں جہاں پیچیدہ مسائل کو حل کرنے کی ضرورت ہوتی ہے، قیمتی ہو سکتی ہے۔ مثال کے طور پر، تکنیکی ٹربل شوٹنگ یا پیچیدہ فیصلہ سازی کے منظرناموں میں، COT پرامپٹنگ LLMs کو معلومات کو مرحلہ وار پروسیس کرنے میں رہنمائی کر سکتی ہے، جس سے زیادہ درست اور معقول نتائج حاصل ہوتے ہیں۔

بہتر درستگی کے لیے خود مستقل مزاجی

  • وسیع تر ایپلی کیشنز: خود مستقل مزاجی کی تکنیک، جہاں ایک سے زیادہ آؤٹ پٹ تیار کیے جاتے ہیں اور سب سے زیادہ مستقل جواب منتخب کیا جاتا ہے، مختلف شعبوں میں کارکردگی کو نمایاں طور پر بڑھا سکتا ہے۔ فنانس یا قانونی جیسے ڈومینز میں جہاں درستگی سب سے اہم ہے، اس طریقہ کو اعلی وشوسنییتا کے لیے جنریٹڈ آؤٹ پٹ کی تصدیق کے لیے استعمال کیا جا سکتا ہے۔

غیر یقینی صورتحال اور انتخابی پیشن گوئی

  • کراس ڈومین کی مطابقت: ایسے شعبوں میں جہاں غلط معلومات کے سنگین نتائج ہو سکتے ہیں، جیسے کہ صحت کی دیکھ بھال اور قانون میں غیر یقینی صورتحال کے تخمینوں کو بتانا بہت ضروری ہے۔ LLMs کی غیر یقینی صورتحال کا اظہار کرنے کی صلاحیت کا استعمال اور اعتماد کم ہونے پر پیشین گوئیوں کو منتخب طور پر موخر کرنا ان ڈومینز میں غلط معلومات کے پھیلاؤ کو روکنے کے لیے ایک اہم ذریعہ ہو سکتا ہے۔

ان ماڈلز کی حقیقی دنیا کا اطلاق سوالات کے جوابات سے باہر ہے۔ انہیں مریض کی تعلیم، تشخیصی عمل میں مدد، اور یہاں تک کہ طبی طلباء کی تربیت کے لیے بھی استعمال کیا جا سکتا ہے۔ تاہم، مناسب انسانی نگرانی کے بغیر AI پر انحصار سے بچنے کے لیے ان کی تعیناتی کا احتیاط سے انتظام کیا جانا چاہیے۔

جیسے جیسے طبی علم تیار ہوتا ہے، ایل ایل ایم کو بھی اپنانا اور سیکھنا چاہیے۔ اس کے لیے مسلسل سیکھنے اور اپ ڈیٹ کرنے کے لیے میکانزم کی ضرورت ہوتی ہے، اس بات کو یقینی بناتے ہوئے کہ ماڈلز وقت کے ساتھ ساتھ متعلقہ اور درست رہیں۔

میں نے پچھلے پانچ سال خود کو مشین لرننگ اور ڈیپ لرننگ کی دلچسپ دنیا میں غرق کرتے ہوئے گزارے ہیں۔ میرے جذبے اور مہارت نے مجھے AI/ML پر خصوصی توجہ کے ساتھ 50 سے زیادہ متنوع سافٹ ویئر انجینئرنگ پراجیکٹس میں حصہ ڈالنے پر مجبور کیا ہے۔ میرے جاری تجسس نے مجھے نیچرل لینگویج پروسیسنگ کی طرف بھی کھینچا ہے، ایک ایسا شعبہ جس کو میں مزید دریافت کرنے کے لیے بے چین ہوں۔