ہمارے ساتھ رابطہ

TinySAM : کسی بھی چیز کے ماڈل کے لیے حدود کو آگے بڑھانا

مصنوعی ذہانت

TinySAM : کسی بھی چیز کے ماڈل کے لیے حدود کو آگے بڑھانا

mm
TinySAM : کسی بھی چیز کے ماڈل کے لیے حدود کو آگے بڑھانا

آبجیکٹ سیگمنٹیشن جدید کمپیوٹر ویژن میں ایک بنیادی اور تنقیدی طور پر اہم شعبہ ہے۔ یہ ایپلی کیشنز میں ایک اہم کردار ادا کرتا ہے جس میں وسیع بصری اجزاء کی ضرورت ہوتی ہے، جیسے آبجیکٹ لوکلائزیشن اور شناخت، اور حقیقی وقت، تیز، اور درست تقسیم کا مطالبہ کرتی ہے۔ اس اہمیت نے آبجیکٹ سیگمنٹیشن کو مستقل طور پر ایک گرم تحقیقی موضوع بنا دیا ہے، مثال کے طور پر سیمنٹیشن، سیمنٹک سیگمنٹیشن، اور پیناپٹک سیگمنٹیشن جیسے شعبوں میں اہم کام کیا گیا ہے۔

آبجیکٹ سیگمنٹیشن کے ارتقاء کے ساتھ، Segment Anything Model (SAM) ایک قابل ذکر ٹول کے طور پر ابھرا ہے، جو نمایاں سیگمنٹیشن کی صلاحیتوں کو ظاہر کرتا ہے اور مختلف کمپیوٹر ویژن ایپلی کیشنز میں تیزی سے اپنایا جا رہا ہے۔ پہلے سے تربیت یافتہ SAM آرکیٹیکچر کا استعمال کرتے ہوئے فریم ورکس نے بہاو وژن کے کاموں میں متاثر کن کارکردگی حاصل کی ہے۔ تاہم، سیگمنٹیشن کے کاموں میں اپنی صلاحیتوں اور اعلیٰ درستگی کے باوجود، SAM کے پیچیدہ اور بھاری فن تعمیر کو کافی کمپیوٹیشنل طاقت کی ضرورت ہوتی ہے، جو کمپیوٹیشنل طور پر محدود آلات پر اس کے نفاذ میں رکاوٹ ہے۔

SAM کے کمپیوٹیشنل چیلنجز سے نمٹنے کے لیے، محققین نے Tiny Segment Anything Model (TinySAM) تیار کیا ہے، جو زیادہ ہلکے ہونے کے ساتھ ساتھ اصل فریم ورک کی صفر شاٹ کارکردگی کو برقرار رکھتا ہے۔ TinySAM زیادہ موثر طالب علم ماڈل بنانے کے لیے آن لائن ہارڈ پرامپٹس کے ساتھ مکمل مرحلے کے علم کشید کا طریقہ استعمال کرتا ہے۔ بعد از تربیت کوانٹائزیشن فوری تقسیم کاری کے کاموں کے مطابق ڈھالنا کمپیوٹیشنل ضروریات کو مزید کم کرتا ہے۔ مزید برآں، TinySAM کے ڈیزائن کا مقصد درجہ بندی کی تقسیم کرنا ہے، کارکردگی پر سمجھوتہ کیے بغیر تخمینہ کی رفتار کو تقریباً دوگنا کرنا ہے۔

یہ مضمون TinySAM کے فریم ورک کا احاطہ کرتا ہے، اس کے بنیادی اصولوں، فن تعمیر، اور کارکردگی کو دوسرے جدید ترین سیگمنٹیشن فریم ورک کے مقابلے میں دریافت کرتا ہے۔ آئیے ان پہلوؤں کو مزید تفصیل سے دیکھیں۔

TinySAM: موثر طبقہ کچھ بھی ماڈل

سیگمنٹ اینیتھنگ ماڈل نے کئی کمپیوٹر ویژن ایپلی کیشنز کی تیزی سے ترقی میں مدد کی ہے جس کی وجہ سے اس کی قابل تعریف سیگمنٹیشن صلاحیتوں کے ساتھ ساتھ ایک بڑے سیگمنٹیشن ڈیٹاسیٹ ہے جس میں 11 ملین سے زیادہ تصاویر اور ایک ارب سے زیادہ تصویری ماسک موجود ہیں۔ اشیاء کو من مانی زمروں اور شکلوں کے ساتھ تقسیم کرنے والے کاموں پر اس کی غیر معمولی کارکردگی کی وجہ سے، یہ تصویر کی پینٹنگ، آبجیکٹ ٹریکنگ، 3D ویژن، اور بہت کچھ جیسے بہاو والے کاموں کو انجام دینے والے فریم ورک کی بنیاد کے طور پر کام کرتا ہے۔ مزید برآں، سیگمنٹ اینیتھنگ ماڈل بھی نمایاں پیش کرتا ہے۔ صفر شاٹ سیگمنٹیشن کارکردگی جس نے حساس صنعتوں کو فائدہ پہنچایا ہے جو محدود مقدار میں ڈیٹا کے ساتھ کام کرتی ہیں بشمول میڈیکل ریسرچ اور میڈیکل امیجنگ انڈسٹریز۔ 

اگرچہ کوئی بھی سیگمنٹ اینیتھنگ ماڈل کی طرف سے پیش کردہ قابل ذکر سیگمنٹیشن کی صلاحیتوں پر سوال نہیں اٹھا سکتا ہے جو کہ نیچے کی دھارے کے نقطہ نظر کے کاموں کی ایک وسیع صف پر ہے، لیکن اس کا ایک پیچیدہ تعمیراتی اوورلوڈ، اعلی کمپیوٹیشنل تقاضوں اور اہم آپریشنل اخراجات کے لحاظ سے منفی پہلو ہے۔ جدید GPU پر چلنے والے سسٹم کے لیے، SAM ماڈل کا تخمینہ وقت 2×1024 امیج کے لیے 1024 سیکنڈ تک زیادہ ہو سکتا ہے۔ نتیجے کے طور پر، محدود کمپیوٹیشنل صلاحیتوں والے آلات پر SAM ایپلیکیشنز کو لاگو کرنا ایک انتہائی مشکل کام ہے۔ اس رکاوٹ کو دور کرنے کے لیے، حالیہ کاموں جیسے MobileSAM اور FastSAM نے زیادہ کمپیوٹیشنل کارکردگی کے ساتھ SAM ماڈل تیار کرنے کی کوشش کی ہے۔ MobileSAM فریم ورک امیج انکوڈر میں بھاری جزو کو TinyViT فریم ورک کے فن تعمیر کے ساتھ تبدیل کرنے کی کوشش کرتا ہے جبکہ FastSAM ماڈل سیگمنٹ ٹاسک کو مثال کے طور پر سیگمنٹیشن ٹاسک میں منتقل کرتا ہے جس کے ساتھ صرف ایک زمرہ ہوتا ہے۔ یولو وی 8 ماڈل اگرچہ یہ طریقے کمپیوٹیشنل تقاضوں کو کم کرنے کے معاملے میں کسی حد تک کامیابی حاصل کرنے کے قابل تھے، لیکن وہ کارکردگی کو برقرار نہیں رکھ سکے خاص طور پر زیرو شاٹ کاموں پر۔ 

TinySAM یا Tiny Segment Anything Model موجودہ SAM ماڈل کی کمپیوٹیشنل ضرورت کو کم کرنے کی کوشش ہے بغیر زیرو شاٹ ڈاون اسٹریم ٹاسک پر کارکردگی میں رکاوٹ ڈالے۔ مزید برآں، TinySAM فریم ورک اپنے فن تعمیر میں علمی کشید کے مکمل مرحلے کے طریقہ کار کو لاگو کرنے کی تجویز پیش کرتا ہے جس کا مقصد طالب علم کے کمپیکٹ نیٹ ورک کی صلاحیت کو بہتر بنانا ہے۔ TinySAM فریم ورک مختلف مراحل سے اساتذہ کے نیٹ ورک کی نگرانی میں طلباء کے نیٹ ورک کو اختتام سے آخر تک پھیلاتا ہے۔ کارکردگی کو مزید بڑھانے کے لیے، فریم ورک ایک اضافی آن لائن ہارڈ پرامپٹ نمونے لینے کی حکمت عملی کو لاگو کر کے کشید کرنے کے عمل کو زیادہ سخت مثالوں میں شرکت کی اجازت دیتا ہے۔ مزید برآں، اضافی طور پر کمپیوٹیشنل اخراجات کو کم کرنے کے لیے، TinySAM فریم ورک بعد از تربیت کوانٹائزیشن اجزاء کے لیے فوری تقسیم کاری کے کاموں کو بے نقاب کرتا ہے۔ 

سیگمنٹ اینیتھنگ ماڈل کی کمپیوٹیشن کی ضرورت کا سب سے بڑا حصہ یہ ہے کہ یہ ماڈل گرڈ پرامپٹ پوائنٹس سے بڑے پیمانے پر ماسک تیار کرتا ہے تاکہ تصویر میں موجود ہر چیز کو الگ کیا جا سکے۔ اس سیگمنٹیشن حکمت عملی کی کمپیوٹیشنل ضرورت پر قابو پانے کے لیے، TinySAM فریم ورک ایک درجہ بندی سیگمنٹ ہر چیز کی حکمت عملی استعمال کرتا ہے جو کارکردگی کو کم کیے بغیر تخمینہ کی رفتار کو تقریباً دوگنا کر دیتا ہے۔ اپنے فن تعمیر میں استعمال کیے گئے ان طریقوں کے ساتھ، TinySAM فریم ورک کمپیوٹیشنل تقاضوں میں نمایاں کمی پیش کرتا ہے، اور کسی بھی کام کو موثر طبقہ کے لیے نئی حدیں متعین کرتا ہے۔ 

TinySAM: فن تعمیر اور طریقہ کار

اس سے پہلے کہ ہم TinySAM فریم ورک کے فن تعمیر اور طریقہ کار کے بارے میں بات کریں، یہ ضروری ہے کہ پہلے اس کے پیشرو، SAM فریم ورک پر ایک نظر ڈالیں۔ اپنے تعارف کے بعد سے، Segment Anything Model نے نیچے کی دھارے کے وژن اور آبجیکٹ سیگمنٹیشن کے کاموں کی ایک رینج میں قابل ذکر کارکردگی، استعداد، اور عام کرنے کی صلاحیتوں کا مظاہرہ کیا ہے۔ 

اس کے بنیادی طور پر، SAM ماڈل تین ذیلی نیٹ ورکس پر مشتمل ہے: پرامپٹ انکوڈر، امیج انکوڈر، اور ماسک ڈیکوڈر۔ پرامپٹ انکوڈر کا بنیادی مقصد صوابدیدی شکل کے ماسک، ان پٹ پوائنٹس اور بکس، اور پوزیشنی معلومات کے ساتھ مفت فارم ٹیکسٹ کو انکوڈ کرنا ہے۔ امیج انکوڈر ایک بھاری ViT یا وژن ٹرانسفارمر پر مبنی نیٹ ورک ہے جو ان پٹ امیج کو ایمبیڈنگز میں نکالتا ہے۔ ماڈل جیومیٹرک اور ٹیکسٹ پرامپٹس پر کارروائی کرنے کے لیے مختلف نیٹ ورکس کا استعمال کرتا ہے۔ آخر میں، ماسک ڈیکوڈر میں دو طرفہ ٹرانسفارمر ہوتا ہے جو پرامپٹ کا آؤٹ پٹ اور امیج انکوڈر حاصل کرتا ہے تاکہ حتمی ماسک کی پیشن گوئی پیدا کی جا سکے۔ ڈیٹاسیٹ کے ساتھ، SAM فریم ورک اشیاء کی شکل اور زمرے سے قطع نظر قابل ذکر اعلیٰ معیار کی تقسیم کاری کی صلاحیتوں کو ظاہر کرتا ہے۔ مزید برآں، the کسی بھی چیز کے ماڈل کو سیگمنٹ کریں۔ زیرو شاٹ ڈاون اسٹریم وژن کے کاموں میں قابل ذکر کارکردگی اور کارکردگی کا مظاہرہ کرتا ہے جس میں آبجیکٹ پروپوزل، کنارے کا پتہ لگانا، ٹیکسٹ ٹو ماسک پریڈیکشن، اور مثال سیگمنٹیشن شامل ہیں۔ اس کی اعلیٰ معیار کی تقسیم کاری کی صلاحیتوں، اور لچکدار فوری پیشکش کی وجہ سے، SAM فریم ورک وژن ایپلی کیشنز کی بنیاد بناتے ہیں۔ اس کے کہنے کے ساتھ ہی، کوئی بھی روایتی SAM فن تعمیر کی اعلیٰ کمپیوٹیشنل ضرورت کو نظر انداز نہیں کر سکتا جس میں پیرامیٹرز کی ایک بڑی تعداد ہے جس کی وجہ سے ڈویلپرز کے لیے محدود وسائل کے ساتھ آلات پر SAM پر مبنی ایپلی کیشنز کو تعینات کرنا تقریباً ناممکن ہو جاتا ہے۔ 

علم کشید

تربیتی مرحلے کے دوران کمپیکٹ نیٹ ورکس کی کارکردگی کو بڑھانے کے لیے علم کشید ایک اہم طریقہ ہے۔ علم کشید کرنے کا طریقہ جو اساتذہ کے نیٹ ورک کے آؤٹ پٹ کو ہلکے وزن والے طلباء کے نیٹ ورک کی تربیت کی نگرانی کے لیے استعمال کرتا ہے۔ علم کشید کرنے کے طریقہ کار کو دو ذیلی زمروں میں تقسیم کیا جا سکتا ہے: درمیانی خصوصیات کے لیے کشید، اور نیٹ ورک آؤٹ پٹس کے لیے کشید، علمی کشید کے ارد گرد تحقیقی کام کی اکثریت تصویر کی درجہ بندی کے کاموں پر مرکوز ہے۔ 

اس کے کہنے کے ساتھ، مندرجہ ذیل اعداد و شمار TinySAM فریم ورک کے عمومی فن تعمیر کو ظاہر کرتا ہے اور ساتھ ہی زیرو شاٹ مثال کے سیگمنٹیشن کاموں پر کارکردگی کا جائزہ بھی لیتا ہے۔ 

پہلے مرحلے میں، TinySAM فریم ورک نالج ڈسٹلیشن کو لاگو کرتا ہے جو خاص طور پر SAM فریم ورک کے لیے ڈیزائن کیا گیا ہے، اور ڈسٹلیشن کے عمل کو مزید فعال کرنے کے لیے، ماڈل ایک آن لائن ہارڈ پرامپٹ سیمپلنگ کا استعمال کرتا ہے تاکہ اساتذہ کے نیٹ ورک سے طالب علموں کے نیٹ ورک تک سخت معلومات حاصل کی جا سکے۔ دوسرے مرحلے میں، TinySAM فریم ورک بعد از تربیت کوانٹائزیشن کے طریقہ کار کو فوری تقسیم کاری کے کاموں کے لیے ڈھالتا ہے اور اسے ہلکے وزن والے طلبہ کے نیٹ ورک پر لاگو کرتا ہے۔ آخر میں، ماڈل درجہ بندی کے سیگمنٹ کو لاگو کرتا ہے ہر چیز کا انفرنس موڈ جو سیگمنٹیشن کے کاموں کے لیے ڈیزائن کیا گیا ہے جس کے نتیجے میں درستگی کے نہ ہونے کے برابر نقصان کے ساتھ تخمینہ کی رفتار کو دوگنا کر دیا جاتا ہے۔ 

مکمل مرحلہ علم کشید

جیسا کہ پہلے ذکر کیا گیا ہے، سیگمنٹ اینیتھنگ ماڈل اپنے بنیادی طور پر تین ذیلی نیٹ ورکس پر مشتمل ہے: پرامپٹ انکوڈر، امیج انکوڈر، اور ماسک ڈیکوڈر، جس میں امیج انکوڈر کا جزو ایک ویژن ٹرانسفارمر پر بنایا گیا ہے، اور اعلیٰ کمپیوٹیشنل تقاضے ہیں۔ اس مسئلے سے نمٹنے کے لیے، MobileSAM فریم ورک نے وژن ٹرانسفارمر کو TinyViT یا Tiny Vision Transformer سے بدل دیا، حالانکہ نمایاں کارکردگی کی خرابی کی وجہ سے متبادل موثر نہیں تھا۔ کارکردگی میں کمی نہ ہونے کو یقینی بنانے کے لیے، TinySAM فریم ورک ایک مکمل اسٹیج نالج ڈسٹلیشن کا طریقہ نافذ کرتا ہے جو ہلکے وزن والے امیج انکوڈر کو سیکھنے کی سطح سے لے کر متعدد علمی سطح تک رہنمائی کرتا ہے۔ زمینی سچائی کے لیبلز اور پیشین گوئی شدہ نتائج کے درمیان روایتی نقصان کے علاوہ، TinySAM فریم ورک مختلف مراحل کے دوران متعدد ڈسٹلیشن نقصانات متعارف کراتا ہے جیسا کہ درج ذیل تصویر میں دکھایا گیا ہے۔ 

کوانٹائزیشن

ماڈل کوانٹائزیشن کمپیوٹر ویژن فریم ورک میں ایک مقبول طریقہ ہے، اور اس کا استعمال وزن یا ایکٹیویشن کو زیادہ سے کم بینڈوڈتھ تک کوانٹائز کرکے کمپیوٹیشنل پیچیدگی اور اسٹوریج کی ضروریات کو کم کرنے کی کوشش میں آؤٹ پٹ کوالٹی کو نمایاں طور پر گرائے بغیر کرنے کے لیے استعمال کیا جاتا ہے۔ 

TinySAM میں کوانٹائزیشن کا بنیادی مقصد فلوٹنگ پوائنٹ ٹینسر کو بٹ انٹیجر ٹینسر پر پروجیکٹ کرنا ہے جس میں میٹرکس ضرب اور کوانٹائزڈ میٹرکس کے درمیان فاصلہ ماپنے کے لیے میٹرک کے ساتھ اسکیلنگ فیکٹر استعمال کیا جائے جو اسکیلنگ فیکٹر کو بہتر بنانے میں اہم کردار ادا کرتا ہے۔ 

درجہ بندی طبقہ کچھ بھی

سیگمنٹ اینیتھنگ ماڈل نے ایک خودکار ماسک جنریٹر استعمال کرنے کی تجویز پیش کی ہے جو تصویر میں ہر چیز کو الگ کرنے کے لیے پوائنٹس کو گرڈ کے طور پر لیتا ہے۔ تاہم، یہ اشارہ کیا گیا ہے کہ گھنے پوائنٹ گرڈ کے استعمال کے نتیجے میں حد سے زیادہ باریک سیگمنٹیشن آؤٹ پٹ نکلتے ہیں اور اس عمل کے لیے بڑے پیمانے پر کمپیوٹیشنل تقاضوں کی ضرورت ہوتی ہے اور اس کے لیے آپریشنل اخراجات زیادہ ہوتے ہیں۔ مزید برآں، ایک سرے پر، ایک مکمل آبجیکٹ کے لیے بہت زیادہ نمونے لینے والے پوائنٹس کے نتیجے میں آبجیکٹ کے مختلف حصوں کو الگ الگ ماسک کے طور پر غلط طور پر تقسیم کیا جا سکتا ہے جبکہ دوسرے سرے پر، ہر چیز کے موڈ کے تخمینے کی وقت کی قیمت بنیادی طور پر اس وجہ سے ہوتی ہے کہ تصویر کے انکوڈر کو نمایاں طور پر سکڑ دیا گیا ہے۔ ہر چیز کے موڈ کی آپریشنل لاگت کو کم کرنے کے لیے، TinySAM فریم ورک ایک درجہ بندی کے ماسک جنریشن اپروچ کا استعمال کرتا ہے، جس میں اصل SAM فریم ورک کے ساتھ حکمت عملی میں فرق مندرجہ ذیل تصویر میں دکھایا گیا ہے۔ 

اصل SAM فریم ورک میں لاگو کردہ نقطہ نظر سے مختلف، TinySAM ماڈل ہر طرف صرف 25% پوائنٹس استعمال کرتا ہے، اس طرح اصل ترتیب میں دستیاب پوائنٹس کا صرف 1/16 استعمال ہوتا ہے۔ ماڈل پھر ان پرامپٹس کے ساتھ ماسک ڈیکوڈر اور پرامپٹ انکوڈر کا اندازہ لگاتا ہے اور آؤٹ پٹ حاصل کرتا ہے۔ اس کے بعد ماڈل ایک خاص حد سے زیادہ اعتماد کے ساتھ کچھ ماسک کو فلٹر کرتا ہے، اور ممکنہ حتمی پیشین گوئیوں کے لیے متعلقہ مقامات کو ماسک کرتا ہے۔ چونکہ ماڈل ان خطوں کو اعلی اعتماد کے ساتھ مثالوں کے سیگمنٹیشن نتیجہ کے طور پر دیکھتا ہے، اس لیے اسے پوائنٹ پرامپٹس پیدا کرنے کی ضرورت نہیں ہے۔ حکمت عملی نہ صرف آبجیکٹ کے زیادہ باریک انقطاع کو روکنے میں مدد کرتی ہے بلکہ یہ آپریشنل اخراجات اور کمپیوٹیشنل ضروریات کو نمایاں طور پر کم کرنے میں بھی مدد کرتی ہے۔ اس کے بعد فریم ورک حتمی ماسک حاصل کرنے کے لیے ان دو راؤنڈ کے نتائج کو ضم اور پوسٹ پروسیس کرتا ہے۔ 

TinySAM: تجربات اور نتائج

ڈسٹلیشن کے عمل کو تیز کرنے کے لیے، TinySAM فریم ورک ٹیچر نیٹ ورک سے امیج ایمبیڈنگز کو پہلے سے ہی کمپیوٹنگ اور اسٹور کرتا ہے، جس کی وجہ سے ماڈل کے لیے اب ٹریننگ کے مرحلے کے دوران ٹیچر نیٹ ورک کے ہیوی امیج انکوڈر کی بار بار گنتی کرنا لازمی نہیں ہے۔ پوسٹ ٹریننگ کوانٹائزیشن کے لیے، TinySAM فریم ورک تمام میٹرکس ملٹی پلائی لیئرز، کنوولوشن لیئرز، ڈیکونولوشن لیئرز، اور لکیری لیئرز کو کوانٹائز کرتا ہے، ماڈل کے ساتھ کنوولوشن اور ڈیکونولوشن لیئرز دونوں کے لیے چینل وار اسکیلنگ فیکٹرز استعمال کرتے ہیں۔ میٹرکس ضرب پرتوں کے لیے، ماڈل ہیڈ وار اسکیلنگ فیکٹرز کو لاگو کرتا ہے جبکہ لکیری پرتوں کے لیے، ماڈل لکیری وار اسکیلنگ فیکٹرز کو لاگو کرتا ہے۔ ماڈل زیرو شاٹ ڈاون اسٹریم کاموں پر بھی تشخیص کرتا ہے۔ 

مثال کے طور پر زیرو شاٹ سیٹنگ میں سیگمنٹیشن کے کاموں کے لیے، TinySAM فریم ورک اپنے پیشرو، Segment Anything Model کی تجرباتی ترتیبات کی پیروی کرتا ہے، اور مثال کے سیگمنٹیشن کے لیے وژن ٹرانسفارمر Det-H یا VitDet-H فریم ورک کے آبجیکٹ کا پتہ لگانے کے نتائج کا استعمال کرتا ہے۔ جیسا کہ مندرجہ ذیل تصویر میں دکھایا گیا ہے، TinySAM فریم ورک مثال کے طور پر سیگمنٹیشن کی درستگی اور FLOPs سکور کے لحاظ سے موجودہ طریقوں سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔ 

مزید برآں، TinySAM ماڈل کی کوالٹیٹیو کارکردگی کو درج ذیل تصویر میں زیرو شاٹ مثال کے طور پر سیگمنٹیشن کے لیے دکھایا گیا ہے جس میں باکس کے اشارے کی نمائندگی کرنے والے سبز باکس کے ساتھ ہے۔ 

صفر شاٹ پوائنٹس کی درست ماسک کی تشخیص کے لحاظ سے، TinySAM ماڈل مختلف ڈیٹا سیٹس پر MobileSAM فریم ورک کو نمایاں طور پر پیچھے چھوڑ دیتا ہے، اور جب فریم ورک کے ذریعے کچھ پوائنٹس کو اشارے کے طور پر استعمال کیا جاتا ہے تو یہ کافی بہتر نتائج فراہم کرتا ہے۔ 

مزید برآں، درج ذیل جدول درجہ بندی کی ہر چیز کے موڈ کی حکمت عملی کے نتیجے میں حاصل ہونے والی کمپیوٹیشنل ضروریات میں سرعت اور کمی کے نتائج کا خلاصہ کرتا ہے۔ ماڈل ایک منصفانہ موازنہ کے لیے مختلف حکمت عملیوں کے ساتھ ایک ہی استحکام سکور اور حد کی قدر کا اطلاق کرتا ہے، اور نتائج کا خلاصہ ذیل میں دیا گیا ہے۔ 

فائنل خیالات

اس مضمون میں، ہم نے TinySAM کے بارے میں بات کی ہے، ایک مجوزہ فریم ورک جو کسی بھی کام کو الگ کرنے کے لیے حدود کو آگے بڑھاتا ہے، اور اصل SAM فریم ورک کے برابر کمپیوٹیشنل تقاضوں اور درستگی کے ساتھ ایک موثر ماڈل فن تعمیر حاصل کرتا ہے۔ TinySAM یا Tiny Segment Anything Model جو اصل فریم ورک کی صفر شاٹ کارکردگی کو برقرار رکھتا ہے اور فراہم کرتا ہے۔ TinySAM فریم ورک سب سے پہلے ایک مکمل مرحلے کے علم کی کشید کا طریقہ نافذ کرتا ہے جو ہلکے وزن والے طالب علم کے ماڈل کو ڈسٹل کرنے کے لیے آن لائن ہارڈ پرامپٹس کا استعمال کرتا ہے۔ TinySAM فریم ورک اس کے بعد تربیت کے بعد کے کوانٹائزیشن کو فوری تقسیم کاری کے کاموں کے لیے ڈھالتا ہے جو کمپیوٹیشنل ضروریات کو کم کرنے میں مزید مدد کرتا ہے۔ مزید برآں، فریم ورک کا مقصد ہر چیز کو درجہ بندی کے مطابق تقسیم کرنا ہے جو کارکردگی کو متاثر کیے بغیر تخمینہ کی رفتار کو تقریباً دوگنا کر دیتا ہے۔ 

"پیشہ سے انجینئر، دل سے مصنف"۔ کنال ایک تکنیکی مصنف ہے جس کے پاس AI اور ML کی گہری محبت اور سمجھ ہے، جو اپنی پرکشش اور معلوماتی دستاویزات کے ذریعے ان شعبوں میں پیچیدہ تصورات کو آسان بنانے کے لیے وقف ہے۔