ہمارے ساتھ رابطہ

محققین انحطاط شدہ تصاویر کو بہتر بنانے کے لیے نئی تکنیکیں تیار کرتے ہیں۔

مصنوعی ذہانت

محققین انحطاط شدہ تصاویر کو بہتر بنانے کے لیے نئی تکنیکیں تیار کرتے ہیں۔

mm

Yale-NUS کالج کے محققین کی ایک ٹیم نے ماحولیاتی عوامل جیسے بارش اور رات کے وقت کے حالات کی وجہ سے ویڈیوز میں کم سطح کے وژن سے زیادہ درست ڈیٹا نکالنے کے لیے کمپیوٹر کے نئے وژن اور گہری سیکھنے کے طریقے تیار کیے ہیں۔ انہوں نے ویڈیوز میں 3D انسانی پوز کے تخمینے کی درستگی کو بھی بہتر بنایا۔ 

کمپیوٹر ویژن ٹیکنالوجی، جو خودکار نگرانی کے نظام، خود مختار گاڑیاں، اور صحت کی دیکھ بھال اور سماجی دوری کے آلات جیسی ایپلی کیشنز میں استعمال ہوتی ہے، اکثر ماحولیاتی عوامل سے متاثر ہوتی ہے، جو نکالے گئے ڈیٹا میں مسائل پیدا کر سکتی ہے۔

نئی تحقیق کو پیش کیا گیا۔ کمپیوٹر ویژن اور پیٹرن ریکگنیشن (CVPR) پر 2021 کانفرنس

تصاویر پر ماحولیاتی اثرات

کم روشنی اور انسانی ساختہ روشنی کے اثرات جیسے چکاچوند، چمک اور فلڈ لائٹس جیسے حالات رات کے وقت کی تصاویر کو متاثر کرتے ہیں۔ بارش کی تصاویر بھی بارش کی لکیروں یا بارش کے جمع ہونے سے متاثر ہوتی ہیں۔ 

Yale-NUS کالج سائنس کے ایسوسی ایٹ پروفیسر روبی ٹین نے تحقیقی ٹیم کی قیادت کی۔ 

"کئی کمپیوٹر ویژن سسٹم جیسے خودکار نگرانی اور خود چلانے والی کاریں، اچھی طرح سے کام کرنے کے لیے ان پٹ ویڈیوز کی واضح مرئیت پر انحصار کرتے ہیں۔ مثال کے طور پر، خود سے چلنے والی کاریں شدید بارش میں مضبوطی سے کام نہیں کر سکتیں اور CCTV خودکار نگرانی کے نظام اکثر رات کو ناکام ہو جاتے ہیں، خاص طور پر اگر مناظر تاریک ہوں یا نمایاں چکاچوند یا فلڈ لائٹس ہوں،" Assoc نے کہا۔ پروفیسر ٹین۔

ٹیم نے دو الگ الگ مطالعات پر انحصار کیا جس میں رات کے وقت کی ویڈیوز اور بارش کی ویڈیوز کے معیار کو بڑھانے کے لیے گہری سیکھنے کے الگورتھم متعارف کرائے گئے۔ 

پہلی تحقیق میں چمک کو بڑھانے پر توجہ مرکوز کی گئی جبکہ بیک وقت شور اور روشنی کے اثرات کو دبانے پر، جیسے چکاچوند، چمک اور فلڈ لائٹس کو رات کے وقت کی واضح تصاویر بنانے کے لیے۔ نئی تکنیک کا مقصد رات کے وقت کی تصاویر اور ویڈیوز کی وضاحت کو بہتر بنانا ہے جب ناگزیر چکاچوند ہو، جو کہ موجودہ طریقوں کو ابھی کرنا باقی ہے۔ 

ان ممالک میں جہاں شدید بارش عام ہے، بارش کا جمع ہونا ویڈیوز میں مرئیت کو منفی طور پر متاثر کرتا ہے۔ دوسرا مطالعہ ایک ایسا طریقہ متعارف کراتے ہوئے مسئلہ کو حل کرنے کے لئے مقرر کیا گیا ہے جو ایک فریم سیدھ کو ملازمت دیتا ہے، جو بارش کی لکیروں سے متاثر ہوئے بغیر بہتر بصری معلومات کو قابل بناتا ہے، جو اکثر مختلف فریموں میں بے ترتیب طور پر ظاہر ہوتے ہیں۔ ٹیم نے گہرائی کا اندازہ لگانے کے لیے ایک متحرک کیمرے کا استعمال کیا، جس نے بارش کے پردے کے اثر کو دور کرنے میں مدد کی۔ جبکہ موجودہ طریقے بارش کی لکیروں کو ہٹانے کے ارد گرد گھومتے ہیں، نئے تیار کردہ طریقے بارش کی لکیروں اور بارش کے اثر دونوں کو بیک وقت ہٹا سکتے ہیں۔ 

تصویر: ییل این یو ایس کالج

3D انسانی پوز کا تخمینہ

نئی تکنیکوں کے ساتھ، ٹیم نے 3D انسانی پوز کے تخمینے پر اپنی تحقیق بھی پیش کی، جسے ویڈیو نگرانی، ویڈیو گیمنگ، اور کھیلوں کی نشریات میں استعمال کیا جا سکتا ہے۔ 

ایک مونوکولر ویڈیو، یا ایک کیمرے سے لی گئی ویڈیو سے 3D ملٹی پرسن پوز کا تخمینہ، پچھلے کچھ سالوں میں تیزی سے تحقیق کی گئی ہے۔ ایک سے زیادہ کیمروں کی ویڈیوز کے برعکس، مونوکیولر ویڈیوز زیادہ لچکدار ہوتے ہیں اور اسے ایک کیمرے سے لیا جا سکتا ہے، جیسے کہ موبائل فون۔ 

اس کے ساتھ ہی، ایک ہی منظر میں متعدد افراد جیسی اعلیٰ سرگرمیاں انسانی کھوج کی درستگی کو متاثر کرتی ہیں۔ یہ خاص طور پر اس وقت درست ہوتا ہے جب لوگ ایک دوسرے کے ساتھ ایک دوسرے کے ساتھ ایک دوسرے کے ساتھ بات چیت کر رہے ہوں 

ٹیم کے تیسرے مطالعہ نے دو موجودہ طریقوں کو ملا کر ایک ویڈیو سے 3D انسانی پوز کا تخمینہ لگایا، جو اوپر سے نیچے اور نیچے تک کے نقطہ نظر تھے۔ نیا طریقہ دوسرے دو کے مقابلے میں کثیر افرادی ترتیبات میں زیادہ قابل اعتماد پوز تخمینہ پیدا کرتا ہے، اور یہ افراد کے درمیان فاصلے کو سنبھالنے کے لیے بہتر طور پر لیس ہے۔ 

"ہماری 3D انسانی پوز کے تخمینے کی تحقیق کے اگلے مرحلے کے طور پر، جسے نیشنل ریسرچ فاؤنڈیشن کی حمایت حاصل ہے، ہم دیکھیں گے کہ ویڈیوز کی رازداری کی معلومات کو کیسے محفوظ کیا جائے۔ بصارت بڑھانے کے طریقوں کے لیے، ہم کمپیوٹر ویژن کے میدان میں ہونے والی پیشرفت میں اپنا حصہ ڈالنے کی کوشش کرتے ہیں، کیونکہ یہ بہت سی ایپلی کیشنز کے لیے اہم ہیں جو ہماری روزمرہ کی زندگیوں کو متاثر کر سکتی ہیں، جیسے کہ خود سے چلنے والی کاروں کو موسمی حالات میں بہتر طریقے سے کام کرنے کے قابل بنانا۔ ایسوسی ایشن پروفیسر ٹین۔

Alex McFarland ایک AI صحافی اور مصنف ہے جو مصنوعی ذہانت میں تازہ ترین پیشرفت کی کھوج لگا رہا ہے۔ اس نے دنیا بھر میں متعدد AI اسٹارٹ اپس اور اشاعتوں کے ساتھ تعاون کیا ہے۔