ہمارے ساتھ رابطہ

مصنوعی ذہانت

اے آئی ماڈل دھندلی امیجز لے سکتا ہے اور ریزولوشن کو 60 گنا بڑھا سکتا ہے۔

mm

اشاعت

 on

ڈیوک یونیورسٹی کے محققین نے ایک AI ماڈل تیار کیا ہے جو انتہائی دھندلی، پکسلیٹ تصاویر لینے اور انہیں اعلیٰ تفصیل کے ساتھ پیش کرنے کے قابل ہے۔  TechXplore کے مطابق, ماڈل نسبتاً کم پکسلز لینے اور حقیقت پسندانہ نظر آنے والے چہرے بنانے کے لیے تصویروں کو اسکیل کرنے کی صلاحیت رکھتا ہے جو کہ اصل تصویر کے ریزولوشن سے تقریباً 64 گنا زیادہ ہیں۔ ماڈل ان خصوصیات کو hallucinates، یا تصور کرتا ہے جو اصل تصویر کی لکیروں کے درمیان ہیں۔

تحقیق سپر ریزولوشن کی ایک مثال ہے۔ بطور ڈیوک یونیورسٹی کی کمپیوٹر سائنس ٹیم سے سنتھیا روڈن TechXplore کو سمجھایا، یہ تحقیقی منصوبہ سپر ریزولوشن کا ریکارڈ قائم کرتا ہے، جیسا کہ اس سے پہلے کبھی بھی ابتدائی پکسلز کے اتنے چھوٹے نمونے سے ایسی تصاویر نہیں بنائی گئی تھیں۔ محققین اس بات پر زور دینے میں محتاط تھے کہ ماڈل اصل میں کم معیار کی تصویر میں اس شخص کے چہرے کو دوبارہ نہیں بناتا ہے۔ اس کے بجائے، یہ نئے چہرے پیدا کرتا ہے، ان تفصیلات کو بھرتا ہے جو پہلے نہیں تھیں۔ اس وجہ سے، ماڈل کو سیکیورٹی سسٹمز جیسی کسی بھی چیز کے لیے استعمال نہیں کیا جا سکتا، کیونکہ یہ فوکس امیجز کو حقیقی شخص کی تصاویر میں تبدیل نہیں کر سکے گا۔

روایتی سپر ریزولوشن تکنیک اس بات کا اندازہ لگا کر کام کرتی ہے کہ تصویر کو ہائی ریزولوشن والی تصویر میں تبدیل کرنے کے لیے کن پکسلز کی ضرورت ہے، ان تصاویر کی بنیاد پر جن کے بارے میں ماڈل پہلے سے جان چکا ہے۔ چونکہ شامل کیے گئے پکسلز اندازوں کا نتیجہ ہیں، اس لیے تمام پکسلز اپنے آس پاس کے پکسلز سے مماثل نہیں ہوں گے اور تصویر کے کچھ علاقے مبہم یا خراب نظر آ سکتے ہیں۔ ڈیوک یونیورسٹی کے محققین نے اپنے AI ماڈل کی تربیت کا ایک مختلف طریقہ استعمال کیا۔ ڈیوک محققین کے ذریعہ تیار کردہ ماڈل پہلے کم ریزولوشن والی تصاویر لے کر اور وقت کے ساتھ ساتھ تصویر میں تفصیل شامل کرکے کام کرتا ہے، مثال کے طور پر ہائی ریزولوشن AI سے تیار کردہ چہروں کا حوالہ دیتا ہے۔ ماڈل AI سے تیار کردہ چہروں کا حوالہ دیتا ہے اور ان کو تلاش کرنے کی کوشش کرتا ہے جو ٹارگٹ امیجز سے مشابہت رکھتے ہیں جب تیار کردہ چہروں کو ہدف کی تصویر کے سائز تک چھوٹا کیا جاتا ہے۔

تحقیقی ٹیم نے نئی امیجز کی تخلیق کو سنبھالنے کے لیے جنریٹو ایڈورسریل نیٹ ورک ماڈل بنایا۔ GAN دراصل دو نیورل نیٹ ورکس ہیں جو دونوں ایک ہی ڈیٹاسیٹ پر تربیت یافتہ ہیں اور ایک دوسرے کے خلاف کھڑے ہیں۔ ایک نیٹ ورک جعلی تصاویر بنانے کا ذمہ دار ہے جو تربیتی ڈیٹاسیٹ میں حقیقی تصاویر کی نقل کرتا ہے، جبکہ دوسرا نیٹ ورک حقیقی تصاویر سے جعلی تصاویر کا پتہ لگانے کا ذمہ دار ہے۔ پہلے نیٹ ورک کو اس وقت مطلع کیا جاتا ہے جب اس کی تصاویر کو جعلی کے طور پر شناخت کیا جاتا ہے، اور یہ اس وقت تک بہتر ہوتا ہے جب تک کہ جعلی تصاویر کو حقیقی تصاویر سے الگ نہیں کیا جا سکتا۔

محققین نے اپنے سپر ریزولوشن ماڈل کو ڈب کیا ہے۔ پلس، اور ماڈل مسلسل اعلیٰ معیار کی تصاویر تیار کرتا ہے یہاں تک کہ اگر دی گئی تصاویر اتنی دھندلی ہوں کہ دوسرے سپر ریزولوشن طریقے ان سے اعلیٰ معیار کی تصاویر نہیں بنا سکتے۔ ماڈل تصویروں سے حقیقت پسندانہ چہرے بنانے کے قابل بھی ہے جہاں چہرے کی خصوصیات تقریباً الگ نہیں ہیں۔ مثال کے طور پر، جب 16×16 ریزولوشن والے چہرے کی تصویر دی جائے تو یہ 1024 x 1024 کی تصویر بنا سکتا ہے۔ اس عمل کے دوران ایک ملین سے زیادہ پکسلز شامل کیے جاتے ہیں، بالوں کے تاروں، جھریوں اور یہاں تک کہ روشنی جیسی تفصیلات کو بھرتے ہیں۔ جب محققین نے دیگر سپر ریزولوشن تکنیکوں کے ذریعے تخلیق کردہ تصاویر کے مقابلے میں 1440 PULSE سے تیار کردہ تصاویر کی درجہ بندی کی، PULSE نے تیار کردہ تصاویر کو مسلسل بہترین اسکور کیا۔

جب کہ محققین نے اپنا ماڈل لوگوں کے چہروں کی تصاویر پر استعمال کیا، وہی تکنیک جو وہ استعمال کرتے ہیں تقریباً کسی بھی چیز پر لاگو کیا جا سکتا ہے۔ مختلف اشیاء کی کم ریزولیوشن امیجز کو اشیاء کے اس سیٹ کی ہائی ریزولوشن امیجز بنانے کے لیے استعمال کیا جا سکتا ہے، مائیکروسکوپی، سیٹلائٹ امیجری، تعلیم، مینوفیکچرنگ اور میڈیسن سے مختلف صنعتوں اور شعبوں کے لیے ممکنہ ایپلی کیشنز کو کھولا جا سکتا ہے۔

میں خصوصیات کے ساتھ بلاگر اور پروگرامر مشین لرننگ اور گہری سیکھنا عنوانات. ڈینیئل کو امید ہے کہ وہ سماجی بھلائی کے لیے AI کی طاقت کو استعمال کرنے میں دوسروں کی مدد کرے گا۔