ہمارے ساتھ رابطہ

محققین نے AI امیج جنریشن کو کنٹرول کرنے کا نیا طریقہ تیار کیا۔

مصنوعی ذہانت

محققین نے AI امیج جنریشن کو کنٹرول کرنے کا نیا طریقہ تیار کیا۔

mm
تصویر: این سی اسٹیٹ یونیورسٹی

نارتھ کیرولائنا اسٹیٹ یونیورسٹی کے محققین نے مصنوعی ذہانت (AI) امیج جنریشن کو کنٹرول کرنے کے لیے ایک نیا طریقہ تیار کیا ہے، جسے خود مختار گاڑیوں جیسے شعبوں میں استعمال کیا جا سکتا ہے۔

مشروط امیج جنریشن اور دیگر تکنیک

کنڈیشنل امیج جنریشن ایک AI ٹاسک ہے جس میں AI سسٹم شامل ہوتا ہے کہ وہ مخصوص حالات کی بنیاد پر تصاویر بناتا ہے، جس کی صارف درخواست کر سکتا ہے۔ نئی تکنیکوں نے اسے اور بھی آگے بڑھایا ہے اور تصویر کے لے آؤٹ کے لیے شرائط کو شامل کیا ہے، جو صارفین کو اس قابل بناتا ہے کہ وہ کس قسم کی اشیاء کو اسکرین پر مخصوص جگہوں پر ظاہر کرنا چاہتے ہیں۔

یونیورسٹی کے محققین کے ذریعہ تیار کردہ نیا جدید ترین طریقہ ان تمام تکنیکوں پر استوار ہے، اور یہ صارفین کو تصاویر کی ایک سیریز میں مخصوص خصوصیات کو برقرار رکھتے ہوئے تصاویر پر زیادہ کنٹرول حاصل کرنے کے قابل بناتا ہے۔

تیانفو وو اس کے شریک مصنف ہیں۔ ریسرچ پیپر اور NC اسٹیٹ میں کمپیوٹر انجینئرنگ کے اسسٹنٹ پروفیسر۔ 

وو کا کہنا ہے کہ "ہمارا نقطہ نظر انتہائی قابل ترتیب ہے۔ "پچھلے طریقوں کی طرح، ہمارا طریقہ صارفین کو اس بات کی اجازت دیتا ہے کہ وہ مخصوص شرائط کی بنیاد پر سسٹم کو ایک تصویر بنا سکے۔ لیکن ہمارا آپ کو اس تصویر کو برقرار رکھنے اور اس میں اضافہ کرنے کی بھی اجازت دیتا ہے۔ مثال کے طور پر، صارفین AI کو پہاڑی منظر بنا سکتے ہیں۔ اس کے بعد صارفین سسٹم کو اس منظر میں اسکیئرز شامل کر سکتے ہیں۔

جوڑ توڑ عناصر

نئے طریقہ کار کے ساتھ، صارفین AI کو عناصر میں ہیرا پھیری کرنے کی بھی اجازت دے سکتے ہیں تاکہ وہ کسی نہ کسی طریقے سے حرکت کرتے ہوئے یا تبدیل ہوتے ہوئے بھی شناختی طور پر ایک جیسے ہوں۔ ایسی ہی ایک مثال AI ہو گی جو تصویروں کا ایک سلسلہ بناتی ہے جہاں سکیئرز کسی زمین کی تزئین میں گھومتے ہوئے ناظرین کی طرف مڑتے ہیں۔

وو کا کہنا ہے کہ "اس کے لیے ایک درخواست خود مختار روبوٹس کو 'تصور کرنے' میں مدد کرے گی کہ وہ کسی کام کو شروع کرنے سے پہلے حتمی نتیجہ کیسا نظر آئے گا۔" "آپ AI ٹریننگ کے لیے امیجز بنانے کے لیے بھی سسٹم کا استعمال کر سکتے ہیں۔ لہذا، بیرونی ذرائع سے تصاویر مرتب کرنے کے بجائے، آپ اس سسٹم کو دوسرے AI سسٹمز کی تربیت کے لیے تصاویر بنانے کے لیے استعمال کر سکتے ہیں۔

نئے نقطہ نظر کا تجربہ COCO-Stuff ڈیٹاسیٹ اور Visual Genome ڈیٹاسیٹ کے ساتھ کیا گیا، اور تصویر کے معیار کے معیارات کی بنیاد پر، یہ پچھلی جدید ترین تکنیکوں سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔ 

وو کا کہنا ہے کہ "ہمارا اگلا مرحلہ یہ دیکھنا ہے کہ کیا ہم اس کام کو ویڈیو اور تین جہتی تصاویر تک بڑھا سکتے ہیں۔"

نئے نقطہ نظر کو تربیت دینے کے لیے، محققین کو 4-GPU ورک سٹیشن پر انحصار کرنا پڑا جس کی وجہ سے بھاری کمپیوٹیشنل طاقت درکار تھی۔ اس کے باوجود، نظام کی تعیناتی اب بھی کمپیوٹیشنل طور پر کم مہنگی ہے۔ 

"ہم نے پایا کہ ایک GPU آپ کو تقریباً حقیقی وقت کی رفتار دیتا ہے،" وو کہتے ہیں۔

"ہمارے کاغذ کے علاوہ، ہم نے اس نقطہ نظر کے لیے اپنا سورس کوڈ GitHub پر دستیاب کر دیا ہے۔ اس نے کہا، ہم صنعت کے شراکت داروں کے ساتھ تعاون کرنے کے لیے ہمیشہ تیار ہیں۔

Alex McFarland ایک AI صحافی اور مصنف ہے جو مصنوعی ذہانت میں تازہ ترین پیشرفت کی کھوج لگا رہا ہے۔ اس نے دنیا بھر میں متعدد AI اسٹارٹ اپس اور اشاعتوں کے ساتھ تعاون کیا ہے۔