اے آئی 101
جنریٹو ایڈورسریئل نیٹ ورک (GAN) کیا ہے؟
جنریٹو ایڈورسریل نیٹ ورکس (GANs) نیورل نیٹ ورک آرکیٹیکچرز کی اقسام ہیں۔ نیا ڈیٹا بنانے کے قابل جو سیکھے ہوئے نمونوں کے مطابق ہے۔ GANs کا استعمال انسانی چہروں یا دیگر اشیاء کی تصاویر بنانے، متن سے تصویری ترجمہ کرنے، ایک قسم کی تصویر کو دوسری میں تبدیل کرنے، اور دیگر ایپلی کیشنز کے درمیان امیجز (سپر ریزولوشن) کو بڑھانے کے لیے استعمال کیا جا سکتا ہے۔ چونکہ GANs مکمل طور پر نیا ڈیٹا تیار کر سکتے ہیں، اس لیے وہ بہت سے جدید ترین AI سسٹمز، ایپلی کیشنز اور تحقیق کے سر پر ہیں۔ پھر بھی GANs بالکل کیسے کام کرتے ہیں؟ آئیے دریافت کریں کہ GANs کیسے کام کرتے ہیں اور ان کے کچھ بنیادی استعمالات پر ایک نظر ڈالتے ہیں۔
جنریٹیو ماڈلز اور GAN کی تعریف
ایک GAN ایک تخلیقی ماڈل کی ایک مثال ہے۔ زیادہ تر AI ماڈلز کو دو اقسام میں سے ایک میں تقسیم کیا جا سکتا ہے: زیر نگرانی اور غیر زیر نگرانی ماڈل۔ زیر نگرانی سیکھنے کے ماڈلز کا استعمال عام طور پر ان پٹ کے مختلف زمروں کے درمیان امتیاز کرنے کے لیے کیا جاتا ہے، درجہ بندی کرنے کے لیے۔ اس کے برعکس، غیر زیر نگرانی ماڈلز کو عام طور پر ڈیٹا کی تقسیم کا خلاصہ کرنے کے لیے استعمال کیا جاتا ہے، اکثر سیکھنے کے لیے ڈیٹا کی گاوسی تقسیم۔ کیونکہ وہ ڈیٹا سیٹ کی تقسیم سیکھتے ہیں وہ اس سیکھی ہوئی تقسیم سے نمونے کھینچ سکتے ہیں اور نیا ڈیٹا تیار کر سکتے ہیں۔
مختلف جنریٹو ماڈلز میں ڈیٹا بنانے اور امکانی تقسیم کا حساب لگانے کے مختلف طریقے ہوتے ہیں۔ مثال کے طور پر، the بولی Bayes ماڈل مختلف ان پٹ فیچرز اور جنریٹیو کلاس کے لیے امکانی تقسیم کا حساب لگا کر کام کرتا ہے۔ جب Naive Bayes ماڈل ایک پیشین گوئی پیش کرتا ہے، تو یہ مختلف متغیرات کے امکان کو لے کر اور ان کو ایک ساتھ ملا کر سب سے زیادہ ممکنہ کلاس کا حساب لگاتا ہے۔ دیگر نان ڈیپ لرننگ جنریٹو ماڈلز میں گاوسی مکسچر ماڈلز اور لیٹنٹ ڈیریچلیٹ ایلوکیشن (ایل ڈی اے) شامل ہیں۔ گہری جھکاؤ پر مبنی جنریٹو ماڈلز شامل ہیں۔ محدود بولٹزمین مشینیں (RBMs), تغیراتی آٹو اینکوڈرز (VAEs)، اور ظاہر ہے، GANs۔
جنریٹو ایڈورسریل نیٹ ورکس تھے۔ پہلی بار 2014 میں ایان گڈفیلو نے تجویز کیا تھا۔، اور انہیں 2015 میں ایلک ریڈفورڈ اور دیگر محققین نے بہتر بنایا، جس کی وجہ سے GANs کے لیے ایک معیاری فن تعمیر ہوا۔ GAN دراصل دو مختلف نیٹ ورکس ہیں جو آپس میں جڑے ہوئے ہیں۔ GANs ہیں۔ دو حصوں پر مشتمل: جنریشن ماڈل اور امتیازی ماڈل، جسے جنریٹر اور امتیازی سلوک بھی کہا جاتا ہے۔
GAN فن تعمیر
جنریٹو ایڈورسریل نیٹ ورکس ہیں۔ جنریٹر ماڈل اور امتیازی ماڈل سے بنایا گیا ہے۔ جنریٹر ماڈل کا کام ڈیٹا کی نئی مثالیں بنانا ہے، ان نمونوں کی بنیاد پر جو ماڈل نے تربیتی ڈیٹا سے سیکھا ہے۔ امتیاز کرنے والے ماڈل کا کام تصاویر کا تجزیہ کرنا ہے (یہ فرض کرتے ہوئے کہ یہ تصویروں پر تربیت یافتہ ہے) اور اس بات کا تعین کرنا ہے کہ آیا تصاویر بنائی گئی ہیں/جعلی ہیں یا اصلی۔
دونوں ماڈلز کو ایک دوسرے کے خلاف کھڑا کیا گیا ہے، جن کی تربیت گیم تھیوریٹک انداز میں کی گئی ہے۔ جنریٹر ماڈل کا مقصد ایسی تصاویر تیار کرنا ہے جو اس کے مخالف کو دھوکہ دیتی ہیں - امتیازی ماڈل۔ دریں اثنا، امتیازی ماڈل کا کام اپنے مخالف، جنریٹر ماڈل پر قابو پانا اور جنریٹر کی طرف سے تیار کردہ جعلی تصاویر کو پکڑنا ہے۔ حقیقت یہ ہے کہ ماڈلز ایک دوسرے کے خلاف کھڑے ہونے کا نتیجہ ہتھیاروں کی دوڑ میں ہوتا ہے جہاں دونوں ماڈل بہتر ہوتے ہیں۔ امتیاز کرنے والے کو اس بارے میں رائے ملتی ہے کہ کون سی تصاویر حقیقی تھیں اور کون سی تصاویر جنریٹر کے ذریعہ تیار کی گئی تھیں، جب کہ جنریٹر کو یہ معلومات فراہم کی جاتی ہے کہ اس کی کن تصاویر کو امتیازی سلوک کرنے والے نے غلط قرار دیا تھا۔ دونوں ماڈلز تربیت کے دوران بہتر ہوتے ہیں، جس کا مقصد ایک ایسے نسلی ماڈل کو تربیت دینا ہے جو جعلی ڈیٹا تیار کر سکے جو بنیادی طور پر اصلی، حقیقی ڈیٹا سے الگ نہیں کیا جا سکتا۔
ایک بار جب تربیت کے دوران ڈیٹا کی گاوسی تقسیم ہو جاتی ہے، تو تخلیقی ماڈل استعمال کیا جا سکتا ہے۔ جنریٹر ماڈل کو ابتدائی طور پر ایک بے ترتیب ویکٹر کھلایا جاتا ہے، جسے یہ گاوسی تقسیم کی بنیاد پر تبدیل کرتا ہے۔ دوسرے لفظوں میں، ویکٹر نسل کو بیج دیتا ہے۔ جب ماڈل کو تربیت دی جاتی ہے، تو ویکٹر کی جگہ ڈیٹا کی گاوسی تقسیم کا کمپریسڈ ورژن، یا نمائندگی ہوگی۔ ڈیٹا کی تقسیم کے کمپریسڈ ورژن کو اویکت اسپیس، یا اویکت متغیرات کہا جاتا ہے۔ بعد میں، GAN ماڈل اس کے بعد پوشیدہ جگہ کی نمائندگی لے سکتا ہے اور اس سے پوائنٹس نکال سکتا ہے، جو کہ جنریشن ماڈل کو دیا جا سکتا ہے اور نئے ڈیٹا کو تیار کرنے کے لیے استعمال کیا جا سکتا ہے جو تربیتی ڈیٹا سے بہت ملتا جلتا ہے۔
discriminator ماڈل کو پورے ٹریننگ ڈومین سے مثالیں دی جاتی ہیں، جو کہ اصلی اور تیار کردہ ڈیٹا دونوں مثالوں پر مشتمل ہوتی ہے۔ حقیقی مثالیں تربیتی ڈیٹاسیٹ میں موجود ہیں، جبکہ جعلی ڈیٹا جنریٹیو ماڈل کے ذریعے تیار کیا جاتا ہے۔ امتیازی ماڈل کی تربیت کا عمل بالکل وہی ہے جیسا کہ بنیادی، بائنری درجہ بندی ماڈل کی تربیت۔
GAN ٹریننگ کا عمل
آئیے پورے کا جائزہ لیتے ہیں۔ تربیت عمل فرضی تصویر بنانے کے کام کے لیے۔
شروع کرنے کے لیے، GAN کو تربیتی ڈیٹاسیٹ کے حصے کے طور پر حقیقی، حقیقی تصاویر کا استعمال کرتے ہوئے تربیت دی جاتی ہے۔ یہ تخلیق شدہ امیجز اور حقیقی امیجز کے درمیان فرق کرنے کے لیے discrimnator ماڈل سیٹ کرتا ہے۔ یہ ڈیٹا کی تقسیم بھی تیار کرتا ہے جسے جنریٹر نیا ڈیٹا تیار کرنے کے لیے استعمال کرے گا۔
جنریٹر بے ترتیب عددی اعداد و شمار کے ایک ویکٹر میں لیتا ہے اور انہیں گاوسی تقسیم کی بنیاد پر تبدیل کرتا ہے، تصویر واپس کرتا ہے۔ تربیتی ڈیٹاسیٹ سے کچھ حقیقی تصاویر کے ساتھ یہ تیار کردہ تصاویر کو امتیازی ماڈل میں شامل کیا جاتا ہے۔ امتیاز کرنے والا اسے موصول ہونے والی تصاویر کی نوعیت کے بارے میں ایک ممکنہ پیشین گوئی پیش کرے گا، 0 اور 1 کے درمیان ایک قدر نکالے گا، جہاں 1 عام طور پر مستند امیجز ہے اور 0 ایک جعلی تصویر ہے۔
کھیل میں ایک ڈبل فیڈ بیک لوپ ہے، کیونکہ زمینی امتیاز کرنے والے کو تصاویر کی زمینی سچائی کھلائی جاتی ہے، جب کہ جنریٹر کو امتیاز کرنے والے کی طرف سے اس کی کارکردگی پر فیڈ بیک دیا جاتا ہے۔
جنریٹیو اور امتیازی ماڈل ایک دوسرے کے ساتھ صفر رقم کا کھیل کھیل رہے ہیں۔ صفر رقم کا کھیل وہ ہوتا ہے جہاں ایک طرف سے حاصل ہونے والا فائدہ دوسری طرف کی قیمت پر آتا ہے (رقم دونوں ایکشنز صفر ہے)۔ جب امتیازی ماڈل اصلی اور جعلی مثالوں کے درمیان کامیابی کے ساتھ فرق کرنے کے قابل ہو جاتا ہے، تب امتیاز کرنے والے کے پیرامیٹرز میں کوئی تبدیلی نہیں کی جاتی ہے۔ تاہم، ماڈل کے پیرامیٹرز میں بڑی اپ ڈیٹس کی جاتی ہیں جب یہ اصلی اور جعلی تصاویر میں فرق کرنے میں ناکام رہتا ہے۔ الٹا جنریٹیو ماڈل کے لیے درست ہے، جب یہ امتیازی ماڈل کو بے وقوف بنانے میں ناکام ہو جاتا ہے تو اسے سزا دی جاتی ہے (اور اس کے پیرامیٹرز کو اپ ڈیٹ کیا جاتا ہے)، لیکن بصورت دیگر اس کے پیرامیٹرز میں کوئی تبدیلی نہیں کی جاتی ہے (یا اسے انعام دیا جاتا ہے)۔
مثالی طور پر، جنریٹر اپنی کارکردگی کو اس مقام تک بہتر بنا سکتا ہے جہاں امتیاز کرنے والا جعلی اور اصلی تصاویر میں فرق نہیں کر سکتا۔ اس کا مطلب یہ ہے کہ امتیاز کرنے والا ہمیشہ حقیقی اور جعلی امیجز کے لیے %50 کے امکانات پیش کرتا رہے گا، یعنی تیار کردہ امیجز کو حقیقی امیجز سے الگ نہیں کیا جانا چاہیے۔ عملی طور پر، GANs عام طور پر اس مقام تک نہیں پہنچ پائیں گے۔ تاہم، جنریٹیو ماڈل کو بالکل اسی طرح کی تصاویر بنانے کی ضرورت نہیں ہے تاکہ وہ اب بھی بہت سے کاموں کے لیے کارآمد ہوں جن کے لیے GAN استعمال کیے جاتے ہیں۔
GAN ایپلی کیشنز
GANs میں متعدد مختلف ایپلی کیشنز ہیں، جن میں سے زیادہ تر تصاویر کی نسل اور تصاویر کے اجزاء کے گرد گھومتی ہیں۔ GANs کو عام طور پر ان کاموں میں استعمال کیا جاتا ہے جہاں مطلوبہ تصویری ڈیٹا غائب ہو یا کچھ صلاحیت میں محدود ہو، مطلوبہ ڈیٹا تیار کرنے کے طریقے کے طور پر۔ آئیے GANs کے عام استعمال کے کچھ معاملات کا جائزہ لیتے ہیں۔
ڈیٹاسیٹس کے لیے نئی مثالیں تیار کرنا
GANs کو سادہ تصویری ڈیٹاسیٹس کے لیے نئی مثالیں بنانے کے لیے استعمال کیا جا سکتا ہے۔ اگر آپ کے پاس صرف مٹھی بھر تربیتی مثالیں ہیں اور آپ کو ان میں سے مزید کی ضرورت ہے، تو GANs کو تصویری درجہ بندی کرنے والے کے لیے نئے تربیتی ڈیٹا بنانے کے لیے استعمال کیا جا سکتا ہے، مختلف سمتوں اور زاویوں پر نئی تربیتی مثالیں تیار کرنا۔
منفرد انسانی چہرے پیدا کرنا

اس تصویر میں موجود عورت موجود نہیں ہے۔ یہ تصویر StyleGAN نے بنائی تھی۔ تصویر: Owlsmcgee بذریعہ Wikimedia Commons, Public Domain (https://commons.wikimedia.org/wiki/File:Woman_1.jpg)
کافی تربیت یافتہ ہونے پر، GANs کو استعمال کیا جا سکتا ہے۔ انسانی چہروں کی انتہائی حقیقت پسندانہ تصاویر بنائیں۔ یہ تیار کردہ تصاویر چہرے کی شناخت کے نظام کو تربیت دینے کے لیے استعمال کی جا سکتی ہیں۔
تصویر سے تصویری ترجمہ
GANs تصویری ترجمہ پر ایکسل۔ GANs کا استعمال سیاہ اور سفید تصویروں کو رنگین کرنے، خاکے یا ڈرائنگ کو فوٹو گرافی کی تصاویر میں ترجمہ کرنے، یا تصاویر کو دن سے رات میں تبدیل کرنے کے لیے استعمال کیا جا سکتا ہے۔
متن سے تصویری ترجمہ
متن سے تصویری ترجمہ ہے۔ GANs کے استعمال سے ممکن ہے۔. جب کسی تصویر اور اس کے ساتھ والی تصویر کو بیان کرنے والے متن کے ساتھ فراہم کیا جائے تو، ایک GAN کر سکتا ہے۔ ایک نئی تصویر بنانے کے لیے تربیت دی جائے۔ جب مطلوبہ تصویر کی تفصیل فراہم کی جائے۔
امیجز میں ترمیم اور مرمت کرنا
GANs کو موجودہ تصاویر میں ترمیم کرنے کے لیے استعمال کیا جا سکتا ہے۔ GANs بارش یا برف جیسے عناصر کو ہٹا دیں۔ ایک تصویر سے، لیکن وہ بھی استعمال کیا جا سکتا ہے پرانی، خراب شدہ تصاویر یا خراب تصاویر کی مرمت کریں۔
سپر قرارداد
سپر ریزولیوشن کم ریزولوشن والی تصویر لینے اور تصویر میں زیادہ پکسلز ڈالنے کا عمل ہے، جس سے اس تصویر کی ریزولوشن بہتر ہوتی ہے۔ GANs کو تصویر لینے کی تربیت دی جا سکتی ہے۔ اس تصویر کا ایک اعلی ریزولوشن ورژن تیار کریں۔