مصنوعی ذہانت
ہنیوآن ویڈیو ڈیپ فیکس کا عروج

یہاں زیر بحث مواد میں سے کچھ کی نوعیت کی وجہ سے، اس مضمون میں معمول سے کم حوالہ جات اور مثالیں ہوں گی۔
AI سنتھیسز کمیونٹی میں فی الحال کچھ قابل ذکر ہو رہا ہے، حالانکہ اس کی اہمیت واضح ہونے میں کچھ وقت لگ سکتا ہے۔ شوق رکھنے والے ویڈیو پر مبنی لوگوں کی مشابہت کو دوبارہ پیش کرنے کے لیے جنریٹیو AI ویڈیو ماڈلز کی تربیت دے رہے ہیں LoRAs Tencent کے حال ہی میں جاری کردہ اوپن سورس پر ہنیوآن ویڈیو فریم ورک.*
کھیلنے کے لیے کلک کریں۔ Hunyuan کی بنیاد پر LoRA تخصیصات کے متنوع نتائج Civit کمیونٹی میں آزادانہ طور پر دستیاب ہیں۔ کم درجہ کے موافقت کے ماڈلز (LoRAs) کو تربیت دینے سے، وقتی استحکام کے مسائل، جنہوں نے AI ویڈیو جنریشن کو دو سالوں سے دوچار کیا ہے، نمایاں طور پر کم ہو گئے ہیں۔ ذرائع: civit.ai
اوپر دکھائی گئی ویڈیو میں، اداکارہ نٹالی پورٹمین، کرسٹینا ہینڈرکس اور اسکارلیٹ جوہانسن کی مشابہتیں، ٹیک لیڈر ایلون مسک کے ساتھ مل کر، ہنیوان جنریٹو ویڈیو سسٹم کے لیے نسبتاً چھوٹی ایڈ آن فائلوں کی تربیت دی گئی ہے، جسے انسٹال کیا جا سکتا ہے۔ مواد کے فلٹرز کے بغیر (جیسے NSFW فلٹرز) صارف کے کمپیوٹر پر۔
اوپر دکھائے گئے کرسٹینا ہینڈرکس LoRA کے خالق کا کہنا ہے کہ سے صرف 16 تصاویر پاگل مرد ماڈل تیار کرنے کے لیے ٹی وی شو کی ضرورت تھی (جو محض 307mb ڈاؤن لوڈ ہے)؛ Reddit اور Discord میں Stable Diffusion کمیونٹی کی متعدد پوسٹس اس بات کی تصدیق کرتی ہیں کہ اس قسم کے LoRAs کو زیادہ تر معاملات میں زیادہ مقدار میں تربیتی ڈیٹا، یا زیادہ تربیتی اوقات کی ضرورت نہیں ہوتی ہے۔
Cکھیلنے کے لئے چاٹنا. آرنلڈ شوارزنیگر کو ہنیوآن ویڈیو LoRA میں زندہ کیا گیا ہے جسے Civit پر ڈاؤن لوڈ کیا جا سکتا ہے۔ AI کے شوقین Bob Doyle کی مزید Arnie مثالوں کے لیے https://www.youtube.com/watch?v=1D7B9g9rY68 دیکھیں۔
Hunyuan LoRAs کو جامد امیجز یا ویڈیوز پر تربیت دی جا سکتی ہے، حالانکہ ویڈیوز پر تربیت کے لیے ہارڈ ویئر کے زیادہ وسائل اور تربیت کے وقت میں اضافہ کی ضرورت ہوتی ہے۔
ہنیوآن ویڈیو ماڈل میں 13 بلین پیرامیٹرز ہیں، جو سورا کے 12 بلین پیرامیٹرز سے زیادہ ہیں، اور کم قابلیت سے کہیں زیادہ ہیں۔ ہنیوآن-ڈی آئی ٹی ماڈل 2024 کے موسم گرما میں اوپن سورس کے لیے جاری کیا گیا۔ صرف 1.5 بلین پیرامیٹرز ہیں۔.
جیسا کہ معاملہ تھا۔ ڈھائی سال پہلے Stable Diffusion اور LoRA کے ساتھ (Stable Diffusion 1.5 کی 'مقامی' مشہور شخصیات کی مثالیں دیکھیں یہاں)، زیر بحث فاؤنڈیشن ماڈل میں مشہور شخصیات کے بارے میں بہت زیادہ محدود سمجھ ہے، اس کے مقابلے میں وفاداری کی سطح جو 'ID-injected' LoRA کے نفاذ کے ذریعے حاصل کی جا سکتی ہے۔
مؤثر طریقے سے، ایک حسب ضرورت، شخصیت پر مرکوز LoRA کو بنیادی ہنیوآن ماڈل کی اہم ترکیب کی صلاحیتوں پر 'مفت سواری' ملتی ہے، جو کہ 2017 کے دور تک حاصل کیے جانے والے انسانی ترکیب کے مقابلے میں نمایاں طور پر زیادہ موثر انسانی ترکیب کی پیشکش کرتی ہے۔ آٹو اینکوڈر ڈیپ فیکس یا feted جیسے سسٹمز کے ذریعے جامد امیجز میں حرکت شامل کرنے کی کوشش کر کے لائیو پورٹریٹ.
یہاں دکھائے گئے تمام LoRAs کو انتہائی مقبول Civit کمیونٹی سے آزادانہ طور پر ڈاؤن لوڈ کیا جا سکتا ہے، جب کہ پرانے حسب ضرورت ساختہ 'static-image' LoRAs کی زیادہ تعداد ویڈیو بنانے کے عمل کے لیے ممکنہ طور پر 'سیڈ' امیجز بھی بنا سکتی ہے (یعنی تصویر سے ویڈیو، ہنیوان ویڈیو کے لیے ایک زیر التواء ریلیز، اگرچہ حل ممکن ہے، اس لمحے کے لئے)۔
کھیلنے کے لیے کلک کریں۔ اوپر، 'جامد' فلکس LoRA سے نمونے؛ ذیل میں، ایک ہنیوان ویڈیو LoRA کی مثالیں جس میں موسیقار ٹیلر سوئفٹ شامل ہیں۔ یہ دونوں LoRAs Civit کمیونٹی میں مفت دستیاب ہیں۔
جیسا کہ میں لکھ رہا ہوں، Civit ویب سائٹ 'Hunyuan'* کے لیے 128 تلاش کے نتائج پیش کرتی ہے۔ یہ تقریباً سبھی کسی نہ کسی طریقے سے NSFW ماڈلز ہیں۔ 22 مشہور شخصیات کی تصویر کشی؛ 18 کو کٹر پورنوگرافی کی نسل کی سہولت کے لیے ڈیزائن کیا گیا ہے۔ اور ان میں سے صرف سات میں عورتوں کے بجائے مردوں کو دکھایا گیا ہے۔
تو کیا نیا هے؟
کی وجہ سے ترقی پذیر فطرت اصطلاح کے گہرائی، اور محدود عوامی فہم (کافی شدید) AI انسانی ویڈیو سنتھیسز فریم ورک کی آج تک کی حدود، ہنیوآن LoRA کی اہمیت کو سمجھنا آسان نہیں ہے ایک شخص جو اتفاق سے تخلیقی AI منظر کی پیروی کرتا ہے۔ آئیے Hunyuan LoRAs اور شناخت پر مبنی AI ویڈیو جنریشن کے لیے پہلے کے طریقوں کے درمیان کچھ اہم فرقوں کا جائزہ لیتے ہیں۔
1: بے لگام مقامی تنصیب
ہنیوآن ویڈیو کا سب سے اہم پہلو یہ ہے کہ اسے مقامی طور پر ڈاؤن لوڈ کیا جا سکتا ہے، اور یہ کہ یہ بہت طاقتور اور سینسر آرام دہ اور پرسکون صارف کے ساتھ ساتھ VFX کمیونٹی کے ہاتھ میں AI ویڈیو جنریشن سسٹم (اس حد تک کہ جغرافیائی علاقوں میں لائسنس اجازت دے سکتے ہیں)۔
آخری بار جب ایسا ہوا تو Stability.ai Stable Diffusion ماڈل کے اوپن سورس کے لیے ریلیز کی آمد تھی۔ 2022 کے موسم گرما میں. اس وقت، OpenAI کے DALL-E2 کے پاس تھا۔ پر قبضہ کر لیا عوامی تخیل، اگرچہ DALLE-2 قابل ذکر پابندیوں کے ساتھ ایک ادا شدہ سروس تھی (جو وقت کے ساتھ ساتھ بڑھتی گئی)۔
جب مستحکم پھیلاؤ دستیاب ہوا، اور کم درجہ کی موافقت نے پھر اس کی شناخت کی تصاویر بنانا ممکن بنایا۔ کوئی بھی شخص (مشہور شخصیت یا نہیں)، ڈویلپر اور صارفین کی دلچسپی کے بہت بڑے مقام نے DALLE-2 کی مقبولیت کو گرہن لگانے میں Stable Diffusion کی مدد کی۔ اگرچہ مؤخر الذکر ایک زیادہ قابل نظام تھا، لیکن اس کے سنسرشپ کے معمولات سخت کے طور پر دیکھا اس کے بہت سے صارفین کے ذریعہ، اور تخصیص ممکن نہیں تھا۔
بلاشبہ، یہی منظر اب سورا اور ہنیوان کے درمیان لاگو ہوتا ہے – یا، زیادہ درست طور پر، درمیان سورہ درجہ ملکیتی جنریٹو ویڈیو سسٹمز، اور اوپن سورس حریف، جن میں سے ہنیوان پہلا ہے - لیکن شاید آخری نہیں (یہاں، اس پر غور کریں بہاؤ آخر کار مستحکم بازی پر اہم زمین حاصل کرے گا)۔
وہ صارفین جو ہنیوان LoRA آؤٹ پٹ بنانا چاہتے ہیں، لیکن جن کے پاس مؤثر طریقے سے خوبصورت سامان کی کمی ہے، وہ ہمیشہ کی طرح، آن لائن کمپیوٹ سروسز کے لیے تربیت کے GPU پہلو کو آف لوڈ کر سکتے ہیں۔ جیسے RunPod. یہ Kaiber یا Kling جیسے پلیٹ فارمز پر AI ویڈیوز بنانے جیسا نہیں ہے، کیوں کہ مقامی ورک فلو کو سپورٹ کرنے کے لیے آن لائن GPU کرائے پر لینے میں کوئی سیمنٹک یا امیج پر مبنی فلٹرنگ (سنسرنگ) شامل نہیں ہے۔
2: 'میزبان' ویڈیوز اور اعلیٰ کوشش کی ضرورت نہیں۔
جب 2017 کے آخر میں ڈیپ فیکس منظرعام پر آئیں گے، تو گمنام طور پر پوسٹ کیا گیا کوڈ مین اسٹریم فورک میں تبدیل ہو جائے گا۔ ڈیپفیسلیب اور چہرہ بدل (کے ساتھ ساتھ ڈیپ فیس لائیو۔ ریئل ٹائم ڈیپ فیکنگ سسٹم)۔
اس طریقہ کار کے لیے ہر ایک شناخت کے ہزاروں چہرے کی تصاویر کو تبدیل کرنے کے لیے بڑی محنت کی ضرورت تھی۔ اس مرحلے میں جتنی کم محنت کی جائے گی، ماڈل اتنا ہی کم موثر ہوگا۔ مزید برآں، تربیت کے اوقات 2-14 دنوں کے درمیان مختلف ہوتے ہیں، دستیاب ہارڈ ویئر کے لحاظ سے، طویل مدتی میں بھی قابل نظام پر زور دیتے ہیں۔
جب ماڈل آخر کار تیار ہو گیا، تو یہ موجودہ ویڈیو میں صرف چہرے ہی مسلط کر سکتا تھا، اور اسے عام طور پر ایک 'ٹارگٹ' (یعنی حقیقی) شناخت کی ضرورت ہوتی ہے جو کہ ظاہری شکل میں سپرمپوزڈ شناخت کے قریب ہو۔
زیادہ حال ہی میں، ROOP, LivePortrait اور متعدد اسی طرح کے فریم ورکس نے بہت کم کوشش کے ساتھ اور اکثر اعلیٰ نتائج کے ساتھ ایک جیسی فعالیت فراہم کی ہے - لیکن درست پیدا کرنے کی صلاحیت کے بغیر پورے جسم کے ڈیپ فیکس - یا چہروں کے علاوہ کوئی عنصر۔

یوٹیوب پر باب ڈوئل کے مواد کے سلسلے سے ROOP Unleashed اور LivePortrait (نیچے بائیں طرف داخل کریں) کی مثالیں۔ ذرائع: https://www.youtube.com/watch?v=i39xeYPBAAM اور https://www.youtube.com/watch?v=QGatEItg2Ns
اس کے برعکس، Hunyuan LoRAs (اور اسی طرح کے سسٹمز جو لامحالہ پیروی کریں گے) پوری دنیا کی بلا روک ٹوک تخلیق کی اجازت دیتے ہیں، بشمول صارف کی تربیت یافتہ LoRA شناخت کی مکمل باڈی سمولیشن۔
3: بڑے پیمانے پر بہتر عارضی مستقل مزاجی
وقتی مستقل مزاجی رہی ہے۔ ہولی گریل اب کئی سالوں سے پھیلاؤ والی ویڈیو۔ ایک LoRA کا استعمال، متعین اشارے کے ساتھ، ایک ہنیوان ویڈیو جنریشن کو ایک مستقل شناخت کا حوالہ دیتا ہے جس پر عمل کرنا ہے۔ نظریہ میں (یہ ابتدائی دن ہیں)، کوئی ایک مخصوص شناخت کے متعدد LoRAs کو تربیت دے سکتا ہے، ہر ایک مخصوص لباس پہنے ہوئے ہے۔
ان سرپرستوں کے تحت، لباس کے بھی ویڈیو جنریشن کے دوران 'میوٹیٹ' ہونے کا امکان کم ہوتا ہے (چونکہ جنریٹو سسٹم اگلے فریم کو پہلے کے فریموں کی ایک بہت ہی محدود ونڈو پر رکھتا ہے)۔
(متبادل طور پر، جیسا کہ تصویر پر مبنی LoRA سسٹمز کے ساتھ ہے، کوئی ایک ویڈیو جنریشن پر ایک سے زیادہ LoRAs، جیسے کہ شناخت + کاسٹیوم LoRAs کا اطلاق کر سکتا ہے)
4: 'انسانی تجربے' تک رسائی
جیسا کہ میں حال ہی میں مشاہدہ، ملکیتی اور FAANG کی سطح کا جنریٹو AI سیکٹر اب اپنے منصوبوں کی انسانی ترکیب کی صلاحیتوں سے متعلق ممکنہ تنقید سے بہت محتاط دکھائی دیتا ہے، کہ اصل لوگ بڑے اعلانات اور ریلیز کے لیے پروجیکٹ کے صفحات میں شاذ و نادر ہی نظر آتے ہیں۔ اس کے بجائے، متعلقہ پبلسٹی لٹریچر تیزی سے ترکیب شدہ نتائج میں 'خوبصورت' اور بصورت دیگر 'غیر دھمکی آمیز' مضامین دکھاتا ہے۔
Hunyuan LoRAs کی آمد کے ساتھ، پہلی بار، کمیونٹی کو ایک انتہائی قابل (معمولی کے بجائے) نظام میں LDM پر مبنی انسانی ویڈیو ترکیب کی حدود کو آگے بڑھانے اور اس موضوع کو مکمل طور پر دریافت کرنے کا موقع ملا ہے جس میں اکثریت کی دلچسپی ہے۔ ہم میں سے - لوگ۔
مضمرات
چونکہ Civit کمیونٹی میں 'Hunyuan' کی تلاش زیادہ تر مشہور LoRAs اور 'Hardcore' LoRAs کو دکھاتی ہے، اس لیے Hunyuan LoRAs کی آمد کا مرکزی مضمرات یہ ہے کہ ان کا استعمال حقیقی لوگوں کی AI فحش (یا دوسری صورت میں ہتک آمیز) ویڈیوز بنانے کے لیے کیا جائے گا - مشہور شخصیات اور نامعلوم افراد۔
تعمیل کے مقاصد کے لیے، ہنیوان LoRAs بنانے والے اور متنوع Discord سرورز پر ان کے ساتھ تجربہ کرنے والے شوقین حقیقی لوگوں کی مثالوں کو پوسٹ کیے جانے سے منع کرنے میں محتاط رہتے ہیں۔ حقیقت یہ ہے کہ بھی تصویر-بیسڈ ڈیپ فیکس اب ہیں۔ شدید ہتھیاروں سے; اور اس آمیزے میں حقیقی معنوں میں حقیقت پسندانہ ویڈیوز شامل کرنے کا امکان آخرکار ان شدید خوف کا جواز پیش کر سکتا ہے جو گزشتہ سات سالوں سے میڈیا میں بار بار پائے جاتے ہیں، اور جس نے نئے ضابطے.
ڈرائیونگ فورس
ہمیشہ کی طرح، فحش باقی ٹیکنالوجی کے لئے ڈرائیونگ فورس. اس طرح کے استعمال کے بارے میں ہماری رائے کچھ بھی ہو، محرک کا یہ انتھک انجن جدید ترین ترقی کو آگے بڑھاتا ہے جو بالآخر مرکزی دھارے کو اپنانے سے زیادہ فائدہ اٹھا سکتا ہے۔
اس صورت میں، یہ ممکن ہے کہ قیمت معمول سے زیادہ ہو، کیونکہ ہائپر ریئلسٹک ویڈیو بنانے کی کھلی سورسنگ کے مجرمانہ، سیاسی اور اخلاقی غلط استعمال کے واضح مضمرات ہیں۔
ایک Reddit گروپ (جس کا میں یہاں نام نہیں دوں گا) NSFW ویڈیو مواد کی AI جنریشن کے لیے وقف ایک منسلک، کھلا Discord سرور ہے جہاں صارفین بہتر کر رہے ہیں۔ ComfyUI ہنیوان پر مبنی ویڈیو پورن جنریشن کے لیے ورک فلو۔ روزانہ، صارفین NSFW کلپس کی مثالیں پوسٹ کرتے ہیں – جن میں سے بہت سے کو معقول طور پر 'انتہائی' قرار دیا جا سکتا ہے، یا کم از کم فورم کے قوانین میں بیان کردہ پابندیوں پر دباؤ ڈالا جا سکتا ہے۔
یہ کمیونٹی نئے ماڈلز کے لیے تربیتی ڈیٹا فراہم کرنے کے لیے کافی اور اچھی طرح سے تیار کردہ GitHub ریپوزٹری کو بھی برقرار رکھتی ہے جس میں ٹولز موجود ہیں جو فحش ویڈیوز کو ڈاؤن لوڈ اور اس پر کارروائی کر سکتے ہیں۔
چونکہ LoRA کا سب سے مشہور ٹرینر، کوہیا-ss، اب Hunyuan LoRA ٹریننگ کی حمایت کرتا ہے۔، بے حد جنریٹو ویڈیو ٹریننگ کے لیے داخلے کی راہ میں حائل رکاوٹیں روزانہ کم ہو رہی ہیں، ہارڈ ویئر کی ضروریات کے ساتھ ہنیوآن ٹریننگ اور ویڈیو جنریشن کے لیے۔
فحش پر مبنی AI کے لیے وقف تربیتی اسکیموں کا اہم پہلو (بلکہ شناخت-بیسڈ ماڈلز، جیسے کہ مشہور شخصیات) یہ ہے کہ ہنیوان جیسا ایک معیاری فاؤنڈیشن ماڈل خاص طور پر NSFW آؤٹ پٹ پر تربیت یافتہ نہیں ہے، اور اس لیے NSFW مواد تیار کرنے کے لیے کہے جانے پر یا تو خراب کارکردگی کا مظاہرہ کر سکتا ہے، یا ناکام ہو سکتا ہے۔ الجھاؤ تصورات اور انجمنوں کو کارکردگی یا قائل کرنے والے انداز میں سیکھا۔
ٹھیک ٹیونڈ NSFW فاؤنڈیشن ماڈلز اور LoRAs تیار کرنے سے، تربیت یافتہ شناختوں کو ایک وقف شدہ 'فحش' ویڈیو ڈومین میں پیش کرنا تیزی سے ممکن ہو جائے گا۔ سب کے بعد، یہ صرف اس چیز کا ویڈیو ورژن ہے جو پہلے ہی ہوا ہے پچھلے ڈھائی سالوں میں اسٹیل امیجز کے لیے۔
VFX
عارضی مستقل مزاجی میں بہت زیادہ اضافہ جو Hunyuan Video LoRAs پیش کرتا ہے، AI بصری اثرات کی صنعت کے لیے ایک واضح اعزاز ہے، جو اوپن سورس سافٹ ویئر کو اپنانے پر بہت زیادہ جھکاؤ رکھتا ہے۔
اگرچہ ہنیوآن ویڈیو LoRA اپروچ ایک مکمل فریم اور ماحول پیدا کرتا ہے، VFX کمپنیوں نے تقریباً یقینی طور پر عارضی طور پر مستقل انسانی چہروں کو الگ کرنے کے ساتھ تجربہ کرنا شروع کر دیا ہے جو اس طریقے سے حاصل کیے جا سکتے ہیں، تاکہ چہروں کو حقیقی دنیا کے ماخذ فوٹیج میں سپرمپوز یا ضم کیا جا سکے۔ .
شوق رکھنے والی کمیونٹی کی طرح، VFX کمپنیوں کو ہنیوان ویڈیو کی تصویر سے ویڈیو اور ویڈیو سے ویڈیو کی فعالیت کا انتظار کرنا چاہیے، جو LoRA سے چلنے والے، ID پر مبنی 'ڈیپ فیک' مواد کے درمیان ممکنہ طور پر سب سے مفید پل ہے۔ یا پھر بہتر بنائیں، اور فریم ورک کی بیرونی صلاحیتوں اور ممکنہ موافقت، اور یہاں تک کہ ہنیوان ویڈیو کے ملکیتی اندرون ملک فورک کی تحقیقات کے لیے وقفہ کا استعمال کریں۔
اگرچہ لائسنس کی شرائط ہنیوآن ویڈیو کے لیے تکنیکی طور پر حقیقی افراد کی تصویر کشی کی اجازت دی جاتی ہے جب تک اجازت دی جاتی ہے، وہ یورپی یونین، برطانیہ اور جنوبی کوریا میں اس کے استعمال کو ممنوع قرار دیتے ہیں۔ 'ویگاس میں قیام' کے اصول پر، اس کا لازمی طور پر یہ مطلب نہیں ہے کہ ان خطوں میں ہنیوآن ویڈیو استعمال نہیں کی جائے گی۔ تاہم، بیرونی ڈیٹا آڈٹ کا امکان، ایک کو نافذ کرنے کے لیے جنریٹیو AI کے ارد گرد بڑھتے ہوئے ضوابط، اس طرح کے غیر قانونی استعمال کو خطرناک بنا سکتا ہے۔
لائسنس کی شرائط کا ایک اور ممکنہ طور پر مبہم علاقہ بیان کرتا ہے:
'اگر، Tencent Hunyuan ورژن کی ریلیز کی تاریخ پر، لائسنس یافتہ کے ذریعے یا اس کے لیے دستیاب تمام مصنوعات یا خدمات کے ماہانہ فعال صارفین پچھلے کیلنڈر کے مہینے میں 100 ملین سے زیادہ ماہانہ فعال صارفین ہیں، تو آپ کو Tencent سے لائسنس کی درخواست کرنی چاہیے، جو Tencent آپ کو اپنی صوابدید پر دے سکتا ہے، اور آپ کو اجازت نہیں ہے کہ وہ کسی دوسرے حق کو استعمال کرنے یا Tencent کے بغیر کسی معاہدے کے بغیر اس کا اظہار کرنے کے مجاز نہیں ہیں۔ آپ کو ایسے حقوق۔'
اس شق کا مقصد واضح طور پر ان کمپنیوں کے ہجوم کے لیے ہے جو ممکنہ طور پر ٹیک ناخواندہ صارفین کے لیے 'مڈل مین' ہنیوان ویڈیو بنا سکتی ہیں، اور جن کو صارفین کی ایک خاص حد سے اوپر، Tencent کو کارروائی میں کاٹنا ہوگا۔
وسیع فقرے کا احاطہ بھی ہو سکتا ہے یا نہیں۔ بلاواسطہ استعمال (یعنی، مشہور فلموں اور ٹی وی میں ہنیوآن کے قابل بصری اثرات کے آؤٹ پٹ کی فراہمی کے ذریعے) وضاحت کی ضرورت ہو سکتی ہے۔
نتیجہ
چونکہ ڈیپ فیک ویڈیو ایک طویل عرصے سے موجود ہے، لہذا شناخت کی ترکیب اور ڈیپ فیکنگ کے نقطہ نظر کے طور پر ہنیوآن ویڈیو LoRA کی اہمیت کو کم کرنا آسان ہوگا۔ اور یہ فرض کرنا کہ اس وقت جو پیش رفت Civit کمیونٹی میں ظاہر ہو رہی ہے، اور متعلقہ Discords اور subreddits میں، واقعی قابل کنٹرول انسانی ویڈیو کی ترکیب کی طرف محض ایک بڑھتے ہوئے جھٹکے کی نمائندگی کرتی ہے۔
زیادہ امکان یہ ہے کہ موجودہ کوششیں ہنیوان ویڈیو کی مکمل طور پر قائل کرنے والے پورے جسم اور مکمل ماحول کے ڈیپ فیکس بنانے کی صلاحیت کے صرف ایک حصے کی نمائندگی کرتی ہیں۔ ایک بار جب تصویر سے ویڈیو کا جزو جاری ہو جائے گا (افواہ اس مہینے میں ہو رہی ہے)، تخلیقی طاقت کی ایک بہت زیادہ دانے دار سطح شوق رکھنے والے اور پیشہ ور برادریوں دونوں کے لیے دستیاب ہو جائے گی۔
جب Stability.ai نے 2022 میں Stable Diffusion جاری کیا، تو بہت سے مبصرین اس بات کا تعین نہیں کر سکے کہ کمپنی اس وقت اتنا قیمتی اور طاقتور جنریٹو سسٹم کیوں دے گی۔ Hunyuan Video کے ساتھ، منافع کا مقصد براہ راست لائسنس میں بنایا گیا ہے - حالانکہ Tencent کے لیے یہ تعین کرنا مشکل ہو سکتا ہے کہ کمپنی کب منافع کی تقسیم کی اسکیم کو متحرک کرتی ہے۔
بہر حال، نتیجہ وہی ہے جو 2022 میں تھا: سرشار ترقیاتی کمیونٹیز فوری طور پر اور ریلیز کے ارد گرد شدید جوش کے ساتھ تشکیل پا چکی ہیں۔ یہ کوششیں اگلے 12 مہینوں میں لے جانے والی کچھ سڑکیں یقینی طور پر نئی سرخیوں کی طرف اشارہ کرنے والی ہیں۔
* اشاعت کے وقت تک 136 تک۔
پہلی بار منگل 7 جنوری 2025 کو شائع ہوا۔