कृत्रिम बुद्धिमत्ता

हुन्युआन वीडियो डीपफेक्स का उदय

Published January 7, 2025

Updated April 26, 2026

Martin Anderson

An Arnie Hunyuan Video LoRA demonstrated by Bob Doyle, on ComfyUI, on YouTube (https://www.youtube.com/watch?v=1D7B9g9rY68) – and, inset right, grabs from various sample videos for the same LoRA at Civit.ai

कुछ चर्चा की जा रही सामग्री की प्रकृति के कारण, इस लेख में सामान्य से कम संदर्भ लिंक और चित्र होंगे।

जनरेटिव एआई वीडियो मॉडल को वीडियो-आधारित LoRAs का उपयोग करके लोगों के समानता को पुन: उत्पन्न करने के लिए प्रशिक्षित करने के लिए जनरेटिव एआई संश्लेषण समुदाय में कुछ उल्लेखनीय हो रहा है, हालांकि इसका महत्व समझने में थोड़ा समय लग सकता है। शौकीन लोग टेंसेंट के हाल ही में जारी खुले स्रोत हुन्युआन वीडियो फ्रेमवर्क पर वीडियो-आधारित LoRAs का उपयोग करके जनरेटिव एआई वीडियो मॉडल को लोगों के समानता को पुन: उत्पन्न करने के लिए प्रशिक्षित कर रहे हैं।*

[वीडियो चौड़ाई=”1200″ ऊंचाई=”900″ mp4=”https://www.unite.ai/wp-content/uploads/2025/01/loras-hunyuan-AE2.mp4″ लूप=”true” ऑटोप्ले=”true”][/वीडियो]

प्ले करने के लिए क्लिक करें।सिविट समुदाय में स्वतंत्र रूप से उपलब्ध हुन्युआन-आधारित LoRA अनुकूलन से विविध परिणाम। समय स्थिरता के मुद्दों को कम करने के लिए, जो दो साल से एआई वीडियो पीढ़ी को प्रभावित कर रहे हैं, कम रैंक अनुकूलन मॉडल (LoRAs) को प्रशिक्षित करके काफी कम किया जा सकता है। स्रोत: civit.ai

उपरोक्त वीडियो में, अभिनेत्रियों नताली पोर्टमैन, क्रिस्टीना हेंड्रिक्स और स्कारलेट जोहानसन, साथ ही साथ टेक लीडर एलोन मस्क की समानता को हुन्युआन जनरेटिव वीडियो सिस्टम के लिए अपेक्षाकृत छोटे ऐड-ऑन फ़ाइलों में प्रशिक्षित किया गया है, जिसे सामग्री फिल्टर (जैसे एनएसएफडब्ल्यू फिल्टर) के बिना एक उपयोगकर्ता के कंप्यूटर पर स्थापित किया जा सकता है।

उपरोक्त में दिखाए गए क्रिस्टीना हेंड्रिक्स LoRA के निर्माता का कहना है कि मॉडल (जो कि 307mb डाउनलोड है) को विकसित करने के लिए मैड मेन टीवी शो से केवल 16 छवियों की आवश्यकता थी; रेडिट और डिस्कॉर्ड पर स्टेबल डिफ्यूजन समुदाय से कई पोस्ट इस बात की पुष्टि करते हैं कि इस तरह के LoRAs को अधिकांश मामलों में उच्च मात्रा में प्रशिक्षण डेटा या उच्च प्रशिक्षण समय की आवश्यकता नहीं होती है।

[वीडियो चौड़ाई=”1280″ ऊंचाई=”720″ mp4=”https://www.unite.ai/wp-content/uploads/2025/01/arnie_hunyuan-AE1.mp4″ लूप=”true” ऑटोप्ले=”true”][/वीडियो]

C्लिक करने के लिए क्लिक करें।आर्नोल्ड श्वार्ज़नेगर को एक हुन्युआन वीडियो LoRA में जीवन दिया गया है जिसे सिविट पर डाउनलोड किया जा सकता है। आगे के अर्नी उदाहरणों के लिए, एआई उत्साही बॉब डॉयल से https://www.youtube.com/watch?v=1D7B9g9rY68 देखें।

हुन्युआन LoRAs को स्थिर छवियों या वीडियो पर प्रशिक्षित किया जा सकता है, हालांकि वीडियो पर प्रशिक्षण अधिक हार्डवेयर संसाधनों और बढ़े हुए प्रशिक्षण समय की आवश्यकता होती है।

हुन्युआन वीडियो मॉडल में 13 अरब पैरामीटर हैं, जो सोरा के 12 अरब पैरामीटर से अधिक है, और गर्मियों में 2024 में खुले स्रोत में जारी किए गए हुन्युआन-डीआईटी मॉडल से बहुत अधिक है, जिसमें केवल 1.5 अरब पैरामीटर हैं।

जैसा कि दो साल से अधिक समय पहले स्टेबल डिफ्यूजन और LoRA (स्टेबल डिफ्यूजन 1.5 के ‘मूल’ सेलिब्रिटी के उदाहरण यहां देखें) के साथ हुआ था, संबंधित आधार मॉडल में सेलिब्रिटी व्यक्तित्वों की तुलना में बहुत अधिक सीमित समझ है, जो ‘आईडी-इंजेक्टेड’ LoRA कार्यान्वयन के माध्यम से प्राप्त की जा सकती है। विश्वासघात।

प्रभावी रूप से, एक अनुकूलित, व्यक्तित्व-केंद्रित LoRA आधार हुन्युआन मॉडल की महत्वपूर्ण संश्लेषण क्षमताओं पर एक ‘मुफ्त सवारी’ प्राप्त करता है, जो 2017-युग ऑटोएनकोडर डीपफेक्स या सिस्टम जैसे लाइवपोर्ट्रेट के माध्यम से स्थिर छवियों में गति जोड़ने की कोशिश करने से प्राप्त की जा सकने वाली तुलना में एक उल्लेखनीय रूप से अधिक प्रभावी मानव संश्लेषण प्रदान करता है। सिस्टम।

यहां दिखाए गए सभी LoRAs को सिविट समुदाय से मुफ्त में डाउनलोड किया जा सकता है, जबकि अधिक पुराने कस्टम-निर्मित ‘स्थिर-छवि’ LoRAs को भी संभावित रूप से ‘बीज’ छवियों के रूप में वीडियो निर्माण प्रक्रिया (अर्थात, छवि-से-वीडियो, हुन्युआन वीडियो के लिए एक प्रतीक्षित रिलीज़, हालांकि वर्कअराउंड संभव हैं, अभी के लिए) के लिए बनाया जा सकता है।

[वीडियो चौड़ाई=”1200″ ऊंचाई=”900″ mp4=”https://www.unite.ai/wp-content/uploads/2025/01/swift-flat-Lora-AE.mp4″ लूप=”true” ऑटोप्ले=”true”][/वीडियो]

प्ले करने के लिए क्लिक करें।उपरोक्त, एक ‘स्थिर’ फ्लक्स LoRA के नमूने; नीचे, संगीतकार टेलर स्विफ्ट के साथ एक हुन्युआन वीडियो LoRA के उदाहरण। दोनों LoRAs सिविट समुदाय में मुफ्त में उपलब्ध हैं।

जैसा कि मैं लिखता हूं, सिविट वेबसाइट ‘हुन्युआन’ के लिए 128 खोज परिणाम प्रदान करती है। * इनमें से लगभग सभी किसी न किसी तरह से एनएसएफडब्ल्यू मॉडल हैं; 22 सेलिब्रिटी को दर्शाते हैं; 18 को हार्डकोर पोर्नोग्राफी के उत्पादन को सुविधाजनक बनाने के लिए डिज़ाइन किया गया है; और केवल सात पुरुषों को महिलाओं के बजाय दर्शाते हैं।

तो क्या नया है?

डीपफेक की विकसित प्रकृति के कारण, और जनरेटिव एआई वीडियो संश्लेषण फ्रेमवर्क की सीमाओं की सीमित सार्वजनिक समझ के कारण, हुन्युआन LoRA का महत्व एक व्यक्ति के लिए जो जनरेटिव एआई दृश्य का अनुसरण कर रहा है, समझना मुश्किल नहीं है। आइए कुछ प्रमुख अंतरों की समीक्षा करें जनरेटिव एआई वीडियो पीढ़ी के पिछले दृष्टिकोण और हुन्युआन LoRAs के बीच।

1: बिना रोक-टोक स्थानीय स्थापना

हुन्युआन वीडियो का सबसे महत्वपूर्ण पहलू यह है कि यह स्थानीय रूप से डाउनलोड किया जा सकता है, और यह एक बहुत ही शक्तिशाली और अनसेंसर्ड एआई वीडियो पीढ़ी प्रणाली को आकस्मिक उपयोगकर्ता के हाथों में रखता है, साथ ही साथ वीएफएक्स समुदाय (जैसा कि लाइसेंस भौगोलिक क्षेत्रों में अनुमति दे सकते हैं) के लिए भी।

पिछली बार ऐसा हुआ था जब स्टेबिलिटी.एआई स्टेबल डिफ्यूजन मॉडल 2022 की गर्मियों में खुले स्रोत में जारी किया गया था। उस समय, ओपनएआई के डीएलएल-ई2 ने सार्वजनिक कल्पना को पकड़ लिया था, हालांकि डीएलएल-ई2 एक भुगतान सेवा थी जिसमें उल्लेखनीय प्रतिबंध थे (जो समय के साथ बढ़ गए)।

जब स्टेबल डिफ्यूजन उपलब्ध हो गया, और लो-रैंक एडैप्टेशन ने यह संभव बना दिया कि किसी भी व्यक्ति (सेलिब्रिटी या नहीं) की पहचान की छवियों का उत्पादन किया जा सके, तो स्टेबल डिफ्यूजन को विकसित करने और उपभोक्ता हित का एक बड़ा केंद्र मददगार साबित हुआ, जिसने डीएलएल-ई2 की लोकप्रियता को पार कर लिया; हालांकि बाद में यह एक अधिक क्षमता वाला सिस्टम था, इसके सेंसरशिप दिनचर्या को कई उपयोगकर्ताओं द्वारा कठोर माना जाता था, और अनुकूलन संभव नहीं था।

संभावित रूप से, यही परिदृश्य अब सोरा और हुन्युआन – या अधिक सटीक रूप से, सोरा-ग्रेड प्रोप्राइटरी जनरेटिव वीडियो सिस्टम, और ओपन सोर्स प्रतिद्वंद्वियों के बीच लागू होता है, जिनमें से हुन्युआन पहला है – लेकिन शायद आखिरी नहीं (यहां, फ्लक्स पर विचार करें जो अंततः स्टेबल डिफ्यूजन पर महत्वपूर्ण जमीन हासिल करेगा)।

जो उपयोगकर्ता हुन्युआन LoRA आउटपुट बनाना चाहते हैं, लेकिन जो प्रभावी रूप से बीफी उपकरण की कमी है, वे हमेशा की तरह, प्रशिक्षण के जीपीयू पहलू को जैसे ऑनलाइन कंप्यूट सेवाओं पर ऑफलोड कर सकते हैं। यह कैबेर या क्लिंग जैसे प्लेटफार्मों पर एआई वीडियो बनाने जैसा नहीं है, क्योंकि स्थानीय कार्य प्रवाह का समर्थन करने के लिए एक ऑनलाइन जीपीयू किराए पर लेने में कोई सेमेंटिक या छवि-आधारित फिल्टरिंग (सेंसरशिप) शामिल नहीं है।

2: ‘होस्ट’ वीडियो और उच्च प्रयास की आवश्यकता नहीं

जब डीपफेक्स 2017 के अंत में दृश्य पर उतरे, तो अनाम रूप से पोस्ट किए गए कोड में मुख्यधारा डीपफेसलैब और फेसस्वैप (साथ ही डीपफेसलाइव रियल-टाइम डीपफेकिंग सिस्टम) में विकसित हो गए।

इस विधि में प्रत्येक पहचान को स्वैप करने के लिए हजारों चेहरे की छवियों का सावधानीपूर्वक क्यूरेशन की आवश्यकता थी; इस चरण में डाले गए प्रयास जितने कम होंगे, मॉडल उतना ही कम प्रभावी होगा। इसके अलावा, प्रशिक्षण समय उपलब्ध हार्डवेयर के आधार पर 2-14 दिनों के बीच भिन्न होता था, जो लंबे समय में भी क्षमता वाले सिस्टम पर जोर देता था।

जब मॉडल अंततः तैयार हो गया, तो यह केवल मौजूदा वीडियो में चेहरे डाल सकता था, और आमतौर पर एक ‘लक्ष्य’ (अर्थात, वास्तविक) पहचान की आवश्यकता थी जो सुपरइम्पोज्ड पहचान के समान दिखती थी।

हाल ही में, रूप, लाइवपोर्ट्रेट और कई समान फ्रेमवर्क ने कम प्रयास के साथ समान कार्यक्षमता प्रदान की है, और अक्सर बेहतर परिणामों के साथ – लेकिन चेहरे के अलावा किसी अन्य तत्व के लिए सटीक पूर्ण-शरीर डीपफेक्स उत्पन्न करने की क्षमता के बिना।

बॉब डॉयल के यूट्यूब पर सामग्री स्ट्रीम से रूप अनलीश्ड और लाइवपोर्ट्रेट (निचले बाएं सेट) के उदाहरण। स्रोत: https://www.youtube.com/watch?v=i39xeYPBAAM और https://www.youtube.com/watch?v=QGatEItg2Ns

हुन्युआन LoRAs (और इसी तरह की प्रणाली जो निश्चित रूप से इसका अनुसरण करेंगी) पूरे दुनिया के निर्माण के लिए अनुमति देते हैं, जिसमें पूर्ण-शरीर सिमुलेशन शामिल है जो उपयोगकर्ता-प्रशिक्षित LoRA पहचान का हिस्सा है।

3: बहुत सुधारित समय स्थिरता

समय स्थिरता जनरेटिव वीडियो के लिए होली ग्रेल रही है। एक LoRA का उपयोग, साथ ही साथ उपयुक्त प्रॉम्प्ट, हुन्युआन वीडियो पीढ़ी को एक स्थिर पहचान संदर्भ प्रदान करता है जिसका पालन करना है। सिद्धांत रूप में, एक विशिष्ट पहचान की कई LoRAs को प्रशिक्षित किया जा सकता है, प्रत्येक विशिष्ट कपड़े पहने हुए।

इन परिस्थितियों में, कपड़े भी वीडियो पीढ़ी के दौरान ‘म्यूटेट’ होने की संभावना कम होती है (क्योंकि जनरेटिव सिस्टम पिछले फ्रेम की एक बहुत ही सीमित खिड़की पर आधारित अगले फ्रेम का आधार बनाता है)।

(वैकल्पिक रूप से, जैसा कि छवि-आधारित LoRA सिस्टम के साथ होता है, एक ही वीडियो पीढ़ी में कई LoRAs, जैसे पहचान + पोशाक LoRAs, लागू किया जा सकता है)

4: ‘मानव प्रयोग’ तक पहुंच

जैसा कि मैंने हाल ही में देखा, प्रोप्राइटरी और एफएएएनजी स्तर के जनरेटिव एआई क्षेत्र अब इतना सावधान हो गया है कि इसकी परियोजनाओं की मानव संश्लेषण क्षमताओं से संबंधित संभावित आलोचना के बारे में, वास्तविक लोग शायद ही कभी प्रमुख घोषणाओं और रिलीज़ के लिए परियोजना पृष्ठों में दिखाई देते हैं।

हुन्युआन LoRAs के आगमन के साथ, पहली बार, समुदाय को LDM-आधारित मानव वीडियो संश्लेषण की सीमाओं को एक अत्यधिक क्षमता वाले (न कि हाशिए पर) सिस्टम में धक्का देने और पूरी तरह से उस विषय का अन्वेषण करने का अवसर मिलता है जो अधिकांश लोगों को सबसे ज्यादा आकर्षित करता है – लोग।

निहितार्थ

चूंकि सिविट समुदाय में ‘हुन्युआन’ के लिए खोज परिणाम मुख्य रूप से सेलिब्रिटी LoRAs और ‘हार्डकोर’ LoRAs दिखाते हैं, हुन्युआन LoRAs के आगमन का केंद्रीय निहितार्थ यह है कि वे वास्तविक लोगों – सेलिब्रिटी और अज्ञात लोगों दोनों की – एआई पोर्नोग्राफिक (या अन्य अपमानजनक) वीडियो बनाने के लिए उपयोग किए जाएंगे।

अनुपालन उद्देश्यों के लिए, जो शौकीन हुन्युआन LoRAs बनाते हैं और विभिन्न डिस्कॉर्ड सर्वर पर प्रयोग करते हैं, वे वास्तविक लोगों की छवियों को पोस्ट करने से सावधान रहते हैं। वास्तविकता यह है कि यहां तक कि छवि-आधारित डीपफेक्स अब गंभीर रूप से हथियारबंद हैं; और वास्तविक वीडियो जोड़ने का प्रस्ताव मिश्रित मीडिया में पिछले सात वर्षों से लगातार भय पैदा करता है, जिसने नए नियम को प्रेरित किया है।

चालक बल

जैसा कि हमेशा, पोर्न प्रगति के लिए इंजन बना हुआ है प्रौद्योगिकी। जो भी हमारी राय इस तरह के उपयोग के बारे में हो, यह दृढ़ इंजन प्रगति में आगे बढ़ने के लिए प्रेरित करता है जो अंततः अधिक मुख्यधारा को अपना सकता है।

इस मामले में, संभावित मूल्य सामान्य से अधिक हो सकता है, क्योंकि हाइपर-वास्तविक वीडियो निर्माण का खुला स्रोत स्पष्ट रूप से आपराधिक, राजनीतिक और नैतिक दुरुपयोग के लिए निहितार्थ रखता है।

एक रेडिट समूह (जिसे मैं यहां नाम नहीं दूंगा) जो एआई द्वारा एनएसएफडब्ल्यू वीडियो सामग्री के निर्माण के लिए समर्पित है, में एक खुला डिस्कॉर्ड सर्वर है जहां उपयोगकर्ता हुन्युआन-आधारित वीडियो पोर्न निर्माण के लिए कम्फ्यूआई कार्य प्रवाह को परिष्कृत कर रहे हैं।

यह समुदाय एक महत्वपूर्ण और विकसित गिटहब रिपॉजिटरी भी बनाए रखता है जिसमें पोर्नोग्राफिक वीडियो डाउनलोड और प्रोसेस करने के लिए उपकरण हैं, ताकि नए मॉडलों के लिए प्रशिक्षण डेटा प्रदान किया जा सके।

चूंकि सबसे लोकप्रिय LoRA प्रशिक्षक, कोह्या-एसएस, अब हुन्युआन LoRA प्रशिक्षण का समर्थन करता है, हुन्युआन वीडियो प्रशिक्षण और वीडियो पीढ़ी के लिए बाधाएं दैनिक रूप से कम हो रही हैं, साथ ही साथ हुन्युआन प्रशिक्षण के लिए हार्डवेयर आवश्यकताएं।

पोर्न-आधारित एआई (सेलिब्रिटी जैसे पहचान-आधारित मॉडल के बजाय) के लिए समर्पित प्रशिक्षण योजनाओं का महत्वपूर्ण पहलू यह है कि एक मानक फाउंडेशन मॉडल जैसे हुन्युआन विशेष रूप से एनएसएफडब्ल्यू आउटपुट पर प्रशिक्षित नहीं है, और इसलिए या तो एनएसएफडब्ल्यू सामग्री का उत्पादन करने में खराब प्रदर्शन कर सकता है, या सीखे गए अवधारणाओं और संघों को एक प्रदर्शनी या समझदार तरीके से विघटित करने में विफल हो सकता है।

एनएसएफडब्ल्यू फाउंडेशन मॉडल और LoRAs को परिष्कृत करके, यह बढ़ती तरह से संभव होगा कि प्रशिक्षित पहचान को एक समर्पित ‘पोर्न’ वीडियो डोमेन में प्रोजेक्ट किया जाए; आखिरकार, यह छवियों के लिए हो चुका है पिछले दो और एक आधे वर्षों में क्या हुआ।

वीएफएक्स

हुन्युआन वीडियो LoRAs द्वारा प्रदान की गई समय स्थिरता में बड़ी वृद्धि एआई विजुअल इफेक्ट्स उद्योग के लिए एक स्पष्ट वरदान है, जो खुले स्रोत सॉफ्टवेयर को अनुकूलित करने पर बहुत अधिक निर्भर करता है।

हालांकि एक हुन्युआन वीडियो LoRA दृष्टिकोण पूरे फ्रेम और पर्यावरण का उत्पादन करता है, वीएफएक्स कंपनियां निश्चित रूप से इस विधि द्वारा प्राप्त किए जा सकने वाले समय-स्थिर मानव चेहरे को अलग करने के लिए प्रयोग करना शुरू कर दिया होगा, ताकि उन्हें वास्तविक दुनिया के स्रोत फुटेज में सुपरइम्पोज़ या एकीकृत किया जा सके।

शौकीन समुदाय की तरह, वीएफएक्स कंपनियों को हुन्युआन वीडियो की छवि-से-वीडियो और वीडियो-से-वीडियो कार्यक्षमता की प्रतीक्षा करनी होगी, जो शायद LoRA-चालित, आईडी-आधारित ‘डीपफेक’ सामग्री के बीच सबसे उपयोगी पुल है; या फिर उन्हें सुधार करना होगा और हुन्युआन वीडियो फ्रेमवर्क और संभावित अनुकूलन की बाहरी क्षमताओं का पता लगाने के लिए अंतराल का उपयोग करना होगा, और यहां तक कि हुन्युआन वीडियो के प्रोप्राइटरी इन-हाउस फोर्क्स का भी पता लगाना होगा।

हालांकि हुन्युआन वीडियो के लाइसेंस शर्तें तकनीकी रूप से वास्तविक व्यक्तियों के चित्रण की अनुमति देती हैं, बशर्ते अनुमति दी जाए, वे इसका उपयोग यूरोपीय संघ, यूनाइटेड किंगडम और दक्षिण कोरिया में निषिद्ध करती हैं। ‘स्टेज पर रहता है’ सिद्धांत पर, यह आवश्यक नहीं है कि हुन्युआन वीडियो का उपयोग इन क्षेत्रों में नहीं किया जाएगा; हालांकि, बाहरी डेटा ऑडिट की संभावना, जेनरेटिव एआई के आसपास बढ़ते नियमन को लागू करने के लिए, ऐसे अवैध उपयोग को जोखिम भरा बना सकती है।

लाइसेंस शर्तों का एक और संभावित रूप से अस्पष्ट क्षेत्र यह कहता है:

‘यदि टेंसेंट हुन्युआन संस्करण रिलीज़ की तारीख पर, लाइसेंसधारी द्वारा उपलब्ध कराई गई सभी उत्पादों या सेवाओं के मासिक सक्रिय उपयोगकर्ता पिछले कैलेंडर माह में 100 मिलियन से अधिक मासिक सक्रिय उपयोगकर्ता हैं, तो आपको टेंसेंट से लाइसेंस का अनुरोध करना होगा, जिसे टेंसेंट अपने विवेकानुसार आपको प्रदान कर सकता है, और आप तब तक इस समझौते के तहत अधिकारों का प्रयोग करने के लिए अधिकृत नहीं हैं जब तक कि टेंसेंट आपको ऐसे अधिकार व्यक्तически नहीं देता।’

यह खंड स्पष्ट रूप से उन कंपनियों के लिए लक्षित है जो हुन्युआन वीडियो को एक अपेक्षाकृत प्रौद्योगिकी-अज्ञानी उपयोगकर्ता निकाय के लिए मध्यस्थ बनाने जा रहे हैं, और जिन्हें एक निश्चित उपयोगकर्ता सीमा से ऊपर जाने पर टेंसेंट में कटौती करनी होगी।

यह क्या निर्धारित करेगा कि क्या व्यापक शब्दावली अप्रत्यक्ष उपयोग (यानी, हुन्युआन-सक्षम विजुअल इफेक्ट्स आउटपुट को लोकप्रिय फिल्मों और टीवी शो में प्रावधान के माध्यम से) को भी कवर कर सकती है, निर्धारित करने के लिए स्पष्टीकरण की आवश्यकता हो सकती है।

निष्कर्ष

चूंकि डीपफेक वीडियो का अस्तित्व लंबे समय से है, यह हुन्युआन वीडियो LoRA के महत्व को कम आंकना आसान हो सकता है, और मान लेना कि सिविट समुदाय, संबंधित डिस्कॉर्ड और सबरेडिट पर वर्तमान में प्रकट हो रहे प्रयास वास्तविक मानव वीडियो संश्लेषण की ओर एक छोटी सी प्रगति का प्रतिनिधित्व करते हैं।

अधिक संभावना यह है कि वर्तमान प्रयास हुन्युआन वीडियो की क्षमता का केवल एक अंश हैं जो पूरी तरह से आश्वस्त पूर्ण-शरीर और पूर्ण-पर्यावरण डीपफेक्स बना सकता है; एक बार छवि-से-वीडियो घटक जारी हो जाने के बाद (इस महीने होने की अफवाह है), एक बहुत ही विस्तृत स्तर की जनरेटिव शक्ति होबी और पेशेवर समुदाय दोनों के लिए उपलब्ध हो जाएगी।

जब स्टेबिलिटी.एआई ने 2022 में स्टेबल डिफ्यूजन जारी किया, तो कई पर्यवेक्षक यह निर्धारित नहीं कर सकते थे कि कंपनी इतनी शक्तिशाली और मूल्यवान जनरेटिव सिस्टम क्यों दे रही थी। हुन्युआन वीडियो के साथ, लाभ प्रेरणा सीधे लाइसेंस में निर्मित होती है – हालांकि यह साबित हो सकता है कि टेंसेंट के लिए यह निर्धारित करना मुश्किल है कि कंपनी लाभ साझा करने की योजना को ट्रिगर करती है।

किसी भी मामले में, परिणाम वही है जो 2022 में था: समर्पित विकास समुदाय तुरंत और तीव्र उत्साह के साथ खुले स्रोत जारी के आसपास बने हैं। जो सड़कें इन प्रयासों को अगले 12 महीनों में ले जाएंगी, वे निश्चित रूप से नए शीर्षकलेख को प्रेरित करने वाले हैं।

* प्रकाशन के समय 136 तक।

मंगलवार, 7 जनवरी, 2025 को पहली बार प्रकाशित

Martin Anderson

मशीन लर्निंग पर लेखक, मानव इमेज सिंथेसिस में डोमेन विशेषज्ञ। मेटाफिजिक.एआई में अनुसंधान सामग्री के पूर्व प्रमुख।
व्यक्तिगत साइट: martinanderson.ai
संपर्क: [email protected]
ट्विटर: @manders_ai