Connect with us

рд╣реБрдиреНрдпреБрдЖрди рд╡реАрдбрд┐рдпреЛ рдбреАрдкрдлреЗрдХреНрд╕ рдХрд╛ рдЙрджрдп

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рд╣реБрдиреНрдпреБрдЖрди рд╡реАрдбрд┐рдпреЛ рдбреАрдкрдлреЗрдХреНрд╕ рдХрд╛ рдЙрджрдп

mm
An Arnie Hunyuan Video LoRA demonstrated by Bob Doyle, on ComfyUI, on YouTube (https://www.youtube.com/watch?v=1D7B9g9rY68) тАУ and, inset right, grabs from various sample videos for the same LoRA at Civit.ai

कुछ चर्चा की जा रही सामग्री की प्रकृति के कारण, इस लेख में सामान्य से कम संदर्भ लिंक और चित्र होंगे।

जनरेटिव एआई वीडियो मॉडल को वीडियो-आधारित LoRAs का उपयोग करके लोगों के समानता को पुन: उत्पन्न करने के लिए प्रशिक्षित करने के लिए जनरेटिव एआई संश्लेषण समुदाय में कुछ उल्लेखनीय हो रहा है, हालांकि इसका महत्व समझने में थोड़ा समय लग सकता है। शौकीन लोग टेंसेंट के हाल ही में जारी खुले स्रोत हुन्युआन वीडियो फ्रेमवर्क पर वीडियो-आधारित LoRAs का उपयोग करके जनरेटिव एआई वीडियो मॉडल को लोगों के समानता को पुन: उत्पन्न करने के लिए प्रशिक्षित कर रहे हैं।*

[वीडियो चौड़ाई=”1200″ ऊंचाई=”900″ mp4=”https://www.unite.ai/wp-content/uploads/2025/01/loras-hunyuan-AE2.mp4″ लूप=”true” ऑटोप्ले=”true”][/वीडियो]

प्ले करने के लिए क्लिक करें।सिविट समुदाय में स्वतंत्र रूप से उपलब्ध हुन्युआन-आधारित LoRA अनुकूलन से विविध परिणाम। समय स्थिरता के मुद्दों को कम करने के लिए, जो दो साल से एआई वीडियो पीढ़ी को प्रभावित कर रहे हैं, कम रैंक अनुकूलन मॉडल (LoRAs) को प्रशिक्षित करके काफी कम किया जा सकता है। स्रोत: civit.ai

उपरोक्त वीडियो में, अभिनेत्रियों नताली पोर्टमैन, क्रिस्टीना हेंड्रिक्स और स्कारलेट जोहानसन, साथ ही साथ टेक लीडर एलोन मस्क की समानता को हुन्युआन जनरेटिव वीडियो सिस्टम के लिए अपेक्षाकृत छोटे ऐड-ऑन फ़ाइलों में प्रशिक्षित किया गया है, जिसे सामग्री फिल्टर (जैसे एनएसएफडब्ल्यू फिल्टर) के बिना एक उपयोगकर्ता के कंप्यूटर पर स्थापित किया जा सकता है।

उपरोक्त में दिखाए गए क्रिस्टीना हेंड्रिक्स LoRA के निर्माता का कहना है कि मॉडल (जो कि 307mb डाउनलोड है) को विकसित करने के लिए मैड मेन टीवी शो से केवल 16 छवियों की आवश्यकता थी; रेडिट और डिस्कॉर्ड पर स्टेबल डिफ्यूजन समुदाय से कई पोस्ट इस बात की पुष्टि करते हैं कि इस तरह के LoRAs को अधिकांश मामलों में उच्च मात्रा में प्रशिक्षण डेटा या उच्च प्रशिक्षण समय की आवश्यकता नहीं होती है।

[वीडियो चौड़ाई=”1280″ ऊंचाई=”720″ mp4=”https://www.unite.ai/wp-content/uploads/2025/01/arnie_hunyuan-AE1.mp4″ लूप=”true” ऑटोप्ले=”true”][/वीडियो]

C्लिक करने के लिए क्लिक करें।आर्नोल्ड श्वार्ज़नेगर को एक हुन्युआन वीडियो LoRA में जीवन दिया गया है जिसे सिविट पर डाउनलोड किया जा सकता है। आगे के अर्नी उदाहरणों के लिए, एआई उत्साही बॉब डॉयल से https://www.youtube.com/watch?v=1D7B9g9rY68 देखें।

हुन्युआन LoRAs को स्थिर छवियों या वीडियो पर प्रशिक्षित किया जा सकता है, हालांकि वीडियो पर प्रशिक्षण अधिक हार्डवेयर संसाधनों और बढ़े हुए प्रशिक्षण समय की आवश्यकता होती है।

हुन्युआन वीडियो मॉडल में 13 अरब पैरामीटर हैं, जो सोरा के 12 अरब पैरामीटर से अधिक है, और गर्मियों में 2024 में खुले स्रोत में जारी किए गए हुन्युआन-डीआईटी मॉडल से बहुत अधिक है, जिसमें केवल 1.5 अरब पैरामीटर हैं।

जैसा कि दो साल से अधिक समय पहले स्टेबल डिफ्यूजन और LoRA (स्टेबल डिफ्यूजन 1.5 के ‘मूल’ सेलिब्रिटी के उदाहरण यहां देखें) के साथ हुआ था, संबंधित आधार मॉडल में सेलिब्रिटी व्यक्तित्वों की तुलना में बहुत अधिक सीमित समझ है, जो ‘आईडी-इंजेक्टेड’ LoRA कार्यान्वयन के माध्यम से प्राप्त की जा सकती है। विश्वासघात।

प्रभावी रूप से, एक अनुकूलित, व्यक्तित्व-केंद्रित LoRA आधार हुन्युआन मॉडल की महत्वपूर्ण संश्लेषण क्षमताओं पर एक ‘मुफ्त सवारी’ प्राप्त करता है, जो 2017-युग ऑटोएनकोडर डीपफेक्स या सिस्टम जैसे लाइवपोर्ट्रेट के माध्यम से स्थिर छवियों में गति जोड़ने की कोशिश करने से प्राप्त की जा सकने वाली तुलना में एक उल्लेखनीय रूप से अधिक प्रभावी मानव संश्लेषण प्रदान करता है। सिस्टम।

यहां दिखाए गए सभी LoRAs को सिविट समुदाय से मुफ्त में डाउनलोड किया जा सकता है, जबकि अधिक पुराने कस्टम-निर्मित ‘स्थिर-छवि’ LoRAs को भी संभावित रूप से ‘बीज’ छवियों के रूप में वीडियो निर्माण प्रक्रिया (अर्थात, छवि-से-वीडियो, हुन्युआन वीडियो के लिए एक प्रतीक्षित रिलीज़, हालांकि वर्कअराउंड संभव हैं, अभी के लिए) के लिए बनाया जा सकता है।

[वीडियो चौड़ाई=”1200″ ऊंचाई=”900″ mp4=”https://www.unite.ai/wp-content/uploads/2025/01/swift-flat-Lora-AE.mp4″ लूप=”true” ऑटोप्ले=”true”][/वीडियो]

प्ले करने के लिए क्लिक करें।उपरोक्त, एक ‘स्थिर’ फ्लक्स LoRA के नमूने; नीचे, संगीतकार टेलर स्विफ्ट के साथ एक हुन्युआन वीडियो LoRA के उदाहरण। दोनों LoRAs सिविट समुदाय में मुफ्त में उपलब्ध हैं।

जैसा कि मैं लिखता हूं, सिविट वेबसाइट ‘हुन्युआन’ के लिए 128 खोज परिणाम प्रदान करती है। * इनमें से लगभग सभी किसी न किसी तरह से एनएसएफडब्ल्यू मॉडल हैं; 22 सेलिब्रिटी को दर्शाते हैं; 18 को हार्डकोर पोर्नोग्राफी के उत्पादन को सुविधाजनक बनाने के लिए डिज़ाइन किया गया है; और केवल सात पुरुषों को महिलाओं के बजाय दर्शाते हैं।

तो क्या नया है?

डीपफेक की विकसित प्रकृति के कारण, और जनरेटिव एआई वीडियो संश्लेषण फ्रेमवर्क की सीमाओं की सीमित सार्वजनिक समझ के कारण, हुन्युआन LoRA का महत्व एक व्यक्ति के लिए जो जनरेटिव एआई दृश्य का अनुसरण कर रहा है, समझना मुश्किल नहीं है। आइए कुछ प्रमुख अंतरों की समीक्षा करें जनरेटिव एआई वीडियो पीढ़ी के पिछले दृष्टिकोण और हुन्युआन LoRAs के बीच।

1: बिना रोक-टोक स्थानीय स्थापना

हुन्युआन वीडियो का सबसे महत्वपूर्ण पहलू यह है कि यह स्थानीय रूप से डाउनलोड किया जा सकता है, और यह एक बहुत ही शक्तिशाली और अनसेंसर्ड एआई वीडियो पीढ़ी प्रणाली को आकस्मिक उपयोगकर्ता के हाथों में रखता है, साथ ही साथ वीएफएक्स समुदाय (जैसा कि लाइसेंस भौगोलिक क्षेत्रों में अनुमति दे सकते हैं) के लिए भी।

पिछली बार ऐसा हुआ था जब स्टेबिलिटी.एआई स्टेबल डिफ्यूजन मॉडल 2022 की गर्मियों में खुले स्रोत में जारी किया गया था। उस समय, ओपनएआई के डीएलएल-ई2 ने सार्वजनिक कल्पना को पकड़ लिया था, हालांकि डीएलएल-ई2 एक भुगतान सेवा थी जिसमें उल्लेखनीय प्रतिबंध थे (जो समय के साथ बढ़ गए)।

जब स्टेबल डिफ्यूजन उपलब्ध हो गया, और लो-रैंक एडैप्टेशन ने यह संभव बना दिया कि किसी भी व्यक्ति (सेलिब्रिटी या नहीं) की पहचान की छवियों का उत्पादन किया जा सके, तो स्टेबल डिफ्यूजन को विकसित करने और उपभोक्ता हित का एक बड़ा केंद्र मददगार साबित हुआ, जिसने डीएलएल-ई2 की लोकप्रियता को पार कर लिया; हालांकि बाद में यह एक अधिक क्षमता वाला सिस्टम था, इसके सेंसरशिप दिनचर्या को कई उपयोगकर्ताओं द्वारा कठोर माना जाता था, और अनुकूलन संभव नहीं था।

संभावित रूप से, यही परिदृश्य अब सोरा और हुन्युआन – या अधिक सटीक रूप से, सोरा-ग्रेड प्रोप्राइटरी जनरेटिव वीडियो सिस्टम, और ओपन सोर्स प्रतिद्वंद्वियों के बीच लागू होता है, जिनमें से हुन्युआन पहला है – लेकिन शायद आखिरी नहीं (यहां, फ्लक्स पर विचार करें जो अंततः स्टेबल डिफ्यूजन पर महत्वपूर्ण जमीन हासिल करेगा)।

जो उपयोगकर्ता हुन्युआन LoRA आउटपुट बनाना चाहते हैं, लेकिन जो प्रभावी रूप से बीफी उपकरण की कमी है, वे हमेशा की तरह, प्रशिक्षण के जीपीयू पहलू को जैसे ऑनलाइन कंप्यूट सेवाओं पर ऑफलोड कर सकते हैं। यह कैबेर या क्लिंग जैसे प्लेटफार्मों पर एआई वीडियो बनाने जैसा नहीं है, क्योंकि स्थानीय कार्य प्रवाह का समर्थन करने के लिए एक ऑनलाइन जीपीयू किराए पर लेने में कोई सेमेंटिक या छवि-आधारित फिल्टरिंग (सेंसरशिप) शामिल नहीं है।

2: ‘होस्ट’ वीडियो और उच्च प्रयास की आवश्यकता नहीं

जब डीपफेक्स 2017 के अंत में दृश्य पर उतरे, तो अनाम रूप से पोस्ट किए गए कोड में मुख्यधारा डीपफेसलैब और फेसस्वैप (साथ ही डीपफेसलाइव रियल-टाइम डीपफेकिंग सिस्टम) में विकसित हो गए।

इस विधि में प्रत्येक पहचान को स्वैप करने के लिए हजारों चेहरे की छवियों का सावधानीपूर्वक क्यूरेशन की आवश्यकता थी; इस चरण में डाले गए प्रयास जितने कम होंगे, मॉडल उतना ही कम प्रभावी होगा। इसके अलावा, प्रशिक्षण समय उपलब्ध हार्डवेयर के आधार पर 2-14 दिनों के बीच भिन्न होता था, जो लंबे समय में भी क्षमता वाले सिस्टम पर जोर देता था।

जब मॉडल अंततः तैयार हो गया, तो यह केवल मौजूदा वीडियो में चेहरे डाल सकता था, और आमतौर पर एक ‘लक्ष्य’ (अर्थात, वास्तविक) पहचान की आवश्यकता थी जो सुपरइम्पोज्ड पहचान के समान दिखती थी।

हाल ही में, रूप, लाइवपोर्ट्रेट और कई समान फ्रेमवर्क ने कम प्रयास के साथ समान कार्यक्षमता प्रदान की है, और अक्सर बेहतर परिणामों के साथ – लेकिन चेहरे के अलावा किसी अन्य तत्व के लिए सटीक पूर्ण-शरीर डीपफेक्स उत्पन्न करने की क्षमता के बिना।

рдмреЙрдм рдбреЙрдпрд▓ рдХреЗ рдпреВрдЯреНрдпреВрдм рдкрд░ рд╕рд╛рдордЧреНрд░реА рд╕реНрдЯреНрд░реАрдо рд╕реЗ рд░реВрдк рдЕрдирд▓реАрд╢реНрдб рдФрд░ рд▓рд╛рдЗрд╡рдкреЛрд░реНрдЯреНрд░реЗрдЯ (рдирд┐рдЪрд▓реЗ рдмрд╛рдПрдВ рд╕реЗрдЯ) рдХреЗ рдЙрджрд╛рд╣рд░рдгред рд╕реНрд░реЛрдд: https://www.youtube.com/watch?v=i39xeYPBAAM рдФрд░ https://www.youtube.com/watch?v=QGatEItg2Ns

बॉब डॉयल के यूट्यूब पर सामग्री स्ट्रीम से रूप अनलीश्ड और लाइवपोर्ट्रेट (निचले बाएं सेट) के उदाहरण। स्रोत: https://www.youtube.com/watch?v=i39xeYPBAAM और https://www.youtube.com/watch?v=QGatEItg2Ns

हुन्युआन LoRAs (और इसी तरह की प्रणाली जो निश्चित रूप से इसका अनुसरण करेंगी) पूरे दुनिया के निर्माण के लिए अनुमति देते हैं, जिसमें पूर्ण-शरीर सिमुलेशन शामिल है जो उपयोगकर्ता-प्रशिक्षित LoRA पहचान का हिस्सा है।

3: बहुत सुधारित समय स्थिरता

समय स्थिरता जनरेटिव वीडियो के लिए होली ग्रेल रही है। एक LoRA का उपयोग, साथ ही साथ उपयुक्त प्रॉम्प्ट, हुन्युआन वीडियो पीढ़ी को एक स्थिर पहचान संदर्भ प्रदान करता है जिसका पालन करना है। सिद्धांत रूप में, एक विशिष्ट पहचान की कई LoRAs को प्रशिक्षित किया जा सकता है, प्रत्येक विशिष्ट कपड़े पहने हुए।

इन परिस्थितियों में, कपड़े भी वीडियो पीढ़ी के दौरान ‘म्यूटेट’ होने की संभावना कम होती है (क्योंकि जनरेटिव सिस्टम पिछले फ्रेम की एक बहुत ही सीमित खिड़की पर आधारित अगले फ्रेम का आधार बनाता है)।

(वैकल्पिक रूप से, जैसा कि छवि-आधारित LoRA सिस्टम के साथ होता है, एक ही वीडियो पीढ़ी में कई LoRAs, जैसे पहचान + पोशाक LoRAs, लागू किया जा सकता है)

4: ‘मानव प्रयोग’ तक पहुंच

जैसा कि मैंने हाल ही में देखा, प्रोप्राइटरी और एफएएएनजी स्तर के जनरेटिव एआई क्षेत्र अब इतना सावधान हो गया है कि इसकी परियोजनाओं की मानव संश्लेषण क्षमताओं से संबंधित संभावित आलोचना के बारे में, वास्तविक लोग शायद ही कभी प्रमुख घोषणाओं और रिलीज़ के लिए परियोजना पृष्ठों में दिखाई देते हैं।

हुन्युआन LoRAs के आगमन के साथ, पहली बार, समुदाय को LDM-आधारित मानव वीडियो संश्लेषण की सीमाओं को एक अत्यधिक क्षमता वाले (न कि हाशिए पर) सिस्टम में धक्का देने और पूरी तरह से उस विषय का अन्वेषण करने का अवसर मिलता है जो अधिकांश लोगों को सबसे ज्यादा आकर्षित करता है – लोग।

निहितार्थ

चूंकि सिविट समुदाय में ‘हुन्युआन’ के लिए खोज परिणाम मुख्य रूप से सेलिब्रिटी LoRAs और ‘हार्डकोर’ LoRAs दिखाते हैं, हुन्युआन LoRAs के आगमन का केंद्रीय निहितार्थ यह है कि वे वास्तविक लोगों – सेलिब्रिटी और अज्ञात लोगों दोनों की – एआई पोर्नोग्राफिक (या अन्य अपमानजनक) वीडियो बनाने के लिए उपयोग किए जाएंगे।

अनुपालन उद्देश्यों के लिए, जो शौकीन हुन्युआन LoRAs बनाते हैं और विभिन्न डिस्कॉर्ड सर्वर पर प्रयोग करते हैं, वे वास्तविक लोगों की छवियों को पोस्ट करने से सावधान रहते हैं। वास्तविकता यह है कि यहां तक कि छवि-आधारित डीपफेक्स अब गंभीर रूप से हथियारबंद हैं; और वास्तविक वीडियो जोड़ने का प्रस्ताव मिश्रित मीडिया में पिछले सात वर्षों से लगातार भय पैदा करता है, जिसने नए नियम को प्रेरित किया है।

चालक बल

जैसा कि हमेशा, पोर्न प्रगति के लिए इंजन बना हुआ है प्रौद्योगिकी। जो भी हमारी राय इस तरह के उपयोग के बारे में हो, यह दृढ़ इंजन प्रगति में आगे बढ़ने के लिए प्रेरित करता है जो अंततः अधिक मुख्यधारा को अपना सकता है।

इस मामले में, संभावित मूल्य सामान्य से अधिक हो सकता है, क्योंकि हाइपर-वास्तविक वीडियो निर्माण का खुला स्रोत स्पष्ट रूप से आपराधिक, राजनीतिक और नैतिक दुरुपयोग के लिए निहितार्थ रखता है।

एक रेडिट समूह (जिसे मैं यहां नाम नहीं दूंगा) जो एआई द्वारा एनएसएफडब्ल्यू वीडियो सामग्री के निर्माण के लिए समर्पित है, में एक खुला डिस्कॉर्ड सर्वर है जहां उपयोगकर्ता हुन्युआन-आधारित वीडियो पोर्न निर्माण के लिए कम्फ्यूआई कार्य प्रवाह को परिष्कृत कर रहे हैं।

यह समुदाय एक महत्वपूर्ण और विकसित गिटहब रिपॉजिटरी भी बनाए रखता है जिसमें पोर्नोग्राफिक वीडियो डाउनलोड और प्रोसेस करने के लिए उपकरण हैं, ताकि नए मॉडलों के लिए प्रशिक्षण डेटा प्रदान किया जा सके।

चूंकि सबसे लोकप्रिय LoRA प्रशिक्षक, कोह्या-एसएस, अब हुन्युआन LoRA प्रशिक्षण का समर्थन करता है, हुन्युआन वीडियो प्रशिक्षण और वीडियो पीढ़ी के लिए बाधाएं दैनिक रूप से कम हो रही हैं, साथ ही साथ हुन्युआन प्रशिक्षण के लिए हार्डवेयर आवश्यकताएं

पोर्न-आधारित एआई (सेलिब्रिटी जैसे पहचान-आधारित मॉडल के बजाय) के लिए समर्पित प्रशिक्षण योजनाओं का महत्वपूर्ण पहलू यह है कि एक मानक फाउंडेशन मॉडल जैसे हुन्युआन विशेष रूप से एनएसएफडब्ल्यू आउटपुट पर प्रशिक्षित नहीं है, और इसलिए या तो एनएसएफडब्ल्यू सामग्री का उत्पादन करने में खराब प्रदर्शन कर सकता है, या सीखे गए अवधारणाओं और संघों को एक प्रदर्शनी या समझदार तरीके से विघटित करने में विफल हो सकता है।

एनएसएफडब्ल्यू फाउंडेशन मॉडल और LoRAs को परिष्कृत करके, यह बढ़ती तरह से संभव होगा कि प्रशिक्षित पहचान को एक समर्पित ‘पोर्न’ वीडियो डोमेन में प्रोजेक्ट किया जाए; आखिरकार, यह छवियों के लिए हो चुका है पिछले दो और एक आधे वर्षों में क्या हुआ

वीएफएक्स

हुन्युआन वीडियो LoRAs द्वारा प्रदान की गई समय स्थिरता में बड़ी वृद्धि एआई विजुअल इफेक्ट्स उद्योग के लिए एक स्पष्ट वरदान है, जो खुले स्रोत सॉफ्टवेयर को अनुकूलित करने पर बहुत अधिक निर्भर करता है।

हालांकि एक हुन्युआन वीडियो LoRA दृष्टिकोण पूरे फ्रेम और पर्यावरण का उत्पादन करता है, वीएफएक्स कंपनियां निश्चित रूप से इस विधि द्वारा प्राप्त किए जा सकने वाले समय-स्थिर मानव चेहरे को अलग करने के लिए प्रयोग करना शुरू कर दिया होगा, ताकि उन्हें वास्तविक दुनिया के स्रोत फुटेज में सुपरइम्पोज़ या एकीकृत किया जा सके।

शौकीन समुदाय की तरह, वीएफएक्स कंपनियों को हुन्युआन वीडियो की छवि-से-वीडियो और वीडियो-से-वीडियो कार्यक्षमता की प्रतीक्षा करनी होगी, जो शायद LoRA-चालित, आईडी-आधारित ‘डीपफेक’ सामग्री के बीच सबसे उपयोगी पुल है; या फिर उन्हें सुधार करना होगा और हुन्युआन वीडियो फ्रेमवर्क और संभावित अनुकूलन की बाहरी क्षमताओं का पता लगाने के लिए अंतराल का उपयोग करना होगा, और यहां तक कि हुन्युआन वीडियो के प्रोप्राइटरी इन-हाउस फोर्क्स का भी पता लगाना होगा।

हालांकि हुन्युआन वीडियो के लाइसेंस शर्तें तकनीकी रूप से वास्तविक व्यक्तियों के चित्रण की अनुमति देती हैं, बशर्ते अनुमति दी जाए, वे इसका उपयोग यूरोपीय संघ, यूनाइटेड किंगडम और दक्षिण कोरिया में निषिद्ध करती हैं। ‘स्टेज पर रहता है’ सिद्धांत पर, यह आवश्यक नहीं है कि हुन्युआन वीडियो का उपयोग इन क्षेत्रों में नहीं किया जाएगा; हालांकि, बाहरी डेटा ऑडिट की संभावना, जेनरेटिव एआई के आसपास बढ़ते नियमन को लागू करने के लिए, ऐसे अवैध उपयोग को जोखिम भरा बना सकती है।

लाइसेंस शर्तों का एक और संभावित रूप से अस्पष्ट क्षेत्र यह कहता है:

‘यदि टेंसेंट हुन्युआन संस्करण रिलीज़ की तारीख पर, लाइसेंसधारी द्वारा उपलब्ध कराई गई सभी उत्पादों या सेवाओं के मासिक सक्रिय उपयोगकर्ता पिछले कैलेंडर माह में 100 मिलियन से अधिक मासिक सक्रिय उपयोगकर्ता हैं, तो आपको टेंसेंट से लाइसेंस का अनुरोध करना होगा, जिसे टेंसेंट अपने विवेकानुसार आपको प्रदान कर सकता है, और आप तब तक इस समझौते के तहत अधिकारों का प्रयोग करने के लिए अधिकृत नहीं हैं जब तक कि टेंसेंट आपको ऐसे अधिकार व्यक्तически नहीं देता।’

यह खंड स्पष्ट रूप से उन कंपनियों के लिए लक्षित है जो हुन्युआन वीडियो को एक अपेक्षाकृत प्रौद्योगिकी-अज्ञानी उपयोगकर्ता निकाय के लिए मध्यस्थ बनाने जा रहे हैं, और जिन्हें एक निश्चित उपयोगकर्ता सीमा से ऊपर जाने पर टेंसेंट में कटौती करनी होगी।

यह क्या निर्धारित करेगा कि क्या व्यापक शब्दावली अप्रत्यक्ष उपयोग (यानी, हुन्युआन-सक्षम विजुअल इफेक्ट्स आउटपुट को लोकप्रिय फिल्मों और टीवी शो में प्रावधान के माध्यम से) को भी कवर कर सकती है, निर्धारित करने के लिए स्पष्टीकरण की आवश्यकता हो सकती है।

निष्कर्ष

चूंकि डीपफेक वीडियो का अस्तित्व लंबे समय से है, यह हुन्युआन वीडियो LoRA के महत्व को कम आंकना आसान हो सकता है, और मान लेना कि सिविट समुदाय, संबंधित डिस्कॉर्ड और सबरेडिट पर वर्तमान में प्रकट हो रहे प्रयास वास्तविक मानव वीडियो संश्लेषण की ओर एक छोटी सी प्रगति का प्रतिनिधित्व करते हैं।

अधिक संभावना यह है कि वर्तमान प्रयास हुन्युआन वीडियो की क्षमता का केवल एक अंश हैं जो पूरी तरह से आश्वस्त पूर्ण-शरीर और पूर्ण-पर्यावरण डीपफेक्स बना सकता है; एक बार छवि-से-वीडियो घटक जारी हो जाने के बाद (इस महीने होने की अफवाह है), एक बहुत ही विस्तृत स्तर की जनरेटिव शक्ति होबी और पेशेवर समुदाय दोनों के लिए उपलब्ध हो जाएगी।

जब स्टेबिलिटी.एआई ने 2022 में स्टेबल डिफ्यूजन जारी किया, तो कई पर्यवेक्षक यह निर्धारित नहीं कर सकते थे कि कंपनी इतनी शक्तिशाली और मूल्यवान जनरेटिव सिस्टम क्यों दे रही थी। हुन्युआन वीडियो के साथ, लाभ प्रेरणा सीधे लाइसेंस में निर्मित होती है – हालांकि यह साबित हो सकता है कि टेंसेंट के लिए यह निर्धारित करना मुश्किल है कि कंपनी लाभ साझा करने की योजना को ट्रिगर करती है।

किसी भी मामले में, परिणाम वही है जो 2022 में था: समर्पित विकास समुदाय तुरंत और तीव्र उत्साह के साथ खुले स्रोत जारी के आसपास बने हैं। जो सड़कें इन प्रयासों को अगले 12 महीनों में ले जाएंगी, वे निश्चित रूप से नए शीर्षकलेख को प्रेरित करने वाले हैं।

* प्रकाशन के समय 136 तक।

मंगलवार, 7 जनवरी, 2025 को पहली बार प्रकाशित

рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкрд░ рд▓реЗрдЦрдХ, рдорд╛рдирд╡ рдЗрдореЗрдЬ рд╕рд┐рдВрдереЗрд╕рд┐рд╕ рдореЗрдВ рдбреЛрдореЗрди рд╡рд┐рд╢реЗрд╖рдЬреНрдЮред рдореЗрдЯрд╛рдлрд┐рдЬрд┐рдХ.рдПрдЖрдИ рдореЗрдВ рдЕрдиреБрд╕рдВрдзрд╛рди рд╕рд╛рдордЧреНрд░реА рдХреЗ рдкреВрд░реНрд╡ рдкреНрд░рдореБрдЦред
рд╡реНрдпрдХреНрддрд┐рдЧрдд рд╕рд╛рдЗрдЯ: martinanderson.ai
рд╕рдВрдкрд░реНрдХ: [email protected]
рдЯреНрд╡рд┐рдЯрд░: @manders_ai