Connect with us

рдбрд┐рдЬрд╝рдиреА рд╕реАрдЬреАрдЖрдИ рдХреЛ рдиреНрдпреВрд░рд▓ рд░реЗрдВрдбрд░рд┐рдВрдЧ рдХреЗ рд╕рд╛рде рдорд┐рд▓рд╛рддрд╛ рд╣реИ рддрд╛рдХрд┐ ‘рдЕрдирдХреИрдиреА рд╡реИрд▓реА’ рдХреЛ рд╕рдВрдмреЛрдзрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХреЗ

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рдбрд┐рдЬрд╝рдиреА рд╕реАрдЬреАрдЖрдИ рдХреЛ рдиреНрдпреВрд░рд▓ рд░реЗрдВрдбрд░рд┐рдВрдЧ рдХреЗ рд╕рд╛рде рдорд┐рд▓рд╛рддрд╛ рд╣реИ рддрд╛рдХрд┐ ‘рдЕрдирдХреИрдиреА рд╡реИрд▓реА’ рдХреЛ рд╕рдВрдмреЛрдзрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХреЗ

mm

डिज़नी के एआई अनुसंधान प्रभाग ने फिल्म-गुणवत्ता वाले चेहरे के अनुकरण के लिए एक हाइब्रिड विधि विकसित की है, जो चेहरे के न्यूरल रेंडरिंग की ताकत को सीजीआई-आधारित दृष्टिकोण की निरंतरता के साथ जोड़ती है।

पENDING पेपर का शीर्षक रेंडरिंग विद स्टाइल: ट्रेडिशनल और न्यूरल अप्रोचेस को हाई क्वालिटी फेस रेंडरिंग के लिए जोड़ना है, और इसे डिज़नी रिसर्च यूट्यूब चैनल (इस लेख के अंत में एम्बेडेड) पर एक नया 10 मिनट का वीडियो में पूर्वावलोकन किया गया है।

मेशेस को न्यूरल फेशियल रेंडर्स के साथ जोड़ा गया।

मेशेस को न्यूरल फेशियल रेंडर्स के साथ जोड़ा गया। वीडियो में बेहतर विवरण और गुणवत्ता के लिए लेख के अंत में एम्बेडेड वीडियो देखें। स्रोत: https://www.youtube.com/watch?v=k-RKSGbWLng (अब https://www.youtube.com/watch?v=TwpLqTmvqVk से बदल दिया गया है)

जैसा कि वीडियो में उल्लेख किया गया है, चेहरे का न्यूरल रेंडरिंग (包括 डीपफेक्स) आंखों और मुंह के अंदरूनी हिस्सों को सीजीआई की तुलना में अधिक वास्तविक बना सकता है, जबकि सीजीआई-चालित चेहरे के टेक्सचर अधिक निरंतर और सिनेमा-स्तर के वीएफएक्स आउटपुट के लिए उपयुक्त होते हैं।

इसलिए, डिज़नी एनवीडिया के स्टाइलगैन2 न्यूरल जनरेटर को चेहरे की आसपास की विशेषताओं और ‘जीवन-महत्वपूर्ण’ तत्वों जैसे आंखों को संभालने दे रहा है, जबकि सीजीआई फेशियल स्किन और संबंधित तत्वों को आउटपुट में सुपरइम्पोज़ कर रहा है।

рд╡реАрдбрд┐рдпреЛ (рд▓реЗрдЦ рдХреЗ рдЕрдВрдд рдореЗрдВ рджреЗрдЦреЗрдВ) рд╕реЗ рдбрд┐рдЬрд╝рдиреА рдХреЗ рд╣рд╛рдЗрдмреНрд░рд┐рдб рджреГрд╖реНрдЯрд┐рдХреЛрдг рдХреА рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдЕрд╡рдзрд╛рд░рдгрд╛, рдЬрд╣рд╛рдВ рдПрдХ рдкреБрд░рд╛рдиреЗ рд╕реНрдХреВрд▓ рдХреЗ рд╕реАрдЬреАрдЖрдИ рдореЗрд╢, рдЬреИрд╕реЗ рдХрд┐ рд░реЛрдЧ рд╡рди (2016) рдХреЗ рд▓рд┐рдП 'рдпреБрд╡рд╛' рдХреИрд░реА рдлрд┐рд╢рд░ рдФрд░ рджрд┐рд╡рдВрдЧрдд рдкреАрдЯрд░ рдХреБрд╢рд┐рдВрдЧ рдХреЛ рдкреБрдирд░реНрдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдХреЛ рдиреНрдпреВрд░рд▓-рд░реЗрдВрдбрд░реЗрдб рдлреЗрд╕ рдПрдирд╡рд╛рдпрд░рдирдореЗрдВрдЯ рдореЗрдВ рдПрдХреАрдХреГрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

वीडियो (लेख के अंत में देखें) से डिज़नी के हाइब्रिड दृष्टिकोण की वास्तुकला अवधारणा, जहां एक पुराने स्कूल के सीजीआई मेश, जैसे कि रोग वन (2016) के लिए ‘युवा’ कैरी फिशर और दिवंगत पीटर कुशिंग को पुनर्निर्माण करने के लिए उपयोग किया जाता है, को न्यूरल-रेंडरेड फेस एनवायरनमेंट में एकीकृत किया जाता है।[/em>

वीडियो में एक सूक्ष्म संदर्भ दिया गया है कि दिवंगत ब्रिटिश स्टार वार्स अभिनेता पीटर कुशिंग के सीजीआई पुनर्निर्माण की अस्वाभाविकता और ‘अनकैनी वैली’ प्रभाव की अक्सर आलोचना की जाती है रोग वन (2016) में, स्वीकार करते हुए:

‘[अब भी] लोगों द्वारा आसानी से कब्जा और रेंडर किए जाने वाले और अंतिम फोटोरियलिस्टिक डिजिटल डबल्स के बीच एक बड़ा अंतर है, जिसमें बाल, आंखें और मुंह के अंदरूनी हिस्से शामिल हैं। इस अंतर को बंद करने के लिए, यह आमतौर पर कुशल कलाकारों से बहुत सारा मैनुअल काम लेता है।’

वास्तव में, यहां तक कि सबसे आधुनिक चेहरे कैप्चर सिस्टम भी आंखों, मुंह के अंदरूनी हिस्सों या बालों को पुनर्निर्माण करने का प्रयास नहीं करते हैं, जो ऐसी तकनीकों में प्रामाणिकता (आंखें) या समय स्थिरता (बाल) के मुद्दों से ग्रस्त हैं।

рд╡реАрдбрд┐рдпреЛ рд╡реАрдПрдлрдПрдХреНрд╕ рдХрд▓рд╛рдХрд╛рд░реЛрдВ рдХреЛ рдПрдХхЕ╕хЮЛ рдЖрдзреБрдирд┐рдХ рдЪреЗрд╣рд░реЗ рдХреИрдкреНрдЪрд░ рд╕рддреНрд░ рдХреЗ рдмрд╛рдж рдХреНрдпрд╛ рдорд┐рд▓реЗрдЧрд╛, рдЗрд╕рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИред рдЖрдВрдЦреЗрдВ, рдмрд╛рд▓, рдлреЗрд╢рд┐рдпрд▓ рд╣реЗрдпрд░, рдФрд░ рдореБрдВрд╣ рдХреЗ рдЕрдВрджрд░реВрдиреА рд╣рд┐рд╕реНрд╕реЗ рд╕рднреА рдХреЛ рдЙрддреНрдкрд╛рджрди рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдЯреАрдореЛрдВ рджреНрд╡рд╛рд░рд╛ рд╕рдВрднрд╛рд▓рд╛ рдЬрд╛рдирд╛ рд╣реЛрдЧрд╛ред

वीडियो वीएफएक्स कलाकारों को एक典型 आधुनिक चेहरे कैप्चर सत्र के बाद क्या मिलेगा, इसका प्रदर्शन करता है। आंखें, बाल, फेशियल हेयर, और मुंह के अंदरूनी हिस्से सभी को उत्पादन पाइपलाइन में अलग-अलग टीमों द्वारा संभाला जाना होगा, साथ ही टेक्सचरिंग और लाइटिंग।[/em>

इल्युमिनेशन कंट्रोल

हाइब्रिड दृष्टिकोण रिलाइटिंग के साथ भी एक लाभ है – चेहरे के न्यूरल रेंडरिंग के लिए एक उल्लेखनीय चुनौती, क्योंकि सीजीआई स्किन सुपरइम्पोज़िशन को अधिक आसानी से रिलिट किया जा सकता है।

सीजीआई/न्यूरल दृष्टिकोण का एक एनिमेटेड संस्करण।

सीजीआई/न्यूरल दृष्टिकोण का एक एनिमेटेड संस्करण।[/em>

अधिक चुनौतीपूर्ण वातावरण में, जैसे कि बाहरी शूट, शोधकर्ताओं ने एक प्रकार के डेमिलिटराइज्ड ज़ोन के आसपास इनपेंटिंग की एक विधि विकसित की है जो व्यक्ति को ‘निर्मित’ किया जा रहा है।

рдПрдХ рдмреНрд▓реИрдХ рдорд╛рд░реНрдЬрд┐рди рдХрд╛ рдЙрддреНрдкрд╛рджрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддрд╛рдХрд┐ рдПрдХ 'рдХреИрдирд╡рд╛рд╕' рдХреЛ рдмрд╛рд╣рд░реА рднрд╛рдЧреЛрдВ рдХреА рдкрд╣рдЪрд╛рди рдХреЗ рд▓рд┐рдП рдЗрдирдкреЗрдВрдЯрд┐рдВрдЧ рдФрд░ рд╕реАрдЬреАрдЖрдИ рд╕реНрдХрд┐рди рдХреЛ рд╕рдВрдпреБрдХреНрдд рд╕реАрдЬреАрдЖрдИ/рдиреНрдпреВрд░рд▓ рдЖрдЙрдЯрдкреБрдЯ рдореЗрдВ рдПрдХреАрдХреГрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдиреБрдорддрд┐ рджреА рдЬрд╛ рд╕рдХреЗред

एक ब्लैक मार्जिन का उत्पादन किया जाता है ताकि एक ‘कैनवास’ को बाहरी भागों की पहचान के लिए इनपेंटिंग और सीजीआई स्किन को संयुक्त सीजीआई/न्यूरल आउटपुट में एकीकृत करने के लिए अनुमति दी जा सके।[/em>

वीडियो में उल्लेख किया गया है:

‘[न्यूरल रेंडर] पृष्ठभूमि प्रतिबंध के साथ पूरी तरह से मेल नहीं खाता है। – यह केवल एक गाइड के रूप में है, क्योंकि वास्तविक मानव घटकों जैसे बाल, आंखें और दांत को अनुकूलित करना मुख्य लक्ष्य है। अधिक चुनौतीपूर्ण है कि परिवर्तित परिवेश प्रकाश व्यवस्था के साथ एक सुसंगत पहचान बनाए रखने का प्रयास करें।’

न्यूरल रेंडर्स से सीजीआई मेशेस बनाना

शोध टीम ने एक वेरिएशनल ऑटोएनकोडर भी विकसित किया है जो एक बड़े 3डी फेस इमेज डेटाबेस पर प्रशिक्षित है, और दावा करता है कि यह ग्राउंड ट्रुथ डेटा से ‘रैंडम लेकिन प्लॉजिबल’ 3डी फेस मेशेस उत्पन्न कर सकता है।

इस शोध को पार करने के लिए सीमाएं हैं, जिनमें न्यूरल रेंडरिंग में बाल को समय स्थिर रखने में कठिनाई शामिल है, और वीडियो (नीचे देखें) में एक सीजीआई/न्यूरल चेहरे के चारों ओर एक सुसंगत पैन के साथ तेजी से परिवर्तित होने वाले बालों के कई उदाहरण दिखाता है।

न्यूरल वीडियो रेंडरिंग में समय स्थिरता एक बहुत व्यापक समस्या है जो केवल डिज़नी की नहीं है, और ऐसा लगता है कि इस प्रणाली के बाद के संस्करण हेयर ‘इन पोस्ट’ जोड़ने या हेयर जेनरेशन के लिए अन्य संभावित दृष्टिकोणों का उपयोग करने के लिए हो सकते हैं जो कि एक नोवेल न्यूरल दृष्टिकोण को अंततः हल करने की उम्मीद करते हैं।

डेटासेट जेनरेशन के लिए उपयोग

विधि को सिंथेटिक डेटा को जनरेट करने और फेशियल इमेज सेट लैंडस्केप को समृद्ध करने के संभावित तरीके के रूप में भी प्रस्तावित किया गया है, जो हाल के वर्षों में खतरनाक रूप से एकरूप हो गया है।

рдбрд┐рдЬрд╝рдиреА рдирдИ рддрдХрдиреАрдХ рдХреЛ рдлреЗрд╢рд┐рдпрд▓ рдЗрдореЗрдЬ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЛ рдЖрдмрд╛рдж рдХрд░рдиреЗ рдХреА рдХрд▓реНрдкрдирд╛ рдХрд░рддрд╛ рд╣реИред

डिज़नी नई तकनीक को फेशियल इमेज डेटासेट को आबाद करने की कल्पना करता है।[/em>

‘[प्रत्येक] फोटोरियलिस्टिक परिणाम में एक अंतर्निहित भूगोल और उपस्थिति मैप होता है, जो ज्ञात प्रकाश व्यवस्था के साथ अज्ञात कैमरा दृष्टिकोण से रेंडर किया जाता है। यह ‘ग्राउंड ट्रुथ’ जानकारी डाउनस्ट्रीम अनुप्रयोगों जैसे मोनोक्युलर, 3डी फेस रिकंस्ट्रक्शन, फेशियल रिकग्निशन, या सीन समझ के लिए प्रशिक्षण के लिए महत्वपूर्ण हो सकती है। और इसलिए, प्रत्येक परिणाम रेंडर को एक डेटा नमूने के रूप में माना जा सकता है, और हम विभिन्न व्यक्तियों के कई संस्करण उत्पन्न कर सकते हैं। ‘

‘इसके अलावा, एक ही व्यक्ति को एक ही अभिव्यक्ति में एक ही दृष्टिकोण और प्रकाश व्यवस्था के साथ पुनर्निर्मित करने के लिए, हम अनुकूलन के दौरान रैंडमाइजेशन सीड को बदलकर फोटो-रियल रेंडर के यादृच्छिक संस्करण उत्पन्न कर सकते हैं।’

शोधकर्ता यह नोट करते हैं कि यह कॉन्फ़िगरेबल आउटपुट की विविधता फेशियल रिकग्निशन अनुप्रयोगों को प्रशिक्षित करने में उपयोगी हो सकती है, निष्कर्ष निकालते हुए:

‘[हमारा] तरीका चेहरे की त्वचा कैप्चर, मॉडलिंग और रेंडरिंग के लिए वर्तमान प्रौद्योगिकी का लाभ उठा सकता है, और स्वचालित रूप से पूरी तरह से फोटोरियलिस्टिक चेहरे के रेंडर बना सकता है जो वांछित पहचान, अभिव्यक्ति और दृश्य कॉन्फ़िगरेशन से मेल खाता है। यह दृष्टिकोण फिल्म और मनोरंजन के लिए चेहरे के रेंडरिंग के लिए अनुप्रयोग और मैनुअल कलाकारों को श्रम बचाने के लिए है, साथ ही गहरे शिक्षण के विभिन्न क्षेत्रों में डेटा जेनरेशन के लिए भी है।’

नई दृष्टिकोण के लिए एक गहरा देखो, आज जारी 10 मिनट का वीडियो देखें:

* मूल वीडियो लिंक को 8 घंटे बाद प्रकाशन के बाद एक अन्य समान वीडियो में बदल दिया गया था। मैंने सभी प्रासंगिक लिंक बदल दिए, क्योंकि मूल वीडियो का कोई निशान नहीं है।

 

8:24 जीएमटी+2 – वीडियो को बदल दिया गया, क्योंकि इसे डिज़नी रिसर्च यूट्यूब चैनल द्वारा कुछ कारणों से बदल दिया गया था।[/em]

рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкрд░ рд▓реЗрдЦрдХ, рдорд╛рдирд╡ рдЗрдореЗрдЬ рд╕рд┐рдВрдереЗрд╕рд┐рд╕ рдореЗрдВ рдбреЛрдореЗрди рд╡рд┐рд╢реЗрд╖рдЬреНрдЮред рдореЗрдЯрд╛рдлрд┐рдЬрд┐рдХ.рдПрдЖрдИ рдореЗрдВ рдЕрдиреБрд╕рдВрдзрд╛рди рд╕рд╛рдордЧреНрд░реА рдХреЗ рдкреВрд░реНрд╡ рдкреНрд░рдореБрдЦред
рд╡реНрдпрдХреНрддрд┐рдЧрдд рд╕рд╛рдЗрдЯ: martinanderson.ai
рд╕рдВрдкрд░реНрдХ: [email protected]
рдЯреНрд╡рд┐рдЯрд░: @manders_ai