Connect with us

рдЖрдИрдкреА-рд╡реЙрд╢рд┐рдВрдЧ рд╡рд┐рдзрд┐рдпрд╛рдВ рдПрдЖрдИ рдореЗрдВ

Anderson рдХрд╛ рдПрдВрдЧрд▓

рдЖрдИрдкреА-рд╡реЙрд╢рд┐рдВрдЧ рд╡рд┐рдзрд┐рдпрд╛рдВ рдПрдЖрдИ рдореЗрдВ

mm
An AI-generated image of Lady Justice surrounded by 'laundered' data. GPT-1.5.

यदि बुद्धिमत्ता के उपयोग में बौद्धिक संपदा के उपयोग पर कानूनी निपटारा होने वाला है, तो ऐसे उपयोग को धुंधला करने के कई तरीके हैं।

 

राय वर्तमान, तेजी से आगे बढ़ने वाली एआई में उत्पन्न हो रही क्रांति सबसे कानूनी रूप से संदेहास्पद वातावरण में हो रही है जो किसी भी परिवर्तनकारी प्रौद्योगिकी विकास के साथ हुई है उन्नीसवीं शताब्दी के बाद से

तीन-चार साल पहले तक, मशीन लर्निंग अनुसंधान समुदाय को आईपी-संरक्षित सामग्री का शोषण करने की एक मौन (अक्सर स्पष्ट) अनुमति थी; चूंकि ये प्रणालियाँ अभी तक परिपक्व या व्यावसायिक रूप से व्यवहार्य नहीं थीं, इसलिए परिणाम हर अर्थ में शैक्षणिक थे।

इस अवधि में, एक नए पीढ़ी के अपवर्ती आधारित बड़े भाषा मॉडल (एलएलएम, जैसे कि चैटजीपीटी और क्लाउड) और दृष्टि-भाषा मॉडल (वीएलएम, जैसे कि सोरा) की अचानक सफलता ने संकेत दिया कि ये अमूर्त और पहले ‘हानिरहित’ शोध के तार व्यावसायिक रूप से व्यवहार्य हो गए थे और अपने ‘मुफ्त पास’ से बाहर निकल गए थे, जहां तक दूसरों की बौद्धिक संपदा का शोषण था।

अब से, अधिकार धारक उन एआई प्रणालियों के फलों में हिस्सा मांगेंगे जो उनके कॉपीराइट या अन्य संरक्षित डेटा पर प्रशिक्षित हैं, जिससे लगातार कानूनी मामलों की बारिश हो रही है जिसके लिए कुछ प्रयास की आवश्यकता है कि उन्हें ट्रैक करने के लिए भी।

рд╕реАрдорд┐рдд рдХреЗрд╡рд▓ рдЕрдореЗрд░рд┐рдХрд╛ рдореЗрдВ рд▓рд╛рдП рдЧрдП рдорд╛рдорд▓реЛрдВ рддрдХ, рдирдП рдорд╛рдорд▓реЗ рдЕрдореЗрд░рд┐рдХрд╛ рдФрд░ рдЙрд╕рдХреЗ рдмрд╛рд╣рд░ рддреЗрдЬреА рд╕реЗ рдЙрддреНрдкрдиреНрди рд╣реЛ рд░рд╣реЗ рд╣реИрдВред рд╕реНрд░реЛрдд - https://copyrightalliance.org/artificial-intelligence-copyright/court-cases/

यहाँ सीमित केवल अमेरिका में लाए गए मामलों तक, नए मामले अमेरिका और उसके बाहर तेजी से उत्पन्न हो रहे हैं। स्रोत

‘मुफ्त भोजन’ को अनिवार्य करना

एआई-सेवा बुनियादी ढांचे में वित्तीय प्रतिबद्धता वर्तमान में हो रही है एआई को इतनी गहराई से अर्थव्यवस्था में समाहित करने के प्रयास के रूप में देखी जा सकती है कि यह न केवल ‘विफल नहीं होने’ के लिए बहुत बड़ा हो जाए, बल्कि ‘मुकदमा चलाने’ के लिए भी बहुत शक्तिशाली हो जाए – या कम से कम, इतना शक्तिशाली कि सफल मुकदमे को क्रांति को उलटने देने की अनुमति नहीं दी जा सकती।

इस सामान्य भावना की ओर, संयुक्त राज्य अमेरिका के वर्तमान राष्ट्रपति नीति में अपने दृष्टिकोण को प्रतिबद्ध कर रहे हैं कि ‘आपको यह उम्मीद नहीं करनी चाहिए कि आपके पास एक सफल एआई कार्यक्रम होगा जब हर एक लेख, पुस्तक, या कुछ और जो आपने पढ़ा है या अध्ययन किया है, आपको इसके लिए भुगतान करना होगा’.

वास्तव में? कुछ भी ऐसा नहीं हुआ है जो पश्चिमी औद्योगिक युग में हुआ हो, और यह पारंपरिक अमेरिकी संस्कृति के खिलाफ जाता है जो मुकदमेबाजी और मुआवजे की है। शायद सबसे निकटतम समान स्थितियाँ चिकित्सा पेटेंट की 20 वर्षों के बाद अनिवार्य समाप्ति (जो स्वयं अक्सर हमले के अधीन है), और सीमा पर गोपनीयता की अपेक्षा को सार्वजनिक स्थानों पर रखा जाता है।

हालांकि, समय बदलते हैं; वर्तमान प्रवृत्ति के खिलाफ कोई गारंटी नहीं है कि ‘प्रमुख अधिकार’ के खिलाफ आईपी सुरक्षा का उल्लंघन नहीं होगा, या बाद में उलट जाएगा, एआई प्रणालियों के विकास और विवादित प्रशिक्षण डेटा के इलाज में मानक अभ्यास बन रहे कई द्वितीयक दृष्टिकोण हैं।

डेटासेट-द्वारा-प्रॉक्सी

इनमें से एक दृष्टिकोण टोरेंट-सूची साइटों द्वारा अपनाई गई (न कि हमेशा सफल) रक्षा के समान दृष्टिकोण का पालन करता है जो यह दावा करते हैं कि वे वास्तव में किसी भी विवादित सामग्री को होस्ट नहीं करते हैं – या कोई सामग्री होस्ट नहीं करते हैं।

इसके अलावा बड़े पैमाने पर छवि या वीडियो डेटा को संग्रहीत और परोसने की आवश्यकता को समाप्त करने के अलावा, इस तरह के संग्रह तेजी से अद्यतन की अनुमति देते हैं – जैसे कि कॉपीराइट धारकों के अनुरोध पर सामग्री को हटाना – और संस्करण।

जैसे टोरेंट केवल बताते हैं कि आईपी-संरक्षित सामग्री कहाँ पाई जा सकती है, कई प्रभावशाली डेटासेट स्वयं केवल ‘पॉइंटर’-शैली की सूची हैं जो मौजूद डेटा की है। यदि अंतिम उपयोगकर्ता इन सूचियों को अपने स्वयं के डेटासेट के लिए डाउनलोड सूची के रूप में उपयोग करना चाहता है, तो यह उनके लिए है, जहां तक क्यूरेटर की देयता का संबंध है।

इनमें से एक है गूगल रिसर्च का कॉन्सेप्टुअल 12एम डेटासेट, जो छवियों के लिए कैप्शन प्रदान करता है, लेकिन केवल उन स्थानों पर इंगित करता है जहां ये छवियां मौजूद हैं (या संकलन के समय मौजूद थीं):

рдЧреВрдЧрд▓ рд░рд┐рд╕рд░реНрдЪ рдХреЗ рдХреЙрдиреНрд╕реЗрдкреНрдЯреБрдЕрд▓ 12рдПрдо рд╕рдВрдХрд▓рди рд╕реЗ рджреЛ рдЙрджрд╛рд╣рд░рдгред рд╕реНрд░реЛрдд - https://github.com/google-research-datasets/conceptual-12m/blob/main/images/cc12m_1.jpg

गूगल रिसर्च के कॉन्सेप्टुअल 12एम संकलन से दो उदाहरण。 स्रोत

एक अन्य प्रमुख उदाहरण, और जो अब एआई के इतिहास में सम्मान का दावा करने का हकदार है, लायोन डेटासेट है जिसने 2022 में स्टेबल डिफ्यूजन उत्पन्न प्रणाली को सुविधा प्रदान की – एंड-यूज़र्स को खुले स्रोत उत्पन्न छवियों की पेशकश करने वाला पहला ऐसा ढांचा जैसा कि प्रोप्राइटरी सिस्टम ऐसी सेवाओं को एक शुद्ध रूप से बंद, व्यावसायिक डोमेन के रूप में स्थापित करने वाले थे:

рд▓рд╛рдпреЛрди рдкрд░рд┐рдпреЛрдЬрдирд╛ рдХреЗ рдХрдИ рд░реВрдкрд╛рдВрддрд░реЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ, рдЬрд┐рд╕рдореЗрдВ рдЖрдзреБрдирд┐рдХ рдФрд░ рдХреЙрдкреАрд░рд╛рдЗрдЯ рдХрд┐рдП рдЧрдП рдХрд▓рд╛рдХреГрддрд┐рдпрд╛рдБ рд╣реИрдВред рд╕реНрд░реЛрдд - https://huggingface.co/datasets/laion/relaion-pop/viewer/default/train

लायोन परियोजना के कई रूपांतरों में से एक, जिसमें आधुनिक और कॉपीराइट किए गए कलाकृतियाँ हैं। स्रोत

इन ‘पॉइंटर’ संग्रहों में से कई में उच्च फ़ाइल आकार इंगित करते हैं कि छवि सामग्री एक डाउनलोड की गई और होस्ट की गई फ़ाइल में शामिल है; हालांकि, गैर-मामूली डाउनलोड आकार अक्सर पाठ सामग्री की उच्च मात्रा के कारण होते हैं, और कभी-कभी निकाले गए एम्बेडिंग या विशेषताओं – प्रशिक्षण प्रक्रिया के दौरान स्रोत डेटा से निकाले गए सारांश या नोड्स को अन्यथा लागू किया जा सकता है।

वीडियो प्रीमियम

वीडियो डेटासेट ‘डेटासेट-द्वारा-प्रॉक्सी’ या पॉइंटर दृष्टिकोण के लिए एक और मजबूत मामला प्रस्तुत करते हैं, क्योंकि एक अर्थपूर्ण और उपयोगी संख्या में वीडियो को एकल डाउनलोड करने योग्य संग्रह में एकत्र करने के लिए आवश्यक भंडारण डेटा की मात्रा निषिद्ध है, और एक ‘वितरित’ विधि वांछनीय है।

हालांकि, दोनों मामलों में – लेकिन विशेष रूप से वीडियो के साथ – डाउनलोड करने योग्य स्रोत यूआरएल वे डेटा का प्रतिनिधित्व करते हैं जिन्हें प्रशिक्षण प्रक्रियाओं में उपयोग करने से पहले महत्वपूर्ण अतिरिक्त ध्यान देने की आवश्यकता होगी। दोनों छवियों और वीडियो को उपलब्ध जीपीयू स्थान में फिट होने के लिए पुनः आकार देने की आवश्यकता होगी, या फिर फसल चयन करने होंगे, जैसे कि 3-5 सेकंड, आमतौर पर।

नोटेबल वीडियो डेटासेट जो ऑनलाइन वीडियो (वीडियो के सीधे पैकेजिंग के बजाय) के संदर्भ का उपयोग करते हैं उनमें गूगल का काइनेटिक्स मानव क्रिया वीडियो डेटासेट और सर्च जाइंट का यूट्यूब-8एम संग्रह शामिल है, जो सेगमेंट एनोटेशन का उपयोग करता है यह इंगित करने के लिए कि प्रत्येक वीडियो को डाउनलोड करने के बाद कैसे व्यवहार किया जाए – लेकिन फिर से अंतिम उपयोगकर्ता को आपूर्ति किए गए यूआरएल से वीडियो प्राप्त करने के लिए छोड़ देता है।

बंद और खुला

अंत में, इस श्रेणी में, ‘खुला’ वीएफएक्स डेटा बंद मंचों के साथ उत्पन्न किया जा सकता है जो परिणामस्वरूप डेटासेट को प्रकाशित और उपलब्ध कराते हैं। यह जानना उचित है कि यह क्यों होता है, और यह विचार करना कि क्या यह इसलिए हो सकता है क्योंकि मूल कंपनी अपने स्वयं के उपयोग के लिए एक आईपी-अनुकूल अपस्ट्रीम मॉडल को स्वच्छ बनाना चाहती है; या कि एक ‘धुला हुआ’ सेट बाहर से अनुरोध किया गया था।

एक ऐसा मामला ‘पीढ़ीगत धुलाई’ का है, जो ओम्नी-वीएफएक्स डेटासेट है, जो ओपन-वीएफएक्स डेटासेट (जो स्वयं पिका और पिक्सवर्स जैसे बंद और अर्ध-बंद प्लेटफार्मों के कई डेटा बिंदुओं को संदर्भित करता है) से कई डेटा बिंदुओं को एकीकृत करता है।

ईमानदारी से, ओम्नी-वीएफएक्स वास्तव में प्रयास नहीं कर रहा है:

рдЦреБрд▓реЗ рд╕реНрд░реЛрдд рдУрдореНрдиреА-рд╡реАрдПрдлрдПрдХреНрд╕ рдбреЗрдЯрд╛рд╕реЗрдЯ рдореЗрдВ, рдПрдХ рдкрд░рд┐рдЪрд┐рдд рдЪреЗрд╣рд░рд╛ред рд╕реНрд░реЛрдд - https://huggingface.co/datasets/GD-ML/Omni-VFX/blob/main/Harley/pixverse%252Fmp4%252Fmedia%252Fweb%252F15e45744-64b1-4a41-84de-626225cf017b_seed734716767.mp4

खुले स्रोत ओम्नी-वीएफएक्स डेटासेट में, एक परिचित चेहरा। स्रोत

पूर्ववर्ती देयता

आईपी-वॉशिंग के लिए दूसरा प्रमुख दृष्टिकोण एक या कई हटाने पर कॉपीराइट सामग्री का उपयोग करना है। इस श्रेणी में एक विधि सिंथेटिक डेटा का उपयोग है जो किसी बिंदु पर अपस्ट्रीम में कॉपीराइट डेटा पर प्रशिक्षित किया गया है। ऐसे मामलों में, विशेष रूप से जहां सिंथेटिक डेटा वास्तविक दिखने वाले परिणाम प्राप्त करने में सक्षम है, कॉपीराइट कार्य परिवर्तनों को प्रदान करता है जो सामान्य दुनिया के मॉडल द्वारा या विशेषज्ञता के बिना मॉडल द्वारा तर्कसंगत रूप से अनुमानित या अनुमानित नहीं किया जा सकता है।

यह विशेष रूप से सच है जहां उत्पन्न वीडियो प्रणालियों को ‘असंभव’ घटनाओं और घटनाओं का उत्पादन करने की आवश्यकता होती है जो सामान्य रूप से ‘विजुअल इफेक्ट्स’ (वीएफएक्स) की श्रेणी में आती हैं।

वास्तव में, जिसने इस विषय को मेरे ध्यान में लाया वह最新 शोध पत्रों की एक श्रृंखला में से एक है जो विभिन्न प्रकार के विजुअल प्रभावों को ‘अभिव्यक्त’ करने की क्षमता प्रदान करता है, जैसे कि शरीर के असंभव भागों से लेजर बीम का उत्पादन करना:

इफेक्टमेकर वेबसाइट से, जहां स्रोत क्लिप (बाएं) में ‘क्रिया’ को स्रोत छवि (केंद्र) पर लागू किया जाता है। स्रोत

उपरोक्त उदाहरण प्रोजेक्ट पेज से हैं इफेक्टमेकर परियोजना के लिए। इफेक्टमेकर इस साल का पहला प्रस्ताव नहीं है जो एक वीडियो क्लिप से वीएफएक्स गतिविधियों को निकालने और इसे एक नए क्लिप में स्थानांतरित करने का प्रयास करता है, और वास्तव में यह एआई वीएफएक्स अनुसंधान में एक विशिष्ट उप-कार्य में बदल रहा है*।

यह जानते हुए कि मीडिया की दिग्गज कंपनियां जैसे मार्वल को आईपी पर कानूनी मामलों में जीतने की एक उच्च संभावना है (यहां तक कि उल्लिखित जलवायु में ‘प्रवर्तित सहनशीलता’ के साथ), वीएफएक्स कंपनियां और स्टार्टअप वर्तमान में अपने उत्पन्न वीएफएक्स फ्रेमवर्क को दूसरी कंपनियों के कॉर्पोरेट आईपी से मुक्त करने के लिए उल्लेखनीय प्रयास कर रहे हैं।

इनमें से सबसे आगे मेटा है, जिसे आर/वीएफएक्स सबरेडिट पर रिपोर्ट किया गया है कि इसने 2026 में एक अच्छी तरह से भुगतान वाले सर्दियों के भर्ती अभियान पर जाने के लिए वीएफएक्स कलाकारों को काम पर रखा है ताकि एआई मॉडल को हॉलीवुड स्तर के विजुअल इफेक्ट शॉट्स का उत्पादन करने के लिए प्रशिक्षित किया जा सके। हालांकि विभिन्न पोस्ट में वेतन का उल्लेख नहीं किया गया था, एक ने इसे ‘सेवानिवृत्ति का पैसा’ कहा।

पैसे का पालन करें

हालांकि, यह सोचना होगा कि मेटा जैसी कंपनियां वास्तव में एक वास्तविक विविधता और वीएफएक्स शॉट्स की बहुतायत के लिए कितना पैसा देने को तैयार हैं, यह देखते हुए कि एक ब्लॉकबस्टर फिल्म के लिए एक औसत वीएफएक्स शॉट लगभग 42,000 अमेरिकी डॉलर है – और कई अधिक महंगे हैं।

इसके अलावा, यह तर्कसंगत है कि बेस्पोक वीएफएक्स-उत्पन्न एआई मॉडल लोकप्रिय मांग के अनुसार झुकेंगे, जिसमें सबसे लोकप्रिय और सबसे महंगे श्रेणियों की फिल्मों से मानक प्रभाव शामिल हैं।

इसके अलावा यह तथ्य कि ‘शेष’ वीएफएक्स पेशेवर अंततः उन शॉट्स को पुनर्निर्माण कर सकते हैं जिन पर उन्होंने मौजूदा फिल्म कैटलॉग के लिए काम किया है – जो स्वयं पैसा कमाते हैं और कमाते रहते हैं – को संदर्भित करते हुए ‘कस्टम’ डेटासेट कार्य को अनुकरणीय के रूप में संदर्भित करता है।

वास्तव में, यदि ऐसे पुनर्निर्माण को लोरास जैसे संलग्न मॉड्यूल में मोड़ दिया जाता है, जो एक बेस मॉडल पर निर्भर करते हैं, तो प्रक्रिया तब तक ही रक्षात्मक है जब तक कि बेस मॉडल ‘आईपी-स्वच्छ’ न हो – और बहुत से ऐसे नहीं हैं।

इसी तरह, यदि ‘नया’ प्रक्रिया फाइन-ट्यूनिंग जैसी ‘हाइब्रिड’ तकनीकों का उपयोग करती है, जहां विजुअल प्रभाव का मूल्य पुराने संग्रह या मॉडल से प्राप्त मॉडल, प्राथमिकताएं या एम्बेडिंग पर निर्भर करता है, तो काम की मौलिकता वास्तव में त्वचीय है और चुनौती के अधीन है।

असंभव मिशन

वीएफएक्स आउटपुट का डोमेन आईपी-वॉशिंग में एक विशेष रूप से दिलचस्प मामला अध्ययन है, क्योंकि विज

рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкрд░ рд▓реЗрдЦрдХ, рдорд╛рдирд╡ рдЗрдореЗрдЬ рд╕рд┐рдВрдереЗрд╕рд┐рд╕ рдореЗрдВ рдбреЛрдореЗрди рд╡рд┐рд╢реЗрд╖рдЬреНрдЮред рдореЗрдЯрд╛рдлрд┐рдЬрд┐рдХ.рдПрдЖрдИ рдореЗрдВ рдЕрдиреБрд╕рдВрдзрд╛рди рд╕рд╛рдордЧреНрд░реА рдХреЗ рдкреВрд░реНрд╡ рдкреНрд░рдореБрдЦред
рд╡реНрдпрдХреНрддрд┐рдЧрдд рд╕рд╛рдЗрдЯ: martinanderson.ai
рд╕рдВрдкрд░реНрдХ: [email protected]
рдЯреНрд╡рд┐рдЯрд░: @manders_ai

рд╡рд┐рдЬреНрдЮрд╛рдкрди рдкреНрд░рдХрдЯреАрдХрд░рдг: Unite.AI рд╕рдЯреАрдХ рдЬрд╛рдирдХрд╛рд░реА рдФрд░ рд╕рдорд╛рдЪрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрдареЛрд░ рд╕рдВрдкрд╛рджрдХреАрдп рдорд╛рдирдХреЛрдВ рдХреЗ рдкреНрд░рддрд┐ рдкреНрд░рддрд┐рдмрджреНрдз рд╣реИред рдЬрдм рдЖрдк рдЙрди рдЙрддреНрдкрд╛рджреЛрдВ рдХреЗ рд▓рд┐рдВрдХ рдкрд░ рдХреНрд▓рд┐рдХ рдХрд░рддреЗ рд╣реИрдВ рдЬрд┐рдирдХреА рд╣рдордиреЗ рд╕рдореАрдХреНрд╖рд╛ рдХреА рд╣реИ, рддреЛ рд╣рдореЗрдВ рдореБрдЖрд╡рдЬрд╛ рдорд┐рд▓ рд╕рдХрддрд╛ рд╣реИред