Connect with us

рд╣рд╛рдирд┐рдХрд╛рд░рдХ рд╡реАрдбрд┐рдпреЛ рд╕рд╛рдордЧреНрд░реА рдХреА рдкрд╣рдЪрд╛рди рдореВрд╡реА рдЯреНрд░реЗрд▓рд░ рдФрд░ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдХреЗ рд╕рд╛рде

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рд╣рд╛рдирд┐рдХрд╛рд░рдХ рд╡реАрдбрд┐рдпреЛ рд╕рд╛рдордЧреНрд░реА рдХреА рдкрд╣рдЪрд╛рди рдореВрд╡реА рдЯреНрд░реЗрд▓рд░ рдФрд░ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдХреЗ рд╕рд╛рде

mm

स्वीडिश मीडिया काउंसिल के एक शोध पत्र में ‘हानिकारक सामग्री’ की स्वचालित पहचान के लिए एक संभावित नई दृष्टिकोण का रूपरेखा तैयार किया गया है, जिसमें ऑडियो और वीडियो सामग्री को अलग-अलग माना जाता है, और मानव-annotated डेटा को परेशान करने वाली सामग्री के लिए एक मार्गदर्शक सूचकांक के रूप में उपयोग किया जाता है।

इस शीर्षक के साथ क्या यह हानिकारक है? वीडियो से हानिकारकता रेटिंग की भविष्यवाणी सीखना, पत्र पेपर में दृश्य के पूरे संदर्भ को ध्यान में रखने के लिए मशीन लर्निंग सिस्टम की आवश्यकता को दर्शाता है, और यह दर्शाता है कि हानिरहित सामग्री (जैसे कि हास्य या व्यंग्य सामग्री) को एक कम जटिल और बहुस्तरीय वीडियो विश्लेषण दृष्टिकोण में हानिकारक के रूप में गलत तरीके से व्याख्या किया जा सकता है – कम से कम इसलिए कि एक फिल्म का संगीत साउंडट्रैक अक्सर अप्रत्याशित तरीकों से उपयोग किया जाता है, या तो दर्शक को असहज करने के लिए या दर्शक को आश्वस्त करने के लिए, और दृश्य घटक के पूरक के रूप में नहीं बल्कि एक प्रतिपक्षी के रूप में।

संभावित रूप से हानिकारक वीडियो का एक डेटासेट

शोधकर्ताओं ने टिप्पणी की है कि इस क्षेत्र में उपयोगी विकास को फिल्मों के कॉपीराइट संरक्षण द्वारा बाधित किया गया है, जो सार्वजनिक स्रोत डेटासेट बनाने को समस्याग्रस्त बना देता है। वे यह भी देखते हैं कि अब तक, इसी तरह के प्रयोगों को पूर्ण लंबाई वाली फिल्मों के लिए लेबल की कमी से पीड़ित किया गया है, जिसके परिणामस्वरूप पिछले कार्य ने डेटा को सरल बना दिया है, या केवल डेटा के एक ही पहलू पर ध्यान केंद्रित किया है, जैसे कि प्रमुख रंग या संवाद विश्लेषण।

इस समस्या को हल करने के लिए, शोधकर्ताओं ने लगभग दस सेकंड की लंबाई के टुकड़ों में कटे हुए 4000 वीडियो क्लिप का एक वीडियो डेटासेट तैयार किया है, जिन्हें स्वीडन में नए फिल्मों के लिए रेटिंग के आवेदन की देखरेख करने वाले पेशेवर फिल्म वर्गीकरणकर्ताओं द्वारा लेबल किया गया है, जिनमें से कई के पास बाल मनोविज्ञान में पेशेवर योग्यता है।

स्वीडिश फिल्म वर्गीकरण प्रणाली के तहत, ‘हानिकारक’ सामग्री को बच्चों में चिंता, भय, और अन्य नकारात्मक प्रभाव पैदा करने की संभावित प्रवृत्ति के आधार पर परिभाषित किया जाता है। शोधकर्ताओं ने टिप्पणी की है कि चूंकि यह रेटिंग प्रणाली विज्ञान के साथ-साथ अंतर्ज्ञान और प्रवृत्ति को शामिल करती है, इसलिए ‘हानिकारक सामग्री’ की परिभाषा के मापदंडों को एक स्वचालित प्रणाली में क्वांटिफाई और स्थापित करना मुश्किल है।

हानि की परिभाषा

पत्र आगे देखता है कि इस चुनौती का सामना करने वाले पहले के मशीन लर्निंग और एल्गोरिदमिक सिस्टम ने विशिष्ट सुविधा का पता लगाने का उपयोग मानदंड के रूप में किया है, जिसमें रक्त और आग की दृश्य पहचान, फट जाने की आवाज, और शॉट लंबाई की आवृत्ति शामिल है, और एक बहुस्तरीय दृष्टिकोण हानिकारक सामग्री की स्वचालित रेटिंग के लिए एक बेहतर विधि प्रदान करने की संभावना है।

स्वीडिश शोधकर्ताओं ने Kinetics-400 मानव आंदोलन बेंचमार्क डेटासेट पर एक 8×8 50-परत वाले न्यूरल नेटवर्क मॉडल को प्रशिक्षित किया, और वीडियो और ऑडियो पूर्वानुमानों को मिलाने के लिए एक वास्तुकला तैयार की।

वास्तव में, ट्रेलर का उपयोग इस प्रकार के डेटासेट बनाने के लिए तीन समस्याओं का समाधान करता है: यह कॉपीराइट मुद्दों को समाप्त करता है; ट्रेलरों की तुलना में मूल फिल्मों की तुलना में अधिक अशांति और उच्च शॉट आवृत्ति की अनुमति देता है, जो एक बड़ी आवृत्ति के साथ एनोटेशन की अनुमति देता है; और यह सुनिश्चित करता है कि एक पूरी फिल्म में हिंसक या परेशान करने वाली सामग्री की कम घटना डेटासेट को असंतुलित नहीं करती है और इसे गलती से बच्चों के लिए उपयुक्त नहीं मानती है।

परिणाम

एक बार मॉडल प्रशिक्षित हो जाने के बाद, स्वीडिश शोधकर्ताओं ने प्रणाली का परीक्षण वीडियो-क्लिप के खिलाफ किया।

इस द डीप (2012) के ट्रेलर में, परीक्षण के लिए उपयोग किए गए दो मॉडल (यादृच्छिक नमूना लेबल बनाम संभाव्य लेबल) ने सफलतापूर्वक फिल्म को 11 वर्ष और उससे अधिक आयु के दर्शकों के लिए उपयुक्त के रूप में वर्गीकृत किया।

рд╕реНрд░реЛрдд: https://arxiv.org/pdf/2106.08323.pdf

स्रोत: https://arxiv.org/pdf/2106.08323.pdf

डिस्कार्नेट (2018) के एक दृश्य में जहां एक दुश्मन प्रतिपक्षी की शुरुआत होती है, दोहरी फ्रेमवर्क ने फिर से सही ढंग से लक्ष्य आयु सीमा का अनुमान लगाया कि 11+/15+।

हालांकि, ए सेकेंड चांस (2014) के ट्रेलर का एक क्लिप अधिक कठिनाई पेश करता है, क्योंकि मॉडल मानव एनोटेशन के साथ सहमत नहीं हो पाया, जिसने दृश्य को ‘बीटी’ (सार्वजनिक रूप से स्वीकार्य) के रूप में वर्गीकृत किया था। वास्तव में, एल्गोरिदम ने संभावित हानि का पता लगाया है जिसे मानव मूल्यांकनकर्ताओं ने इसके लिए जिम्मेदार नहीं ठहराया है।

शोधकर्ताओं का दावा है कि प्रणाली के लिए एक उच्च सटीकता स्कोर है, लेकिन कुछ विफलताएं हुईं, जैसे कि सिटी स्टेट (2011) का एक क्लिप, जिसमें एक नग्न आदमी को एक राइफल से धमकी दी जा रही है।

इस मामले में, प्रणाली ने क्लिप को 11+ रेटिंग सौंपी है, जो मानव एनोटेशन के विपरीत है।

इरादे और हानिकारकता का विरोधाभास

पत्र यह भी देखता है कि पेडर्ट (2020) के ट्रेलर के एक क्लिप का मूल्यांकन करते समय, प्रणाली ने दृश्य और भाषाई पहलुओं (हालांकि पात्र आग्नेयास्त्रों पर चर्चा कर रहे हैं, इरादा हास्य है) के आधार पर क्लिप को ‘सार्वजनिक’ रेटिंग सौंपी, लेकिन व्यंग्य संदर्भ में उपयोग किए जाने वाले धमकी भरे संगीत से भ्रमित हो गई।

इसी तरह, फॉर समा (2019) के फिल्म के ट्रेलर में, संगीत सामग्री की धमकी भरी शैली दृश्य सामग्री से मेल नहीं खाती है, और एक बार फिर, प्रणाली को दोनों घटकों को एक समान निर्णय लेने के लिए अलग करने में कठिनाई होती है जो क्लिप की ऑडियो और वीडियो सामग्री दोनों को कवर करती है।

अंत में, प्रणाली वर्जिन माउंटेन (2015) के ट्रेलर के एक क्लिप में ऑडियो/वीडियो विरोधाभास को सफलतापूर्वक नेविगेट करती है, जिसमें कुछ धमकी भरे दृश्य संकेत हैं (जैसे कि एक टूटी हुई खिड़की) जो संगीत द्वारा कमजोर हो जाते हैं। इसलिए, फ्रेमवर्क सही ढंग से अनुमान लगाता है कि क्लिप ‘सार्वजनिक’ (बीटी) रेटिंग है।

शोधकर्ताओं का मानना है कि इस प्रकार की प्रणाली विशेष रूप से बच्चों पर केंद्रित है, और परिणाम अन्य प्रकार के दर्शकों के लिए अच्छी तरह से सामान्य नहीं होंगे। वे यह भी सुझाव देते हैं कि ‘हानिकारक’ सामग्री को इस रूप में कोडिफाई करने से एल्गोरिदमिक रेटिंग प्रणाली कम अप्रत्याशित हो सकती है, लेकिन वे इस तरह के दृष्टिकोण के विकास में विचारों के अवांछित दमन की संभावना को भी नोट करते हैं:

‘सामग्री को हानिकारक मानना एक नाजुक मुद्दा है। सूचना की स्वतंत्रता और संवेदनशील समूहों की रक्षा के बीच एक महत्वपूर्ण संतुलन है। हम मानते हैं कि यह काम सही दिशा में एक कदम है, जो हानिकारकता का मूल्यांकन करने के लिए उपयोग किए जाने वाले मानदंडों के बारे में पारदर्शी होने के लिए। इसके अलावा, हम मानते हैं कि हानिकारकता को उपयुक्तता से अलग करना हानिकारक सामग्री की वर्गीकरण को अधिक विषयगत बनाने के लिए एक महत्वपूर्ण कदम है।’

‘…हानिकारक सामग्री का पता लगाना यूट्यूब जैसे ऑनलाइन प्लेटफ़ॉर्म के लिए भी रुचिकर है। ऐसे प्लेटफ़ॉर्म पर, स्वतंत्रता और सुरक्षा के बीच संतुलन और भी महत्वपूर्ण हो जाता है और एल्गोरिदम के स्वामित्व स्वरूप द्वारा जटिल हो जाता है।’

 

рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкрд░ рд▓реЗрдЦрдХ, рдорд╛рдирд╡ рдЗрдореЗрдЬ рд╕рд┐рдВрдереЗрд╕рд┐рд╕ рдореЗрдВ рдбреЛрдореЗрди рд╡рд┐рд╢реЗрд╖рдЬреНрдЮред рдореЗрдЯрд╛рдлрд┐рдЬрд┐рдХ.рдПрдЖрдИ рдореЗрдВ рдЕрдиреБрд╕рдВрдзрд╛рди рд╕рд╛рдордЧреНрд░реА рдХреЗ рдкреВрд░реНрд╡ рдкреНрд░рдореБрдЦред
рд╡реНрдпрдХреНрддрд┐рдЧрдд рд╕рд╛рдЗрдЯ: martinanderson.ai
рд╕рдВрдкрд░реНрдХ: [email protected]
рдЯреНрд╡рд┐рдЯрд░: @manders_ai