рдирд┐рдЧрд░рд╛рдиреА
рдПрдЖрдИ рдиреЗ рдЦрд╛рд▓реА рджреАрд╡рд╛рд░реЛрдВ рджреНрд╡рд╛рд░рд╛ рдЦреБрд▓рд╛рд╕рд╛ рдХреА рдЧрдИ рдЧреБрдкреНрдд рдЧрддрд┐рд╡рд┐рдзрд┐ рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдпрд╛

एक अनुसंधान सहयोग, जिसमें NVIDIA और MIT के योगदानकर्ता शामिल हैं, ने एक मशीन लर्निंग विधि विकसित की है जो किसी भी प्रकाश स्रोत के पास न होने पर भी एक निकटवर्ती दीवार पर अप्रत्यक्ष प्रकाश व्यवस्था को देखकर छिपे हुए लोगों की पहचान कर सकती है। इस विधि की सटीकता लगभग 94% है जब यह छिपे हुए लोगों की संख्या की पहचान करने का प्रयास करती है, और यह एक छिपे हुए व्यक्ति की विशिष्ट गतिविधि की भी पहचान कर सकती है जो मानव आंखों और मानक छवि वृद्धि विधियों के लिए अदृश्य प्रकाश की बड़ी मात्रा में वृद्धि करती है।

अदृश्य परिवर्तन, नए तरीके से बढ़ाया गया, जो परिवर्तन के क्षेत्रों की पहचान करने के लिए कन्वोल्यूशनल न्यूरल नेटवर्क का उपयोग करता है। स्रोत: https://www.youtube.com/watch?v=K4PapXyX-bI
नई पेपर का शीर्षक एक खाली दीवार पर घूरने से आप क्या सीख सकते हैं है, जिसमें NVIDIA और MIT के साथ-साथ इज़राइल प्रौद्योगिकी संस्थान के योगदान शामिल हैं।
पिछले दृष्टिकोण ‘दीवारों के चारों ओर देखने’ पर नियंत्रित प्रकाश स्रोतों या ज्ञात अवरोधन स्रोतों के पूर्व ज्ञान पर निर्भर करते हैं, जबकि नई तकनीक किसी भी नए कमरे में सामान्य हो सकती है, जिसमें पुनः कैलिब्रेशन की कोई आवश्यकता नहीं है। दो कन्वोल्यूशनल न्यूरल नेटवर्क जो छिपे हुए लोगों को अलग करते हैं, ने केवल 20 दृश्यों से प्राप्त डेटा का उपयोग किया है।
परियोजना उच्च जोखिम वाले, सुरक्षा-संवेदनशील स्थितियों, खोज और बचाव अभियानों, सामान्य कानून प्रवर्तन निगरानी कार्यों, आपातकालीन प्रतिक्रिया परिदृश्यों, बुजुर्ग लोगों में गिरने का पता लगाने और स्वायत्त वाहनों के लिए छिपे हुए पैदल यात्रियों का पता लगाने के लिए है।
पассив मूल्यांकन
जैसा कि कंप्यूटर विजन परियोजनाओं के साथ अक्सर होता है, केंद्रीय कार्य छवि स्ट्रीम में महसूस की गई स्थिति परिवर्तनों की पहचान, वर्गीकरण और संचालन करना था। परिवर्तनों को जोड़ने से वे पैटर्न बनते हैं जो या तो व्यक्तियों की संख्या की पहचान करने या एक या एक से अधिक व्यक्तियों की गतिविधि का पता लगाने के लिए उपयोग किए जा सकते हैं।
कार्य पूरी तरह से पассив दृश्य मूल्यांकन की संभावना खोलता है, जिसमें प्रतिबिंबित सतहों, वाई-फाई सिग्नल, रडार, ध्वनि या अन्य ‘विशेष परिस्थितियों’ की आवश्यकता नहीं होती है जो हाल के वर्षों में खतरनाक या महत्वपूर्ण वातावरण में छिपे हुए मानव उपस्थिति की स्थापना करने के लिए अन्य शोध प्रयासों में आवश्यक थीं।

नई अनुसंधान के लिए उपयोग की जाने वाली एक नमूना डेटा-संग्रह परिदृश्य। विषयों को सावधानी से स्थिति दी जाती है ताकि वे छाया न डालें या सीधे प्रकाश स्रोतों को अवरुद्ध न करें, और कोई प्रतिबिंबित सतह या अन्य ‘चीट’ वेक्टर अनुमति नहीं है। स्रोत: https://arxiv.org/pdf/2108.13027.pdf
प्रभावी रूप से, दृश्य के लिए परिकल्पित सामान्य परिदृश्य में वातावरणीय प्रकाश छिपे हुए लोगों से परावर्तित प्रकाश के कारण होने वाली छोटी विकृतियों को दबा देगा। शोधकर्ता यह गणना करते हैं कि व्यक्तियों का प्रकाश-विकृति योगदान आमतौर पर दृश्य प्रकाश के कुल मूल्य का 1% से कम होगा।
स्थिर प्रकाश को हटाना
स्पष्ट रूप से स्थिर दीवार छवि से गति को निकालने के लिए, यह आवश्यक है कि वीडियो का समय समीकरण निकाला जाए और प्रत्येक फ्रेम से हटा दिया जाए। परिणामी गति पैटर्न आमतौर पर अच्छी गुणवत्ता वाले वीडियो उपकरणों के शोर सीमा से नीचे होते हैं, और वास्तव में अधिकांश गति नकारात्मक पिक्सेल स्थान में होती है।
इसे ठीक करने के लिए, शोधकर्ता वीडियो को 16 गुना कम नमूना लेते हैं और परिणामी फुटेज को 50 गुना बढ़ाते हैं, साथ ही नकारात्मक पिक्सेल (जो बेसलाइन वीडियो सेंसर शोर द्वारा खाता नहीं दिया जा सकता है) की उपस्थिति को निर्धारित करने के लिए मध्य-ग्रे आधार स्तर जोड़ते हैं।

मानव-दृश्य दीवार और छिपे हुए व्यक्तियों के परिवर्तन के बीच अंतर। चूंकि छवि गुणवत्ता इस शोध में एक केंद्रीय मुद्दा है, कृपया लेख के अंत में आधिकारिक वीडियो देखें जो उच्च गुणवत्ता वाली छवि प्रदान करता है।
गति को महसूस करने का अवसर बहुत ही नाजुक है, और यहां तक कि 60 हर्ट्ज एसी आवृत्ति पर प्रकाश के फ्लिकरिंग से भी प्रभावित हो सकता है। इसलिए, यह प्राकृतिक परिवर्तन भी मूल्यांकन किया जाना चाहिए और व्यक्ति-प्रेरित गति उभरने से पहले फुटेज से हटा दिया जाना चाहिए।
अंत में, प्रणाली स्थान-काल ग्राफ बनाती है जो एक निश्चित संख्या में छिपे हुए कमरे के निवासियों का संकेत देती है – विचारशील दृश्य हस्ताक्षर:

एक कमरे में छिपे हुए लोगों की विभिन्न संख्या का प्रतिनिधित्व करने वाले हस्ताक्षर स्थान-काल ग्राफ।
विभिन्न मानव गतिविधियों के परिणामस्वरूप भी हस्ताक्षर परिवर्तन होंगे जो वर्गीकृत और बाद में मान्यता प्राप्त हो सकते हैं:

निष्क्रियता, चलने, झुकने, हाथ हिलाने और कूदने के लिए स्थान-काल प्लॉट हस्ताक्षर।
छिपे हुए व्यक्ति की पहचान के लिए एक स्वचालित मशीन लर्निंग-आधारित कार्यप्रवाह का उत्पादन करने के लिए, 20 उपयुक्त परिदृश्यों से विभिन्न फुटेज का उपयोग दो न्यूरल नेटवर्क को प्रशिक्षित करने के लिए किया गया था – एक दृश्य में लोगों की संख्या को गिनने के लिए और दूसरा किसी भी गति की पहचान करने के लिए।
परीक्षण
शोधकर्ताओं ने दस अनदेखे वास्तविक दुनिया के वातावरण में प्रशिक्षित प्रणाली का परीक्षण किया, जो अंतिम तैनाती के लिए अपेक्षित सीमाओं को पुनः बनाने के लिए डिज़ाइन किए गए थे। प्रणाली ने 256 फ्रेम (आमतौर पर लगभग 8 सेकंड का वीडियो) में छिपे हुए लोगों की संख्या को वर्गीकृत करने में 94.4% तक की सटीकता हासिल की, और उसी शर्तों के तहत गतिविधियों को वर्गीकृत करने में 93.7% तक की सटीकता हासिल की। हालांकि सटीकता कम फ्रेम के साथ गिरती है, यह एक रैखिक गिरावट नहीं है, और यहां तक कि 64 फ्रेम भी ‘लोगों की संख्या’ मूल्यांकन के लिए 79.4% की सटीकता दर प्राप्त कर सकते हैं (लगभग 95% की तुलना में चार गुना अधिक फ्रेम)।
हालांकि विधि मौसम-आधारित प्रकाश परिवर्तनों के प्रति लचीली है, यह एक टेलीविजन द्वारा रोशन की गई दृश्य में संघर्ष करती है, या परिस्थितियों में जहां लोग दीवार के समान रंग के एकरूप कपड़े पहने हुए हैं।
अधिक विवरण, उच्च गुणवत्ता वाले निकाली गई छवियों सहित, नीचे दिए गए आधिकारिक वीडियो में देखे जा सकते हैं।













