Connect with us

рдПрдЖрдИ рдиреЗ рдЦрд╛рд▓реА рджреАрд╡рд╛рд░реЛрдВ рджреНрд╡рд╛рд░рд╛ рдЦреБрд▓рд╛рд╕рд╛ рдХреА рдЧрдИ рдЧреБрдкреНрдд рдЧрддрд┐рд╡рд┐рдзрд┐ рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдпрд╛

рдирд┐рдЧрд░рд╛рдиреА

рдПрдЖрдИ рдиреЗ рдЦрд╛рд▓реА рджреАрд╡рд╛рд░реЛрдВ рджреНрд╡рд╛рд░рд╛ рдЦреБрд▓рд╛рд╕рд╛ рдХреА рдЧрдИ рдЧреБрдкреНрдд рдЧрддрд┐рд╡рд┐рдзрд┐ рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдпрд╛

mm

एक अनुसंधान सहयोग, जिसमें NVIDIA और MIT के योगदानकर्ता शामिल हैं, ने एक मशीन लर्निंग विधि विकसित की है जो किसी भी प्रकाश स्रोत के पास न होने पर भी एक निकटवर्ती दीवार पर अप्रत्यक्ष प्रकाश व्यवस्था को देखकर छिपे हुए लोगों की पहचान कर सकती है। इस विधि की सटीकता लगभग 94% है जब यह छिपे हुए लोगों की संख्या की पहचान करने का प्रयास करती है, और यह एक छिपे हुए व्यक्ति की विशिष्ट गतिविधि की भी पहचान कर सकती है जो मानव आंखों और मानक छवि वृद्धि विधियों के लिए अदृश्य प्रकाश की बड़ी मात्रा में वृद्धि करती है।

अदृश्य परिवर्तन, नए तरीके से बढ़ाया गया, जो परिवर्तन के क्षेत्रों की पहचान करने के लिए कन्वोल्यूशनल न्यूरल नेटवर्क का उपयोग करता है। स्रोत: https://www.youtube.com/watch?v=K4PapXyX-bI

अदृश्य परिवर्तन, नए तरीके से बढ़ाया गया, जो परिवर्तन के क्षेत्रों की पहचान करने के लिए कन्वोल्यूशनल न्यूरल नेटवर्क का उपयोग करता है। स्रोत: https://www.youtube.com/watch?v=K4PapXyX-bI

नई पेपर का शीर्षक एक खाली दीवार पर घूरने से आप क्या सीख सकते हैं है, जिसमें NVIDIA और MIT के साथ-साथ इज़राइल प्रौद्योगिकी संस्थान के योगदान शामिल हैं।

पिछले दृष्टिकोण ‘दीवारों के चारों ओर देखने’ पर नियंत्रित प्रकाश स्रोतों या ज्ञात अवरोधन स्रोतों के पूर्व ज्ञान पर निर्भर करते हैं, जबकि नई तकनीक किसी भी नए कमरे में सामान्य हो सकती है, जिसमें पुनः कैलिब्रेशन की कोई आवश्यकता नहीं है। दो कन्वोल्यूशनल न्यूरल नेटवर्क जो छिपे हुए लोगों को अलग करते हैं, ने केवल 20 दृश्यों से प्राप्त डेटा का उपयोग किया है।

परियोजना उच्च जोखिम वाले, सुरक्षा-संवेदनशील स्थितियों, खोज और बचाव अभियानों, सामान्य कानून प्रवर्तन निगरानी कार्यों, आपातकालीन प्रतिक्रिया परिदृश्यों, बुजुर्ग लोगों में गिरने का पता लगाने और स्वायत्त वाहनों के लिए छिपे हुए पैदल यात्रियों का पता लगाने के लिए है।

पассив मूल्यांकन

जैसा कि कंप्यूटर विजन परियोजनाओं के साथ अक्सर होता है, केंद्रीय कार्य छवि स्ट्रीम में महसूस की गई स्थिति परिवर्तनों की पहचान, वर्गीकरण और संचालन करना था। परिवर्तनों को जोड़ने से वे पैटर्न बनते हैं जो या तो व्यक्तियों की संख्या की पहचान करने या एक या एक से अधिक व्यक्तियों की गतिविधि का पता लगाने के लिए उपयोग किए जा सकते हैं।

कार्य पूरी तरह से पассив दृश्य मूल्यांकन की संभावना खोलता है, जिसमें प्रतिबिंबित सतहों, वाई-फाई सिग्नल, रडार, ध्वनि या अन्य ‘विशेष परिस्थितियों’ की आवश्यकता नहीं होती है जो हाल के वर्षों में खतरनाक या महत्वपूर्ण वातावरण में छिपे हुए मानव उपस्थिति की स्थापना करने के लिए अन्य शोध प्रयासों में आवश्यक थीं।

рдирдИ рдЕрдиреБрд╕рдВрдзрд╛рди рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рдиреЗ рд╡рд╛рд▓реА рдПрдХ рдирдореВрдирд╛ рдбреЗрдЯрд╛-рд╕рдВрдЧреНрд░рд╣ рдкрд░рд┐рджреГрд╢реНрдпред рд╡рд┐рд╖рдпреЛрдВ рдХреЛ рд╕рд╛рд╡рдзрд╛рдиреА рд╕реЗ рд╕реНрдерд┐рддрд┐ рджреА рдЬрд╛рддреА рд╣реИ рддрд╛рдХрд┐ рд╡реЗ рдЫрд╛рдпрд╛ рди рдбрд╛рд▓реЗрдВ рдпрд╛ рд╕реАрдзреЗ рдкреНрд░рдХрд╛рд╢ рд╕реНрд░реЛрддреЛрдВ рдХреЛ рдЕрд╡рд░реБрджреНрдз рди рдХрд░реЗрдВ, рдФрд░ рдХреЛрдИ рдкреНрд░рддрд┐рдмрд┐рдВрдмрд┐рдд рд╕рддрд╣ рдпрд╛ рдЕрдиреНрдп 'рдЪреАрдЯ' рд╡реЗрдХреНрдЯрд░ рдЕрдиреБрдорддрд┐ рдирд╣реАрдВ рд╣реИред рд╕реНрд░реЛрдд: https://arxiv.org/pdf/2108.13027.pdf

नई अनुसंधान के लिए उपयोग की जाने वाली एक नमूना डेटा-संग्रह परिदृश्य। विषयों को सावधानी से स्थिति दी जाती है ताकि वे छाया न डालें या सीधे प्रकाश स्रोतों को अवरुद्ध न करें, और कोई प्रतिबिंबित सतह या अन्य ‘चीट’ वेक्टर अनुमति नहीं है। स्रोत: https://arxiv.org/pdf/2108.13027.pdf

प्रभावी रूप से, दृश्य के लिए परिकल्पित सामान्य परिदृश्य में वातावरणीय प्रकाश छिपे हुए लोगों से परावर्तित प्रकाश के कारण होने वाली छोटी विकृतियों को दबा देगा। शोधकर्ता यह गणना करते हैं कि व्यक्तियों का प्रकाश-विकृति योगदान आमतौर पर दृश्य प्रकाश के कुल मूल्य का 1% से कम होगा।

स्थिर प्रकाश को हटाना

स्पष्ट रूप से स्थिर दीवार छवि से गति को निकालने के लिए, यह आवश्यक है कि वीडियो का समय समीकरण निकाला जाए और प्रत्येक फ्रेम से हटा दिया जाए। परिणामी गति पैटर्न आमतौर पर अच्छी गुणवत्ता वाले वीडियो उपकरणों के शोर सीमा से नीचे होते हैं, और वास्तव में अधिकांश गति नकारात्मक पिक्सेल स्थान में होती है।

इसे ठीक करने के लिए, शोधकर्ता वीडियो को 16 गुना कम नमूना लेते हैं और परिणामी फुटेज को 50 गुना बढ़ाते हैं, साथ ही नकारात्मक पिक्सेल (जो बेसलाइन वीडियो सेंसर शोर द्वारा खाता नहीं दिया जा सकता है) की उपस्थिति को निर्धारित करने के लिए मध्य-ग्रे आधार स्तर जोड़ते हैं।

मानव-दृश्य दीवार और छिपे हुए व्यक्तियों के परिवर्तन के बीच अंतर। चूंकि छवि गुणवत्ता इस शोध में एक केंद्रीय मुद्दा है, कृपया लेख के अंत में आधिकारिक वीडियो देखें जो उच्च गुणवत्ता वाली छवि प्रदान करता है।

मानव-दृश्य दीवार और छिपे हुए व्यक्तियों के परिवर्तन के बीच अंतर। चूंकि छवि गुणवत्ता इस शोध में एक केंद्रीय मुद्दा है, कृपया लेख के अंत में आधिकारिक वीडियो देखें जो उच्च गुणवत्ता वाली छवि प्रदान करता है।

गति को महसूस करने का अवसर बहुत ही नाजुक है, और यहां तक कि 60 हर्ट्ज एसी आवृत्ति पर प्रकाश के फ्लिकरिंग से भी प्रभावित हो सकता है। इसलिए, यह प्राकृतिक परिवर्तन भी मूल्यांकन किया जाना चाहिए और व्यक्ति-प्रेरित गति उभरने से पहले फुटेज से हटा दिया जाना चाहिए।

अंत में, प्रणाली स्थान-काल ग्राफ बनाती है जो एक निश्चित संख्या में छिपे हुए कमरे के निवासियों का संकेत देती है – विचारशील दृश्य हस्ताक्षर:

рдПрдХ рдХрдорд░реЗ рдореЗрдВ рдЫрд┐рдкреЗ рд╣реБрдП рд▓реЛрдЧреЛрдВ рдХреА рд╡рд┐рднрд┐рдиреНрди рд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рд╣рд╕реНрддрд╛рдХреНрд╖рд░ рд╕реНрдерд╛рди-рдХрд╛рд▓ рдЧреНрд░рд╛рдлред

एक कमरे में छिपे हुए लोगों की विभिन्न संख्या का प्रतिनिधित्व करने वाले हस्ताक्षर स्थान-काल ग्राफ।

विभिन्न मानव गतिविधियों के परिणामस्वरूप भी हस्ताक्षर परिवर्तन होंगे जो वर्गीकृत और बाद में मान्यता प्राप्त हो सकते हैं:

рдирд┐рд╖реНрдХреНрд░рд┐рдпрддрд╛, рдЪрд▓рдиреЗ, рдЭреБрдХрдиреЗ, рд╣рд╛рде рд╣рд┐рд▓рд╛рдиреЗ рдФрд░ рдХреВрджрдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрдерд╛рди-рдХрд╛рд▓ рдкреНрд▓реЙрдЯ рд╣рд╕реНрддрд╛рдХреНрд╖рд░ред

निष्क्रियता, चलने, झुकने, हाथ हिलाने और कूदने के लिए स्थान-काल प्लॉट हस्ताक्षर।

छिपे हुए व्यक्ति की पहचान के लिए एक स्वचालित मशीन लर्निंग-आधारित कार्यप्रवाह का उत्पादन करने के लिए, 20 उपयुक्त परिदृश्यों से विभिन्न फुटेज का उपयोग दो न्यूरल नेटवर्क को प्रशिक्षित करने के लिए किया गया था – एक दृश्य में लोगों की संख्या को गिनने के लिए और दूसरा किसी भी गति की पहचान करने के लिए।

परीक्षण

शोधकर्ताओं ने दस अनदेखे वास्तविक दुनिया के वातावरण में प्रशिक्षित प्रणाली का परीक्षण किया, जो अंतिम तैनाती के लिए अपेक्षित सीमाओं को पुनः बनाने के लिए डिज़ाइन किए गए थे। प्रणाली ने 256 फ्रेम (आमतौर पर लगभग 8 सेकंड का वीडियो) में छिपे हुए लोगों की संख्या को वर्गीकृत करने में 94.4% तक की सटीकता हासिल की, और उसी शर्तों के तहत गतिविधियों को वर्गीकृत करने में 93.7% तक की सटीकता हासिल की। हालांकि सटीकता कम फ्रेम के साथ गिरती है, यह एक रैखिक गिरावट नहीं है, और यहां तक कि 64 फ्रेम भी ‘लोगों की संख्या’ मूल्यांकन के लिए 79.4% की सटीकता दर प्राप्त कर सकते हैं (लगभग 95% की तुलना में चार गुना अधिक फ्रेम)।

हालांकि विधि मौसम-आधारित प्रकाश परिवर्तनों के प्रति लचीली है, यह एक टेलीविजन द्वारा रोशन की गई दृश्य में संघर्ष करती है, या परिस्थितियों में जहां लोग दीवार के समान रंग के एकरूप कपड़े पहने हुए हैं।

अधिक विवरण, उच्च गुणवत्ता वाले निकाली गई छवियों सहित, नीचे दिए गए आधिकारिक वीडियो में देखे जा सकते हैं।

рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкрд░ рд▓реЗрдЦрдХ, рдорд╛рдирд╡ рдЗрдореЗрдЬ рд╕рд┐рдВрдереЗрд╕рд┐рд╕ рдореЗрдВ рдбреЛрдореЗрди рд╡рд┐рд╢реЗрд╖рдЬреНрдЮред рдореЗрдЯрд╛рдлрд┐рдЬрд┐рдХ.рдПрдЖрдИ рдореЗрдВ рдЕрдиреБрд╕рдВрдзрд╛рди рд╕рд╛рдордЧреНрд░реА рдХреЗ рдкреВрд░реНрд╡ рдкреНрд░рдореБрдЦред
рд╡реНрдпрдХреНрддрд┐рдЧрдд рд╕рд╛рдЗрдЯ: martinanderson.ai
рд╕рдВрдкрд░реНрдХ: [email protected]
рдЯреНрд╡рд┐рдЯрд░: @manders_ai