Connect with us

1970 के दशक का वाइब से लेकर ऊर्जा-संरक्षण वाली एआई निगरानी तक

Anderson का एंगल

1970 के दशक का वाइब से लेकर ऊर्जा-संरक्षण वाली एआई निगरानी तक

mm
Excerpts from a video simulating a grayscale video stream activated by object detection – source: https://videos.pexels.com/video-files/36553218/15498630_2560_1440_25fps.mp4

नए शोध से पता चलता है कि अधिकांश वीडियो एआई को रंग की बिल्कुल भी आवश्यकता नहीं है, इसे केवल महत्वपूर्ण क्षणों पर चालू करने और डेटा उपयोग को 90% से अधिक कम करने से सटीकता में बहुत कम कमी आती है।

 

रिमोट स्ट्रीमिंग कैमरे और अन्य अनटेदर्ड, बैटरी-चालित वीडियो उपकरणों को कसकर अनुकूलित निगरानी सेटअप की आवश्यकता होती है, क्योंकि वे अस्थिर बिजली स्रोतों – जैसे कि सौर – पर निर्भर हो सकते हैं या उन्हें आवधिक रिचार्जिंग, या मानवीय हस्तक्षेप के अन्य रूपों की आवश्यकता हो सकती है, ऐसी स्थितियों में जहाँ आदर्श रूप से, किसी की उपस्थिति की आवश्यकता नहीं होनी चाहिए।

इस शोध की श्रृंखला के साथ-साथ, कैमरा-युक्त वेयरेबल्स में रुचि भी बढ़ी है (भले ही ऐसे उपकरण पहले से ही शक्ति और कंप्यूट सीमाओं द्वारा कसकर सीमित थे), क्योंकि एज एआई अब उन्हें काफी अधिक उपयोगी बनाने का वादा करती है।

इन विचारों से परे, एज एआई और निगरानी लागत को कम करने की दीर्घकालिक प्रेरणा (विशेष रूप से ऐसे मामलों में जहाँ ऐसी बचत ग्राहक को पारित करने की आवश्यकता नहीं है) ‘एज’ उपयोग-मामलों के लिए ऊर्जा संरक्षण के दृष्टिकोण में नवाचार के लिए एक सम्मोहक मामला बनाती है।

साउंड ऑफ

स्ट्रीमिंग वीडियो-सेंसिंग के क्षेत्र में, संसाधन-वंचित एज निगरानी उपकरणों को कम से कम संभव ऊर्जा का उपयोग करना चाहिए, जबकि फिर भी ‘रोचक’ घटनाओं की निगरानी के लिए पर्याप्त शक्ति व्यय करनी चाहिए – उस बिंदु पर, अधिक संसाधन खर्च करना उचित होगा।

प्रभावी रूप से, यह गति-संचालित लाइटों के समान ही एक उपयोग मामला है, जो केवल तभी प्रकाश प्रदान करती हैं जब कम-ऊर्जा-खपत वाले सेंसर यह निर्धारित करते हैं कि वहाँ कोई है जो इसकी सराहना कर सके।

चूंकि ऑडियो-निगरानी और संपीड़न वीडियो की तुलना में काफी कम संसाधन-गहन है, इसलिए हाल के वर्षों में कई दृष्टिकोणों ने सीमित प्रणालियों में ध्यान ‘चालू’ करने के लिए ध्वनि-संचालित संकेतों का उपयोग करने का प्रयास किया है; लिसन टू लुक और ईगोट्रिगर जैसे फ्रेमवर्क:

ईगोट्रिगर प्रणाली में, ऑडियो-संचालित ट्रिगरिंग हाथ-वस्तु अंतःक्रिया संकेतों से छवि कैप्चर को चुनिंदा रूप से सक्रिय करती है, संसाधन-सीमित स्मार्ट-ग्लासेस प्रणालियों में एपिसोडिक मेमोरी प्रदर्शन को संरक्षित करते हुए अनावश्यक फ्रेम को कम करती है। स्रोत - https://arxiv.org/pdf/2508.01915

ईगोट्रिगर प्रणाली में, ऑडियो-संचालित ट्रिगरिंग हाथ-वस्तु अंतःक्रिया संकेतों से छवि कैप्चर को चुनिंदा रूप से सक्रिय करती है, संसाधन-सीमित स्मार्ट-ग्लासेस प्रणालियों में एपिसोडिक मेमोरी प्रदर्शन को संरक्षित करते हुए अनावश्यक फ्रेम को कम करती है। स्रोत

स्पष्ट है कि दृश्य घटनाओं की तलाश के लिए ऑडियो आदर्श माध्यम नहीं है, क्योंकि कई आवश्यक ऐसी घटनाओं का कोई संबद्ध ऑडियो संकेत नहीं हो सकता है, या वे एज माइक्रोफोन की सीमा से बाहर हो सकती हैं।

लाइट स्लीपर

एक नया पेपर सुझाव देता है कि इससे बेहतर क्या हो सकता है, एक वीडियो स्ट्रीम जो एआई के साथ मिलकर काम कर सके ताकि जैसे ही कोई देखी जाने वाली घटना घटित हो, संसाधन बढ़ा सके। नीचे दिया गया सिमुलेशन* इस अवधारणा का एक सामान्य विचार देता है – निम्न-रिज़ॉल्यूशन निगरानी उस न्यूनतम सिग्नल-स्तर पर बनाए रखी जाती है जो ऑब्जेक्ट-डिटेक्शन फ्रेमवर्क के संचालन के लिए आवश्यक है, और किसी घटना के ट्रिगर होने के कारण रिज़ॉल्यूशन बढ़ाने के लिए सिस्टम को बताने के लिए:

वांछित व्यवहार का एक सिमुलेशन – कि स्ट्रीमिंग और विश्लेषण डिफ़ॉल्ट रूप से संसाधन खपत के अपने निम्नतम स्तर पर काम करते हैं; केवल इतना कि जब ग्रेस्केल स्ट्रीम में ‘रोचक’ या मांगी गई घटनाओं का पता चलता है तो उच्च संसाधन खपत को ट्रिगर किया जा सके। ब्लैक-एंड-व्हाइट निगरानी शैली काफी ‘रेट्रो’ हो सकती है, लेकिन यह आने वाली चीजों का संकेत हो सकती है। यह वीडियो लेखक द्वारा नए पेपर के मूल विचारों के संबंध में केवल उदाहरण देने के उद्देश्य से बनाया गया था। स्रोत:

नया कार्य, विभिन्न यूके संस्थानों और हुआवेई के बीच एक शैक्षणिक सहयोग, एज निगरानी के लिए एक प्रशिक्षण-मुक्त, एआई-सुविधायुक्त, ग्रेस्केल-हमेशा, रंग-ऑन-डिमांड स्कीमा प्रस्तावित करता है – जिसे कम टोकन उपयोग पर काम करने के लिए डिज़ाइन किया गया है जब कोई ‘मुख्य घटना’ नहीं हो रही है, और केवल घटना की अवधि के लिए खपत बढ़ाने के लिए।

स्ट्रीमिंग वीडियो समझ बेंचमार्क में, कलरट्रिगर नामक नई प्रणाली, पूर्ण-रंग बेसलाइन प्रदर्शन का 91.6% हासिल करने में सक्षम थी, जबकि उन मानकों में केवल 8.1% आरजीबी फ्रेम का उपयोग कर रही थी:

जब मॉडल केवल ग्रेस्केल वीडियो देखता है, तो यह महत्वपूर्ण विवरणों को भ्रमित कर देता है और गलत उत्तर देता है; लेकिन सही क्षणों पर रंग को ट्रिगर करने से छवि स्पष्ट हो जाती है और रंग पर निर्भर कार्यों द्वारा ट्रिगर की गई गलतियों को ठीक कर देती है। स्रोत - https://lvgd.github.io/ColorTrigger/

जब मॉडल केवल ग्रेस्केल वीडियो देखता है, तो यह महत्वपूर्ण विवरणों को भ्रमित कर देता है और गलत उत्तर देता है; लेकिन सही क्षणों पर रंग को ट्रिगर करने से छवि स्पष्ट हो जाती है और रंग पर निर्भर कार्यों द्वारा ट्रिगर की गई गलतियों को ठीक कर देती है। स्रोत

नया पेपर का शीर्षक है कलर व्हेन इट काउंट्स: ग्रेस्केल-गाइडेड ऑनलाइन ट्रिगरिंग फॉर ऑलवेज-ऑन स्ट्रीमिंग वीडियो सेंसिंग, और यह क्वीन मैरी यूनिवर्सिटी ऑफ लंदन, डरहम यूनिवर्सिटी, इंपीरियल कॉलेज लंदन और हुआवेई नोहाज़ आर्क लैब के आठ शोधकर्ताओं से आया है। पेपर का एक साथी प्रोजेक्ट पेज भी है।

विधि

नई प्रणाली में अस्थायी संरचना को संरक्षित करने के लिए, कलरट्रिगर निरंतर कम-बैंडविड्थ ग्रेस्केल निगरानी बनाए रखता है। एक कारणात्मक ऑनलाइन ट्रिगर कम-रिज़ॉल्यूशन स्ट्रीम के एक स्लाइडिंग विंडो (यानी, किसी विशेष समय के आसपास फ्रेमों की एक लचीली प्लस-माइनस रेंज, जैसे किसी घटना ट्रिगर की संवेदन) का विश्लेषण करता है:

निरंतर उच्च-रिज़ॉल्यूशन आरजीबी कैप्चर तेजी से शक्ति खत्म कर देता है, इसलिए रिकॉर्डिंग जल्दी बंद हो जाती है और महत्वपूर्ण क्षण छूट सकते हैं। इसके विपरीत, कलरट्रिगर हर समय एक कम-शक्ति ग्रेस्केल स्ट्रीम चलाता रहता है, और केवल चयनित क्षणों पर आरजीबी कैमरा सक्रिय करता है – रिकॉर्डिंग समय बढ़ाते हुए, जबकि बाद के प्रश्नों के उत्तर देने के लिए आवश्यक दृश्य विवरणों को कैप्चर करता रहता है। स्रोत - https://arxiv.org/pdf/2603.22466 निरंतर उच्च-रिज़ॉल्यूशन आरजीबी कैप्चर तेजी से शक्ति खत्म कर देता है, इसलिए रिकॉर्डिंग जल्दी बंद हो जाती है और महत्वपूर्ण क्षण छूट सकते हैं। इसके विपरीत, कलरट्रिगर हर समय एक कम-शक्ति ग्रेस्केल स्ट्रीम चलाता रहता है, और केवल

लेखक मशीन लर्निंग पर, मानव छवि संश्लेषण में डोमेन विशेषज्ञ। Metaphysic.ai में पूर्व अनुसंधान सामग्री प्रमुख।
व्यक्तिगत साइट: martinanderson.ai
संपर्क: [email protected]
ट्विटर: @manders_ai