Connect with us

दृष्टि ट्रांसफॉर्मर नए ‘पैच-टू-क्लस्टर अटेंशन’ विधि के साथ चुनौतियों पर विजय प्राप्त करते हैं

कृत्रिम बुद्धिमत्ता

दृष्टि ट्रांसफॉर्मर नए ‘पैच-टू-क्लस्टर अटेंशन’ विधि के साथ चुनौतियों पर विजय प्राप्त करते हैं

mm

कृत्रिम बुद्धिमत्ता (एआई) प्रौद्योगिकियों, विशेष रूप से दृष्टि ट्रांसफॉर्मर (वीआईटी), ने छवियों में वस्तुओं की पहचान और वर्गीकरण करने की उनकी क्षमता में बहुत आशा दिखाई है। हालांकि, उनके व्यावहारिक अनुप्रयोग को दो महत्वपूर्ण चुनौतियों से सीमित किया गया है: उच्च गणना शक्ति की आवश्यकता और निर्णय लेने में पारदर्शिता की कमी। अब, शोधकर्ताओं के एक समूह ने एक नए ‘पैच-टू-क्लस्टर अटेंशन’ (पाका) विधि के साथ एक सफलता हासिल की है। पाका का उद्देश्य छवि वस्तु पहचान, वर्गीकरण और खंडीकरण में वीआईटी की क्षमताओं को बढ़ाना है, साथ ही साथ लंबे समय से चली आ रही गणना मांगों और निर्णय लेने की स्पष्टता की समस्याओं का समाधान करना है।

वीआईटी की चुनौतियों का सामना: नए समाधान की एक झलक

ट्रांसफॉर्मर, अपनी श्रेष्ठ क्षमताओं के कारण, एआई दुनिया में सबसे प्रभावशाली मॉडलों में से एक हैं। इन मॉडलों की शक्ति को दृश्य डेटा के माध्यम से वीआईटी के माध्यम से विस्तारित किया गया है, जो एक प्रकार का ट्रांसफॉर्मर है जो दृश्य इनपुट के साथ प्रशिक्षित होता है। वीआईटी द्वारा छवियों की व्याख्या और समझने में जो भारी संभावनाएं प्रदान की जाती हैं, उन्हें दो प्रमुख मुद्दों द्वारा रोका गया है।
पहला, छवियों में विशाल मात्रा में डेटा की प्रकृति के कारण, वीआईटी को महत्वपूर्ण गणना शक्ति और स्मृति की आवश्यकता होती है। यह जटिलता कई प्रणालियों के लिए अभिभूत कर सकती है, विशेष रूप से उच्च-रिज़ॉल्यूशन छवियों को संभालते समय। दूसरा, वीआईटी के भीतर निर्णय लेने की प्रक्रिया अक्सर जटिल और अपारदर्शी होती है। उपयोगकर्ता यह समझने में कठिनाई का सामना करते हैं कि वीआईटी छवि में विभिन्न वस्तुओं या विशेषताओं के बीच कैसे भेद करता है, जो कई अनुप्रयोगों के लिए महत्वपूर्ण है।
हालांकि, नवाचारी पाका विधि इन दोनों चुनौतियों का समाधान प्रदान करती है। “हम क्लस्टरिंग तकनीकों का उपयोग करके गणना और स्मृति की मांग से संबंधित चुनौती का समाधान करते हैं, जो ट्रांसफॉर्मर आर्किटेक्चर को छवि में वस्तुओं की बेहतर पहचान और ध्यान केंद्रित करने में मदद करती है,” टियनफू वू, एक पेपर के सह-लेखक और नॉर्थ कैरोलिना स्टेट यूनिवर्सिटी में इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग के एसोसिएट प्रोफेसर ने समझाया।
पाका में क्लस्टरिंग तकनीकों का उपयोग गणना आवश्यकताओं को काफी कम कर देता है, जो समस्या को एक द्विघात प्रक्रिया से एक प्रबंधनीय रैखिक प्रक्रिया में बदल देता है। वू ने प्रक्रिया को और समझाया, “क्लस्टरिंग द्वारा, हम इसे एक रैखिक प्रक्रिया बनाने में सक्षम हैं, जहां प्रत्येक छोटी इकाई को केवल एक निर्धारित संख्या में क्लस्टर की तुलना में करने की आवश्यकता होती है।”
क्लस्टरिंग वीआईटी में निर्णय लेने की प्रक्रिया को भी स्पष्ट करता है। छवि डेटा के खंडों को एक साथ समूहित करने में महत्वपूर्ण विशेषताओं का पता लगाने के लिए क्लस्टर बनाने की प्रक्रिया कैसे वीआईटी निर्णय लेता है। जैसा कि एआई केवल एक सीमित संख्या में क्लस्टर बनाता है, उपयोगकर्ता निर्णय लेने की प्रक्रिया को आसानी से समझने और जांचने में सक्षम होते हैं, जो मॉडल की व्याख्या करने योग्यता को काफी बढ़ाता है।

पाका विधि अन्य राज्य-ऑफ-द-आर्ट वीआईटी को पीछे छोड़ देती है

व्यापक परीक्षण के माध्यम से, शोधकर्ताओं ने पाया कि पाका विधि कई मोर्चों पर अन्य वीआईटी को पीछे छोड़ देती है। वू ने कहा, “हमने पाया कि पाका ने एसविन और पीवीटी को हर मामले में पीछे छोड़ दिया।” परीक्षण प्रक्रिया से पता चला कि पाका छवियों में वस्तुओं की पहचान और वर्गीकरण करने और खंडीकरण में उत्कृष्ट था, जो छवियों में वस्तुओं की सीमाओं को कुशलता से रेखांकित करता था। इसके अलावा, यह अन्य वीआईटी की तुलना में अधिक समय-कुशल पाया गया, जो कार्यों को तेजी से करता था।
पाका की सफलता से प्रेरित होकर, शोध टीम इसके विकास को आगे बढ़ाने के लिए बड़े आधारभूत डेटासेट पर प्रशिक्षित करने का लक्ष्य रखती है। ऐसा करके, वे छवि-आधारित एआई के साथ वर्तमान में संभव की सीमाओं को आगे बढ़ाने की उम्मीद करते हैं।
शोध पत्र, “पाका-वीआईटी: दृष्टि ट्रांसफॉर्मर में पैच-टू-क्लस्टर अटेंशन सीखना,” आगामी आईईईई/सीवीएफ कंप्यूटर विजन और पैटर्न रिकग्निशन सम्मेलन में प्रस्तुत किया जाएगा। यह एक महत्वपूर्ण मील का पत्थर हो सकता है जो अधिक कुशल, पारदर्शी और सुलभ एआई प्रणालियों के लिए मार्ग प्रशस्त कर सकता है।

एलेक्स मैकफारलैंड एक एआई पत्रकार और लेखक हैं जो कृत्रिम बुद्धिमत्ता में नवीनतम विकासों का अन्वेषण कर रहे हैं। उन्होंने विश्वभर के कई एआई स्टार्टअप्स और प्रकाशनों के साथ सहयोग किया है।