рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдиреЗ рдЧрд╣рд░реЗ рд╢рд┐рдХреНрд╖рдг рдиреНрдпреВрд░рд▓ рдиреЗрдЯрд╡рд░реНрдХ рдХреЗ рднреАрддрд░ рдЕрддреНрдпрдзрд┐рдХ рдХреБрд╢рд▓ рдЙрдк-рдиреЗрдЯрд╡рд░реНрдХ рдХреА рдЦреЛрдЬ рдХреА

mm

गहरे शिक्षण न्यूरल नेटवर्क अक्सर विशाल होते हैं और बड़ी मात्रा में कंप्यूटिंग शक्ति की आवश्यकता होती है, लेकिन एक नए खोज से पता चलता है कि यह कैसे कार्यों को अधिक कुशलता से पूरा करने के लिए कम किया जा सकता है। जोनाथन फ्रैंकले और उनकी टीम ने एमआईटी से “लॉटरी टिकट हाइपोथीसिस” के साथ आया है, जो दिखाता है कि बड़े न्यूरल नेटवर्क के भीतर पतले उप-नेटवर्क होते हैं। ये उप-नेटवर्क कम आवश्यक कंप्यूटिंग शक्ति के साथ कार्य को अधिक कुशलता से पूरा कर सकते हैं, लेकिन सबसे बड़ी चुनौती इन उप-नेटवर्क को खोजना है, जिन्हें टीम जीतने वाले लॉटरी टिकट के रूप में संदर्भित करती है।

टीम ने बीईआरटी के भीतर इन उप-नेटवर्क की खोज की, जो प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के लिए शीर्ष-स्तरीय मशीन लर्निंग तकनीक है। एनएलपी, जो कृत्रिम बुद्धिमत्ता (एआई) का एक उपक्षेत्र है, मानव भाषा को समझने और विश्लेषण करने के लिए जिम्मेदार है, और इसका उपयोग अनुप्रयोगों जैसे कि पूर्वानुमानिक पाठ जनरेशन और चैटबॉट्स के लिए किया जाता है।

हालांकि, बीईआरटी बड़ा है और सुपरकंप्यूटिंग शक्ति की आवश्यकता होती है, जो अधिकांश उपयोगकर्ताओं के लिए असुलभ है। इन उप-नेटवर्क की नई खोज के साथ, यह पहुंच को खोल सकता है, जिससे अधिक उपयोगकर्ता एनएलपी टूल विकसित करने के लिए प्रौद्योगिकी का उपयोग कर सकते हैं।

“हम उस बिंदु पर पहुंच रहे हैं जहां हमें इन मॉडलों को पतला और अधिक कुशल बनाना होगा,” फ्रैंकले कहते हैं।

उनके अनुसार, यह विकास एनएलपी के लिए “प्रवेश बाधा” को कम कर सकता है।

बीईआरटी – “अत्यधिक महंगा”

बीईआरटी गूगल के सर्च इंजन जैसी चीजों के लिए मौलिक है और 2018 में गूगल द्वारा इसके जारी होने के बाद से बहुत ध्यान मिला है। यह न्यूरल नेटवर्क बनाने के लिए एक तरीका है और लेखन के टुकड़ों में खाली पासेज भरने के कई प्रयासों द्वारा प्रशिक्षित किया जाता है। बीईआरटी की सबसे प्रभावशाली विशेषताओं में से एक इसका विशाल प्रारंभिक प्रशिक्षण डेटासेट है।

इसके बाद यह विशिष्ट कार्यों के लिए उपयोगकर्ताओं द्वारा समायोजित किया जा सकता है, जैसे कि ग्राहक-सेवा चैटबॉट, लेकिन एक बार फिर, इसके लिए बड़ी मात्रा में प्रसंस्करण शक्ति की आवश्यकता होती है, जिसमें 1 अरब तक पहुंचने की संभावना है।

“एक मानक बीईआरटी मॉडल – वर्तमान में – 340 मिलियन पैरामीटर है,” फ्रैंकले कहते हैं। “यह बहुत ही महंगा है। यह आप या मेरे लिए कंप्यूटिंग क्षमता से बहुत आगे है।”

टेक्सास विश्वविद्यालय के प्रमुख लेखक तियानलोंग चेन के अनुसार, बीईआरटी जैसे मॉडल “विशाल नेटवर्क आकार” से पीड़ित हैं, लेकिन नई अनुसंधान के लिए “लॉटरी टिकट हाइपोथीसिस एक समाधान की तरह लगता है।”

कुशल उप-नेटवर्क

चेन और टीम ने बीईआरटी के भीतर एक छोटे मॉडल की तलाश की और खोजे गए उप-नेटवर्क के प्रदर्शन की तुलना मूल बीईआरटी मॉडल से की। यह विभिन्न एनएलपी कार्यों पर परीक्षण किया गया था, जिसमें प्रश्नों के उत्तर देना और वाक्य में खाली शब्द भरना शामिल था।

टीम ने सफल उप-नेटवर्क की खोज की जो मूल बीईआरटी मॉडल की तुलना में 40 से 90 प्रतिशत पतले थे, वास्तविक प्रतिशत कार्य पर निर्भर करता है। इसके अलावा, वे कार्य-विशिष्ट फाइन-ट्यूनिंग से पहले उन्हें पहचान सकते थे, जिससे कंप्यूटिंग लागत और कम हो जाती है। एक और लाभ यह था कि कुछ उप-नेटवर्क एक विशिष्ट कार्य के लिए चुने जा सकते थे और फिर दूसरे के लिए पुन: उपयोग किए जा सकते थे।

“मुझे लगता था कि यह काम करेगा, लेकिन मैं इसके लिए तैयार नहीं था,” फ्रैंकले कहते हैं। “मुझे उम्मीद थी कि परिणाम अधिक जटिल होगा।”

फेसबुक एआई रिसर्च के वैज्ञानिक एरी मोरकोस के अनुसार, यह खोज “आकर्षक” है, और “इन मॉडलों का उपयोग बढ़ता जा रहा है। इसलिए, यह महत्वपूर्ण है कि लॉटरी टिकट हाइपोथीसिस क्या पकड़ता है।”

मोरकोस यह भी कहते हैं कि यदि ये उप-नेटवर्क बहुत कम कंप्यूटिंग शक्ति का उपयोग करके चल सकते हैं, तो यह “बहुत प्रभावशाली” होगा, क्योंकि “वर्तमान में ये बहुत बड़े मॉडल बहुत महंगे हैं।”

“मुझे नहीं पता कि हम इन सुपरकंप्यूटर-शैली के गणना का उपयोग करके कितना बड़ा हो सकते हैं,” फ्रैंकले जोड़ते हैं। “हमें प्रवेश बाधा को कम करना होगा।”

“उम्मीद है कि यह लागत को कम करेगा, यह सभी के लिए अधिक सुलभ बनाएगा … जो केवल एक लैपटॉप के साथ छोटे लोग हैं,” वह निष्कर्ष निकालते हैं।

अनुसंधान न्यूरल इंफॉर्मेशन प्रोसेसिंग सिस्टम्स कॉन्फ्रेंस में प्रस्तुत किया जाने वाला है।

рдПрд▓реЗрдХреНрд╕ рдореИрдХрдлрд╛рд░рд▓реИрдВрдб рдПрдХ рдПрдЖрдИ рдкрддреНрд░рдХрд╛рд░ рдФрд░ рд▓реЗрдЦрдХ рд╣реИрдВ рдЬреЛ рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдореЗрдВ рдирд╡реАрдирддрдо рд╡рд┐рдХрд╛рд╕реЛрдВ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдЙрдиреНрд╣реЛрдВрдиреЗ рд╡рд┐рд╢реНрд╡рднрд░ рдХреЗ рдХрдИ рдПрдЖрдИ рд╕реНрдЯрд╛рд░реНрдЯрдЕрдкреНрд╕ рдФрд░ рдкреНрд░рдХрд╛рд╢рдиреЛрдВ рдХреЗ рд╕рд╛рде рд╕рд╣рдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИред