рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рдмреЙрдХреНрд╕ рдХреЗ рдмрд╛рд╣рд░ рд╕реЛрдЪрдирд╛ рдПрдЖрдИ рдирд╡рд╛рдЪрд╛рд░ рдХреЛ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП
हम में से कई लोग जो एआई स्पेस में नवाचार कर रहे हैं, हम अज्ञात क्षेत्र में काम कर रहे हैं। एआई कंपनियां नई प्रौद्योगिकियों को इतनी तेजी से विकसित कर रही हैं, कि कोई भी दृश्य में होने वाले दृढ़ काम को सामान्य मान सकता है। लेकिन एक ऐसे क्षेत्र में जहां मिशन वास्तविक और डिजिटल दुनिया के बीच की रेखाओं को धुंधला करना है — वर्तमान में ऐतिहासिक डेटा या शोध पर निर्भर करने के लिए बहुत कुछ नहीं है; इसलिए हमें बॉक्स के बाहर सोचने की आवश्यकता है।
जबकि परंपरागत मशीन लर्निंग ज्ञान और परीक्षण किए गए अभ्यासों पर निर्भर रहना सबसे सुविधाजनक है, यह अक्सर संभव नहीं है (या पूर्ण समाधान) उभरते हुए क्षेत्रों में। पहले से कभी नहीं हल किए गए समस्याओं को हल करने के लिए, उन्हें नए तरीकों से दृष्टिकोण करने की आवश्यकता है।
यह एक चुनौती है जो आपको याद दिलाती है कि आप पहले स्थान पर इंजीनियरिंग, डेटा साइंस, या उत्पाद विकास क्षेत्र में क्यों प्रवेश किया: खोज के लिए जुनून। मैं इसे अपने दैनिक जीवन में अनुभव करता हूं, Ultraleap में मेरी भूमिका में, जहां हम मिश्रित वास्तविकता वातावरण में मानव हाथ की गतिविधियों को ट्रैक और प्रतिक्रिया देने वाले सॉफ़्टवेयर विकसित करते हैं। हमारे काम में, मशीन लर्निंग मॉडल को प्रशिक्षित करने के बारे में जो कुछ हम जानते थे वह अक्सर अपने सिर पर खड़ा हो जाता है, क्योंकि मानव हाथ — साथ ही साथ वस्तुओं और पर्यावरण के साथ इसका सामना करना पड़ता है — बहुत अप्रत्याशित है।
यहाँ कुछ दृष्टिकोण हैं जिन्हें मेरी टीम और मैंने डिजिटल दुनिया में स्वाभाविक बातचीत लाने के लिए प्रयोग और डेटा साइंस को पुनः कल्पना करने के लिए अपनाया है, जो सटीक है और वास्तविक दुनिया में उतनी ही प्राकृतिक लगती है।
लाइनों के भीतर नवाचार
जब आप एक नवजात स्थान में नवाचार कर रहे हों, तो आपको अक्सर ऐसी सीमाओं का सामना करना पड़ता है जो एक दूसरे के विरोधी लगते हैं। मेरी टीम को हाथ और उंगलियों की गतिविधियों की जटिलताओं को पकड़ने और हाथ और उंगलियों को उनके आसपास की दुनिया के साथ कैसे बातचीत करते हैं, यह सभी हाथ ट्रैकिंग मॉडल में पैक किया जाता है जो अभी भी सीमित कंप्यूट में एक्सआर हार्डवेयर में फिट होते हैं। इसका मतलब है कि हमारे मॉडल — जो जटिल और जटिल हैं — को बहुत कम भंडारण लेना चाहिए और बहुत कम ऊर्जा की खपत करनी चाहिए (1/100,000 वें के हिसाब से) बड़े एलएलएम की तुलना में जो हेडलाइंस को प्रभावित करते हैं। यह हमें एक रोमांचक चुनौती प्रस्तुत करता है, जिसमें हमारे मॉडल के दृढ़ प्रयोग और मूल्यांकन की आवश्यकता होती है उनके वास्तविक दुनिया के अनुप्रयोग में।
लेकिन अनगिनत परीक्षण और प्रयोग इसके लायक हैं: एक शक्तिशाली मॉडल बनाना जो अभी भी कम अनुमान लागत, शक्ति की खपत और विलंबता पर डिलीवर करता है, एक आश्चर्य है जिसे एक्सआर स्पेस के बाहर भी एज कंप्यूटिंग में लागू किया जा सकता है।
जिन सीमाओं का हम सामना करते हैं उन्हें प्रयोग करते समय अन्य उद्योगों पर भी प्रभाव पड़ेगा। कुछ व्यवसायों में अपने अनुप्रयोग डोमेन में सूक्ष्मताओं के कारण अद्वितीय चुनौतियाँ होंगी, जबकि अन्य में सीमित डेटा हो सकता है क्योंकि वे एक निशे बाजार में हैं जिसे बड़े टेक प्लेयर्स ने नहीं छुआ है।
जबकि एक-आकार-फिट-सभी समाधान कुछ कार्यों के लिए पर्याप्त हो सकते हैं, कई अनुप्रयोग डोमेन को वास्तविक, चुनौतीपूर्ण समस्याओं को हल करने की आवश्यकता होती है जो उनके कार्य के लिए विशिष्ट हैं। उदाहरण के लिए, ऑटोमोटिव असेंबली लाइनें दोष निरीक्षण के लिए एमएल मॉडल लागू करती हैं। इन मॉडलों को बहुत उच्च-रिज़ॉल्यूशन वाली इमेजरी से निपटना होता है जो एक कार की बड़ी सतह क्षेत्र पर छोटे दोषों की पहचान करने के लिए आवश्यक है। इस मामले में, अनुप्रयोग उच्च प्रदर्शन की मांग करता है, लेकिन समस्या यह है कि कम फ्रेम दर, लेकिन उच्च-रिज़ॉल्यूशन मॉडल कैसे प्राप्त किया जाए।
नवाचार को बढ़ावा देने के लिए मॉडल आर्किटेक्चर का मूल्यांकन
एक अच्छा डेटासेट किसी भी सफल एआई ब्रेकथ्रू के पीछे ड्राइविंग बल है। लेकिन किसी विशेष उद्देश्य के लिए एक डेटासेट “अच्छा” क्या बनाता है? और जब आप पहले से कभी नहीं हल की गई समस्याओं को हल कर रहे हैं, तो आप कैसे विश्वास कर सकते हैं कि मौजूदा डेटा प्रासंगिक होगा? हम यह मान नहीं सकते कि कुछ एमएल कार्यों के लिए अच्छे मेट्रिक्स अन्य विशिष्ट व्यवसाय कार्य प्रदर्शन के लिए अनुवाद करते हैं। यह वह जगह है जहां हमें सामान्य रूप से आयोजित एमएल “सत्य” के खिलाफ जाने और इसके बजाय सक्रिय रूप से अन्वेषण करने के लिए कहा जाता है कि हम डेटा को कैसे लेबल, साफ और लागू करते हैं दोनों सिम्युलेटेड और वास्तविक दुनिया के डेटा।
स्वभाव से, हमारा डोमेन मूल्यांकन के लिए चुनौतीपूर्ण है और मैनुअल गुणवत्ता आश्वासन की आवश्यकता होती है – हाथ से। हम केवल अपने डेटा की गुणवत्ता मेट्रिक्स को नहीं देख रहे हैं। हम अपने डेटासेट और डेटा स्रोतों पर पुनरावृत्ति करते हैं और उन्हें वास्तविक दुनिया में उत्पन्न होने वाले मॉडल की गुणवत्ता के आधार पर मूल्यांकन करते हैं। जब हम अपने डेटा को ग्रेड और वर्गीकृत करने के तरीके का पुनः मूल्यांकन करते हैं, तो हम अक्सर डेटासेट या रुझानों को खोजते हैं जिन्हें हम अन्यथा अनदेखा कर सकते थे। अब उन डेटासेट के साथ, और अनगिनत प्रयोगों ने हमें दिखाया कि कौन से डेटा पर भरोसा नहीं करना है, हमने एक नए मार्ग को अनलॉक किया है जिसे हम पहले से याद कर रहे थे।
Ultraleap का नवीनतम हाथ-ट्रैकिंग प्लेटफ़ॉर्म, Hyperion, इसका एक उत्कृष्ट उदाहरण है। हमारे डेटासेट में सुधार ने हमें अधिक परिष्कृत हाथ ट्रैकिंग विकसित करने में मदद की जो माइक्रोगेस्चर के साथ-साथ हाथ की गतिविधियों को भी सटीक रूप से ट्रैक कर सकता है, यहां तक कि जब उपयोगकर्ता कोई वस्तु पकड़े हुए होता है।
एक छोटा सा कदम पीछे, एक बड़ा कदम आगे
जबकि नवाचार की गति कभी भी धीमी नहीं लगती, हम कर सकते हैं। हम प्रयोग, सीखने, विकास में हैं, और जब हम बस इतना करने का समय लेते हैं, तो हम अक्सर कुछ ऐसा बनाते हैं जो बहुत मूल्यवान है जब हम किताब के अनुसार जा रहे हैं और अगले तकनीकी नवाचार को बाहर निकाल रहे हैं। वास्तविक अनुप्रयोग डोमेन में मापा गया मॉडल प्रदर्शन के खिलाफ प्रयोग करने से होने वाले ब्रेकथ्रू का कोई विकल्प नहीं है। और हम यह केवल तभी कर सकते हैं जब हम अपने डेटा एनोटेशन का अन्वेषण करते हैं, अपने डेटा स्रोतों को प्रश्न में रखते हैं, और स्वयं गुणवत्ता मेट्रिक्स को फिर से परिभाषित करते हैं। और जब हम असामान्य आवश्यकताओं और सीमाओं को सीमित करने के बजाय उन्हें नवाचार और अंततः एक प्रतिस्पर्धी लाभ के अवसर के रूप में लेते हैं, तो हम यह कर सकते हैं।












