Connect with us

рд╡рд┐рд▓реНрд╕рди рдкрд╛рдВрдЧ, рд░рд┐рдпрд▓ рд╡рд░реНрд▓реНрдб рдПрдЖрдИ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЗ рд╕рд╣-рд▓реЗрдЦрдХ

рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░

рд╡рд┐рд▓реНрд╕рди рдкрд╛рдВрдЧ, рд░рд┐рдпрд▓ рд╡рд░реНрд▓реНрдб рдПрдЖрдИ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЗ рд╕рд╣-рд▓реЗрдЦрдХ

mm

विल्सन पांग ने नवंबर 2018 में Appen में सीटीओ के रूप में शामिल होकर कंपनी के उत्पादों और प्रौद्योगिकी की जिम्मेदारी संभाली। विल्सन के पास सॉफ्टवेयर इंजीनियरिंग और डेटा साइंस में उन्नीस साल से अधिक का अनुभव है। एपेन में शामिल होने से पहले, विल्सन चीन में सीट्रिप के मुख्य डेटा अधिकारी थे, जो दुनिया की दूसरी सबसे बड़ी ऑनलाइन यात्रा एजेंसी कंपनी है, जहां उन्होंने डेटा इंजीनियरों, विश्लेषकों, डेटा उत्पाद प्रबंधकों और वैज्ञानिकों का नेतृत्व किया ताकि उपयोगकर्ता अनुभव में सुधार हो और संचालन की दक्षता बढ़ जाए जो व्यवसाय को बढ़ावा देता है। उसके पहले, वह कैलिफोर्निया में ईबे में इंजीनियरिंग के वरिष्ठ निदेशक थे और डेटा सेवा और समाधान, खोज विज्ञान, विपणन प्रौद्योगिकी और बिलिंग प्रणाली सहित विभिन्न डोमेन में नेतृत्व प्रदान किया। उन्होंने आईबीएम में एक आर्किटेक्ट के रूप में काम किया था जो विभिन्न ग्राहकों के लिए प्रौद्योगिकी समाधान बना रहा था। विल्सन ने चीन में जेजियांग विश्वविद्यालय से इलेक्ट्रिकल इंजीनियरिंग में अपनी मास्टर्स और बैचलर्स की डिग्री प्राप्त की।

हम उनकी नई पुस्तक पर चर्चा करते हैं: द रियल वर्ल्ड ऑफ एआई: रेस्पॉन्सिबल मशीन लर्निंग के लिए एक व्यावहारिक गाइड

आप बताते हैं कि जब आप ईबे की खोज विज्ञान टीम का नेतृत्व कर रहे थे, तो मशीन लर्निंग के साथ आपका पहला सबक यह समझना था कि कौन से मेट्रिक्स को मापना महत्वपूर्ण है। उदाहरण दिया गया था कि कैसे “प्रति सत्र खरीदारी” मेट्रिक्स ने आइटम के मौद्रिक मूल्य के लिए खाता नहीं दिया। कंपनियां इसी तरह के मुद्दों से बचने के लिए कौन से मेट्रिक्स को मापने की आवश्यकता को सबसे अच्छी तरह से कैसे समझ सकती हैं?

अपनी टीम द्वारा एआई मॉडल के लिए जिम्मेदार लक्ष्यों से शुरू करें – हमारे मामले में, हम मशीन लर्निंग के साथ अधिक राजस्व चलाना चाहते थे। जब आप लक्ष्यों को मेट्रिक्स से जोड़ते हैं, तो उन मेट्रिक्स की यांत्रिकी के बारे में सोचें जो मॉडल को रिलीज़ करने और लोगों के साथ बातचीत करने के बाद उत्पन्न होंगे, लेकिन अपने अनुमानों पर भी ध्यान दें। हमारे मामले में, हमने माना कि मॉडल राजस्व के लिए अनुकूलित होगा, लेकिन प्रति सत्र खरीदारी की संख्या इसका अनुवाद नहीं करती है, क्योंकि मॉडल उच्च संख्या में कम-टिकट मूल्य की बिक्री के लिए अनुकूलित था, और अंत में हम अधिक पैसा नहीं कमा रहे थे। एक बार जब हमें यह एहसास हुआ, तो हम मेट्रिक्स को बदलने और मॉडल को सही दिशा में इंगित करने में सक्षम थे। इसलिए, ग्रैन्युलर मेट्रिक्स का निर्धारण करना, साथ ही साथ अनुमानों पर ध्यान देना परियोजना की सफलता के लिए महत्वपूर्ण है।

आपको व्यक्तिगत रूप से इस पुस्तक के शोध और लेखन से क्या सीखने को मिला?

हमारे पास विभिन्न कंपनियों और उद्योगों से विभिन्न प्रकार की समस्याएं हैं जिन्हें एआई द्वारा हल किया जा सकता है। उपयोग के मामले बहुत अलग हो सकते हैं, एआई समाधान अलग हो सकता है, एआई समाधान को प्रशिक्षित करने के लिए डेटा अलग हो सकता है। हालांकि, इन सभी अंतरों के बावजूद, एआई यात्रा के दौरान लोगों द्वारा की गई गलतियां बहुत समान हैं। ये गलतियां विभिन्न प्रकार की कंपनियों में और विभिन्न उद्योगों में बार-बार होती हैं।

हमने एआई परियोजनाओं को लागू करने के लिए कुछ सामान्य सर्वोत्तम प्रथाओं को साझा किया है, जिसमें उम्मीद है कि अधिक लोगों और कंपनियों को उन गलतियों से बचने में मदद मिलेगी और उन्हें जिम्मेदार एआई को तैनात करने में आत्मविश्वास मिलेगा।

आपको लगता है कि लोग इस पुस्तक को पढ़ने से क्या सबसे महत्वपूर्ण सबक लेंगे?

हम दृढ़ता से विश्वास करते हैं कि मशीन लर्निंग प्रौद्योगिकी का सोच-समझकर, जिम्मेदार और नैतिक उपयोग दुनिया को अधिक न्यायपूर्ण, न्यायसंगत और समावेशी बना सकता है। मशीन लर्निंग प्रौद्योगिकी व्यवसाय की दुनिया में सब कुछ को फिर से आकार देने का वादा करती है, लेकिन इसके लिए यह जरूरी नहीं है कि यह कठिन हो। ऐसे परीक्षणित और परीक्षणित तरीके और प्रक्रियाएं हैं जिनका पालन टीमें कर सकती हैं और उत्पादन में तैनात करने में आत्मविश्वास प्राप्त कर सकती हैं।

एक और महत्वपूर्ण सबक यह है कि व्यवसाय के मालिक (जैसे उत्पाद प्रबंधक) और अधिक तकनीकी पक्ष (जैसे इंजीनियर और डेटा वैज्ञानिक) के सदस्यों को एक सामान्य भाषा बोलने की आवश्यकता है। एआई को सफलतापूर्वक तैनात करने के लिए, नेताओं को टीमों के बीच की खाई को पुल करना होगा, व्यवसाय विशेषज्ञों और सी-स्तर के लिए पर्याप्त संदर्भ प्रदान करना होगा ताकि वे तकनीकी लागूकर्ताओं के साथ कुशलता से बातचीत कर सकें।

लोग अक्सर सोचते हैं कि जब वे एआई के बारे में सोचते हैं तो उन्हें कोड के बारे में लगता है। पुस्तक में एक प्रमुख सबक यह है कि डेटा एआई मॉडल की सफलता के लिए महत्वपूर्ण है। डेटा के साथ बहुत कुछ होता है – संग्रह से लेकर लेबलिंग तक, स्टोरेज और प्रत्येक चरण मॉडल की सफलता को प्रभावित करेगा। एआई के सबसे सफल तैनाती वे हैं जो डेटा पर उच्च जोर देते हैं और इसे लगातार बेहतर बनाने का प्रयास करते हैं।

वास्तविक दुनिया में एआई के लिए केवल एक क्रॉस-फ़ंक्शनल टीम और एक नवाचारी भावना की आवश्यकता होती है।

पुस्तक में चर्चा की गई है कि एआई मॉडल की सटीकता को पर्याप्त रूप से उच्च होने के लिए कब निर्धारित किया जाए। सटीकता के प्रकार का मूल्यांकन करने का सबसे आसान तरीका क्या है जिसकी आवश्यकता है?

यह आपके उपयोग के मामलों और जोखिम सहनशीलता पर निर्भर करता है। एआई विकसित करने वाली टीमें हमेशा एक परीक्षण चरण होना चाहिए जहां वे सटीकता स्तर और अपने संगठन और हितधारकों के लिए स्वीकार्य सीमा निर्धारित करते हैं। जीवन-मृत्यु उपयोग के मामलों के लिए – जहां एआई गलत होने पर क्षति हो सकती है, जैसे कि सजा सॉफ्टवेयर, स्व-ड्राइविंग कारें, चिकित्सा उपयोग के मामलों में, सीमा बहुत अधिक है – और टीमों को मॉडल गलत होने पर सावधानी बरतनी चाहिए। अधिक दोष-सहिष्णु उपयोग के मामलों के लिए – जहां विषयivity खेल में है – जैसे कि सामग्री, खोज या विज्ञापन प्रासंगिकता, टीमें उपयोगकर्ता प्रतिक्रिया पर भरोसा कर सकती हैं ताकि वे मॉडल को समायोजित करना जारी रख सकें भले ही वे उत्पादन में हों। конечно, यहां कुछ उच्च-जोखिम वाले उपयोग के मामले भी हैं, जहां अवैध या अनैतिक सामग्री उपयोगकर्ताओं को दिखाई जा सकती है, इसलिए सावधानियां और प्रतिक्रिया तंत्र भी यहां होना चाहिए।

परियोजना के लिए सफलता को परिभाषित करने के महत्व को परिभाषित करें?

यह उतना ही महत्वपूर्ण है कि व्यवसाय की समस्या के साथ शुरू किया जाए, जितना कि सफलता को परिभाषित करना है, क्योंकि दोनों हाथ से हाथ मिलाते हैं। पुस्तक में दिए गए उदाहरण के अनुसार, ऑटोमोटिव डीलर ने एआई का उपयोग करके छवियों को लेबल करने के लिए, उन्होंने यह नहीं निर्धारित किया कि सफलता क्या दिखती है, क्योंकि उन्होंने एक व्यवसायिक समस्या को हल करने के लिए नहीं सोचा था। सफलता उनके लिए कई चीजें हो सकती थीं, जो समस्या को हल करने में मुश्किल बना देती है, यहां तक कि लोगों की टीमों के लिए भी, न कि एक मशीन लर्निंग मॉडल के लिए जिसका दायरा निश्चित है। यदि उन्होंने दंतचिकित्सा के साथ सभी वाहनों को लेबल करने के लिए निर्धारित किया था ताकि मरम्मत के लिए वाहनों की सूची बनाई जा सके, और सफलता को 80% वाहन दंतचिकित्सा को सटीक रूप से लेबल करने के रूप में परिभाषित किया जा सके, तो जब वे 85% सटीक रूप से लेबल करते हैं, तो टीम इसे सफलता कहेगी। लेकिन यदि यह सफलता व्यवसायिक समस्या से जुड़ी नहीं है और सीधे व्यवसायिक प्रभाव से जुड़ी नहीं है, तो परियोजना का मूल्यांकन करना मुश्किल है। यहां, व्यवसायिक समस्या अधिक जटिल थी, और दंतचिकित्सा लेबलिंग केवल इसका एक घटक था। उनके मामले में, वे सफलता को मरम्मत प्रक्रिया पर समय/पैसे की बचत या मरम्मत प्रक्रिया को X% द्वारा अनुकूलन के रूप में परिभाषित करके बेहतर हो सकते थे और फिर लेबलिंग प्रभाव को वास्तविक व्यवसायिक परिणामों में अनुवादित कर सकते थे।

उत्पादन तैनाती में होने वाले सभी उपयोग के मामलों को कवर करने के लिए प्रशिक्षण डेटा उदाहरणों को सुनिश्चित करना कितना महत्वपूर्ण है?

यह बहुत महत्वपूर्ण है कि मॉडल को पूर्वाग्रह से बचने के लिए सभी उपयोग के मामलों पर प्रशिक्षित किया जाए। लेकिन यह भी महत्वपूर्ण है कि यह ध्यान दिया जाए कि उत्पादन में सभी उपयोग के मामलों को कवर करना असंभव है, टीमों को अपने उत्पादन डेटा के साथ-साथ अपने प्रशिक्षण डेटा को समझने की आवश्यकता है ताकि वे एआई को उत्पादन में मिलने वाले डेटा के लिए प्रशिक्षित कर सकें। विभिन्न उपयोग के मामलों वाले बड़े और विविध समूहों से प्रशिक्षण डेटा तक पहुंच मॉडल की सफलता के लिए महत्वपूर्ण होगी। उदाहरण के लिए, एक मॉडल जो अपलोड की गई छवि में लोगों के पालतू जानवरों को पहचानने के लिए प्रशिक्षित किया जाता है, को सभी प्रकार के पालतू जानवरों पर प्रशिक्षित किया जाना चाहिए; कुत्ते, बिल्ली, पक्षी, छोटे स्तनधारी, छिपकली आदि। यदि मॉडल केवल कुत्तों, बिल्लियों और पक्षियों पर प्रशिक्षित किया जाता है, तो जब कोई अपने गिनी सूअर की छवि अपलोड करता है, तो मॉडल इसे पहचान नहीं पाएगा। यह एक बहुत ही सरल उदाहरण है, लेकिन यह दिखाता है कि संभावित उपयोग के मामलों पर प्रशिक्षण देना मॉडल की सफलता के लिए कितना महत्वपूर्ण है।

पुस्तक में शीर्ष से अच्छी डेटा स्वच्छता आदतों को विकसित करने की आवश्यकता पर चर्चा की गई है, कुछ सामान्य पहले कदम क्या हैं जो इस आदत को प्रोत्साहित करने के लिए?

अच्छी डेटा स्वच्छता आदतें आंतरिक डेटा की उपयोगिता को बढ़ाएंगी और इसे एमएल उपयोग के मामलों के लिए तैयार करेंगी। पूरी कंपनी को अपने डेटासेट को व्यवस्थित करने और ट्रैक करने में अच्छा होना होगा। इसे प्राप्त करने का एक तरीका यह है कि इसे एक व्यवसायिक आवश्यकता बनाना और इसके कार्यान्वयन को ट्रैक करना ताकि बहुत कम रिपोर्टें कस्टम जॉब बन जाएं, और टीमें अधिक से अधिक डेटा पाइपलाइनों के साथ काम करें जो एक केंद्रीय भंडार में निर्देशित होती हैं, जिसमें एक स्पष्ट ओन्टोलॉजी होती है। एक और अच्छी प्रथा यह है कि डेटा को कब और कहां एकत्र किया गया था और इसे डेटाबेस में रखने से पहले इसके साथ क्या हुआ, साथ ही अनुपयोगी या स्टेल डेटा को नियमित रूप से साफ करने के लिए प्रक्रियाएं स्थापित करना।

धन्यवाद इस महान साक्षात्कार के लिए, जो पाठक इस पुस्तक के बारे में अधिक जानने में रुचि रखते हैं, मैं उन्हें पुस्तक पढ़ने की सलाह देता हूं द रियल वर्ल्ड ऑफ एआई: रेस्पॉन्सिबल मशीन लर्निंग के लिए एक व्यावहारिक गाइड

рдПрдВрдЯреЛрдиреА рдПрдХ рджреВрд░рджрд░реНрд╢реА рдиреЗрддрд╛ рдФрд░ Unite.AI рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рднрд╛рдЧреАрджрд╛рд░ рд╣реИрдВ, рдЬреЛ рдХрд┐ рдПрдЖрдИ рдФрд░ рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдХреЗ рднрд╡рд┐рд╖реНрдп рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдФрд░ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдЯреВрдЯ рдЬреБрдиреВрди рд╕реЗ рдкреНрд░реЗрд░рд┐рдд рд╣реИрдВред рдПрдХ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдЙрджреНрдпрдореА, рд╡рд╣ рдорд╛рдирддрд╛ рд╣реИ рдХрд┐ рдПрдЖрдИ рд╕рдорд╛рдЬ рдХреЗ рд▓рд┐рдП рдЙрддрдирд╛ рд╣реА рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рд╣реЛрдЧрд╛ рдЬрд┐рддрдирд╛ рдХрд┐ рдмрд┐рдЬрд▓реА, рдФрд░ рдЕрдХреНрд╕рд░ рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдФрд░ рдПрдЬреАрдЖрдИ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЙрддреНрд╕рд╛рд╣рд┐рдд рд╣реЛрддрд╛ рд╣реИред

рдПрдХ рдлреНрдпреВрдЪрд░рд┐рд╕реНрдЯ рдХреЗ рд░реВрдк рдореЗрдВ, рд╡рд╣ рдЗрди рдирд╡рд╛рдЪрд╛рд░реЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╣рдорд╛рд░реА рджреБрдирд┐рдпрд╛ рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдХреА рдЦреЛрдЬ рдореЗрдВ рд╕рдорд░реНрдкрд┐рдд рд╣реИред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рд╡рд╣ рд╕рд┐рдХреНрдпреЛрд░рд┐рдЯреАрдЬрд╝.io рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рд╣реИрдВ, рдПрдХ рдордВрдЪ рдЬреЛ рднрд╡рд┐рд╖реНрдп рдХреЛ рдлрд┐рд░ рд╕реЗ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рдиреЗ рдФрд░ рдкреВрд░реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЖрдХрд╛рд░ рджреЗрдиреЗ рд╡рд╛рд▓реА рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдореЗрдВ рдирд┐рд╡реЗрд╢ рдкрд░ рдХреЗрдВрджреНрд░рд┐рдд рд╣реИред