рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░
рд╡рд┐рд▓реНрд╕рди рдкрд╛рдВрдЧ, рд░рд┐рдпрд▓ рд╡рд░реНрд▓реНрдб рдПрдЖрдИ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЗ рд╕рд╣-рд▓реЗрдЦрдХ

विल्सन पांग ने नवंबर 2018 में Appen में सीटीओ के रूप में शामिल होकर कंपनी के उत्पादों और प्रौद्योगिकी की जिम्मेदारी संभाली। विल्सन के पास सॉफ्टवेयर इंजीनियरिंग और डेटा साइंस में उन्नीस साल से अधिक का अनुभव है। एपेन में शामिल होने से पहले, विल्सन चीन में सीट्रिप के मुख्य डेटा अधिकारी थे, जो दुनिया की दूसरी सबसे बड़ी ऑनलाइन यात्रा एजेंसी कंपनी है, जहां उन्होंने डेटा इंजीनियरों, विश्लेषकों, डेटा उत्पाद प्रबंधकों और वैज्ञानिकों का नेतृत्व किया ताकि उपयोगकर्ता अनुभव में सुधार हो और संचालन की दक्षता बढ़ जाए जो व्यवसाय को बढ़ावा देता है। उसके पहले, वह कैलिफोर्निया में ईबे में इंजीनियरिंग के वरिष्ठ निदेशक थे और डेटा सेवा और समाधान, खोज विज्ञान, विपणन प्रौद्योगिकी और बिलिंग प्रणाली सहित विभिन्न डोमेन में नेतृत्व प्रदान किया। उन्होंने आईबीएम में एक आर्किटेक्ट के रूप में काम किया था जो विभिन्न ग्राहकों के लिए प्रौद्योगिकी समाधान बना रहा था। विल्सन ने चीन में जेजियांग विश्वविद्यालय से इलेक्ट्रिकल इंजीनियरिंग में अपनी मास्टर्स और बैचलर्स की डिग्री प्राप्त की।
हम उनकी नई पुस्तक पर चर्चा करते हैं: द रियल वर्ल्ड ऑफ एआई: रेस्पॉन्सिबल मशीन लर्निंग के लिए एक व्यावहारिक गाइड
आप बताते हैं कि जब आप ईबे की खोज विज्ञान टीम का नेतृत्व कर रहे थे, तो मशीन लर्निंग के साथ आपका पहला सबक यह समझना था कि कौन से मेट्रिक्स को मापना महत्वपूर्ण है। उदाहरण दिया गया था कि कैसे “प्रति सत्र खरीदारी” मेट्रिक्स ने आइटम के मौद्रिक मूल्य के लिए खाता नहीं दिया। कंपनियां इसी तरह के मुद्दों से बचने के लिए कौन से मेट्रिक्स को मापने की आवश्यकता को सबसे अच्छी तरह से कैसे समझ सकती हैं?
अपनी टीम द्वारा एआई मॉडल के लिए जिम्मेदार लक्ष्यों से शुरू करें – हमारे मामले में, हम मशीन लर्निंग के साथ अधिक राजस्व चलाना चाहते थे। जब आप लक्ष्यों को मेट्रिक्स से जोड़ते हैं, तो उन मेट्रिक्स की यांत्रिकी के बारे में सोचें जो मॉडल को रिलीज़ करने और लोगों के साथ बातचीत करने के बाद उत्पन्न होंगे, लेकिन अपने अनुमानों पर भी ध्यान दें। हमारे मामले में, हमने माना कि मॉडल राजस्व के लिए अनुकूलित होगा, लेकिन प्रति सत्र खरीदारी की संख्या इसका अनुवाद नहीं करती है, क्योंकि मॉडल उच्च संख्या में कम-टिकट मूल्य की बिक्री के लिए अनुकूलित था, और अंत में हम अधिक पैसा नहीं कमा रहे थे। एक बार जब हमें यह एहसास हुआ, तो हम मेट्रिक्स को बदलने और मॉडल को सही दिशा में इंगित करने में सक्षम थे। इसलिए, ग्रैन्युलर मेट्रिक्स का निर्धारण करना, साथ ही साथ अनुमानों पर ध्यान देना परियोजना की सफलता के लिए महत्वपूर्ण है।
आपको व्यक्तिगत रूप से इस पुस्तक के शोध और लेखन से क्या सीखने को मिला?
हमारे पास विभिन्न कंपनियों और उद्योगों से विभिन्न प्रकार की समस्याएं हैं जिन्हें एआई द्वारा हल किया जा सकता है। उपयोग के मामले बहुत अलग हो सकते हैं, एआई समाधान अलग हो सकता है, एआई समाधान को प्रशिक्षित करने के लिए डेटा अलग हो सकता है। हालांकि, इन सभी अंतरों के बावजूद, एआई यात्रा के दौरान लोगों द्वारा की गई गलतियां बहुत समान हैं। ये गलतियां विभिन्न प्रकार की कंपनियों में और विभिन्न उद्योगों में बार-बार होती हैं।
हमने एआई परियोजनाओं को लागू करने के लिए कुछ सामान्य सर्वोत्तम प्रथाओं को साझा किया है, जिसमें उम्मीद है कि अधिक लोगों और कंपनियों को उन गलतियों से बचने में मदद मिलेगी और उन्हें जिम्मेदार एआई को तैनात करने में आत्मविश्वास मिलेगा।
आपको लगता है कि लोग इस पुस्तक को पढ़ने से क्या सबसे महत्वपूर्ण सबक लेंगे?
हम दृढ़ता से विश्वास करते हैं कि मशीन लर्निंग प्रौद्योगिकी का सोच-समझकर, जिम्मेदार और नैतिक उपयोग दुनिया को अधिक न्यायपूर्ण, न्यायसंगत और समावेशी बना सकता है। मशीन लर्निंग प्रौद्योगिकी व्यवसाय की दुनिया में सब कुछ को फिर से आकार देने का वादा करती है, लेकिन इसके लिए यह जरूरी नहीं है कि यह कठिन हो। ऐसे परीक्षणित और परीक्षणित तरीके और प्रक्रियाएं हैं जिनका पालन टीमें कर सकती हैं और उत्पादन में तैनात करने में आत्मविश्वास प्राप्त कर सकती हैं।
एक और महत्वपूर्ण सबक यह है कि व्यवसाय के मालिक (जैसे उत्पाद प्रबंधक) और अधिक तकनीकी पक्ष (जैसे इंजीनियर और डेटा वैज्ञानिक) के सदस्यों को एक सामान्य भाषा बोलने की आवश्यकता है। एआई को सफलतापूर्वक तैनात करने के लिए, नेताओं को टीमों के बीच की खाई को पुल करना होगा, व्यवसाय विशेषज्ञों और सी-स्तर के लिए पर्याप्त संदर्भ प्रदान करना होगा ताकि वे तकनीकी लागूकर्ताओं के साथ कुशलता से बातचीत कर सकें।
लोग अक्सर सोचते हैं कि जब वे एआई के बारे में सोचते हैं तो उन्हें कोड के बारे में लगता है। पुस्तक में एक प्रमुख सबक यह है कि डेटा एआई मॉडल की सफलता के लिए महत्वपूर्ण है। डेटा के साथ बहुत कुछ होता है – संग्रह से लेकर लेबलिंग तक, स्टोरेज और प्रत्येक चरण मॉडल की सफलता को प्रभावित करेगा। एआई के सबसे सफल तैनाती वे हैं जो डेटा पर उच्च जोर देते हैं और इसे लगातार बेहतर बनाने का प्रयास करते हैं।
वास्तविक दुनिया में एआई के लिए केवल एक क्रॉस-फ़ंक्शनल टीम और एक नवाचारी भावना की आवश्यकता होती है।
पुस्तक में चर्चा की गई है कि एआई मॉडल की सटीकता को पर्याप्त रूप से उच्च होने के लिए कब निर्धारित किया जाए। सटीकता के प्रकार का मूल्यांकन करने का सबसे आसान तरीका क्या है जिसकी आवश्यकता है?
यह आपके उपयोग के मामलों और जोखिम सहनशीलता पर निर्भर करता है। एआई विकसित करने वाली टीमें हमेशा एक परीक्षण चरण होना चाहिए जहां वे सटीकता स्तर और अपने संगठन और हितधारकों के लिए स्वीकार्य सीमा निर्धारित करते हैं। जीवन-मृत्यु उपयोग के मामलों के लिए – जहां एआई गलत होने पर क्षति हो सकती है, जैसे कि सजा सॉफ्टवेयर, स्व-ड्राइविंग कारें, चिकित्सा उपयोग के मामलों में, सीमा बहुत अधिक है – और टीमों को मॉडल गलत होने पर सावधानी बरतनी चाहिए। अधिक दोष-सहिष्णु उपयोग के मामलों के लिए – जहां विषयivity खेल में है – जैसे कि सामग्री, खोज या विज्ञापन प्रासंगिकता, टीमें उपयोगकर्ता प्रतिक्रिया पर भरोसा कर सकती हैं ताकि वे मॉडल को समायोजित करना जारी रख सकें भले ही वे उत्पादन में हों। конечно, यहां कुछ उच्च-जोखिम वाले उपयोग के मामले भी हैं, जहां अवैध या अनैतिक सामग्री उपयोगकर्ताओं को दिखाई जा सकती है, इसलिए सावधानियां और प्रतिक्रिया तंत्र भी यहां होना चाहिए।
परियोजना के लिए सफलता को परिभाषित करने के महत्व को परिभाषित करें?
यह उतना ही महत्वपूर्ण है कि व्यवसाय की समस्या के साथ शुरू किया जाए, जितना कि सफलता को परिभाषित करना है, क्योंकि दोनों हाथ से हाथ मिलाते हैं। पुस्तक में दिए गए उदाहरण के अनुसार, ऑटोमोटिव डीलर ने एआई का उपयोग करके छवियों को लेबल करने के लिए, उन्होंने यह नहीं निर्धारित किया कि सफलता क्या दिखती है, क्योंकि उन्होंने एक व्यवसायिक समस्या को हल करने के लिए नहीं सोचा था। सफलता उनके लिए कई चीजें हो सकती थीं, जो समस्या को हल करने में मुश्किल बना देती है, यहां तक कि लोगों की टीमों के लिए भी, न कि एक मशीन लर्निंग मॉडल के लिए जिसका दायरा निश्चित है। यदि उन्होंने दंतचिकित्सा के साथ सभी वाहनों को लेबल करने के लिए निर्धारित किया था ताकि मरम्मत के लिए वाहनों की सूची बनाई जा सके, और सफलता को 80% वाहन दंतचिकित्सा को सटीक रूप से लेबल करने के रूप में परिभाषित किया जा सके, तो जब वे 85% सटीक रूप से लेबल करते हैं, तो टीम इसे सफलता कहेगी। लेकिन यदि यह सफलता व्यवसायिक समस्या से जुड़ी नहीं है और सीधे व्यवसायिक प्रभाव से जुड़ी नहीं है, तो परियोजना का मूल्यांकन करना मुश्किल है। यहां, व्यवसायिक समस्या अधिक जटिल थी, और दंतचिकित्सा लेबलिंग केवल इसका एक घटक था। उनके मामले में, वे सफलता को मरम्मत प्रक्रिया पर समय/पैसे की बचत या मरम्मत प्रक्रिया को X% द्वारा अनुकूलन के रूप में परिभाषित करके बेहतर हो सकते थे और फिर लेबलिंग प्रभाव को वास्तविक व्यवसायिक परिणामों में अनुवादित कर सकते थे।
उत्पादन तैनाती में होने वाले सभी उपयोग के मामलों को कवर करने के लिए प्रशिक्षण डेटा उदाहरणों को सुनिश्चित करना कितना महत्वपूर्ण है?
यह बहुत महत्वपूर्ण है कि मॉडल को पूर्वाग्रह से बचने के लिए सभी उपयोग के मामलों पर प्रशिक्षित किया जाए। लेकिन यह भी महत्वपूर्ण है कि यह ध्यान दिया जाए कि उत्पादन में सभी उपयोग के मामलों को कवर करना असंभव है, टीमों को अपने उत्पादन डेटा के साथ-साथ अपने प्रशिक्षण डेटा को समझने की आवश्यकता है ताकि वे एआई को उत्पादन में मिलने वाले डेटा के लिए प्रशिक्षित कर सकें। विभिन्न उपयोग के मामलों वाले बड़े और विविध समूहों से प्रशिक्षण डेटा तक पहुंच मॉडल की सफलता के लिए महत्वपूर्ण होगी। उदाहरण के लिए, एक मॉडल जो अपलोड की गई छवि में लोगों के पालतू जानवरों को पहचानने के लिए प्रशिक्षित किया जाता है, को सभी प्रकार के पालतू जानवरों पर प्रशिक्षित किया जाना चाहिए; कुत्ते, बिल्ली, पक्षी, छोटे स्तनधारी, छिपकली आदि। यदि मॉडल केवल कुत्तों, बिल्लियों और पक्षियों पर प्रशिक्षित किया जाता है, तो जब कोई अपने गिनी सूअर की छवि अपलोड करता है, तो मॉडल इसे पहचान नहीं पाएगा। यह एक बहुत ही सरल उदाहरण है, लेकिन यह दिखाता है कि संभावित उपयोग के मामलों पर प्रशिक्षण देना मॉडल की सफलता के लिए कितना महत्वपूर्ण है।
पुस्तक में शीर्ष से अच्छी डेटा स्वच्छता आदतों को विकसित करने की आवश्यकता पर चर्चा की गई है, कुछ सामान्य पहले कदम क्या हैं जो इस आदत को प्रोत्साहित करने के लिए?
अच्छी डेटा स्वच्छता आदतें आंतरिक डेटा की उपयोगिता को बढ़ाएंगी और इसे एमएल उपयोग के मामलों के लिए तैयार करेंगी। पूरी कंपनी को अपने डेटासेट को व्यवस्थित करने और ट्रैक करने में अच्छा होना होगा। इसे प्राप्त करने का एक तरीका यह है कि इसे एक व्यवसायिक आवश्यकता बनाना और इसके कार्यान्वयन को ट्रैक करना ताकि बहुत कम रिपोर्टें कस्टम जॉब बन जाएं, और टीमें अधिक से अधिक डेटा पाइपलाइनों के साथ काम करें जो एक केंद्रीय भंडार में निर्देशित होती हैं, जिसमें एक स्पष्ट ओन्टोलॉजी होती है। एक और अच्छी प्रथा यह है कि डेटा को कब और कहां एकत्र किया गया था और इसे डेटाबेस में रखने से पहले इसके साथ क्या हुआ, साथ ही अनुपयोगी या स्टेल डेटा को नियमित रूप से साफ करने के लिए प्रक्रियाएं स्थापित करना।
धन्यवाद इस महान साक्षात्कार के लिए, जो पाठक इस पुस्तक के बारे में अधिक जानने में रुचि रखते हैं, मैं उन्हें पुस्तक पढ़ने की सलाह देता हूं द रियल वर्ल्ड ऑफ एआई: रेस्पॉन्सिबल मशीन लर्निंग के लिए एक व्यावहारिक गाइड।












