рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░
рдкреЗрдбреНрд░реЛ рдЕрд▓реНрд╡реЗрд╕, рдУрдкрд▓.рдПрдЖрдИ рдХреЗ рд╕реАрдИрдУ рдФрд░ рд╕рдВрд╕реНрдерд╛рдкрдХ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

पेड्रो अल्वेस ओपल.एआई के सीईओ और संस्थापक हैं, जो एक प्लेटफ़ॉर्म है जो विश्लेषकों और विषय विशेषज्ञों को शक्तिशाली पूर्वानुमानिक विश्लेषण से सशक्त बनाता है। इस प्लेटफ़ॉर्म में दुनिया के अग्रणी डेटा वैज्ञानिकों के ज्ञान और विशेषज्ञता से लैस है, ताकि उपयोगकर्ता वास्तव में अच्छे पर ध्यान केंद्रित कर सकें: व्यवसायिक प्रभाव पैदा करना।
आपको शुरू में डेटा साइंस में क्या आकर्षित किया?
2001 में, मैंने मशीन लर्निंग और आर्टिफ़िशियल इंटेलिजेंस में जबरदस्त संभावनाएं देखीं। कंप्यूटर साइंस का अध्ययन करने के दौरान, और यह तय करने के लिए कि कौन सा उपक्षेत्र आगे बढ़ना है, मैंने सोचा: ठीक है, एआई/एमएल कंप्यूटर साइंस का एक क्षेत्र है जो मुझे दिलचस्प लगता है – आप किसी भी क्षेत्र में घटनाओं की भविष्यवाणी करने में मदद कर सकते हैं। चाहे आप जीव विज्ञान, चिकित्सा या वित्त में हों, यदि आपके पास मशीन लर्निंग और एआई है, तो आप उन क्षेत्रों को काफी हद तक आगे बढ़ा सकते हैं। मुझे हमेशा से लगता था कि इसके पीछे की गणित रोमांचक है।
जैसे ही मैं स्नातक स्कूल में प्रवेश किया, मैंने तय किया कि मशीन लर्निंग में अपनी विशेषज्ञता में सुधार करने का सबसे अच्छा तरीका यह होगा कि मैं सीखूं कि इसका आवेदन कैसे किया जाए। मैं हमेशा से व्यावहारिक रहा हूं; मैं सिद्धांत के लिए सिद्धांत सीखना नहीं चाहता था। मैंने मशीन लर्निंग का अध्ययन करने का चुनाव किया क्योंकि यह जेनोमिक्स और प्रोटिओमिक्स के क्षेत्र में लागू होता है। मेरा सारा स्नातक कार्य कम्प्यूटेशनल जीव विज्ञान में था, लेकिन ध्यान मशीन लर्निंग पर था।
इसके तुरंत बाद, मैं स्वास्थ्य सेवा उद्योग में प्रवेश किया, जहां मैंने एआई/एमएल अनुप्रयोगों के लिए बड़ी संभावना देखी। यह तब था जब मैंने उन समस्याओं को देखा जो एआई को व्यावहारिक रूप से अकादमिक क्षेत्र से बाहर आते ही थीं। मैंने एआई की वास्तविकता का अनुभव किया और सीखा कि यह वास्तविक दुनिया में कितनी अप्रभावी ढंग से लागू की गई थी, और इसके तकनीकी मुद्दों के कारण नहीं। इसलिए, मैं तब समस्या को हल करने के लिए आकर्षित हुआ।
आप पहले बान्जो में मुख्य डेटा वैज्ञानिक थे, जहां आपने सामाजिक नेटवर्क क्षेत्र में चुनौतियों का सामना किया। कुछ चुनौतियों पर चर्चा कर सकते हैं?
एक कंपनी के रूप में, हम सामाजिक मीडिया पर दर्ज की गई घटनाओं का पता लगाते थे, विशेष रूप से उन घटनाओं का जो संभावित खतरे के रूप में उजागर की जानी थी, जैसे कि एक निकटवर्ती कार दुर्घटना या एक इमारत में आग। हम पहले उत्तरदाताओं को सतर्क करने में मदद करने के लिए इन घटनाओं को झंडा दिखाते थे। हम सामाजिक मीडिया का उपयोग अच्छे के लिए कर रहे थे।
इनमें से कई घटनाएं सामाजिक मीडिया डेटा के संबंध में दुर्लभ हैं। उदाहरण के लिए, किसी भी शहर में प्रतिदिन कई दुर्घटनाएं होती हैं, लेकिन जब आप सामाजिक मीडिया डेटा की मात्रा को देखते हैं, तो एक कार दुर्घटना की तस्वीर काफी कम हो जाती है। एक कार दुर्घटना की तस्वीर के साथ, कुछ मिनटों के भीतर, लाखों तस्वीरें होती हैं – पिल्लों, भोजन, सेल्फी की तस्वीरें और एक कार दुर्घटना की तस्वीर। मूल रूप से, बान्जो में, हम सुई को ढूंढ रहे थे घास में।
तो एक चुनौती जो उत्पन्न हुई थी वह कंप्यूटर दृष्टि के बारे में थी। हालांकि उस समय कंप्यूटर दृष्टि अच्छी थी, जब आप कुछ मिलियन में से एक को खोजने की कोशिश करते हैं, तो भी एक छोटी सी त्रुटि दर संभावना आपके इन दुर्लभ घटनाओं का पता लगाने की संभावना को पूरी तरह से नष्ट कर सकती है।
उदाहरण के लिए, एक सार्वजनिक डेटासेट था जो जब न्यूरल नेटवर्क को प्रशिक्षित करने के लिए उपयोग किया जाता था, तो वे रंग की पहचान नहीं कर पाते थे। यहां तक कि अगर एक तस्वीर में रंगीन थी और न्यूरल नेटवर्क सभी आरजीबी देख रहा था, तो यह रंग को एक संकेतक के रूप में उपयोग नहीं करता था। एक पारंपरिक पुलिस कार और एक पारंपरिक टैक्सी – दोनों मूल रूप से एक ही कार मॉडल हैं और शीर्ष पर एक अतिरिक्त टुकड़ा (यानी, पुलिस कार पर सायरन या टैक्सी पर मुक्त/व्यस्त संकेत) है। लेकिन अगर आप रंग देखते हैं, तो दोनों के बीच का अंतर स्पष्ट है। क्योंकि इस उदाहरण से, हम समझने में सक्षम थे कि एक उचित डेटासेट बनाना महत्वपूर्ण है।
2017 में, आपने ओपल लॉन्च किया। इस स्टार्टअप की उत्पत्ति कहानी क्या है?
मैं चाहता था कि कंपनियां एआई को लागू करने से एक ठोस आरओआई प्राप्त करें। गार्टनर के अनुसार, 80 से 90 प्रतिशत एआई परियोजनाएं कभी भी प्रकाश में नहीं आती हैं। इसका कुछ भी लेना-देना तकनीकी पहलुओं से नहीं है, जैसे कि मॉडल की सटीकता। यह आमतौर पर कंपनी की संस्कृति या कंपनी के भीतर प्रक्रियात्मक पहलुओं से संबंधित होता है।
यह डेटा साइंस टीम और व्यवसाय उपयोगकर्ता के बीच पर्याप्त संचार की कमी के कारण हो सकता है, जिससे ऐसे मॉडल बनते हैं जो व्यवसाय टीम की जरूरतों को पूरा नहीं करते हैं। या अगर वे सही मॉडल बनाते हैं, तो जब डेटा साइंस टीम समाप्त हो जाती है, तो व्यवसाय टीम भविष्यवाणियों का लाभ नहीं उठाती है। अधिकांश कंपनियों में, बिक्री, विपणन और लॉजिस्टिक्स जैसे विभाग वास्तव में एआई का उपयोग करना चाहिए, लेकिन यह डेटा साइंस टीम है जो मॉडल को समझती है। जब ये टीमें उन मॉडलों को नहीं समझती हैं जो उनके लिए बनाए जा रहे हैं, तो वे उनकी भविष्यवाणियों पर भरोसा नहीं करती हैं और इसलिए उनका उपयोग नहीं करती हैं।
तो अगर एआई व्यवसाय को करने के तरीके को नहीं बदल रहा है, तो इसका क्या मतलब है?
हम एक ऐसा प्लेटफ़ॉर्म बनाना चाहते थे जो इसे समझ सके – हम डेटा साइंस टीम या व्यवसाय विश्लेषकों, डेटा विश्लेषकों, कंपनी में शामिल किसी को भी सही परियोजनाओं का निर्माण करने में मदद करना चाहते हैं और कर्मचारियों को मॉडल को समझने और विश्वास करने में मदद करते हैं। अगर हम इसे ठीक करते हैं, तो मुझे लगता है कि डेटा साइंस अंततः कंपनियों के लिए वास्तविक तरीके से मूल्यवान हो सकता है।
आपका कहना है कि डेटा वैज्ञानिक उन कार्यों पर कीमती समय बर्बाद कर रहे हैं जिन्हें एआई के साथ स्वचालित किया जा सकता है। कुछ उदाहरण दे सकते हैं जो कार्यों को स्वचालित किया जाना चाहिए?
एक डेटा वैज्ञानिक आमतौर पर एक मॉडल को पूरा करने में कई महीने लेता है, और एक बार अंतिम रूप देने के बाद, कंपनी मॉडल को लागू करती है, हालांकि यह संभवतः उतना सटीक नहीं होगा। मॉडल को लागू करने के बाद के महीनों में, डेटा वैज्ञानिक मॉडल को और अधिक सटीक बनाने के प्रयास में इस पर काम करना जारी रखता है। यह आमतौर पर वह जगह है जहां अधिकांश डेटा वैज्ञानिक अपना समय बिताते हैं जब वे अन्य कार्यों पर समय बिता सकते हैं, जैसे कि यह सुनिश्चित करना कि कर्मचारी समझें, विश्वास करें और मौजूदा एआई मॉडल का उपयोग करें। सभी समय जो फीचर इंजीनियरिंग, मॉडल प्रशिक्षण, पैरामीटर ट्यूनिंग और एल्गोरिदम चयन जैसे कार्यों पर बिताया जाता है, मॉडल की सटीकता बढ़ाने के लिए, आसानी से एआई के साथ स्वचालित किया जा सकता है।
आप मेटा-लर्निंग का वर्णन कर सकते हैं और ओपल इसका उपयोग कैसे करता है?
मेटा-लर्निंग से पहले मशीन लर्निंग की पहली परत को समझना महत्वपूर्ण है। कहें, आपके पास एक डेटासेट है जो कारखाने के फर्श पर मशीनों के टूटने का अनुमान लगाता है। मशीन कर्मचारियों को सूचित करती है कि यह टूटने वाली है, ताकि वे निवारक रखरखाव कर सकें। यह पहली परत का अधिग्रहण माना जाता है।
मेटा-लर्निंग, जिसे अक्सर “सीखने के लिए सीखना” कहा जाता है, सीखने की उस प्रक्रिया को और अधिक समझना है। तो जब आप मॉडल को मशीन त्रुटियों की भविष्यवाणी करने के लिए प्रशिक्षित कर रहे हैं, तो आपके पास एक और मॉडल है जो देख रहा है। उदाहरण के लिए, दूसरा मॉडल व्यवसायों को यह समझने में मदद कर सकता है कि भविष्यवाणी मॉडल किन पैरामीटरों को अच्छी तरह से सीख रहा है और कौन से पैरामीटर काम नहीं कर रहे हैं। जब आप मेटा-लर्निंग करते हैं, तो आप अधिक कुशल मॉडल बनाने में बेहतर हो जाते हैं, तेजी से।
आपके सिंथेटिक डेटा पर क्या विचार हैं?
सिंथेटिक डेटा को सही से निष्पादित नहीं किए जाने पर बहुत मुश्किल हो सकता है।
कहें, आपके पास चिकित्सा रिकॉर्ड डेटा है – आपके पास 20 रोगियों के लिए उनकी उम्र, लिंग, वजन, ऊंचाई, रक्तचाप, दवाओं की सूची आदि है। सिंथेटिक डेटा बनाना संभव है जो मशीन लर्निंग के साथ इन चिकित्सा रिकॉर्ड पर आधारित है। हालांकि, यदि आप केवल मशीन लर्निंग या सांख्यिकी पर भरोसा करते हैं, तो आप असंगत सिंथेटिक डेटा के साथ समाप्त हो सकते हैं। यह मानों का एक यादृच्छिक मिश्रण और मेल कर सकता है। एक 3 साल का बच्चा जो 6 फीट लंबा है या एक 4 फुट लंबा व्यक्ति जो 1000 पाउंड वजन का है। जबकि एआई/एमएल अधिकांश मामलों में विश्वसनीय हैं, चिकित्सा रिकॉर्ड के लिए सिंथेटिक डेटा का उपयोग करने के लिए एक डॉक्टर की प्रविष्टि की आवश्यकता होगी।
तो आप एक चिकित्सा पेशेवर को शामिल करते हैं ताकि वे पैरामीटर बना सकें, जैसे “यदि व्यक्ति इस उम्र का है, तो एक वास्तविक ऊंचाई सीमा और वजन क्या है,” या “यदि वे इस दवा का सेवन कर रहे हैं, तो वे किन दवाओं का सेवन नहीं कर रहे हैं?” यह प्रक्रिया अनिवार्य रूप से एक विशाल उद्यम बन जाएगी और प्रत्येक रोगी के चिकित्सा रिकॉर्ड के संबंध में सभी संभावनाओं को मैप करने के लिए बहुत जटिल हो जाएगी।
छवियों के क्षेत्र में, हालांकि, सिंथेटिक डेटा बहुत आसान हो सकता है। कहें, आपके पास एक कार की तस्वीर है, और कार ऊपरी बाएं कोने में है। आपको विशेषज्ञ होने की आवश्यकता नहीं है ताकि आप जानें कि उसी कार को नीचे बाएं कोने, ऊपरी दाएं कोने या केंद्र में रखा जा सकता है। न केवल व्यक्ति कैमरे को कई तरीकों से इंगित कर सकता है, बल्कि वे तस्वीर को भी पुनः संरेखित कर सकते हैं। तस्वीर के फोकस को बदलना, ताकि कार सभी विभिन्न कोनों में हो – सिंथेटिक डेटा बनाने का एक और सरल तरीका है घूर्णन का उपयोग करना।
कुछ उदाहरण दे सकते हैं कि ओपल ने उद्यमों को उनकी डेटा आवश्यकताओं में कैसे मदद की?
ओपल.एआई उद्यमों को संगठन के सभी स्तरों पर गहन डेटा विश्लेषण का लाभ उठाने और अपने कर्मचारियों को एआई के मूल्य को अनलॉक करने का अवसर प्रदान करने की क्षमता प्रदान करता है, केवल कुछ क्लिक के साथ। जैसा कि संगठन डेटा वैज्ञानिकों की एक छोटी टीम पर निर्भर करते हैं ताकि वे एआई को व्यक्त और लागू कर सकें, ओपल.एआई प्लेटफ़ॉर्म विभिन्न विभागों में कर्मचारियों को अपने डेटा से अंतर्दृष्टि तक पहुंचने और अपनी दैनिक दक्षता बढ़ाने के लिए उपकरण प्रदान करता है।
इसके साथ कहा, एक बड़ा अवरोध जिसे संगठन अक्सर एआई को लागू करते समय面 करते हैं वह मॉडल व्याख्या है। यह आवश्यक है कि उद्यमों को ऐसा एआई प्रदान किया जाए जिसे उनके कर्मचारी समझ सकें और अधिक महत्वपूर्ण रूप से, विश्वास करें। मॉडल व्याख्या इसमें मदद करती है। ओपल.एआई प्लेटफ़ॉर्म का हमारा लक्ष्य एआई या प्रौद्योगिकी के जानकार नहीं होने वाले कर्मचारियों को यह समझने का अवसर प्रदान करना है कि मॉडल भविष्यवाणियां कैसे करता है और क्यों। मॉडल व्याख्या बनाने से दीर्घकालिक परिणाम उद्यमों के लिए शक्तिशाली होंगे।
इसके अलावा, मॉडल से कंपनियों के लिए एक मॉडल की भविष्यवाणी करने के अलावा बहुत अधिक मूल्य है। एआई संभावित समस्याओं या उन क्षेत्रों का खुलासा कर सकता है जिन पर पूंजी लगाई जा सकती है। हम इसे डेटा व्याख्या कहते हैं – यह विभिन्न तरीके हैं जिनसे एक मॉडल कंपनी के लिए मूल्यवान बुद्धिमान अंतर्दृष्टि साझा कर सकता है। यह एक बड़ा तरीका है जिसमें एआई व्यवसायों में मदद कर सकता है, और एक क्षेत्र जिसमें हम अपने प्रतिस्पर्धा के संबंध में आगे बढ़ रहे हैं।
साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें ओपल.एआई पर जाना चाहिए।












