рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░
рдПрдордЖрд░ рдиреВрд░-рдПрд▓реНрдбрд┐рди, рдПрд▓рдПрдХреНрд╕рдЯреА рдореЗрдВ рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХреА рдХреЗ рдЙрдкрд╛рдзреНрдпрдХреНрд╖ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

एमआर नूर-एल्डिन, एलएक्सटी में प्रौद्योगिकी के उपाध्यक्ष हैं। एमआर एक पीएचडी अनुसंधान वैज्ञानिक हैं जिनके पास स्वचालित भाषण मान्यता (एएसआर) के संदर्भ में भाषण/ऑडियो प्रसंस्करण और मशीन लर्निंग में 16 वर्षों से अधिक का पेशेवर अनुभव है, जिसमें हाल के वर्षों में स्ट्रीमिंग एंड-टू-एंड भाषण मान्यता के लिए गहरे शिक्षण तकनीकों पर विशेष ध्यान और हाथों-हाथ अनुभव है।
एलएक्सटी वैश्विक संगठनों के लिए बुद्धिमान प्रौद्योगिकी को शक्ति प्रदान करने के लिए एआई प्रशिक्षण डेटा में एक उभरता हुआ नेता है। एक अंतरराष्ट्रीय योगदानकर्ताओं के नेटवर्क के साथ साझेदारी में, एलएक्सटी विभिन्न मोडलिटी में डेटा इकट्ठा करता है और उद्यम द्वारा आवश्यक गति, पैमाने और लचीलेपन के साथ एनोटेट करता है। उनकी वैश्विक विशेषज्ञता 145 से अधिक देशों और 1000 से अधिक भाषा स्थानों में फैली हुई है।
आपने मैकगिल विश्वविद्यालय से सिग्नल प्रोसेसिंग में पीएचडी की पढ़ाई की, इस क्षेत्र में आपकी रुचि क्या थी?
मैंने हमेशा इंजीनियरिंग का अध्ययन करना चाहा था, और स्वाभाविक रूप से विज्ञान में रुचि थी, लेकिन मैं विशेष रूप से गणित और भौतिकी की ओर आकर्षित हुआ। मैंने प्रकृति को कैसे काम करता है और उस समझ को प्रौद्योगिकी बनाने के लिए कैसे लागू किया जाए, यह जानने की कोशिश की। स्कूल के बाद, मेरे पास चिकित्सा और अन्य पेशों में जाने का अवसर था, लेकिन मैंने विशेष रूप से इंजीनियरिंग को चुना क्योंकि यह मेरे दो निकटतम क्षेत्रों में से एक था: गणित और भौतिकी। और एक बार जब मैंने इसे चुना, तो कई संभावित मार्ग थे – यांत्रिक, सिविल, और इतने पर। लेकिन मैंने विशेष रूप से विद्युत अभियांत्रिकी को चुना क्योंकि यह मेरे लिए गणित और भौतिकी की समस्याओं के लिए सबसे करीबी और सबसे कठिन है, साथ ही साथ आधुनिक प्रौद्योगिकी का आधार है जो मुझे हमेशा से प्रेरित करता है।
विद्युत अभियांत्रिकी के भीतर, विभिन्न विशेषज्ञता हैं जिन्हें चुनना होता है, जो आम तौर पर दो छतरियों के तहत आते हैं: दूरसंचार और सिग्नल प्रोसेसिंग, और बिजली और विद्युत अभियांत्रिकी। जब समय आया कि उनमें से एक को चुनना होगा, तो मैंने दूरसंचार और सिग्नल प्रोसेसिंग को चुना क्योंकि यह भौतिकी के माध्यम से प्रकृति का वर्णन करने के लिए करीब है और हमारी इंद्रियों द्वारा कैसे संवाद करते हैं और कैसे गणितीय रूप से उस जानकारी का प्रतिनिधित्व करते हैं ताकि हम उस ज्ञान का लाभ उठा सकें और प्रौद्योगिकी में सुधार कर सकें।
क्या आप मैकगिल विश्वविद्यालय में कृत्रिम बैंडविड्थ विस्तार (बीडब्ल्यूई) के सूचना-सिद्धांतिक पहलू पर अपने शोध पर चर्चा कर सकते हैं?
जब मैंने अपनी स्नातक की डिग्री पूरी की, तो मैं सिग्नल प्रोसेसिंग क्षेत्र में अकादमिक रूप से आगे बढ़ना चाहता था। एक वर्ष के बाद फोटोनिक्स का अध्ययन करने के बाद, मैंने अपनी मास्टर्स की डिग्री पूरी की और भाषण मान्यता पर ध्यान केंद्रित किया। जब यह समय आया कि पीएचडी करनी होगी, तो मैंने अपने क्षेत्र को थोड़ा व्यापक बनाने का फैसला किया और सामान्य ऑडियो और स्पीच प्रोसेसिंग के साथ-साथ मशीन लर्निंग और सूचना सिद्धांत के क्षेत्र में भी काम किया।
मेरे पीएचडी के लिए वाहन संकीर्णबैंड भाषण का बैंडविड्थ विस्तार था। संकीर्णबैंड भाषण से तात्पर्य पारंपरिक दूरसंचार भाषण से है। भाषण की आवृत्ति सामग्री 20 किलोहertz तक फैली हुई है, लेकिन जानकारी सामग्री का अधिकांश 4 किलोहertz तक सीमित है। बैंडविड्थ विस्तार से तात्पर्य 3.4 किलोहertz से ऊपर तक की भाषण सामग्री को कृत्रिम रूप से विस्तारित करने से है, जो पारंपरिक दूरसंचार में ऊपरी आवृत्ति सीमा है। उस लापता उच्च आवृत्ति सामग्री को बेहतर ढंग से पुनर्निर्माण करने के लिए, आपको पहले दोनों आवृत्ति बैंड में भाषण सामग्री के बीच साझा जानकारी को मापना होगा, फिर उस जानकारी का उपयोग एक मॉडल को प्रशिक्षित करने के लिए करें जो उस साझा जानकारी को सीखता है; एक मॉडल जो एक बार प्रशिक्षित हो जाने के बाद, केवल संकीर्णबैंड भाषण और मॉडल द्वारा सीखी गई जानकारी के आधार पर उच्चबैंड सामग्री उत्पन्न कर सकता है। उस साझा “साझा जानकारी” को मापने और प्रस्तुत करने के लिए सूचना सिद्धांत आता है। सूचना सिद्धांत किसी भी संकेत में जानकारी को मापने और प्रस्तुत करने का अध्ययन है। इसलिए, मेरा शोध भाषण के कृत्रिम बैंडविड्थ विस्तार में सुधार के लिए सूचना सिद्धांत को शामिल करने के बारे में था।
आप न्यांस कम्युनिकेशंस में 16 वर्षों से अधिक समय तक प्रिंसिपल स्पीच वैज्ञानिक थे, जो अब माइक्रोसॉफ्ट का हिस्सा है, इस अनुभव से आपके कुछ प्रमुख निष्कर्ष क्या थे?
मेरे दृष्टिकोण से, सबसे महत्वपूर्ण लाभ यह था कि मैं हमेशा राज्य-कला और कटिंग-एज तकनीकों पर काम कर रहा था और सिग्नल प्रोसेसिंग और मशीन लर्निंग में वास्तविक दुनिया के अनुप्रयोगों में उनका अनुप्रयोग कर रहा था। मुझे विभिन्न डोमेन में कॉन्वर्सेशनल एआई उत्पादों पर काम करने का अवसर मिला, जिनमें उद्यम, स्वास्थ्य सेवा, ऑटोमोटिव और गतिशीलता शामिल थे। इनमें से कुछ विशिष्ट अनुप्रयोगों में वर्चुअल सहायक, इंटरैक्टिव वॉयस रिस्पांस, वॉयसमेल से टेक्स्ट और अन्य शामिल थे जहां उचित प्रतिनिधित्व और प्रतिलेखन महत्वपूर्ण है, जैसे कि स्वास्थ्य सेवा में डॉक्टर-रोगी बातचीत के साथ। इन 16 वर्षों में, मुझे सौभाग्य मिला कि मैंने साक्षात्कार के माध्यम से कॉन्वर्सेशनल एआई के विकास को देखा और उसका हिस्सा बना, सांख्यिकीय मॉडलिंग के दिनों से लेकर गहरे शिक्षण के क्रमिक अधिग्रहण तक, और अब जहां गहरे शिक्षण प्रभुत्व और लगभग सभी एआई पहलुओं में प्रभुत्व रखता है, जिसमें उत्पन्न एआई और पारंपरिक भविष्यवाणी या विभेदक एआई शामिल है। इस अनुभव से एक और महत्वपूर्ण निष्कर्ष यह है कि डेटा की मात्रा और गुणवत्ता एआई मॉडल क्षमताओं और प्रदर्शन के लिए एक महत्वपूर्ण चालक की भूमिका निभाती है।
आपके द्वारा प्रकाशित सबसे महत्वपूर्ण शोध पत्र के बारे में आपकी राय क्या है और क्यों यह महत्वपूर्ण था?
गूगल स्कॉलर के अनुसार सबसे अधिक उद्धृत पत्र 2008 में प्रकाशित एक पत्र होगा, जिसका शीर्षक “मेल-फ्रीक्वेंसी सेप्ट्रल कॉफिशिएंट-आधारित संकीर्णबैंड भाषण का बैंडविड्थ विस्तार” है। इस पत्र का मुख्य फोकस स्वचालित भाषण मान्यता (एएसआर) क्षेत्र में व्यापक रूप से उपयोग की जाने वाली विशेषता प्रतिनिधित्व का उपयोग करके भाषण सामग्री को पुनर्निर्माण करने के बारे में है।
हालांकि, मेरे दृष्टिकोण से, सबसे नवाचारी पत्र दूसरा सबसे अधिक उद्धृत पत्र है, जो 2011 में प्रकाशित हुआ था, जिसका शीर्षक “संकीर्णबैंड भाषण के बैंडविड्थ विस्तार के लिए गॉसियन मिश्रण मॉडल फ्रेमवर्क का स्मृति-आधारित अनुमान” है। इस कार्य में, मैंने भाषण में लंबी अवधि की जानकारी को मॉडल करने के लिए एक नई सांख्यिकीय मॉडलिंग तकनीक का प्रस्ताव दिया। इस तकनीक का लाभ यह है कि यह भाषण में लंबी अवधि की जानकारी को न्यूनतम अतिरिक्त जटिलता के साथ मॉडल करने की अनुमति देता है और एक ऐसे तरीके से जो अभी भी वास्तविक समय में वाइडबैंड भाषण के उत्पादन की अनुमति देता है।
जून 2023 में आपको एलएक्सटी में प्रौद्योगिकी के उपाध्यक्ष के रूप में नियुक्त किया गया था, इस पद को संभालने के लिए आपको क्या आकर्षित किया?
मेरे अकादमिक और पेशेवर अनुभव से पहले एलएक्सटी में, मैंने हमेशा डेटा के साथ काम किया है। वास्तव में, जैसा कि मैंने पहले उल्लेख किया है, मेरे लिए न्यांस कम्युनिकेशंस में काम करने का एक महत्वपूर्ण निष्कर्ष यह था कि डेटा एआई मॉडल जीवन चक्र में एक महत्वपूर्ण भूमिका निभाता है। गुणवत्तापूर्ण डेटा की पर्याप्त मात्रा होना एआई की सफलता के लिए महत्वपूर्ण है। इसलिए, जब मैं अपने करियर के एक ऐसे चरण में था जहां मैं एक स्टार्टअप जैसे वातावारण में सीखना, अपने कौशल को व्यापक बनाना और अपने भाषण और एआई अनुभव का उपयोग करके अधिकतम प्रभाव डालना चाहता था, तो मुझे एलएक्सटी में शामिल होने का अवसर मिला। यह एक आदर्श मेल था। न केवल एलएक्सटी एक एआई डेटा प्रदाता है जो एक प्रभावशाली और निरंतर गति से बढ़ रहा है, बल्कि मैंने यह भी देखा कि यह एआई ज्ञान और ग्राहक विविधता के मामले में विकास के एक आदर्श चरण में है। मैं इस यात्रा में शामिल होने और अपने भाषण और एआई अनुभव को लेकर बड़ा प्रभाव डालने का अवसर पाने के लिए उत्साहित था।
आपका एलएक्सटी में एक औसत दिन कैसा दिखता है?
मेरा औसत दिन最新 शोध पर नजर रखने से शुरू होता है, जो हाल ही में उत्पन्न एआई पर केंद्रित रहा है, और हम अपने ग्राहकों की जरूरतों के लिए इसका कैसे अनुप्रयोग कर सकते हैं। मेरे पास एक उत्कृष्ट टीम है जो हमारे ग्राहकों की विशिष्ट एआई डेटा जरूरतों के लिए समाधान बनाने और अनुकूलित करने में बहुत सक्षम है। इसलिए, मैं उनके साथ मिलकर उस एजेंडे को निर्धारित करता हूं।
वार्षिक और त्रैमासिक योजना भी है, और रणनीतिक उद्देश्यों को व्यक्तिगत टीम लक्ष्यों में तोड़ना और उन योजनाओं के साथ प्रगति को ट्रैक करना। जैसे फीचर विकास पर काम कर रहे हैं, हमारे पास आमतौर पर दो प्रौद्योगिकी ट्रैक होते हैं। एक यह सुनिश्चित करने के लिए है कि हमारे पास अपने वर्तमान और नए आगामी परियोजनाओं पर सर्वोत्तम परिणाम देने के लिए सही टुकड़े हैं। दूसरा ट्रैक हमारी तकनीकी क्षमताओं में सुधार और विस्तार करना है, जिसमें उनमें मशीन लर्निंग को एकीकृत करने पर ध्यान केंद्रित किया जाता है।
क्या आप एलएक्सटी में जिन मशीन लर्निंग एल्गोरिदम पर काम करते हैं उनके प्रकारों पर चर्चा कर सकते हैं?
कृत्रिम बुद्धिमत्ता समाधान विभिन्न उद्योगों में व्यवसायों को बदल रहे हैं, और हम एलएक्सटी में उन्हें शक्ति प्रदान करने वाले मशीन लर्निंग एल्गोरिदम को प्रशिक्षित करने के लिए उच्च गुणवत्ता वाले डेटा प्रदान करने में सम्मानित महसूस करते हैं। हमारे ग्राहक विभिन्न अनुप्रयोगों पर काम कर रहे हैं, जिनमें ऑगमेंटेड और वर्चुअल रियलिटी, कंप्यूटर विजन, कॉन्वर्सेशनल एआई, जनरेटिव एआई, सर्च प्रासंगिकता और स्पीच और प्राकृतिक भाषा प्रसंस्करण शामिल हैं। हम मशीन लर्निंग एल्गोरिदम और भविष्य की प्रौद्योगिकियों को डेटा जनरेशन और वृद्धि के माध्यम से शक्ति प्रदान करने के लिए प्रतिबद्ध हैं जो हर भाषा, संस्कृति और मोडलिटी में काम करते हैं।
भाषण और ऑडियो प्रसंस्करण अंग्रेजी और विशेष रूप से श्वेत पुरुषों के लिए लगभग पूर्णता की ओर बढ़ रहा है। आपको लगता है कि यह सभी भाषाओं, लिंगों और जातियों के लिए एक समान खेल का मैदान होगा, इसका अनुमान कितना समय लगेगा?
यह एक जटिल प्रश्न है, और कई कारकों पर निर्भर करता है, जिनमें आर्थिक, राजनीतिक, सामाजिक और प्रौद्योगिकी शामिल हैं। लेकिन यह स्पष्ट है कि अंग्रेजी भाषा की प्रमुखता ने एआई को वर्तमान स्थिति में ला दिया है। इसलिए, एक समान खेल का मैदान हासिल करने के लिए यह विभिन्न जातियों और आबादी से डेटा की प्रतिनिधित्व और उपलब्धता की गति पर निर्भर करता है।
आपकी दृष्टि एलएक्सटी के लिए विभिन्न ग्राहकों के लिए एआई प्रयासों को कैसे तेज करने के लिए है?
हमारा लक्ष्य एलएक्सटी में कुशल, सटीक और तेज एआई विकास को सक्षम करने वाले डेटा समाधान प्रदान करना है। हमारे 12 वर्षों के एआई डेटा स्थान में अनुभव के माध्यम से, हमने न केवल ग्राहकों की जरूरतों के बारे में व्यापक ज्ञान प्राप्त किया है, बल्कि हमने अपनी प्रक्रियाओं को डेटा की उच्चतम गुणवत्ता प्रदान करने के लिए लगातार परिष्कृत किया है। परिणामस्वरूप, हमारी प्रतिबद्धता के कारण, हम अपने ग्राहकों को डेटा की गुणवत्ता, कुशलता और मूल्य निर्धारण के लिए सर्वोत्तम संयोजन प्रदान करने के लिए एक विश्वसनीय एआई डेटा साथी बन गए हैं। मेरी दृष्टि यह है कि हम इस एलएक्सटी “मो” को हमारे द्वारा काम की जाने वाली सभी मोडलिटी और अब हमारे द्वारा सेवा किए जाने वाले सभी प्रकार के एआई विकास में विस्तारित करना है, जिसमें उत्पन्न एआई शामिल है। इस लक्ष्य को प्राप्त करने के लिए, हमें अपनी मशीन लर्निंग और डेटा विज्ञान क्षमताओं को रणनीतिक रूप से विस्तारित करने की आवश्यकता है, दोनों प्रौद्योगिकी और संसाधनों के संदर्भ में।
साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें एलएक्सटी पर जाना चाहिए।












