рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░

рдПрдордЖрд░ рдиреВрд░-рдПрд▓реНрдбрд┐рди, рдПрд▓рдПрдХреНрд╕рдЯреА рдореЗрдВ рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХреА рдХреЗ рдЙрдкрд╛рдзреНрдпрдХреНрд╖ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

mm

एमआर नूर-एल्डिन, एलएक्सटी में प्रौद्योगिकी के उपाध्यक्ष हैं। एमआर एक पीएचडी अनुसंधान वैज्ञानिक हैं जिनके पास स्वचालित भाषण मान्यता (एएसआर) के संदर्भ में भाषण/ऑडियो प्रसंस्करण और मशीन लर्निंग में 16 वर्षों से अधिक का पेशेवर अनुभव है, जिसमें हाल के वर्षों में स्ट्रीमिंग एंड-टू-एंड भाषण मान्यता के लिए गहरे शिक्षण तकनीकों पर विशेष ध्यान और हाथों-हाथ अनुभव है।

एलएक्सटी वैश्विक संगठनों के लिए बुद्धिमान प्रौद्योगिकी को शक्ति प्रदान करने के लिए एआई प्रशिक्षण डेटा में एक उभरता हुआ नेता है। एक अंतरराष्ट्रीय योगदानकर्ताओं के नेटवर्क के साथ साझेदारी में, एलएक्सटी विभिन्न मोडलिटी में डेटा इकट्ठा करता है और उद्यम द्वारा आवश्यक गति, पैमाने और लचीलेपन के साथ एनोटेट करता है। उनकी वैश्विक विशेषज्ञता 145 से अधिक देशों और 1000 से अधिक भाषा स्थानों में फैली हुई है।

आपने मैकगिल विश्वविद्यालय से सिग्नल प्रोसेसिंग में पीएचडी की पढ़ाई की, इस क्षेत्र में आपकी रुचि क्या थी?

मैंने हमेशा इंजीनियरिंग का अध्ययन करना चाहा था, और स्वाभाविक रूप से विज्ञान में रुचि थी, लेकिन मैं विशेष रूप से गणित और भौतिकी की ओर आकर्षित हुआ। मैंने प्रकृति को कैसे काम करता है और उस समझ को प्रौद्योगिकी बनाने के लिए कैसे लागू किया जाए, यह जानने की कोशिश की। स्कूल के बाद, मेरे पास चिकित्सा और अन्य पेशों में जाने का अवसर था, लेकिन मैंने विशेष रूप से इंजीनियरिंग को चुना क्योंकि यह मेरे दो निकटतम क्षेत्रों में से एक था: गणित और भौतिकी। और एक बार जब मैंने इसे चुना, तो कई संभावित मार्ग थे – यांत्रिक, सिविल, और इतने पर। लेकिन मैंने विशेष रूप से विद्युत अभियांत्रिकी को चुना क्योंकि यह मेरे लिए गणित और भौतिकी की समस्याओं के लिए सबसे करीबी और सबसे कठिन है, साथ ही साथ आधुनिक प्रौद्योगिकी का आधार है जो मुझे हमेशा से प्रेरित करता है।

विद्युत अभियांत्रिकी के भीतर, विभिन्न विशेषज्ञता हैं जिन्हें चुनना होता है, जो आम तौर पर दो छतरियों के तहत आते हैं: दूरसंचार और सिग्नल प्रोसेसिंग, और बिजली और विद्युत अभियांत्रिकी। जब समय आया कि उनमें से एक को चुनना होगा, तो मैंने दूरसंचार और सिग्नल प्रोसेसिंग को चुना क्योंकि यह भौतिकी के माध्यम से प्रकृति का वर्णन करने के लिए करीब है और हमारी इंद्रियों द्वारा कैसे संवाद करते हैं और कैसे गणितीय रूप से उस जानकारी का प्रतिनिधित्व करते हैं ताकि हम उस ज्ञान का लाभ उठा सकें और प्रौद्योगिकी में सुधार कर सकें।

क्या आप मैकगिल विश्वविद्यालय में कृत्रिम बैंडविड्थ विस्तार (बीडब्ल्यूई) के सूचना-सिद्धांतिक पहलू पर अपने शोध पर चर्चा कर सकते हैं?

जब मैंने अपनी स्नातक की डिग्री पूरी की, तो मैं सिग्नल प्रोसेसिंग क्षेत्र में अकादमिक रूप से आगे बढ़ना चाहता था। एक वर्ष के बाद फोटोनिक्स का अध्ययन करने के बाद, मैंने अपनी मास्टर्स की डिग्री पूरी की और भाषण मान्यता पर ध्यान केंद्रित किया। जब यह समय आया कि पीएचडी करनी होगी, तो मैंने अपने क्षेत्र को थोड़ा व्यापक बनाने का फैसला किया और सामान्य ऑडियो और स्पीच प्रोसेसिंग के साथ-साथ मशीन लर्निंग और सूचना सिद्धांत के क्षेत्र में भी काम किया।

मेरे पीएचडी के लिए वाहन संकीर्णबैंड भाषण का बैंडविड्थ विस्तार था। संकीर्णबैंड भाषण से तात्पर्य पारंपरिक दूरसंचार भाषण से है। भाषण की आवृत्ति सामग्री 20 किलोहertz तक फैली हुई है, लेकिन जानकारी सामग्री का अधिकांश 4 किलोहertz तक सीमित है। बैंडविड्थ विस्तार से तात्पर्य 3.4 किलोहertz से ऊपर तक की भाषण सामग्री को कृत्रिम रूप से विस्तारित करने से है, जो पारंपरिक दूरसंचार में ऊपरी आवृत्ति सीमा है। उस लापता उच्च आवृत्ति सामग्री को बेहतर ढंग से पुनर्निर्माण करने के लिए, आपको पहले दोनों आवृत्ति बैंड में भाषण सामग्री के बीच साझा जानकारी को मापना होगा, फिर उस जानकारी का उपयोग एक मॉडल को प्रशिक्षित करने के लिए करें जो उस साझा जानकारी को सीखता है; एक मॉडल जो एक बार प्रशिक्षित हो जाने के बाद, केवल संकीर्णबैंड भाषण और मॉडल द्वारा सीखी गई जानकारी के आधार पर उच्चबैंड सामग्री उत्पन्न कर सकता है। उस साझा “साझा जानकारी” को मापने और प्रस्तुत करने के लिए सूचना सिद्धांत आता है। सूचना सिद्धांत किसी भी संकेत में जानकारी को मापने और प्रस्तुत करने का अध्ययन है। इसलिए, मेरा शोध भाषण के कृत्रिम बैंडविड्थ विस्तार में सुधार के लिए सूचना सिद्धांत को शामिल करने के बारे में था।

आप न्यांस कम्युनिकेशंस में 16 वर्षों से अधिक समय तक प्रिंसिपल स्पीच वैज्ञानिक थे, जो अब माइक्रोसॉफ्ट का हिस्सा है, इस अनुभव से आपके कुछ प्रमुख निष्कर्ष क्या थे?

मेरे दृष्टिकोण से, सबसे महत्वपूर्ण लाभ यह था कि मैं हमेशा राज्य-कला और कटिंग-एज तकनीकों पर काम कर रहा था और सिग्नल प्रोसेसिंग और मशीन लर्निंग में वास्तविक दुनिया के अनुप्रयोगों में उनका अनुप्रयोग कर रहा था। मुझे विभिन्न डोमेन में कॉन्वर्सेशनल एआई उत्पादों पर काम करने का अवसर मिला, जिनमें उद्यम, स्वास्थ्य सेवा, ऑटोमोटिव और गतिशीलता शामिल थे। इनमें से कुछ विशिष्ट अनुप्रयोगों में वर्चुअल सहायक, इंटरैक्टिव वॉयस रिस्पांस, वॉयसमेल से टेक्स्ट और अन्य शामिल थे जहां उचित प्रतिनिधित्व और प्रतिलेखन महत्वपूर्ण है, जैसे कि स्वास्थ्य सेवा में डॉक्टर-रोगी बातचीत के साथ। इन 16 वर्षों में, मुझे सौभाग्य मिला कि मैंने साक्षात्कार के माध्यम से कॉन्वर्सेशनल एआई के विकास को देखा और उसका हिस्सा बना, सांख्यिकीय मॉडलिंग के दिनों से लेकर गहरे शिक्षण के क्रमिक अधिग्रहण तक, और अब जहां गहरे शिक्षण प्रभुत्व और लगभग सभी एआई पहलुओं में प्रभुत्व रखता है, जिसमें उत्पन्न एआई और पारंपरिक भविष्यवाणी या विभेदक एआई शामिल है। इस अनुभव से एक और महत्वपूर्ण निष्कर्ष यह है कि डेटा की मात्रा और गुणवत्ता एआई मॉडल क्षमताओं और प्रदर्शन के लिए एक महत्वपूर्ण चालक की भूमिका निभाती है।

आपके द्वारा प्रकाशित सबसे महत्वपूर्ण शोध पत्र के बारे में आपकी राय क्या है और क्यों यह महत्वपूर्ण था?

गूगल स्कॉलर के अनुसार सबसे अधिक उद्धृत पत्र 2008 में प्रकाशित एक पत्र होगा, जिसका शीर्षक “मेल-फ्रीक्वेंसी सेप्ट्रल कॉफिशिएंट-आधारित संकीर्णबैंड भाषण का बैंडविड्थ विस्तार” है। इस पत्र का मुख्य फोकस स्वचालित भाषण मान्यता (एएसआर) क्षेत्र में व्यापक रूप से उपयोग की जाने वाली विशेषता प्रतिनिधित्व का उपयोग करके भाषण सामग्री को पुनर्निर्माण करने के बारे में है।

हालांकि, मेरे दृष्टिकोण से, सबसे नवाचारी पत्र दूसरा सबसे अधिक उद्धृत पत्र है, जो 2011 में प्रकाशित हुआ था, जिसका शीर्षक “संकीर्णबैंड भाषण के बैंडविड्थ विस्तार के लिए गॉसियन मिश्रण मॉडल फ्रेमवर्क का स्मृति-आधारित अनुमान” है। इस कार्य में, मैंने भाषण में लंबी अवधि की जानकारी को मॉडल करने के लिए एक नई सांख्यिकीय मॉडलिंग तकनीक का प्रस्ताव दिया। इस तकनीक का लाभ यह है कि यह भाषण में लंबी अवधि की जानकारी को न्यूनतम अतिरिक्त जटिलता के साथ मॉडल करने की अनुमति देता है और एक ऐसे तरीके से जो अभी भी वास्तविक समय में वाइडबैंड भाषण के उत्पादन की अनुमति देता है।

जून 2023 में आपको एलएक्सटी में प्रौद्योगिकी के उपाध्यक्ष के रूप में नियुक्त किया गया था, इस पद को संभालने के लिए आपको क्या आकर्षित किया?

मेरे अकादमिक और पेशेवर अनुभव से पहले एलएक्सटी में, मैंने हमेशा डेटा के साथ काम किया है। वास्तव में, जैसा कि मैंने पहले उल्लेख किया है, मेरे लिए न्यांस कम्युनिकेशंस में काम करने का एक महत्वपूर्ण निष्कर्ष यह था कि डेटा एआई मॉडल जीवन चक्र में एक महत्वपूर्ण भूमिका निभाता है। गुणवत्तापूर्ण डेटा की पर्याप्त मात्रा होना एआई की सफलता के लिए महत्वपूर्ण है। इसलिए, जब मैं अपने करियर के एक ऐसे चरण में था जहां मैं एक स्टार्टअप जैसे वातावारण में सीखना, अपने कौशल को व्यापक बनाना और अपने भाषण और एआई अनुभव का उपयोग करके अधिकतम प्रभाव डालना चाहता था, तो मुझे एलएक्सटी में शामिल होने का अवसर मिला। यह एक आदर्श मेल था। न केवल एलएक्सटी एक एआई डेटा प्रदाता है जो एक प्रभावशाली और निरंतर गति से बढ़ रहा है, बल्कि मैंने यह भी देखा कि यह एआई ज्ञान और ग्राहक विविधता के मामले में विकास के एक आदर्श चरण में है। मैं इस यात्रा में शामिल होने और अपने भाषण और एआई अनुभव को लेकर बड़ा प्रभाव डालने का अवसर पाने के लिए उत्साहित था।

आपका एलएक्सटी में एक औसत दिन कैसा दिखता है?

मेरा औसत दिन最新 शोध पर नजर रखने से शुरू होता है, जो हाल ही में उत्पन्न एआई पर केंद्रित रहा है, और हम अपने ग्राहकों की जरूरतों के लिए इसका कैसे अनुप्रयोग कर सकते हैं। मेरे पास एक उत्कृष्ट टीम है जो हमारे ग्राहकों की विशिष्ट एआई डेटा जरूरतों के लिए समाधान बनाने और अनुकूलित करने में बहुत सक्षम है। इसलिए, मैं उनके साथ मिलकर उस एजेंडे को निर्धारित करता हूं।

वार्षिक और त्रैमासिक योजना भी है, और रणनीतिक उद्देश्यों को व्यक्तिगत टीम लक्ष्यों में तोड़ना और उन योजनाओं के साथ प्रगति को ट्रैक करना। जैसे फीचर विकास पर काम कर रहे हैं, हमारे पास आमतौर पर दो प्रौद्योगिकी ट्रैक होते हैं। एक यह सुनिश्चित करने के लिए है कि हमारे पास अपने वर्तमान और नए आगामी परियोजनाओं पर सर्वोत्तम परिणाम देने के लिए सही टुकड़े हैं। दूसरा ट्रैक हमारी तकनीकी क्षमताओं में सुधार और विस्तार करना है, जिसमें उनमें मशीन लर्निंग को एकीकृत करने पर ध्यान केंद्रित किया जाता है।

क्या आप एलएक्सटी में जिन मशीन लर्निंग एल्गोरिदम पर काम करते हैं उनके प्रकारों पर चर्चा कर सकते हैं?

कृत्रिम बुद्धिमत्ता समाधान विभिन्न उद्योगों में व्यवसायों को बदल रहे हैं, और हम एलएक्सटी में उन्हें शक्ति प्रदान करने वाले मशीन लर्निंग एल्गोरिदम को प्रशिक्षित करने के लिए उच्च गुणवत्ता वाले डेटा प्रदान करने में सम्मानित महसूस करते हैं। हमारे ग्राहक विभिन्न अनुप्रयोगों पर काम कर रहे हैं, जिनमें ऑगमेंटेड और वर्चुअल रियलिटी, कंप्यूटर विजन, कॉन्वर्सेशनल एआई, जनरेटिव एआई, सर्च प्रासंगिकता और स्पीच और प्राकृतिक भाषा प्रसंस्करण शामिल हैं। हम मशीन लर्निंग एल्गोरिदम और भविष्य की प्रौद्योगिकियों को डेटा जनरेशन और वृद्धि के माध्यम से शक्ति प्रदान करने के लिए प्रतिबद्ध हैं जो हर भाषा, संस्कृति और मोडलिटी में काम करते हैं।

भाषण और ऑडियो प्रसंस्करण अंग्रेजी और विशेष रूप से श्वेत पुरुषों के लिए लगभग पूर्णता की ओर बढ़ रहा है। आपको लगता है कि यह सभी भाषाओं, लिंगों और जातियों के लिए एक समान खेल का मैदान होगा, इसका अनुमान कितना समय लगेगा?

यह एक जटिल प्रश्न है, और कई कारकों पर निर्भर करता है, जिनमें आर्थिक, राजनीतिक, सामाजिक और प्रौद्योगिकी शामिल हैं। लेकिन यह स्पष्ट है कि अंग्रेजी भाषा की प्रमुखता ने एआई को वर्तमान स्थिति में ला दिया है। इसलिए, एक समान खेल का मैदान हासिल करने के लिए यह विभिन्न जातियों और आबादी से डेटा की प्रतिनिधित्व और उपलब्धता की गति पर निर्भर करता है।

आपकी दृष्टि एलएक्सटी के लिए विभिन्न ग्राहकों के लिए एआई प्रयासों को कैसे तेज करने के लिए है?

हमारा लक्ष्य एलएक्सटी में कुशल, सटीक और तेज एआई विकास को सक्षम करने वाले डेटा समाधान प्रदान करना है। हमारे 12 वर्षों के एआई डेटा स्थान में अनुभव के माध्यम से, हमने न केवल ग्राहकों की जरूरतों के बारे में व्यापक ज्ञान प्राप्त किया है, बल्कि हमने अपनी प्रक्रियाओं को डेटा की उच्चतम गुणवत्ता प्रदान करने के लिए लगातार परिष्कृत किया है। परिणामस्वरूप, हमारी प्रतिबद्धता के कारण, हम अपने ग्राहकों को डेटा की गुणवत्ता, कुशलता और मूल्य निर्धारण के लिए सर्वोत्तम संयोजन प्रदान करने के लिए एक विश्वसनीय एआई डेटा साथी बन गए हैं। मेरी दृष्टि यह है कि हम इस एलएक्सटी “मो” को हमारे द्वारा काम की जाने वाली सभी मोडलिटी और अब हमारे द्वारा सेवा किए जाने वाले सभी प्रकार के एआई विकास में विस्तारित करना है, जिसमें उत्पन्न एआई शामिल है। इस लक्ष्य को प्राप्त करने के लिए, हमें अपनी मशीन लर्निंग और डेटा विज्ञान क्षमताओं को रणनीतिक रूप से विस्तारित करने की आवश्यकता है, दोनों प्रौद्योगिकी और संसाधनों के संदर्भ में।

साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें एलएक्सटी पर जाना चाहिए।

рдПрдВрдЯреЛрдиреА рдПрдХ рджреВрд░рджрд░реНрд╢реА рдиреЗрддрд╛ рдФрд░ рдпреВрдирд╛рдЗрдЯ.рдПрдЖрдИ рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рднрд╛рдЧреАрджрд╛рд░ рд╣реИрдВ, рдЬреЛ рдПрдЖрдИ рдФрд░ рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдХреЗ рднрд╡рд┐рд╖реНрдп рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдФрд░ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдЯреВрдЯ рдЬреБрдиреВрди рд╕реЗ рдкреНрд░реЗрд░рд┐рдд рд╣реИрдВред рдПрдХш┐Юч╗н рдЙрджреНрдпрдореА, рд╡рд╣ рдорд╛рдирддрд╛ рд╣реИ рдХрд┐ рдПрдЖрдИ рд╕рдорд╛рдЬ рдХреЗ рд▓рд┐рдП рдмрд┐рдЬрд▓реА рдХреЗ рд░реВрдк рдореЗрдВ рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рд╣реЛрдЧрд╛, рдФрд░ рдЕрдХреНрд╕рд░ рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдФрд░ рдПрдЬреАрдЖрдИ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЙрддреНрд╕рд╛рд╣рд┐рдд рд╣реЛрддрд╛ рд╣реИред

рдПрдХ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХреЗ рд░реВрдк рдореЗрдВ, рд╡рд╣ рдЗрди рдирд╡рд╛рдЪрд╛рд░реЛрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЬрд╛рдирдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдорд░реНрдкрд┐рдд рд╣реИ рдХрд┐ рд╡реЗ рд╣рдорд╛рд░реА рджреБрдирд┐рдпрд╛ рдХреЛ рдХреИрд╕реЗ рдЖрдХрд╛рд░ рджреЗрдВрдЧреЗред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рд╡рд╣ рд╕рд┐рдХреНрдпреЛрд░рд┐рдЯреАрдЬрд╝.io рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рд╣реИрдВ, рдПрдХ рдордВрдЪ рдЬреЛ рднрд╡рд┐рд╖реНрдп рдХреЛ рдкреБрдирд░рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рдиреЗ рдФрд░ рдкреВрд░реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЛ рдкреБрдирдГ рдЖрдХрд╛рд░ рджреЗрдиреЗ рд╡рд╛рд▓реА рдирд╡реАрдирддрдо рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдореЗрдВ рдирд┐рд╡реЗрд╢ рдкрд░ рдХреЗрдВрджреНрд░рд┐рдд рд╣реИред