рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рдЕрд▓реЗрдХреНрдЬреЗрдВрдбрд░ рд╣реБрдбреЗрдХ, рдХрд┐рд░рд╛ рд╕рд┐рд╕реНрдЯрдореНрд╕ рдХреЗ рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рд╕реАрдЯреАрдУ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

अलेक्स हुडेक किरा सिस्टम्स के सह-संस्थापक और सीटीओ हैं। उन्होंने वाटरलू विश्वविद्यालय से कंप्यूटर विज्ञान में पीएचडी और एम.मैथ की डिग्री प्राप्त की है, और टोरंटो विश्वविद्यालय से भौतिकी और कंप्यूटर विज्ञान में बी.एससी।
उनके पिछले शोध में जैव सूचना विज्ञान के क्षेत्र में डीएनए अनुक्रमों के बीच समानताएं खोजने पर ध्यान केंद्रित किया गया था। उन्होंने प्रमाण प्रणालियों और डेटाबेस क्वेरी संकलन के क्षेत्र में भी काम किया है।
आपने मशीन लर्निंग और एआई में रुचि कब शुरू की?
मैंने हमेशा कंप्यूटर विज्ञान में रुचि रखी है। स्नातक में, मैंने एल्गोरिदम, योजना, तर्क, मशीन लर्निंग और एआई, संख्यात्मक गणना और अन्य विषयों पर पाठ्यक्रम लिए। मेरी मशीन लर्निंग में रुचि विश्वविद्यालय में पीएचडी के दौरान बढ़ी। वहां, मैंने डीएनए का अध्ययन करने के लिए मशीन लर्निंग विधियों का उपयोग किया। इसके बाद, मैंने अपने पोस्टडॉक्टरल शोध के हिस्से के रूप में औपचारिक तर्कशास्त्र में गहराई से जाना। तर्क और तर्कशास्त्र कुछ हद तक एआई के दृष्टिकोण से सिक्के का दूसरा पहलू है और मुझे लगता है कि इसके बारे में अधिक जानना महत्वपूर्ण था।
कुछ आपके पिछले शोध में जैव सूचना विज्ञान के क्षेत्र में डीएनए अनुक्रमों के बीच समानताएं खोजने पर ध्यान केंद्रित किया गया था। क्या आप इस काम पर चर्चा कर सकते हैं?
मेरे शोध का मुख्य भाग एक अधिक वास्तविक मॉडल डीएनए म्यूटेशन का निर्माण करने में शामिल था, जिसमें हिडन मार्कोव मॉडल का उपयोग किया गया था। मैंने इस अधिक जटिल मॉडल का उपयोग एक नए एल्गोरिदम में किया जो डीएनए के उन क्षेत्रों को खोजने में सक्षम था जो अन्य प्रजातियों के साथ साझा वंश के थे। विशेष रूप से, यह नया एल्गोरिदम पिछले एल्गोरिदम की तुलना में बहुत अधिक कमजोर रूप से संबंधित अनुक्रम क्षेत्रों को खोजने में सक्षम था।
पीएचडी से पहले, मैं एक अनुसंधान प्रयोगशाला में काम करता था जो मानव जीनोम परियोजना का हिस्सा था। मैंने जिन परियोजनाओं पर काम किया, उनमें से एक मानव क्रोमोसोम 7 का पहला पूर्ण मसौदा तैयार करना था।
किरा लॉन्च करने के पीछे क्या प्रेरणा थी?
किरा का विचार मेरे सह-संस्थापक नूह वैसबर्ग से आया था। उन्होंने अपने करियर में एक वकील के रूप में कई घंटे उस तरह के काम में बिताए थे जिसे हमने अब एआई बनाया है। यह मुझे दिलचस्प लगा क्योंकि इसमें प्राकृतिक भाषा और समस्या अच्छी तरह से परिभाषित थी, और मैं व्यवसाय की संभावना को देख सकता था। मानव भाषा को समझने वाला एआई बनाने में कुछ आकर्षक है क्योंकि भाषा मानव संज्ञान के बहुत करीब से जुड़ी हुई है।
क्या आप कॉन्ट्रैक्ट विश्लेषण सॉफ्टवेयर क्या है और यह कानूनी पेशेवरों को कैसे लाभान्वित करता है, इसका वर्णन कर सकते हैं?
किरा पर्यवेक्षित मशीन लर्निंग का उपयोग करता है, जिसका अर्थ है कि एक अनुभवी वकील वास्तविक अनुबंधों से प्रावधानों को एक प्रणाली में डालता है जो उन उदाहरणों से सीखने के लिए डिज़ाइन की गई है। प्रणाली इस डेटा का अध्ययन करती है, प्रासंगिक भाषा सीखती है, और संभाव्य प्रावधान मॉडल बनाती है। मॉडलों को तब अनुभवी वकीलों द्वारा अनुबंधों के एक सेट के खिलाफ परीक्षण किया जाता है जो प्रणाली से परिचित नहीं हैं, ताकि इसकी तैयारी का पता लगाया जा सके। यह उच्च सटीकता वाली मशीन लर्निंग प्रौद्योगिकी लगभग किसी भी अनुबंध में किसी भी प्रावधान, खंड या डेटा बिंदु की पहचान और विश्लेषण कर सकती है, जिससे अनुबंध समीक्षा प्रक्रिया में त्रुटियों और जोखिमों को कम किया जा सकता है। इसके अलावा, ग्राहकों ने 20-90% की समय बचत की सूचना दी है, जो कानूनी फर्मों को अपनी वास्तविक दरों में वृद्धि करने, राजस्व बढ़ाने और मौजूदा ग्राहकों को बनाए रखने में मदद करता है। कंपनियों के लिए, यह घरेलू कानूनी व्यय को कम करके उत्पादकता में सुधार करता है।
प्राकृतिक भाषा प्रसंस्करण (एनएलपी) अधिकांश कंपनियों के लिए कठिन है। क्या आप कानूनी शब्दावली और कानूनी पेशेवरों के लिए अद्वितीय सूक्ष्मताओं के साथ-साथ एनएलपी के साथ जुड़ी अतिरिक्त चुनौतियों पर चर्चा कर सकते हैं?
अधिकांश लोगों के लिए कानूनी भाषा बहुत विदेशी लगती है, लेकिन मशीन लर्निंग के दृष्टिकोण से यह वास्तव में इतना अलग नहीं है। कुछ अधिक अनोखी चीजें हैं; पूंजीकरण अधिक महत्वपूर्ण है और वाक्य सामान्य से बहुत लंबे हो सकते हैं, लेकिन हमें अन्य डोमेन की तुलना में एनएलपी के लिए काफी अलग दृष्टिकोण की आवश्यकता नहीं है।
एक ऐसी चीज जो काफी अलग है वह डेटा गोपनीयता और अनुकूलन की आवश्यकता है। कानूनी पेशेवरों को ग्राहक डेटा को गोपनीय रखने की आवश्यकता है, और एक मशीन लर्निंग उत्पाद में प्रशिक्षण डेटा को साझा करना या पूल करना इन आवश्यकताओं के विपरीत है। वास्तव में, प्रशिक्षण डेटा को रखना अक्सर संभव नहीं होता है क्योंकि उन्हें परियोजना के बाद ग्राहक डेटा को हटाने के लिए बाध्य किया जाता है। इसलिए, विक्रेताओं के बिना मॉडल को प्रशिक्षित करने में सक्षम होना महत्वपूर्ण है, साथ ही मशीन लर्निंग तकनीकें जो सीखे हुए मॉडल का निरीक्षण करके प्रशिक्षण डेटा के किसी भी हिस्से को पुनर्प्राप्त करना मुश्किल या असंभव बनाती हैं। मॉडल को पुनः प्रशिक्षित किए बिना नए प्रशिक्षण डेटा के साथ अद्यतन करने की अनुमति देने वाली तकनीकें भी एक आवश्यकता हैं।
अनुकूलन के मोर्चे पर, ग्राहकों को अपने स्वयं के मॉडल बनाने में सक्षम होने की आवश्यकता है। यह इसलिए है क्योंकि अधिक जटिल कानूनी अवधारणाओं के लिए पेशेवरों के बीच उचित असहमति हो सकती है, और फर्म अक्सर अपनी विशिष्ट स्थितियों से मेल खाने के लिए मॉडल को समायोजित या बनाना चाहते हैं।
किरा सॉफ्टवेयर में डेटा को वर्गीकृत करने के लिए गहरे शिक्षण का उपयोग कैसे किया जाता है?
हम अपने उत्पाद में बहुत अधिक गहरा शिक्षण का उपयोग नहीं करते हैं, हालांकि हमारी आंतरिक अनुसंधान टीम गहरे शिक्षण समाधानों का मूल्यांकन और अन्वेषण करने में बहुत समय बिताती है। अब तक, हमारे सामने आने वाली समस्याओं पर, गहरे शिक्षण तकनीकें गैर-गहरे शिक्षण दृष्टिकोणों का मिलान कर रही हैं, या सबसे अच्छा, एक बहुत छोटी वृद्धि प्राप्त कर रही हैं। गहरे शिक्षण पद्धतियों के巨े गणना ओवरहेड के साथ-साथ प्रशिक्षण डेटा को निजी रखने में चुनौतियों को देखते हुए, वे अब तक अपनाने के लिए पर्याप्त रूप से प्रेरक नहीं रहे हैं।
किरा द्वारा पेश किए जाने वाले कुछ निर्मित प्रावधान मॉडल क्या हैं?
वर्तमान में, किरा 1,000 से अधिक निर्मित प्रावधानों, खंडों और डेटा बिंदुओं (स्मार्ट फील्ड) की पहचान और निकाल सकता है। वे विभिन्न विषयों से संबंधित हैं, एमएंडए ड्यू डिलिजेंस – जिसके साथ किरा की कल्पना की गई थी – से लेकर ब्रेक्सिट तक; से रियल एस्टेट तक। स्मार्ट फील्ड हमारी विषय विशेषज्ञ टीम द्वारा बनाए जाते हैं जिसमें अनुभवी वकील और लेखाकार शामिल हैं। हमारी मशीन लर्निंग प्रौद्योगिकी के साथ, किरा के मानक लगभग हर स्मार्ट फील्ड को 90% रिकॉल हासिल करने की आवश्यकता है, जिसका अर्थ है कि हमारा सॉफ्टवेयर आपके अनुबंधों या दस्तावेजों में 90% या अधिक प्रावधान, खंड या डेटा बिंदु को खोजेगा जिसे आप विशेष रूप से देख रहे हैं, जिससे अनुबंध समीक्षा प्रक्रिया में जोखिम और त्रुटियों को कम किया जा सकता है। इसके अलावा, हमारे क्विक स्टडी टूल का उपयोग करके असीमित संख्या में कस्टम फील्ड बनाई जा सकती है जो स्वचालित रूप से प्रासंगिक अंतर्दृष्टि की पहचान और निकाल सकती है।
कानूनी दुनिया अक्सर नई प्रौद्योगिकी को अपनाने में धीमी होने के लिए जानी जाती है। क्या आप पाते हैं कि कानूनी फर्मों को शिक्षित करने में एक बाधा है जब यह एआई के बारे में जागरूकता लाने की बात आती है?
वकीलों को यह जानने में रुचि होती है कि चीजें कैसे काम करती हैं, इसलिए शिक्षा महत्वपूर्ण है। कानूनी पेशेवरों को मशीन लर्निंग और एआई के बारे में सिखाना अन्य पेशेवरों की तुलना में कठिन नहीं है, लेकिन यह आवश्यक है कि प्रशिक्षण सामग्री तैयार हो। कई गोद लेने वाली बाधाएं सामाजिक भी हैं; लोग अक्सर एआई का उपयोग करके अपनी आंतरिक प्रक्रियाओं को अनुकूलित करने के लिए सर्वोत्तम प्रथाओं के बारे में पूछते हैं, या यह जानने में रुचि रखते हैं कि वे एआई का उपयोग करके अपने व्यवसाय की पेशकश को कैसे बदल सकते हैं ताकि वे केवल दक्षता में सुधार से परे लाभ प्राप्त कर सकें।
2011 में किरा सिस्टम्स की शुरुआत की तुलना में आज कानूनी फर्में एआई और प्रौद्योगिकी के बारे में बहुत अधिक जागरूक हैं। कई के पास नवाचार टीमें हैं जो नई प्रौद्योगिकी की जांच करने और नए समाधानों को अपनाने के लिए प्रोत्साहित करने का काम सौंपा गया है।
क्या किरा के बारे में आप कुछ और साझा करना चाहेंगे?
शैक्षिक साहित्य और ओपन सोर्स मशीन लर्निंग लाइब्रेरी हमें कंपनी को बूटस्ट्रैप करने में मददगार साबित हुईं। हम मानते हैं कि खुली जानकारी और सॉफ्टवेयर दुनिया के लिए एक बड़ा लाभ है। इस प्रकाश में, मैं विशेष रूप से खुश हूं कि हमारी अनुसंधान टीम अपने कई अनुसंधान प्रयासों के परिणामों को शैक्षिक पत्रिकाओं और सम्मेलनों में प्रकाशित करती है। इसके अलावा यह साबित करता है कि हम राज्य की कला की सीमाओं को आगे बढ़ाते हैं, यह हमें उन समुदायों को वापस देने की अनुमति देता है जिन्होंने हमें शुरू करने में मदद की और जिनसे हम अभी भी बहुत मूल्य प्राप्त करते हैं। आप हमारे पेपर https://kirasystems.com/science/ पर पा सकते हैं।
अधिक जानने के लिए किरा सिस्टम्स पर जाएं।












