рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░
рд░реЗрдмреЗрдХрд╛ рдХреНрд╡рд┐рдпрди, рдкреИрдЯреНрд░реЛрдирд╕ рдПрдЖрдИ рдХреА рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рд╕реАрдЯреАрдУ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

रेबेका क्वियन पैट्रोनस एआई की सह-संस्थापक और सीटीओ हैं, जिनके पास लगभग एक दशक का अनुभव है उत्पादन मशीन लर्निंग सिस्टम बनाने का एनएलपी, एम्बॉडेड एआई और इन्फ्रास्ट्रक्चर के बीच। फेसबुक एआई में, उन्होंने शोध और तैनाती में काम किया, फेयरबेर्टा को प्रशिक्षित किया, जो एक बड़ा भाषा मॉडल है जो न्यायसंगतता उद्देश्यों के साथ डिज़ाइन किया गया है, विकिपीडिया सामग्री को पुनः लिखने के लिए एक जनसांख्यिकीय-परेशानी मॉडल विकसित किया, और रोबोटिक सहायकों के लिए सेमेंटिक पार्सिंग का नेतृत्व किया। उन्होंने एम्बॉडेड एजेंटों के लिए मानव-इन-द-लूप पाइपलाइनें भी बनाईं और इन्फ्रास्ट्रक्चर टूलिंग जैसे कंटिन्यूअस कंट्रास्ट सेट माइनिंग बनाया, जिसे फेसबुक की इन्फ्रास्ट्रक्चर टीमों में अपनाया गया और आईसीएसई में प्रस्तुत किया गया। उन्होंने फेसबुकरिसर्च/फैरो और ड्रॉइडलेट सेमेंटिक पार्सिंग नोटबुक्स जैसे ओपन-सोर्स परियोजनाओं में योगदान दिया है। एक संस्थापक के रूप में, वह अब स्केलेबल पर्यवेक्षण, रिन्फोर्समेंट लर्निंग और सुरक्षित, पर्यावरण-जागरूक एआई एजेंटों को तैनात करने पर ध्यान केंद्रित करती है।
पैट्रोनस एआई एक सैन फ्रांसिस्को स्थित कंपनी है जो बड़े भाषा मॉडल (एलएलएम) और एआई एजेंटों का मूल्यांकन, निगरानी और अनुकूलन करने के लिए एक शोध-निर्देशित प्लेटफ़ॉर्म प्रदान करती है ताकि डेवलपर्स आत्मविश्वास के साथ विश्वसनीय जनरेटिव एआई उत्पादों को शिप कर सकें। प्लेटफ़ॉर्म में स्वचालित मूल्यांकन उपकरण, बेंचमार्किंग, विश्लेषण, कस्टम डेटासेट और एजेंट-विशिष्ट वातावरण शामिल हैं जो हॉलुसिनेशन, सुरक्षा जोखिम या तर्कसंगत विफलताओं जैसे प्रदर्शन मुद्दों की पहचान करते हैं, जिससे टीमें वास्तविक दुनिया के उपयोग के मामलों में एआई प्रणालियों में सुधार और समस्या निवारण करने में सक्षम होती हैं। पैट्रोनस उद्यम ग्राहकों और प्रौद्योगिकी भागीदारों को सशक्त बनाता है ताकि वे मॉडल व्यवहार को स्कोर कर सकें, बड़े पैमाने पर त्रुटियों का पता लगा सकें और उत्पादन एआई अनुप्रयोगों में विश्वसनीयता और प्रदर्शन में सुधार कर सकें।
आपके पास फेसबुक एआई में एमएल सिस्टम बनाने का एक गहरा अनुभव है, जिसमें फेयरबेर्टा और मानव-इन-द-लूप पाइपलाइनों पर काम करना शामिल है। उस अनुभव ने वास्तविक दुनिया के एआई तैनाती और सुरक्षा पर आपके दृष्टिकोण को कैसे आकार दिया?
मेटा एआई में काम करने से मुझे व्यावहारिक रूप से विश्वसनीय मॉडल बनाने के लिए क्या लगता है – विशेष रूप से जिम्मेदार एनएलपी के आसपास। मैंने न्यायसंगतता-केंद्रित भाषा मॉडलिंग पर काम किया, जैसे कि एलएलएम को न्यायसंगतता उद्देश्यों के साथ प्रशिक्षित करना, और मैंने पहले से ही देखा कि मॉडल आउटपुट का मूल्यांकन और व्याख्या करना कितना मुश्किल है। यह सुरक्षा के बारे में मेरी सोच को आकार देता है। यदि आप मॉडल व्यवहार को माप और समझ नहीं सकते हैं, तो वास्तविक दुनिया में एआई को आत्मविश्वास से तैनात करना मुश्किल है।
आपको शोध इंजीनियरिंग से उद्यमिता में संक्रमण करने, पैट्रोनस एआई की सह-स्थापना करने और उस समय की सबसे जरूरी समस्या क्या थी?
मूल्यांकन एआई में एक ब्लॉक बन गया। मैंने अप्रैल में मेटा एआई छोड़ दिया और अनंद के साथ पैट्रोनस शुरू किया क्योंकि मैंने पहले से ही देखा था कि एआई आउटपुट का मूल्यांकन और व्याख्या करना कितना मुश्किल है। और जब जनरेटिव एआई ने उद्यम कार्य प्रवाह में प्रवेश किया, तो यह स्पष्ट हो गया कि यह अब केवल एक प्रयोगशाला समस्या नहीं थी।
हमें उद्यमों से यही बात सुनने को मिली। वे एलएलएम को अपनाना चाहते थे, लेकिन वे उन्हें विश्वसनीय रूप से परीक्षण नहीं कर सकते थे, उन पर निगरानी नहीं रख सकते थे, या विफलता मोड जैसे हॉलुसिनेशन को समझ नहीं सकते थे, विशेष रूप से नियंत्रित उद्योगों में जहां त्रुटियों के लिए बहुत कम सहनशीलता है।
तो शुरुआत में जरूरी समस्या मॉडल मूल्यांकन को स्वचालित और स्केल करने का तरीका बनाना था – वास्तविक दुनिया के दृश्यों में मॉडल को स्कोर करना, प्रतिकूल परीक्षण मामलों को उत्पन्न करना और बेंचमार्किंग – ताकि टीमें अनुमान के बजाय आत्मविश्वास के साथ तैनात कर सकें।
पैट्रोनस ने हाल ही में एआई एजेंटों के लिए अनुकूली वातावरण के रूप में जनरेटिव सिम्युलेटर पेश किए। मौजूदा मूल्यांकन या प्रशिक्षण दृष्टिकोण में क्या सीमाएं थीं जिन्होंने आपको इस दिशा में ले जाने के लिए प्रेरित किया?
हमने देखा कि एआई एजेंटों का मूल्यांकन कैसे किया जाता है और वे वास्तविक दुनिया में प्रदर्शन करने की उम्मीद कैसे करते हैं, इसके बीच बढ़ती असंगति। पारंपरिक बेंचमार्क अलग-अलग क्षमताओं को एक निश्चित समय में मापते हैं, लेकिन वास्तविक काम गतिशील है। कार्य बाधित हो जाते हैं, आवश्यकताएं मध्य-कार्य में बदलती हैं, और निर्णय लंबे समय तक चलते हैं। एजेंट स्थिर परीक्षणों पर मजबूत दिख सकते हैं और फिर तैनाती के बाद बहुत बुरी तरह विफल हो सकते हैं। जब एजेंट बेहतर होते हैं, तो वे स्थिर बेंचमार्क को भी संतृप्त कर देते हैं, जिससे सीखने में पठार आ जाता है। जनरेटिव सिम्युलेटर एक जीवंत वातावरण के साथ स्थिर परीक्षणों को बदलने के तरीके के रूप में उभरे।
आप जनरेटिव सिम्युलेटरों को कैसे देखते हैं जो एआई एजेंटों को प्रशिक्षित और मूल्यांकन करने के तरीके को बदलते हैं, स्थिर बेंचमार्क या निश्चित डेटासेट की तुलना में?
परिवर्तन यह है कि बेंचमार्क परीक्षणों के बजाय वातावरण बन जाते हैं। एजेंट को एक निश्चित सेट के प्रश्न प्रस्तुत करने के बजाय, सिम्युलेटर असाइनमेंट, परिस्थितियों और मूल्यांकन तर्क को गतिशील रूप से उत्पन्न करता है। जब एजेंट व्यवहार करता है और सुधारता है, तो वातावरण अनुकूलन करता है। यह पारंपरिक प्रशिक्षण और मूल्यांकन के बीच सीमा को समाप्त कर देता है। आप अब यह नहीं पूछ रहे हैं कि क्या एक एजेंट एक बेंचमार्क पास करता है, बल्कि क्या यह एक गतिशील प्रणाली में विश्वसनीय रूप से काम कर सकता है।
तकनीकी दृष्टिकोण से, जनरेटिव सिम्युलेटरों के पीछे मुख्य वास्तुकला विचार क्या हैं, विशेष रूप से कार्य पीढ़ी, वातावरण गतिविधियों और पुरस्कार संरचनाओं के आसपास?
उच्च स्तर पर, जनरेटिव सिम्युलेटर प्रशिक्षण के साथ अनुकूली वातावरण पीढ़ी को जोड़ती है। सिम्युलेटर नए कार्य बना सकता है, दुनिया के नियमों को गतिशील रूप से अपडेट कर सकता है, और एजेंट की क्रियाओं का मूल्यांकन वास्तविक समय में कर सकता है। एक प्रमुख घटक जिसे हम पाठ्यक्रम समायोजक कहते हैं, वह एजेंट व्यवहार का विश्लेषण करता है और सीखने को उत्पादक बनाए रखने के लिए दृश्यों की कठिनाई और संरचना को संशोधित करता है। पुरस्कार संरचनाएं सत्यापन योग्य और डोमेन-विशिष्ट होने के लिए डिज़ाइन की जाती हैं, ताकि एजेंटों को सही व्यवहार की ओर मार्गदर्शन किया जा सके, न कि उपनगरीय संक्षिप्त नामों की ओर।
एआई मूल्यांकन और एजेंट टूलिंग स्थान अधिक भीड़भाड़ वाला होता जा रहा है, पैट्रोनस का दृष्टिकोण क्या है जो इसे सबसे अधिक अलग करता है?
हमारा फोकस पारिस्थितिकी वैधता पर है। हम वातावरण डिज़ाइन करते हैं जो वास्तविक मानव कार्य प्रवाह को दर्शाते हैं, जिसमें बाधाएं, संदर्भ स्विच, टूल उपयोग और बहु-चरण तर्क शामिल हैं। हम एजेंटों को पूर्व-निर्धारित परीक्षणों पर अच्छा दिखाने के बजाय, हम विफलताओं को उजागर करने पर ध्यान केंद्रित करते हैं जो उत्पादन में महत्वपूर्ण हैं। सिम्युलेटर समय के साथ व्यवहार का मूल्यांकन करता है, न कि केवल अलग-अलग आउटपुट।
कौन से कार्य या विफलता मोड सिम्युलेटर-आधारित मूल्यांकन से सबसे अधिक लाभान्वित होते हैं, पारंपरिक परीक्षण की तुलना में?
लंबी दूरी की, बहु-चरण कार्य सबसे अधिक लाभान्वित होते हैं। यहां तक कि छोटे प्रति-चरण त्रुटि दरें भी जटिल कार्यों पर बड़ी विफलता दर में जुड़ सकती हैं, जिसे स्थिर बेंचमार्क पकड़ नहीं पाते हैं। सिम्युलेटर-आधारित मूल्यांकन समय के साथ विफलताओं को उजागर करने के लिए संभव बनाता है, जैसे कि ट्रैक पर रहना, बाधाओं को संभालना, टूल उपयोग का समन्वय करना और कार्य के दौरान परिस्थितियों में बदलाव के अनुकूल होना।
पर्यावरण-आधारित सीखने से एआई सुरक्षा के बारे में आपकी सोच कैसे बदलती है, और क्या जनरेटिव सिम्युलेटर पुरस्कार हैकिंग या उभरने वाली विफलता मोड जैसे नए जोखिम पेश करते हैं?
पर्यावरण-आधारित सीखने से वास्तव में कई सुरक्षा मुद्दों का पता लगाना आसान हो जाता है। पुरस्कार हैकिंग स्थिर वातावरण में पनप सकती है जहां एजेंट निश्चित खामियों का फायदा उठा सकते हैं। जनरेटिव सिम्युलेटर में, वातावरण खुद एक चलती हुई लक्ष्य है, जो उन शॉर्टकट्स को बनाए रखना मुश्किल बना देता है। हालांकि, पुरस्कारों और पर्यवेक्षण के आसपास सावधानीपूर्वक डिजाइन अभी भी आवश्यक है। वातावरण का लाभ यह है कि यह स्थिर बेंचमार्क की तुलना में एजेंट व्यवहार में बहुत अधिक नियंत्रण और दृश्यता प्रदान करता है।
पांच साल आगे देखते हुए, पैट्रोनस एआई को तकनीकी महत्वाकांक्षा और उद्योग प्रभाव के मामले में कहां देखते हैं?
हम मानते हैं कि वातावरण एआई के लिए मूलभूत बुनियादी ढांचा बन रहे हैं। जब एजेंट प्रश्नों का उत्तर देने से वास्तविक काम करने की ओर बढ़ते हैं, तो वे सीखने वाले वातावरण उनकी क्षमता और विश्वसनीयता को आकार देंगे। हमारी दीर्घकालिक महत्वाकांक्षा वास्तविक दुनिया के कार्य प्रवाह को संरचित वातावरण में बदलना है जिससे एजेंट निरंतर सीख सकें। मूल्यांकन और प्रशिक्षण के बीच पारंपरिक अलगाव ध्वस्त हो रहा है, और हम सोचते हैं कि यह परिवर्तन एआई प्रणालियों की अगली लहर को परिभाषित करेगा।
साक्षात्कार के लिए धन्यवाद, पाठकों को अधिक जानने के लिए पैट्रोनस एआई पर जाना चाहिए।












