рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░

рд░реЗрдмреЗрдХрд╛ рдХреНрд╡рд┐рдпрди, рдкреИрдЯреНрд░реЛрдирд╕ рдПрдЖрдИ рдХреА рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рд╕реАрдЯреАрдУ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

mm

रेबेका क्वियन पैट्रोनस एआई की सह-संस्थापक और सीटीओ हैं, जिनके पास लगभग एक दशक का अनुभव है उत्पादन मशीन लर्निंग सिस्टम बनाने का एनएलपी, एम्बॉडेड एआई और इन्फ्रास्ट्रक्चर के बीच। फेसबुक एआई में, उन्होंने शोध और तैनाती में काम किया, फेयरबेर्टा को प्रशिक्षित किया, जो एक बड़ा भाषा मॉडल है जो न्यायसंगतता उद्देश्यों के साथ डिज़ाइन किया गया है, विकिपीडिया सामग्री को पुनः लिखने के लिए एक जनसांख्यिकीय-परेशानी मॉडल विकसित किया, और रोबोटिक सहायकों के लिए सेमेंटिक पार्सिंग का नेतृत्व किया। उन्होंने एम्बॉडेड एजेंटों के लिए मानव-इन-द-लूप पाइपलाइनें भी बनाईं और इन्फ्रास्ट्रक्चर टूलिंग जैसे कंटिन्यूअस कंट्रास्ट सेट माइनिंग बनाया, जिसे फेसबुक की इन्फ्रास्ट्रक्चर टीमों में अपनाया गया और आईसीएसई में प्रस्तुत किया गया। उन्होंने फेसबुकरिसर्च/फैरो और ड्रॉइडलेट सेमेंटिक पार्सिंग नोटबुक्स जैसे ओपन-सोर्स परियोजनाओं में योगदान दिया है। एक संस्थापक के रूप में, वह अब स्केलेबल पर्यवेक्षण, रिन्फोर्समेंट लर्निंग और सुरक्षित, पर्यावरण-जागरूक एआई एजेंटों को तैनात करने पर ध्यान केंद्रित करती है।

पैट्रोनस एआई एक सैन फ्रांसिस्को स्थित कंपनी है जो बड़े भाषा मॉडल (एलएलएम) और एआई एजेंटों का मूल्यांकन, निगरानी और अनुकूलन करने के लिए एक शोध-निर्देशित प्लेटफ़ॉर्म प्रदान करती है ताकि डेवलपर्स आत्मविश्वास के साथ विश्वसनीय जनरेटिव एआई उत्पादों को शिप कर सकें। प्लेटफ़ॉर्म में स्वचालित मूल्यांकन उपकरण, बेंचमार्किंग, विश्लेषण, कस्टम डेटासेट और एजेंट-विशिष्ट वातावरण शामिल हैं जो हॉलुसिनेशन, सुरक्षा जोखिम या तर्कसंगत विफलताओं जैसे प्रदर्शन मुद्दों की पहचान करते हैं, जिससे टीमें वास्तविक दुनिया के उपयोग के मामलों में एआई प्रणालियों में सुधार और समस्या निवारण करने में सक्षम होती हैं। पैट्रोनस उद्यम ग्राहकों और प्रौद्योगिकी भागीदारों को सशक्त बनाता है ताकि वे मॉडल व्यवहार को स्कोर कर सकें, बड़े पैमाने पर त्रुटियों का पता लगा सकें और उत्पादन एआई अनुप्रयोगों में विश्वसनीयता और प्रदर्शन में सुधार कर सकें।

आपके पास फेसबुक एआई में एमएल सिस्टम बनाने का एक गहरा अनुभव है, जिसमें फेयरबेर्टा और मानव-इन-द-लूप पाइपलाइनों पर काम करना शामिल है। उस अनुभव ने वास्तविक दुनिया के एआई तैनाती और सुरक्षा पर आपके दृष्टिकोण को कैसे आकार दिया?

मेटा एआई में काम करने से मुझे व्यावहारिक रूप से विश्वसनीय मॉडल बनाने के लिए क्या लगता है – विशेष रूप से जिम्मेदार एनएलपी के आसपास। मैंने न्यायसंगतता-केंद्रित भाषा मॉडलिंग पर काम किया, जैसे कि एलएलएम को न्यायसंगतता उद्देश्यों के साथ प्रशिक्षित करना, और मैंने पहले से ही देखा कि मॉडल आउटपुट का मूल्यांकन और व्याख्या करना कितना मुश्किल है। यह सुरक्षा के बारे में मेरी सोच को आकार देता है। यदि आप मॉडल व्यवहार को माप और समझ नहीं सकते हैं, तो वास्तविक दुनिया में एआई को आत्मविश्वास से तैनात करना मुश्किल है।

आपको शोध इंजीनियरिंग से उद्यमिता में संक्रमण करने, पैट्रोनस एआई की सह-स्थापना करने और उस समय की सबसे जरूरी समस्या क्या थी?

मूल्यांकन एआई में एक ब्लॉक बन गया। मैंने अप्रैल में मेटा एआई छोड़ दिया और अनंद के साथ पैट्रोनस शुरू किया क्योंकि मैंने पहले से ही देखा था कि एआई आउटपुट का मूल्यांकन और व्याख्या करना कितना मुश्किल है। और जब जनरेटिव एआई ने उद्यम कार्य प्रवाह में प्रवेश किया, तो यह स्पष्ट हो गया कि यह अब केवल एक प्रयोगशाला समस्या नहीं थी।

हमें उद्यमों से यही बात सुनने को मिली। वे एलएलएम को अपनाना चाहते थे, लेकिन वे उन्हें विश्वसनीय रूप से परीक्षण नहीं कर सकते थे, उन पर निगरानी नहीं रख सकते थे, या विफलता मोड जैसे हॉलुसिनेशन को समझ नहीं सकते थे, विशेष रूप से नियंत्रित उद्योगों में जहां त्रुटियों के लिए बहुत कम सहनशीलता है।

तो शुरुआत में जरूरी समस्या मॉडल मूल्यांकन को स्वचालित और स्केल करने का तरीका बनाना था – वास्तविक दुनिया के दृश्यों में मॉडल को स्कोर करना, प्रतिकूल परीक्षण मामलों को उत्पन्न करना और बेंचमार्किंग – ताकि टीमें अनुमान के बजाय आत्मविश्वास के साथ तैनात कर सकें।

पैट्रोनस ने हाल ही में एआई एजेंटों के लिए अनुकूली वातावरण के रूप में जनरेटिव सिम्युलेटर पेश किए। मौजूदा मूल्यांकन या प्रशिक्षण दृष्टिकोण में क्या सीमाएं थीं जिन्होंने आपको इस दिशा में ले जाने के लिए प्रेरित किया?

हमने देखा कि एआई एजेंटों का मूल्यांकन कैसे किया जाता है और वे वास्तविक दुनिया में प्रदर्शन करने की उम्मीद कैसे करते हैं, इसके बीच बढ़ती असंगति। पारंपरिक बेंचमार्क अलग-अलग क्षमताओं को एक निश्चित समय में मापते हैं, लेकिन वास्तविक काम गतिशील है। कार्य बाधित हो जाते हैं, आवश्यकताएं मध्य-कार्य में बदलती हैं, और निर्णय लंबे समय तक चलते हैं। एजेंट स्थिर परीक्षणों पर मजबूत दिख सकते हैं और फिर तैनाती के बाद बहुत बुरी तरह विफल हो सकते हैं। जब एजेंट बेहतर होते हैं, तो वे स्थिर बेंचमार्क को भी संतृप्त कर देते हैं, जिससे सीखने में पठार आ जाता है। जनरेटिव सिम्युलेटर एक जीवंत वातावरण के साथ स्थिर परीक्षणों को बदलने के तरीके के रूप में उभरे।

आप जनरेटिव सिम्युलेटरों को कैसे देखते हैं जो एआई एजेंटों को प्रशिक्षित और मूल्यांकन करने के तरीके को बदलते हैं, स्थिर बेंचमार्क या निश्चित डेटासेट की तुलना में?

परिवर्तन यह है कि बेंचमार्क परीक्षणों के बजाय वातावरण बन जाते हैं। एजेंट को एक निश्चित सेट के प्रश्न प्रस्तुत करने के बजाय, सिम्युलेटर असाइनमेंट, परिस्थितियों और मूल्यांकन तर्क को गतिशील रूप से उत्पन्न करता है। जब एजेंट व्यवहार करता है और सुधारता है, तो वातावरण अनुकूलन करता है। यह पारंपरिक प्रशिक्षण और मूल्यांकन के बीच सीमा को समाप्त कर देता है। आप अब यह नहीं पूछ रहे हैं कि क्या एक एजेंट एक बेंचमार्क पास करता है, बल्कि क्या यह एक गतिशील प्रणाली में विश्वसनीय रूप से काम कर सकता है।

तकनीकी दृष्टिकोण से, जनरेटिव सिम्युलेटरों के पीछे मुख्य वास्तुकला विचार क्या हैं, विशेष रूप से कार्य पीढ़ी, वातावरण गतिविधियों और पुरस्कार संरचनाओं के आसपास?

उच्च स्तर पर, जनरेटिव सिम्युलेटर प्रशिक्षण के साथ अनुकूली वातावरण पीढ़ी को जोड़ती है। सिम्युलेटर नए कार्य बना सकता है, दुनिया के नियमों को गतिशील रूप से अपडेट कर सकता है, और एजेंट की क्रियाओं का मूल्यांकन वास्तविक समय में कर सकता है। एक प्रमुख घटक जिसे हम पाठ्यक्रम समायोजक कहते हैं, वह एजेंट व्यवहार का विश्लेषण करता है और सीखने को उत्पादक बनाए रखने के लिए दृश्यों की कठिनाई और संरचना को संशोधित करता है। पुरस्कार संरचनाएं सत्यापन योग्य और डोमेन-विशिष्ट होने के लिए डिज़ाइन की जाती हैं, ताकि एजेंटों को सही व्यवहार की ओर मार्गदर्शन किया जा सके, न कि उपनगरीय संक्षिप्त नामों की ओर।

एआई मूल्यांकन और एजेंट टूलिंग स्थान अधिक भीड़भाड़ वाला होता जा रहा है, पैट्रोनस का दृष्टिकोण क्या है जो इसे सबसे अधिक अलग करता है?

हमारा फोकस पारिस्थितिकी वैधता पर है। हम वातावरण डिज़ाइन करते हैं जो वास्तविक मानव कार्य प्रवाह को दर्शाते हैं, जिसमें बाधाएं, संदर्भ स्विच, टूल उपयोग और बहु-चरण तर्क शामिल हैं। हम एजेंटों को पूर्व-निर्धारित परीक्षणों पर अच्छा दिखाने के बजाय, हम विफलताओं को उजागर करने पर ध्यान केंद्रित करते हैं जो उत्पादन में महत्वपूर्ण हैं। सिम्युलेटर समय के साथ व्यवहार का मूल्यांकन करता है, न कि केवल अलग-अलग आउटपुट।

कौन से कार्य या विफलता मोड सिम्युलेटर-आधारित मूल्यांकन से सबसे अधिक लाभान्वित होते हैं, पारंपरिक परीक्षण की तुलना में?

लंबी दूरी की, बहु-चरण कार्य सबसे अधिक लाभान्वित होते हैं। यहां तक कि छोटे प्रति-चरण त्रुटि दरें भी जटिल कार्यों पर बड़ी विफलता दर में जुड़ सकती हैं, जिसे स्थिर बेंचमार्क पकड़ नहीं पाते हैं। सिम्युलेटर-आधारित मूल्यांकन समय के साथ विफलताओं को उजागर करने के लिए संभव बनाता है, जैसे कि ट्रैक पर रहना, बाधाओं को संभालना, टूल उपयोग का समन्वय करना और कार्य के दौरान परिस्थितियों में बदलाव के अनुकूल होना।

पर्यावरण-आधारित सीखने से एआई सुरक्षा के बारे में आपकी सोच कैसे बदलती है, और क्या जनरेटिव सिम्युलेटर पुरस्कार हैकिंग या उभरने वाली विफलता मोड जैसे नए जोखिम पेश करते हैं?

पर्यावरण-आधारित सीखने से वास्तव में कई सुरक्षा मुद्दों का पता लगाना आसान हो जाता है। पुरस्कार हैकिंग स्थिर वातावरण में पनप सकती है जहां एजेंट निश्चित खामियों का फायदा उठा सकते हैं। जनरेटिव सिम्युलेटर में, वातावरण खुद एक चलती हुई लक्ष्य है, जो उन शॉर्टकट्स को बनाए रखना मुश्किल बना देता है। हालांकि, पुरस्कारों और पर्यवेक्षण के आसपास सावधानीपूर्वक डिजाइन अभी भी आवश्यक है। वातावरण का लाभ यह है कि यह स्थिर बेंचमार्क की तुलना में एजेंट व्यवहार में बहुत अधिक नियंत्रण और दृश्यता प्रदान करता है।

पांच साल आगे देखते हुए, पैट्रोनस एआई को तकनीकी महत्वाकांक्षा और उद्योग प्रभाव के मामले में कहां देखते हैं?

हम मानते हैं कि वातावरण एआई के लिए मूलभूत बुनियादी ढांचा बन रहे हैं। जब एजेंट प्रश्नों का उत्तर देने से वास्तविक काम करने की ओर बढ़ते हैं, तो वे सीखने वाले वातावरण उनकी क्षमता और विश्वसनीयता को आकार देंगे। हमारी दीर्घकालिक महत्वाकांक्षा वास्तविक दुनिया के कार्य प्रवाह को संरचित वातावरण में बदलना है जिससे एजेंट निरंतर सीख सकें। मूल्यांकन और प्रशिक्षण के बीच पारंपरिक अलगाव ध्वस्त हो रहा है, और हम सोचते हैं कि यह परिवर्तन एआई प्रणालियों की अगली लहर को परिभाषित करेगा।

साक्षात्कार के लिए धन्यवाद, पाठकों को अधिक जानने के लिए पैट्रोनस एआई पर जाना चाहिए।

рдПрдВрдЯреЛрдиреА рдПрдХ рджреВрд░рджрд░реНрд╢реА рдиреЗрддрд╛ рдФрд░ Unite.AI рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рднрд╛рдЧреАрджрд╛рд░ рд╣реИрдВ, рдЬреЛ рдХрд┐ рдПрдЖрдИ рдФрд░ рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдХреЗ рднрд╡рд┐рд╖реНрдп рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдФрд░ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдЯреВрдЯ рдЬреБрдиреВрди рд╕реЗ рдкреНрд░реЗрд░рд┐рдд рд╣реИрдВред рдПрдХ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдЙрджреНрдпрдореА, рд╡рд╣ рдорд╛рдирддрд╛ рд╣реИ рдХрд┐ рдПрдЖрдИ рд╕рдорд╛рдЬ рдХреЗ рд▓рд┐рдП рдЙрддрдирд╛ рд╣реА рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рд╣реЛрдЧрд╛ рдЬрд┐рддрдирд╛ рдХрд┐ рдмрд┐рдЬрд▓реА, рдФрд░ рдЕрдХреНрд╕рд░ рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдФрд░ рдПрдЬреАрдЖрдИ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЙрддреНрд╕рд╛рд╣рд┐рдд рд╣реЛрддрд╛ рд╣реИред

рдПрдХ рдлреНрдпреВрдЪрд░рд┐рд╕реНрдЯ рдХреЗ рд░реВрдк рдореЗрдВ, рд╡рд╣ рдЗрди рдирд╡рд╛рдЪрд╛рд░реЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╣рдорд╛рд░реА рджреБрдирд┐рдпрд╛ рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдХреА рдЦреЛрдЬ рдореЗрдВ рд╕рдорд░реНрдкрд┐рдд рд╣реИред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рд╡рд╣ рд╕рд┐рдХреНрдпреЛрд░рд┐рдЯреАрдЬрд╝.io рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рд╣реИрдВ, рдПрдХ рдордВрдЪ рдЬреЛ рднрд╡рд┐рд╖реНрдп рдХреЛ рдлрд┐рд░ рд╕реЗ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рдиреЗ рдФрд░ рдкреВрд░реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЖрдХрд╛рд░ рджреЗрдиреЗ рд╡рд╛рд▓реА рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдореЗрдВ рдирд┐рд╡реЗрд╢ рдкрд░ рдХреЗрдВрджреНрд░рд┐рдд рд╣реИред