рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░
рдЬрд╝реБрдЬрд╝рд╛рдирд╛ рд╕реНрдЯрд╛рдорд┐рд░реЛрд╡реНрд╕реНрдХрд╛, рдкрд╛рдерд╡реЗ рдХреА рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рд╕реАрдИрдУ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

ज़ुज़ाना स्टामिरोव्स्का, पाथवे की सह-संस्थापक और सीईओ, एक शोधकर्ता हैं जो पहले उभरते घटनाओं और बड़े पैमाने पर नेटवर्क विकास पर काम करती थीं। उनकी परियोजनाओं को अमेरिकी राष्ट्रीय विज्ञान अकादमी द्वारा मान्यता प्राप्त थी, और वह जटिल प्रणालियों में पीएचडी रखती हैं। ज़ुज़ाना, सीटीओ जान चोरोव्स्की और सीएसओ एड्रियन कोसोव्स्की के साथ, एक टीम का नेतृत्व करती है जिसने पहले से ही 62,000 से अधिक स्टार वाले गिटहब पर खुले एआई टूल बनाए हैं।
पाथवे एआई मॉडल को कैसे सोचते हैं और अनुकूलन करते हैं, इसे फिर से कल्पना करने की कोशिश कर रहा है, जिसका उद्देश्य ऐसी प्रणालियों का निर्माण करना है जो निरंतर और अनुकूल रूप से काम करती हैं, न कि बैचों में। पीछे की ओर, इसके टूलिंग और वास्तुकला मॉडल को वास्तविक समय में संसाधित, सीखने और विकसित करने की अनुमति देती है। कंपनी ने लुकास्ज़ कैसर (ट्रांसफॉर्मर के सह-आविष्कारक) और प्रमुख वेंचर फर्मों जैसे प्रमुख लोगों से समर्थन हासिल किया है।
आपको पाथवे लॉन्च करने के लिए क्या प्रेरित किया, और आपकी जटिल प्रणालियों, गेम थ्योरी और उभरते घटनाओं की पृष्ठभूमि ने कंपनी के दृष्टिकोण और तकनीकी दिशा को कैसे आकार दिया?
हमने मानवों की तरह सोचते और अनुकूलन करने वाले एआई बनाने की कोशिश की। हमें एहसास हुआ कि इसका मतलब है कि एआई प्रणालियों (गहरे शिक्षण मॉडल या बड़ी संख्या में ईंटों से निर्मित मशीन लर्निंग पाइपलाइन) को निरंतर आधार पर डेटा से सीखने में सक्षम होना चाहिए, अनुभव के साथ बेहतर होना चाहिए, और कभी-कभी अपने पिछले विश्व दृष्टिकोण को “सुधारना” चाहिए। हमने वास्तव में “मशीन अनलर्निंग” विषय पर काफी कवरेज प्राप्त किया। मॉडल के अलावा, ऐसी प्रणालियों को एक पूरे इंजीनियरिंग परत की आवश्यकता थी, जो स्रोत पर डेटा को पकड़ने और इसे तुरंत गतिशील प्रणालियों में डालने के लिए थी।
जब आप 2020 में कंपनी की शुरुआत की, तो आपके पास भविष्य के एआई प्रणालियों के बारे में क्या पहले से ही अनुमान थे, और वे कैसे विकसित हुए हैं?
हमारे पास शुरू से ही यह दृढ़ विश्वास था कि एआई को जीवित, अनुकूलनीय और बड़े पैमाने पर प्रक्रियाओं में एकीकृत किया जाना चाहिए। यह स्रोत से सीधे सीखना चाहिए, संभव के रूप में कच्चे डेटा के साथ।
आप “पोस्ट-ट्रांसफॉर्मर” आर्किटेक्चर के बारे में हमें बता सकते हैं जिसे आप पेश कर रहे हैं और यह वर्तमान ट्रांसफॉर्मर-आधारित प्रणालियों से कैसे अलग है?
हमारा नया आर्किटेक्चर, जिसे बेबी ड्रैगन हैचलिंग (बीडीएच) कहा जाता है, औपचारिक रूप से ट्रांसफॉर्मर के साथ जुड़ता है कि वे जानकारी कैसे संसाधित करते हैं और मस्तिष्क में तर्क कैसे उत्पन्न होता है। बीडीएच एक भौतिक प्रणाली की तरह व्यवहार करता है: एक मस्तिष्क जैसे कंप्यूटिंग मॉडल जिसमें न्यूरॉन एक साथ मिलकर अगले सबसे प्रासंगिक तथ्य की खोज करते हैं। संदर्भ तर्क ट्रांसफॉर्मर की स्थिर संदर्भ लंबाई जैसी इंजीनियरिंग सीमाओं से सीमित नहीं है, बल्कि मॉडल के न्यूरॉन की संख्या के साथ स्केल करता है।
आपका दृष्टिकोण मानवीय तर्क से कैसे प्रेरित है, विशेष रूप से अनुकूलन और निरंतर सीखने की अनुमति देने में?
बीडीएच प्राकृतिक बुद्धिमत्ता और प्राकृतिक बुद्धिमत्ता को करीब लाता है। यह आर्किटेक्चर मस्तिष्क में न्यूरॉन और सिनैप्स के काम करने के तरीके से प्रेरित है। यह जैविक ध्यान तंत्र को मशीन लर्निंग में ध्यान की गणनात्मक धारणा के साथ मैप करता है, ट्रांसफॉर्मर और मस्तिष्क के बीच एक मापनीय पुल बनाता है।
एक चुनौती यह है कि स्थिरता के साथ अनुकूलन को कैसे संतुलित किया जाए – आप सुनिश्चित करते हैं कि प्रणालियां वास्तविक समय में सीखती हैं और पिछले ज्ञान को खोए बिना?
बीडीएच अपनी स्केल-फ्री संरचना और स्थानीयकृत न्यूरॉन राज्यों पर भरोसा करता है ताकि लंबे समय तक तर्क को बनाए रखा जा सके, स्थिरता और नए ज्ञान और अवलोकनों को एकीकृत करने की क्षमता के बीच संतुलन बनाए रखा। यह प्राकृतिक स्वास्थ्य संतुलन आसानी से निकाला जा सकता है और मॉडल के जीवनकाल में इसका पालन किया जा सकता है।
आपके दृष्टिकोण में क्या इंजीनियरिंग व्यापार-ऑफ हैं जो लाइव डेटा प्रोसेसिंग इंजन का निर्माण करने में शामिल हैं जो इन क्षमताओं को बड़े पैमाने पर बनाए रख सकते हैं?
पाथवे की एंटरप्राइज़ पेशकश बाजार में सबसे तेज़ डेटा प्रोसेसिंग इंजन पर निर्भर करती है। यह इंजन हमारी वास्तविक समय में इनपुट को संभालने और नए जानकारी के साथ कम विलंबता के साथ प्रतिक्रिया करने की क्षमता का समर्थन करता है। वर्तमान बीडीएच ब्रेकथ्रू के साथ, हम यह सुनिश्चित करते हैं कि यह वास्तविक समय की अनुकूलन क्षमता मूल रूप से उपयोग किए जाने वाले एआई मॉडलों तक विस्तारित हो। हमारा सर्वोपरि लक्ष्य बड़े पैमाने पर तैनाती के लिए स्थिर अनुकूलन से दूर जाना है और लंबी अवधि के तर्क को संभालने में सक्षम बुनियादी ढांचे का निर्माण करना है।
कौन से सबसे प्रेरक उपयोग के मामले हैं जो वास्तव में इस अगले चरण के एआई की मांग करते हैं, और वर्तमान ट्रांसफॉर्मर-आधारित प्रणालियां कहां कम पड़ जाती हैं?
कई नवाचारों ने तेजी से नए डेटा के अनुकूल होने और गहराई से ‘कार्य पर समय’ पर भरोसा करने के लिए जनरेटिव एआई की कार्यक्षमता का विस्तार किया है, लेकिन अभी तक कुछ भी एक अत्यधिक प्रतिभाशाली व्यक्ति को नियुक्त करने की जगह नहीं ले सकता है।
आप कुछ उदाहरण साझा कर सकते हैं कि संगठनों जैसे नाटो, ला पोस्टे, या फॉर्मूला 1 ने आपकी प्रौद्योगिकी का कैसे उपयोग किया है और इसका क्या प्रभाव पड़ा है?
नाटो, ला पोस्टे, और फॉर्मूला 1 टीमें पहले से ही पाथवे प्रौद्योगिकी की शुरुआती अपनाने वाले हैं।
उद्योगों जैसे स्वास्थ्य सेवा या रक्षा में अनुकूल प्रणालियों को तैनात करने में सबसे बड़े बाधाएं क्या हैं, और आप उन्हें कैसे संबोधित करते हैं?
वर्तमान एलएलएमएस जेनरेट कंटेंट जो “नया” है बिना वास्तविक निर्णय के – इसे ‘जेन’ जेन एआई कहा जाता है। कई उच्च नियामक उद्योगों को परिभाषा के अनुसार शासन की आवश्यकता होती है, और वे अक्सर एआई-संचालित व्यवसाय प्रक्रियाओं को तैनात करने से हिचकिचाते हैं जिनमें पुनरावृत्ति, विश्वास, और अवलोकनीयता नहीं है।
जैसे ही एआई प्रणालियां वास्तविक समय में सीखती और अनुकूलन करती हैं, क्या नैतिक विचार या सुरक्षा आवश्यक हैं?
अनुभव के साथ सीखने वाली प्रणालियों के पास वास्तव में सुरक्षित होने का बेहतर मौका है क्योंकि वे स्व-निर्देशित और अद्यतन कर सकते हैं यदि वे पहले गलत थे।
एक “पोस्ट-ट्रांसफॉर्मर” परिदृश्य के लिए क्या आवश्यक है ताकि यह एआई समुदाय भर में मुख्यधारा बन जाए?
एक मॉडल जो बाजार में है जो बहुत उपयोगी है और जिसमें अनुमान की लागत काफी कम है और तेजी से है। हम मानते हैं कि विशेष रूप से एंटरप्राइज में बाजार जीतने के लिए एक अवसर है।
साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें पाथवे पर जाना चाहिए।












