рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░
Etan Ginsberg, Martian рдХреЗ рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

Etan Ginsberg Martian के सह-संस्थापक हैं, जो एक ऐसा प्लेटफ़ॉर्म है जो गतिशील रूप से प्रत्येक प्रॉम्प्ट को सबसे अच्छे एलएलएम में रूट करता है। रूटिंग के माध्यम से, मार्टियन जीपीटी-4 सहित किसी भी व्यक्तिगत प्रदाता की तुलना में उच्च प्रदर्शन और कम लागत प्राप्त करता है। यह प्रणाली कंपनी की विशिष्ट मॉडल मैपिंग प्रौद्योगिकी पर बनाई गई है जो जटिल ब्लैक बॉक्स से एलएलएम को अधिक व्याख्यात्मक वास्तुकला में अनपैक करती है, जिससे यह मैकेनिस्टिक व्याख्यात्मकता का पहला व्यावसायिक अनुप्रयोग बन जाता है।
एटन ने मध्य विद्यालय में ही कोडिंग, वेबसाइट डिज़ाइनिंग और ई-बिजनेस बनाना शुरू कर दिया था। एक बहुमुखी प्रतिभा एटन एक विश्व मेमोरी चैंपियनशिप प्रतियोगी हैं और शेन्ज़ेन, चीन में विश्व स्पीड रीडिंग चैंपियनशिप में दूसरे स्थान पर रहे।
वह एक वीडीओ हैकथॉन प्रतियोगी हैं। पिछले पुरस्कारों में टेक क्रंच एसजेड में तीसरा पुरस्कार, प्रिंसटन हैकथॉन में शीर्ष 7 फाइनलिस्ट और येल हैकथॉन में 3 उद्योग पुरस्कार शामिल हैं।
आप एक पिछले दो बार स्टार्टअप संस्थापक हैं, वे कंपनियां क्या थीं और आपने इस अनुभव से क्या सीखा?
मेरी पहली कंपनी अमेरिकन निंजा वॉरियर के खेल को बढ़ावा देने और आगे बढ़ाने के लिए पहला प्लेटफ़ॉर्म था। 2012 में, मैंने अमेरिकन निंजा वॉरियर को एक भूमिगत खेल (90 के दशक में एमएमए की तरह) के रूप में देखा और मैंने पहला प्लेटफ़ॉर्म बनाया जहां लोग ब्लूप्रिंट खरीद सकते थे, बाधाओं का ऑर्डर दे सकते थे और प्रशिक्षण के लिए जिम ढूंढ सकते थे। मैंने अपने खुद के जिम शुरू करने के लिए कंपनियों के लिए परामर्श किया, जिसमें यूएस स्पेशल फोर्सेस के लिए एक प्रशिक्षण पाठ्यक्रम में मदद करना और पहले 3 महीनों में $300k की आय वाले सुविधा को स्केल करना शामिल था। हालांकि मैं हाई स्कूल में था, मैंने 20+ कर्मचारियों की टीमों को प्रबंधित करने का अपना पहला अनुभव प्राप्त किया और प्रभावी प्रबंधन और अंतरव्यक्तिगत संबंधों के बारे में सीखा।
मेरी दूसरी कंपनी एक वैकल्पिक परिसंपत्ति प्रबंधन कंपनी थी जिसकी मैंने 2017 में स्थापना की थी, क्रिप्टो में आईसीओ-लहर से पहले। यह मेरा एनएलपी के साथ पहला संपर्क था, जहां हमने सोशल मीडिया डेटा के भावना विश्लेषण का उपयोग एक निवेश रणनीति के रूप में किया था।
मैंने स्टार्टअप चलाने में जाने वाले कठिन और नरम कौशल के बारे में बहुत कुछ सीखा। aynı समय में, मैंने अपने बारे में और यह जानने के बारे में बहुत कुछ सीखा कि मैं किस पर काम करना चाहता हूं। मुझे लगता है कि सबसे सफल कंपनियां उन संस्थापकों द्वारा शुरू की जाती हैं जिनके पास एक व्यापक दृष्टि या लक्ष्य होता है। मैं 2017 में क्रिप्टो को छोड़ दिया ताकि मैं एनएलपी पर ध्यान केंद्रित कर सकूं क्योंकि मानव बुद्धिमत्ता को बढ़ाने और समझने की बात वास्तव में मुझे प्रेरित करती है। मुझे यह जानकर खुशी हुई कि।
जब आप पेंसिल्वेनिया विश्वविद्यालय में पढ़ रहे थे, तो आपने कुछ एआई अनुसंधान किया, आप विशेष रूप से क्या अनुसंधान कर रहे थे?
हमारा अनुसंधान मूल रूप से एलएलएम के अनुप्रयोगों का निर्माण करने पर केंद्रित था। विशेष रूप से, हमने एलएलएम के शैक्षिक अनुप्रयोगों पर काम किया और पहले एलएलएम-संचालित संज्ञानात्मक ट्यूटर का निर्माण किया। परिणाम काफी अच्छे थे – हमने प्रारंभिक प्रयोग में 0.3 मानक विचलन में छात्र परिणामों में सुधार देखा – और हमारी प्रणाली पेंसिल्वेनिया विश्वविद्यालय से लेकर भूटान विश्वविद्यालय तक उपयोग की जा रही है।
क्या आप बता सकते हैं कि यह अनुसंधान आपको मार्टियन के सह-संस्थापक के रूप में कैसे ले गया?
क्योंकि हम एलएलएम पर अनुप्रयोग बनाने वाले पहले लोगों में से थे, हम उन पहले लोगों में से भी थे जिन्हें एलएलएम पर अनुप्रयोग बनाने के साथ आने वाली समस्याओं का सामना करना पड़ा। यह हमारे शोध को बुनियादी ढांचे की परत की ओर ले गया। उदाहरण के लिए, हम जीपीटी-3 जैसे बड़े मॉडल के आउटपुट पर छोटे मॉडल को फ़ाइन-ट्यून करने और प्रोग्रामिंग और गणित समस्या समाधान जैसे कार्यों के लिए विशेषज्ञता वाले डेटा स्रोतों पर मॉडल को फ़ाइन-ट्यून करने के लिए बहुत जल्दी पहुंच गए। यह अंततः हमें मॉडल व्यवहार को समझने और मॉडल रूटिंग के बारे में समस्याओं की ओर ले गया।
मार्टियन नाम और बुद्धिमत्ता के साथ इसका संबंध भी दिलचस्प है, क्या आप इस नाम के चयन की कहानी साझा कर सकते हैं?
हमारी कंपनी का नाम हंगेरियन-अमेरिकी वैज्ञानिकों के एक समूह के नाम पर रखा गया है, जिन्हें “द मार्टियन” के नाम से जाना जाता है।” यह समूह, जो 20वीं शताब्दी में रहता था, कुछ ऐसे लोगों से बना था जो सबसे चतुर लोगों में से थे:
- उनमें से सबसे प्रसिद्ध जॉन वॉन न्यूमैन थे; उन्होंने गेम थ्योरी, आधुनिक कंप्यूटर आर्किटेक्चर, ऑटोमेटा थ्योरी का आविष्कार किया और दर्जनों अन्य क्षेत्रों में मौलिक योगदान दिया।
- पॉल एर्डोस इतिहास में सबसे अधिक प्रकाशित गणितज्ञ थे, जिन्होंने 1500 से अधिक पेपर प्रकाशित किए थे।
- थियोडोर वॉन कारमैन ने एरोडायनामिक्स के मूल सिद्धांतों की स्थापना की और अमेरिकी अंतरिक्ष कार्यक्रम की स्थापना में मदद की। पृथ्वी और बाहरी अंतरिक्ष के बीच मानव-परिभाषित सीमा को उनके काम की मान्यता में “कारमैन लाइन” नाम दिया गया है।
- लео स्जिलार्ड ने परमाणु बम, विकिरण चिकित्सा और कण त्वरक का आविष्कार किया।
इन वैज्ञानिकों और 14 अन्य लोगों (जिनमें हाइड्रोजन बम के आविष्कारक, आधुनिक भौतिकी में समूह सिद्धांत को पेश करने वाले व्यक्ति, और संयोजन, संख्या सिद्धांत, संख्यात्मक विश्लेषण और संभाव्यता सिद्धांत जैसे क्षेत्रों में मौलिक योगदानकर्ता शामिल हैं) ने एक उल्लेखनीय समानता साझा की – वे सभी बुडापेस्ट के एक ही हिस्से में पैदा हुए थे। इससे लोगों को यह पूछने के लिए प्रेरित किया गया: इतनी बुद्धिमत्ता का स्रोत क्या था?
इसके जवाब में, स्जिलार्ड ने मजाक में कहा कि “मार्टियन पहले से ही यहां हैं और वे खुद को हंगेरियन कहते हैं!” वास्तव में, कोई नहीं जानता।
मानवता खुद को कृत्रिम बुद्धिमत्ता के साथ एक नए सुपरइंटेलिजेंट दिमाग के साथ एक समान स्थिति में पाती है। लोग जानते हैं कि मॉडल बहुत चतुर हो सकते हैं, लेकिन उन्हें पता नहीं है कि वे कैसे काम करते हैं।
हमारा मिशन यह प्रश्न का उत्तर देना है – आधुनिक सुपरइंटेलिजेंस को समझना और हार्नेस करना।
आपके पास अविश्वसनीय स्मृति कारनामों का एक इतिहास है, आप इन स्मृति चुनौतियों में कैसे शामिल हुए और यह ज्ञान मार्टियन की अवधारणा में आपकी मदद कैसे की?
अधिकांश खेलों में, एक पेशेवर एथलीट एक औसत व्यक्ति की तुलना में 2-3 गुना बेहतर प्रदर्शन कर सकता है (एक फील्ड गोल कितनी दूर तक किक कर सकता है या एक फास्ट बॉल कितनी तेजी से फेंक सकता है, इसकी तुलना एक पेशेवर से करें)। स्मृति खेल दिलचस्प हैं क्योंकि शीर्ष एथलीट 100 गुना या यहां तक कि 1000 गुना अधिक स्मृति कर सकते हैं जितना कि एक औसत व्यक्ति कम प्रशिक्षण के साथ – और अक्सर वे लोग होते हैं जिनकी प्राकृतिक स्मृति औसत होती है जो विशिष्ट तकनीकों का श्रेय देते हैं जो कोई भी सीख सकता है। मैं मानव ज्ञान को अधिकतम करना चाहता हूं, और मैंने दुनिया स्मृति चैंपियनशिप को एक अनदेखी अंतर्दृष्टि के रूप में देखा कि हम कैसे असाधारण रिटर्न को बढ़ाने के लिए मानव बुद्धिमत्ता को बढ़ा सकते हैं।
मैंने स्मृति तकनीकों को शिक्षा प्रणाली में तैनात करना चाहा, इसलिए मैंने देखा कि एनएलपी और एलएलएम कैसे सबसे प्रभावी शैक्षिक तरीकों को मुख्यधारा की शिक्षा प्रणाली में उपयोग करने से रोकने वाली सेटअप लागत को कम करने में मदद कर सकते हैं। यश और मैंने पहले एलएलएम-संचालित संज्ञानात्मक ट्यूटर बनाया और इससे हमें एलएलएम-निर्देशन के साथ समस्याओं का पता चला, जिसे हम आज हल करने में मदद करते हैं।
मार्टियन मूल रूप से एक बड़े भाषा मॉडल (एलएलएम) का उपयोग करने के निर्णय को स abstract करता है, यह वर्तमान में डेवलपर्स के लिए एक दर्दनाक बिंदु क्यों है?
यह बड़े भाषा मॉडल बनाना आसान हो रहा है – कंप्यूट की लागत कम हो रही है, एल्गोरिदम अधिक कुशल हो रहे हैं, और मॉडल बनाने के लिए अधिक ओपन-सोर्स टूल उपलब्ध हैं। इसके परिणामस्वरूप, अधिक कंपनियां और डेवलपर्स कस्टम डेटा पर प्रशिक्षित कस्टम मॉडल बना रहे हैं। जैसा कि इन मॉडलों में अलग-अलग लागत और क्षमताएं हैं, आप एक से अधिक मॉडल का उपयोग करके बेहतर प्रदर्शन प्राप्त कर सकते हैं, लेकिन सभी का परीक्षण करना और सही मॉडल का पता लगाना मुश्किल है। हम डेवलपर्स के लिए इसका ध्यान रखते हैं।
क्या आप बता सकते हैं कि प्रणाली कैसे समझती है कि प्रत्येक विशिष्ट कार्य के लिए कौन सा एलएलएम सबसे अच्छा उपयोग किया जाता है?
अच्छी तरह से रूटिंग करना मूल रूप से मॉडल को समझने के बारे में है। मॉडल के बीच प्रभावी ढंग से रूटिंग करने के लिए, आप मॉडल को विफल या सफल होने के कारणों को समझना चाहते हैं। मॉडल-मैपिंग के साथ इन विशेषताओं को समझने से हमें यह निर्धारित करने की अनुमति मिलती है कि कोई दिया गया मॉडल एक अनुरोध पर कैसा प्रदर्शन करेगा, बिना उस मॉडल को चलाए। परिणामस्वरूप, हम उस अनुरोध को उस मॉडल में भेज सकते हैं जो सबसे अच्छा परिणाम произ动生成 करेगा।
क्या आप एलएलएम का उपयोग अनुकूलन करने से होने वाली लागत बचत के प्रकार पर चर्चा कर सकते हैं?
हम उपयोगकर्ताओं को लागत और प्रदर्शन के बीच व्यापार कैसे करना है, यह निर्दिष्ट करने की अनुमति देते हैं। यदि आप केवल प्रदर्शन की परवाह करते हैं, तो हम ओपनएआई/मूल्यांकन पर जीपीटी-4 से बेहतर प्रदर्शन कर सकते हैं। यदि आप अपने इकाई अर्थशास्त्र को काम करने के लिए एक विशिष्ट लागत की तलाश में हैं, तो हम आपको अपने अनुरोध के लिए अधिकतम लागत निर्दिष्ट करने देते हैं, फिर उस अनुरोध को पूरा करने के लिए सबसे अच्छा मॉडल ढूंढते हैं। और यदि आप कुछ अधिक गतिशील चाहते हैं, तो हम आपको एक बेहतर उत्तर के लिए कितना भुगतान करने को तैयार हैं, यह निर्दिष्ट करने देते हैं – इस तरह, यदि दो मॉडलों में समान प्रदर्शन होता है लेकिन लागत में बड़ा अंतर होता है, तो हम आपको कम खर्चीले मॉडल का उपयोग करने दे सकते हैं। हमारे कुछ ग्राहकों ने 12 गुना तक की लागत में कमी देखी है।
मार्टियन के भविष्य के लिए आपकी दृष्टि क्या है?
प्रत्येक बार जब हम मॉडल की हमारी मूलभूत समझ में सुधार करते हैं, तो यह एआई के लिए एक परिवर्तन लाता है। फ़ाइन-ट्यूनिंग आउटपुट को समझने से संचालित परिवर्तन है। प्रॉम्प्टिंग इनपुट को समझने से संचालित परिवर्तन है। मॉडल की हमारी समझ में यह एकमात्र अंतर पारंपरिक एमएल (“एक रिग्रेसर प्रशिक्षित करें”) और आधुनिक जनरेटिव एआई (“एक बेबी एआई को प्रॉम्प्ट करें”) के बीच बहुत कुछ अलग करता है।
हमारा लक्ष्य निरंतरता से व्याख्यात्मकता में सफलता प्राप्त करना है जब तक कि एआई पूरी तरह से समझ में नहीं आ जाता और हमारे पास तर्क या कैलकुलस के सिद्धांतों के रूप में एक बुद्धिमत्ता का सिद्धांत नहीं हो जाता।
इसका अर्थ है निर्माण करना। इसका अर्थ है शानदार एआई टूलिंग बनाना और लोगों के हाथों में डालना। इसका अर्थ है ऐसी चीजें जारी करना जो कोई और नहीं कर रहा है, जो पहले से नहीं की गई हैं, और जो – सबसे ज्यादा – दिलचस्प और उपयोगी हैं।
सर फ्रांसिस बेकन के शब्दों में, “ज्ञान शक्ति है।” तदनुसार, यह सुनिश्चित करने का सबसे अच्छा तरीका है कि हम एआई को समझते हैं, यह है कि हम शक्तिशाली उपकरण जारी करें। हमारे विचार में, एक मॉडल राउटर इस तरह का एक उपकरण है। हम इसे बनाने, विकसित करने और लोगों के हाथों में डालने के लिए उत्साहित हैं।
यह उन कई उपकरणों में से पहला है जिन्हें हम आने वाले महीनों में जारी करने जा रहे हैं। एक सुंदर कृत्रिम बुद्धिमत्ता के सिद्धांत की खोज करने के लिए, पूरी तरह से नए प्रकार के एआई बुनियादी ढांचे को सक्षम करने के लिए, मानव और मशीन दोनों के लिए एक उज्जवल भविष्य बनाने में मदद करने के लिए – हम उन उपकरणों को आपके साथ साझा करने के लिए इंतजार नहीं कर सकते।
साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें मार्टियन पर जाना चाहिए।












