Connect with us

Etan Ginsberg, Martian рдХреЗ рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░

Etan Ginsberg, Martian рдХреЗ рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

mm

Etan Ginsberg Martian के सह-संस्थापक हैं, जो एक ऐसा प्लेटफ़ॉर्म है जो गतिशील रूप से प्रत्येक प्रॉम्प्ट को सबसे अच्छे एलएलएम में रूट करता है। रूटिंग के माध्यम से, मार्टियन जीपीटी-4 सहित किसी भी व्यक्तिगत प्रदाता की तुलना में उच्च प्रदर्शन और कम लागत प्राप्त करता है। यह प्रणाली कंपनी की विशिष्ट मॉडल मैपिंग प्रौद्योगिकी पर बनाई गई है जो जटिल ब्लैक बॉक्स से एलएलएम को अधिक व्याख्यात्मक वास्तुकला में अनपैक करती है, जिससे यह मैकेनिस्टिक व्याख्यात्मकता का पहला व्यावसायिक अनुप्रयोग बन जाता है।

एटन ने मध्य विद्यालय में ही कोडिंग, वेबसाइट डिज़ाइनिंग और ई-बिजनेस बनाना शुरू कर दिया था। एक बहुमुखी प्रतिभा एटन एक विश्व मेमोरी चैंपियनशिप प्रतियोगी हैं और शेन्ज़ेन, चीन में विश्व स्पीड रीडिंग चैंपियनशिप में दूसरे स्थान पर रहे।

वह एक वीडीओ हैकथॉन प्रतियोगी हैं। पिछले पुरस्कारों में टेक क्रंच एसजेड में तीसरा पुरस्कार, प्रिंसटन हैकथॉन में शीर्ष 7 फाइनलिस्ट और येल हैकथॉन में 3 उद्योग पुरस्कार शामिल हैं।

आप एक पिछले दो बार स्टार्टअप संस्थापक हैं, वे कंपनियां क्या थीं और आपने इस अनुभव से क्या सीखा?

मेरी पहली कंपनी अमेरिकन निंजा वॉरियर के खेल को बढ़ावा देने और आगे बढ़ाने के लिए पहला प्लेटफ़ॉर्म था। 2012 में, मैंने अमेरिकन निंजा वॉरियर को एक भूमिगत खेल (90 के दशक में एमएमए की तरह) के रूप में देखा और मैंने पहला प्लेटफ़ॉर्म बनाया जहां लोग ब्लूप्रिंट खरीद सकते थे, बाधाओं का ऑर्डर दे सकते थे और प्रशिक्षण के लिए जिम ढूंढ सकते थे। मैंने अपने खुद के जिम शुरू करने के लिए कंपनियों के लिए परामर्श किया, जिसमें यूएस स्पेशल फोर्सेस के लिए एक प्रशिक्षण पाठ्यक्रम में मदद करना और पहले 3 महीनों में $300k की आय वाले सुविधा को स्केल करना शामिल था। हालांकि मैं हाई स्कूल में था, मैंने 20+ कर्मचारियों की टीमों को प्रबंधित करने का अपना पहला अनुभव प्राप्त किया और प्रभावी प्रबंधन और अंतरव्यक्तिगत संबंधों के बारे में सीखा।

मेरी दूसरी कंपनी एक वैकल्पिक परिसंपत्ति प्रबंधन कंपनी थी जिसकी मैंने 2017 में स्थापना की थी, क्रिप्टो में आईसीओ-लहर से पहले। यह मेरा एनएलपी के साथ पहला संपर्क था, जहां हमने सोशल मीडिया डेटा के भावना विश्लेषण का उपयोग एक निवेश रणनीति के रूप में किया था।

मैंने स्टार्टअप चलाने में जाने वाले कठिन और नरम कौशल के बारे में बहुत कुछ सीखा। aynı समय में, मैंने अपने बारे में और यह जानने के बारे में बहुत कुछ सीखा कि मैं किस पर काम करना चाहता हूं। मुझे लगता है कि सबसे सफल कंपनियां उन संस्थापकों द्वारा शुरू की जाती हैं जिनके पास एक व्यापक दृष्टि या लक्ष्य होता है। मैं 2017 में क्रिप्टो को छोड़ दिया ताकि मैं एनएलपी पर ध्यान केंद्रित कर सकूं क्योंकि मानव बुद्धिमत्ता को बढ़ाने और समझने की बात वास्तव में मुझे प्रेरित करती है। मुझे यह जानकर खुशी हुई कि।

जब आप पेंसिल्वेनिया विश्वविद्यालय में पढ़ रहे थे, तो आपने कुछ एआई अनुसंधान किया, आप विशेष रूप से क्या अनुसंधान कर रहे थे?

हमारा अनुसंधान मूल रूप से एलएलएम के अनुप्रयोगों का निर्माण करने पर केंद्रित था। विशेष रूप से, हमने एलएलएम के शैक्षिक अनुप्रयोगों पर काम किया और पहले एलएलएम-संचालित संज्ञानात्मक ट्यूटर का निर्माण किया। परिणाम काफी अच्छे थे – हमने प्रारंभिक प्रयोग में 0.3 मानक विचलन में छात्र परिणामों में सुधार देखा – और हमारी प्रणाली पेंसिल्वेनिया विश्वविद्यालय से लेकर भूटान विश्वविद्यालय तक उपयोग की जा रही है।

क्या आप बता सकते हैं कि यह अनुसंधान आपको मार्टियन के सह-संस्थापक के रूप में कैसे ले गया?

क्योंकि हम एलएलएम पर अनुप्रयोग बनाने वाले पहले लोगों में से थे, हम उन पहले लोगों में से भी थे जिन्हें एलएलएम पर अनुप्रयोग बनाने के साथ आने वाली समस्याओं का सामना करना पड़ा। यह हमारे शोध को बुनियादी ढांचे की परत की ओर ले गया। उदाहरण के लिए, हम जीपीटी-3 जैसे बड़े मॉडल के आउटपुट पर छोटे मॉडल को फ़ाइन-ट्यून करने और प्रोग्रामिंग और गणित समस्या समाधान जैसे कार्यों के लिए विशेषज्ञता वाले डेटा स्रोतों पर मॉडल को फ़ाइन-ट्यून करने के लिए बहुत जल्दी पहुंच गए। यह अंततः हमें मॉडल व्यवहार को समझने और मॉडल रूटिंग के बारे में समस्याओं की ओर ले गया।

मार्टियन नाम और बुद्धिमत्ता के साथ इसका संबंध भी दिलचस्प है, क्या आप इस नाम के चयन की कहानी साझा कर सकते हैं?

हमारी कंपनी का नाम हंगेरियन-अमेरिकी वैज्ञानिकों के एक समूह के नाम पर रखा गया है, जिन्हें “द मार्टियन” के नाम से जाना जाता है।” यह समूह, जो 20वीं शताब्दी में रहता था, कुछ ऐसे लोगों से बना था जो सबसे चतुर लोगों में से थे:

  • उनमें से सबसे प्रसिद्ध जॉन वॉन न्यूमैन थे; उन्होंने गेम थ्योरी, आधुनिक कंप्यूटर आर्किटेक्चर, ऑटोमेटा थ्योरी का आविष्कार किया और दर्जनों अन्य क्षेत्रों में मौलिक योगदान दिया।
  • पॉल एर्डोस इतिहास में सबसे अधिक प्रकाशित गणितज्ञ थे, जिन्होंने 1500 से अधिक पेपर प्रकाशित किए थे।
  • थियोडोर वॉन कारमैन ने एरोडायनामिक्स के मूल सिद्धांतों की स्थापना की और अमेरिकी अंतरिक्ष कार्यक्रम की स्थापना में मदद की। पृथ्वी और बाहरी अंतरिक्ष के बीच मानव-परिभाषित सीमा को उनके काम की मान्यता में “कारमैन लाइन” नाम दिया गया है।
  • लео स्जिलार्ड ने परमाणु बम, विकिरण चिकित्सा और कण त्वरक का आविष्कार किया।

इन वैज्ञानिकों और 14 अन्य लोगों (जिनमें हाइड्रोजन बम के आविष्कारक, आधुनिक भौतिकी में समूह सिद्धांत को पेश करने वाले व्यक्ति, और संयोजन, संख्या सिद्धांत, संख्यात्मक विश्लेषण और संभाव्यता सिद्धांत जैसे क्षेत्रों में मौलिक योगदानकर्ता शामिल हैं) ने एक उल्लेखनीय समानता साझा की – वे सभी बुडापेस्ट के एक ही हिस्से में पैदा हुए थे। इससे लोगों को यह पूछने के लिए प्रेरित किया गया: इतनी बुद्धिमत्ता का स्रोत क्या था?

इसके जवाब में, स्जिलार्ड ने मजाक में कहा कि “मार्टियन पहले से ही यहां हैं और वे खुद को हंगेरियन कहते हैं!” वास्तव में, कोई नहीं जानता।

मानवता खुद को कृत्रिम बुद्धिमत्ता के साथ एक नए सुपरइंटेलिजेंट दिमाग के साथ एक समान स्थिति में पाती है। लोग जानते हैं कि मॉडल बहुत चतुर हो सकते हैं, लेकिन उन्हें पता नहीं है कि वे कैसे काम करते हैं।

हमारा मिशन यह प्रश्न का उत्तर देना है – आधुनिक सुपरइंटेलिजेंस को समझना और हार्नेस करना।

आपके पास अविश्वसनीय स्मृति कारनामों का एक इतिहास है, आप इन स्मृति चुनौतियों में कैसे शामिल हुए और यह ज्ञान मार्टियन की अवधारणा में आपकी मदद कैसे की?

अधिकांश खेलों में, एक पेशेवर एथलीट एक औसत व्यक्ति की तुलना में 2-3 गुना बेहतर प्रदर्शन कर सकता है (एक फील्ड गोल कितनी दूर तक किक कर सकता है या एक फास्ट बॉल कितनी तेजी से फेंक सकता है, इसकी तुलना एक पेशेवर से करें)। स्मृति खेल दिलचस्प हैं क्योंकि शीर्ष एथलीट 100 गुना या यहां तक कि 1000 गुना अधिक स्मृति कर सकते हैं जितना कि एक औसत व्यक्ति कम प्रशिक्षण के साथ – और अक्सर वे लोग होते हैं जिनकी प्राकृतिक स्मृति औसत होती है जो विशिष्ट तकनीकों का श्रेय देते हैं जो कोई भी सीख सकता है। मैं मानव ज्ञान को अधिकतम करना चाहता हूं, और मैंने दुनिया स्मृति चैंपियनशिप को एक अनदेखी अंतर्दृष्टि के रूप में देखा कि हम कैसे असाधारण रिटर्न को बढ़ाने के लिए मानव बुद्धिमत्ता को बढ़ा सकते हैं।

मैंने स्मृति तकनीकों को शिक्षा प्रणाली में तैनात करना चाहा, इसलिए मैंने देखा कि एनएलपी और एलएलएम कैसे सबसे प्रभावी शैक्षिक तरीकों को मुख्यधारा की शिक्षा प्रणाली में उपयोग करने से रोकने वाली सेटअप लागत को कम करने में मदद कर सकते हैं। यश और मैंने पहले एलएलएम-संचालित संज्ञानात्मक ट्यूटर बनाया और इससे हमें एलएलएम-निर्देशन के साथ समस्याओं का पता चला, जिसे हम आज हल करने में मदद करते हैं।

मार्टियन मूल रूप से एक बड़े भाषा मॉडल (एलएलएम) का उपयोग करने के निर्णय को स abstract करता है, यह वर्तमान में डेवलपर्स के लिए एक दर्दनाक बिंदु क्यों है?

यह बड़े भाषा मॉडल बनाना आसान हो रहा है – कंप्यूट की लागत कम हो रही है, एल्गोरिदम अधिक कुशल हो रहे हैं, और मॉडल बनाने के लिए अधिक ओपन-सोर्स टूल उपलब्ध हैं। इसके परिणामस्वरूप, अधिक कंपनियां और डेवलपर्स कस्टम डेटा पर प्रशिक्षित कस्टम मॉडल बना रहे हैं। जैसा कि इन मॉडलों में अलग-अलग लागत और क्षमताएं हैं, आप एक से अधिक मॉडल का उपयोग करके बेहतर प्रदर्शन प्राप्त कर सकते हैं, लेकिन सभी का परीक्षण करना और सही मॉडल का पता लगाना मुश्किल है। हम डेवलपर्स के लिए इसका ध्यान रखते हैं।

क्या आप बता सकते हैं कि प्रणाली कैसे समझती है कि प्रत्येक विशिष्ट कार्य के लिए कौन सा एलएलएम सबसे अच्छा उपयोग किया जाता है?

अच्छी तरह से रूटिंग करना मूल रूप से मॉडल को समझने के बारे में है। मॉडल के बीच प्रभावी ढंग से रूटिंग करने के लिए, आप मॉडल को विफल या सफल होने के कारणों को समझना चाहते हैं। मॉडल-मैपिंग के साथ इन विशेषताओं को समझने से हमें यह निर्धारित करने की अनुमति मिलती है कि कोई दिया गया मॉडल एक अनुरोध पर कैसा प्रदर्शन करेगा, बिना उस मॉडल को चलाए। परिणामस्वरूप, हम उस अनुरोध को उस मॉडल में भेज सकते हैं जो सबसे अच्छा परिणाम произ动生成 करेगा।

क्या आप एलएलएम का उपयोग अनुकूलन करने से होने वाली लागत बचत के प्रकार पर चर्चा कर सकते हैं?

हम उपयोगकर्ताओं को लागत और प्रदर्शन के बीच व्यापार कैसे करना है, यह निर्दिष्ट करने की अनुमति देते हैं। यदि आप केवल प्रदर्शन की परवाह करते हैं, तो हम ओपनएआई/मूल्यांकन पर जीपीटी-4 से बेहतर प्रदर्शन कर सकते हैं। यदि आप अपने इकाई अर्थशास्त्र को काम करने के लिए एक विशिष्ट लागत की तलाश में हैं, तो हम आपको अपने अनुरोध के लिए अधिकतम लागत निर्दिष्ट करने देते हैं, फिर उस अनुरोध को पूरा करने के लिए सबसे अच्छा मॉडल ढूंढते हैं। और यदि आप कुछ अधिक गतिशील चाहते हैं, तो हम आपको एक बेहतर उत्तर के लिए कितना भुगतान करने को तैयार हैं, यह निर्दिष्ट करने देते हैं – इस तरह, यदि दो मॉडलों में समान प्रदर्शन होता है लेकिन लागत में बड़ा अंतर होता है, तो हम आपको कम खर्चीले मॉडल का उपयोग करने दे सकते हैं। हमारे कुछ ग्राहकों ने 12 गुना तक की लागत में कमी देखी है।

मार्टियन के भविष्य के लिए आपकी दृष्टि क्या है?

प्रत्येक बार जब हम मॉडल की हमारी मूलभूत समझ में सुधार करते हैं, तो यह एआई के लिए एक परिवर्तन लाता है। फ़ाइन-ट्यूनिंग आउटपुट को समझने से संचालित परिवर्तन है। प्रॉम्प्टिंग इनपुट को समझने से संचालित परिवर्तन है। मॉडल की हमारी समझ में यह एकमात्र अंतर पारंपरिक एमएल (“एक रिग्रेसर प्रशिक्षित करें”) और आधुनिक जनरेटिव एआई (“एक बेबी एआई को प्रॉम्प्ट करें”) के बीच बहुत कुछ अलग करता है।

हमारा लक्ष्य निरंतरता से व्याख्यात्मकता में सफलता प्राप्त करना है जब तक कि एआई पूरी तरह से समझ में नहीं आ जाता और हमारे पास तर्क या कैलकुलस के सिद्धांतों के रूप में एक बुद्धिमत्ता का सिद्धांत नहीं हो जाता।

इसका अर्थ है निर्माण करना। इसका अर्थ है शानदार एआई टूलिंग बनाना और लोगों के हाथों में डालना। इसका अर्थ है ऐसी चीजें जारी करना जो कोई और नहीं कर रहा है, जो पहले से नहीं की गई हैं, और जो – सबसे ज्यादा – दिलचस्प और उपयोगी हैं।

सर फ्रांसिस बेकन के शब्दों में, “ज्ञान शक्ति है।” तदनुसार, यह सुनिश्चित करने का सबसे अच्छा तरीका है कि हम एआई को समझते हैं, यह है कि हम शक्तिशाली उपकरण जारी करें। हमारे विचार में, एक मॉडल राउटर इस तरह का एक उपकरण है। हम इसे बनाने, विकसित करने और लोगों के हाथों में डालने के लिए उत्साहित हैं।

यह उन कई उपकरणों में से पहला है जिन्हें हम आने वाले महीनों में जारी करने जा रहे हैं। एक सुंदर कृत्रिम बुद्धिमत्ता के सिद्धांत की खोज करने के लिए, पूरी तरह से नए प्रकार के एआई बुनियादी ढांचे को सक्षम करने के लिए, मानव और मशीन दोनों के लिए एक उज्जवल भविष्य बनाने में मदद करने के लिए – हम उन उपकरणों को आपके साथ साझा करने के लिए इंतजार नहीं कर सकते।

साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें मार्टियन पर जाना चाहिए।

рдПрдВрдЯреЛрдиреА рдПрдХ рджреВрд░рджрд░реНрд╢реА рдиреЗрддрд╛ рдФрд░ Unite.AI рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рднрд╛рдЧреАрджрд╛рд░ рд╣реИрдВ, рдЬреЛ рдХрд┐ рдПрдЖрдИ рдФрд░ рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдХреЗ рднрд╡рд┐рд╖реНрдп рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдФрд░ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдЯреВрдЯ рдЬреБрдиреВрди рд╕реЗ рдкреНрд░реЗрд░рд┐рдд рд╣реИрдВред рдПрдХ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдЙрджреНрдпрдореА, рд╡рд╣ рдорд╛рдирддрд╛ рд╣реИ рдХрд┐ рдПрдЖрдИ рд╕рдорд╛рдЬ рдХреЗ рд▓рд┐рдП рдЙрддрдирд╛ рд╣реА рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рд╣реЛрдЧрд╛ рдЬрд┐рддрдирд╛ рдХрд┐ рдмрд┐рдЬрд▓реА, рдФрд░ рдЕрдХреНрд╕рд░ рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдФрд░ рдПрдЬреАрдЖрдИ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЙрддреНрд╕рд╛рд╣рд┐рдд рд╣реЛрддрд╛ рд╣реИред

рдПрдХ рдлреНрдпреВрдЪрд░рд┐рд╕реНрдЯ рдХреЗ рд░реВрдк рдореЗрдВ, рд╡рд╣ рдЗрди рдирд╡рд╛рдЪрд╛рд░реЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╣рдорд╛рд░реА рджреБрдирд┐рдпрд╛ рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдХреА рдЦреЛрдЬ рдореЗрдВ рд╕рдорд░реНрдкрд┐рдд рд╣реИред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рд╡рд╣ рд╕рд┐рдХреНрдпреЛрд░рд┐рдЯреАрдЬрд╝.io рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рд╣реИрдВ, рдПрдХ рдордВрдЪ рдЬреЛ рднрд╡рд┐рд╖реНрдп рдХреЛ рдлрд┐рд░ рд╕реЗ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рдиреЗ рдФрд░ рдкреВрд░реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЖрдХрд╛рд░ рджреЗрдиреЗ рд╡рд╛рд▓реА рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдореЗрдВ рдирд┐рд╡реЗрд╢ рдкрд░ рдХреЗрдВрджреНрд░рд┐рдд рд╣реИред