Connect with us

рдЪреАрди рдХрд╛ рдПрдЖрдИ рдорд┐рд░реЗрдЬ: рдХреИрд╕реЗ “рдУрдкрди рд╕реЛрд░реНрд╕” рд╕рдмрд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд╛рддреЛрдВ рдХреЛ рдЫреБрдкрд╛рддрд╛ рд╣реИ

рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛

рдЪреАрди рдХрд╛ рдПрдЖрдИ рдорд┐рд░реЗрдЬ: рдХреИрд╕реЗ “рдУрдкрди рд╕реЛрд░реНрд╕” рд╕рдмрд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд╛рддреЛрдВ рдХреЛ рдЫреБрдкрд╛рддрд╛ рд╣реИ

mm

बिग टेक खिलाड़ियों जैसे गूगल, माइक्रोसॉफ्ट, और मेटा एआई बाजार पर हावी होने के लिए प्रतिस्पर्धा कर रहे हैं, चीन के हाई फ्लायर, बaidu, मूनशॉट, और अलीबाबा ने अपने डीपसीक, ERNIE 4.5, किमी K2, और क्वेन3 बड़े भाषा मॉडलों को क्रमशः ओपन सोर्स के रूप में जारी करने के लिए सुर्खियां बनाई हैं। यह प्रोप्राइटरी जेनएआई मॉडलों को जारी करने से दूर एक बदलाव है, जिसे चीन के एआई उद्योग द्वारा ओपन सोर्स की शक्ति को अपनाने और एआई विकास को लोकतांत्रिक बनाने और नवाचार को बढ़ावा देने के संकेत के रूप में देखा जा रहा है।

जैसे कि कई खिलाड़ी अपनी पेशकश को ओपन सोर्स के रूप में बढ़ावा देते हैं और यहां तक कि अपनी कंपनी के नाम में भी इसे शामिल करते हैं, हाई फ्लायर, बaidu, और मूनशॉट ने वास्तव में अपने मॉडलों के दिल में महत्वपूर्ण टुकड़े जैसे डेटासेट साझा नहीं किए हैं। जैसे ही ये बड़े मॉडल विकसित होते हैं और विकासकर्ताओं पर निर्भर होते हैं, वास्तविक ओपन सोर्स की पारदर्शिता जिसे परीक्षण, जांच, और पुनरावृत्ति किया जा सकता है, तो यह विश्वसनीय, नैतिक, और लाभकारी प्रौद्योगिकी बनाने के लिए महत्वपूर्ण है जिस पर हम सभी भरोसा कर सकते हैं। इन सभी “ओपन सोर्स” मॉडलों को वास्तव में “ओपन वेट” कहा जा सकता है, जिसका अर्थ है कि वे डाउनलोड किए जा सकते हैं और उपयोग किए जा सकते हैं, लेकिन डेटा के बिना किसी भी अर्थपूर्ण तरीके से जांच नहीं की जा सकती है।

जैसे ही यूएस खिलाड़ी जैसे ओपन एआई और मेटा ओपन सोर्स से दूर जा रहे हैं, बaidu का अपने ERNIE 4.5 मॉडलों के सुइट का मुफ्त में उपयोग करने के लिए खुला निमंत्रण वास्तव में नवाचार और विकासकर्ताओं के साथ सहयोग को बढ़ावा दे सकता है जो छोटे, शक्तिशाली अनुप्रयोगों को बनाने की तलाश में हैं। 同 समय, कंपनी ने जो चीन के गूगल के समान है, ने अपने मॉडलों को अपनाने और एआई पारिस्थितिकी तंत्र में अपने मॉडलों को स्थापित करके एक प्रतिस्पर्धी बढ़त दी है।

यही बात डीपसीक, कम मूल्य वाले किमी K2, और अद्यतन क्वेन3 – जो क्लॉड ओपस 4 और जीपीटी-4ओ-0327 जैसे बंद मॉडलों को चुनौती देने वाले बेंचमार्क का दावा करता है – के लिए कही जा सकती है।

इन एआई खिलाड़ियों ने खुद को कमोडिटी मॉडल ऑफ चॉइस की दौड़ में अच्छी तरह से स्थापित किया है और क्वेन3 का नवीनतम अद्यतन वास्तव में ओपन सोर्स समुदाय की प्रतिक्रिया से प्रेरित था।

जैसे कि कई जो अपने बड़े एआई मॉडल को ओपन सोर्स के रूप में बढ़ावा देते हैं, चीनी एआई समुदाय वास्तव में अपने एआई सिस्टम के डेटा या अन्य महत्वपूर्ण टुकड़ों को साझा नहीं कर रहा है। इसके बजाय, वे वैश्विक विकासकर्ताओं से अपने मॉडलों पर अंधविश्वास करने के लिए कह रहे हैं जिन्हें वे वास्तव में समझ नहीं सकते हैं या जांच नहीं कर सकते हैं।

ओपन सोर्स कमोडिटी एआई मॉडल के साथ भविष्य पर दावा

जब 2007 में आईफोन बाजार में आया, तो कुछ ने सोचा कि मैक आईओएस के साथ स्मार्टफोन गेम पर राज करेगा, लेकिन ओपन-सोर्स भागीदारी स्टार्टअप्स के लिए एकीकृत है, जबकि विश्वभर में उद्यमशीलता और आर्थिक विकास को भी बढ़ावा देती है – और एंड्रॉइड, जो 2005 में गूगल द्वारा अधिग्रहित एक स्टार्टअप था, इस मार्ग का अनुसरण किया और जीत हासिल की।

ओपन सोर्स सॉफ्टवेयर जारी करके जिसे देखा, संशोधित, अपनाया, और साझा किया जा सकता है, एंड्रॉइड ने अकादमिकों, विकासकर्ताओं, और यहां तक कि प्रतिस्पर्धियों को सॉफ्टवेयर पर सहयोग करने के लिए आमंत्रित किया। इसने नवाचार प्रक्रिया को तेज किया, खेल को लोकतांत्रिक बनाया, और अंततः, कीमतों को कम किया। एंड्रॉइड पहले आईफोन के एक साल बाद बाजार में आया और इस साल की शुरुआत में, 71.88 प्रतिशत वैश्विक बाजार के हिस्से के साथ आईओएस के 27.65 प्रतिशत के मुकाबले

एक प्रौद्योगिकी क्रांति जो रातोंरात हुई, स्मार्टफोन सर्वव्यापी हो गए और जैसे ही सॉफ्टवेयर, हार्डवेयर, और यूजर इंटरफेस में सुधार जारी है, उद्योग स्मार्टफोन के काम करने के तरीके को क्रांतिकारी बनाने से आगे बढ़ गया है। मोबाइल फोन अब एक कमोडिटी है, और आज हाथ में नवाचार वे ऐप्स हैं जो उन पर चलते हैं, और प्रतिस्पर्धियों के लिए, स्मार्टफोन प्रदाताओं को एक पारिस्थितिकी तंत्र बनाए रखना होगा जो विकासकर्ताओं को आमंत्रित करता है।

चैटजीपीटी के लॉन्च के तीन साल बाद, एआई उद्योग खुद को एक समान स्थिति में पाता है। वैश्विक एआई उद्योग के हर खिलाड़ी अपने मॉडलों को अगले एंड्रॉइड या यहां तक कि आईओएस बनाने के लिए प्रतिस्पर्धा कर रहे हैं, और डीपसीक, ERNIE 4.5, और किमी K2 मॉडलों को ओपन सोर्स के रूप में जारी करके, चीनी नवप्रवर्तनकर्ता एक बढ़ते पारिस्थितिकी तंत्र पर दावा करने की कोशिश कर रहे हैं।

जैसे ही यह उनके पक्ष में काम कर सकता है, हालांकि, यह वास्तविक ओपन सोर्स की पारदर्शिता को बढ़ावा नहीं देता है जो न केवल नवाचार को जन्म देने के लिए आवश्यक है, बल्कि हमें विश्वास है कि नवाचार पर भरोसा किया जा सकता है।

ओपन सोर्स एआई में डेटा गायब है

एआई मॉडलों को बनाने और साझा करने के लिए पारंपरिक सॉफ्टवेयर से कहीं अधिक जटिल होने के कारण, पूरी तरह से ओपन सोर्स एआई के लिए कोई छोटा सा ऑर्डर नहीं है। इसके बजाय एक सरल स्रोत कोड, एआई सिस्टम सात घटकों से बने होते हैं – जिनमें स्रोत कोड, मॉडल पैरामीटर, डेटासेट, हाइपरपैरामीटर, प्रशिक्षण स्रोत कोड, रैंडम नंबर जेनरेशन, और सॉफ्टवेयर फ्रेमवर्क शामिल हैं।

प्रत्येक टुकड़े को एक मॉडल को वांछित परिणाम देने के लिए संगीतमय तरीके से काम करने की आवश्यकता है, जिसका अर्थ है कि विकासकर्ताओं को साझा, संशोधित, और अपनाने और समझने के लिए पूरी दृश्यता की आवश्यकता है कि क्या हो रहा है। वैज्ञानिक विधि के आधार के रूप में पुनरुत्पादन के साथ, हालांकि, एआई उद्योग की “ओपन सोर्स” शब्द का उपयोग करने की आदत है जो मुफ्त या कम मूल्य वाले रिलीज को संदर्भित करता है जो कुछ टुकड़ों के साथ उपलब्ध हैं।

उदाहरण के लिए, बaidu ने दस ERNIE 4.5 मॉडल मुफ्त में उपलब्ध कराए। मॉडल और पैरामीटर साझा करने के साथ, कंपनी ने ERNIEKit और FastDeploy डिप्लॉयमेंट टूलकिट्स को भी ओपन सोर्स किया। वे विकासकर्ताओं को शक्तिशाली एआई अनुप्रयोगों को बनाने के लिए उत्साहित करने वाले औद्योगिक-ग्रेड क्षमता, संसाधन-कुशल प्रशिक्षण और अनुमान प्रवाह, और मल्टी-हार्डवेयर संगतता प्रदान करके सक्षम करते हैं।

दूसरे शब्दों में, बaidu ने विकासकर्ताओं को उत्साहजनक उपकरण प्रदान किए हैं जो उन्हें तेजी से नवाचार को बढ़ावा देने में सक्षम बनाते हैं, जो उन्हें ERNIE 4.5 को प्रतिस्पर्धा से ऊपर चुनने के लिए प्रेरित करते हैं।

हालांकि, ERNIE 4.5 का लाभ उठाने वाले विकासकर्ताओं को अंधविश्वास से मॉडल पर विश्वास करने के लिए कहा जा रहा है, क्योंकि बaidu ने डेटासेट सहित बहुत कुछ छुपाया है जो इसके मॉडलों को सूचित और सिखाता है।

पारदर्शी ओपन सोर्स एआई मॉडल की शक्ति

जैसे ही एआई पजल का प्रत्येक टुकड़ा एक मॉडल को काम करने के लिए महत्वपूर्ण है, 80 प्रतिशत एआई परियोजनाएं विफल हो जाती हैं, और डेटा समस्या के दिल में है। असटीक, अधूरा, और पूर्वाग्रहपूर्ण डेटा सेट ऐसे मॉडलों को जन्म देते हैं जो पूर्वानुमानित या वांछित तरीके से व्यवहार नहीं करते हैं।

हाल ही में जारी 2023 टेस्ला फुल-सेल्फ-ड्राइविंग (एफएसडी) दुर्घटना वीडियो, उदाहरण के लिए, एक डेटासेट और मॉडल की कमी के सबसे बुरे सenario को उजागर करता है। जैसे ही टेस्ला मॉडल वाई एक सेटिंग सन में तेजी से बढ़ा, आंशिक रूप से स्वचालित प्रणाली अपने कैमरों द्वारा देखे जा रहे या नहीं देखे जा रहे को समझ या प्रतिक्रिया नहीं कर सकी। जैसे ही मानव-चालित कारें धीमी हो गईं और रुक गईं, एफएसडी की भ्रम का परिणाम एक महिला की मौत हो गई।

यह विनाशकारी विफलता अधूरे दृश्य डेटा को दर्शाती है, साथ ही साथ एक सुरक्षा तंत्र की कमी जो ऐसे अंधे धब्बों के लिए खाता है। जब विकासकर्ताओं के पास अपने डेटा में दृश्यता नहीं होती है, तो वे यह नहीं देख सकते कि यह मॉडल के साथ कैसे बातचीत कर रहा है, जिसका अर्थ है कि वे ऐसी गलतियों को उजागर नहीं कर सकते हैं और मजबूत प्रदर्शन के लिए पुनरावृत्ति नहीं कर सकते हैं।

और भी चिंताजनक, डेटा के बिना जो मॉडल को ईंधन देता है, वे इसे अंधविश्वास से विश्वास करने के लिए मजबूर हैं।

जब डेटासेट ओपन सोर्स होते हैं, हालांकि, एआई समुदाय ने सिद्ध किया है कि यह परेशानी भरे मुद्दों को उजागर करेगा, जैसे कि 1,000 से अधिक यूआरएल्स का पता लगाना जो लायोन 5बी में सत्यापित बाल शोषण सामग्री को शामिल करते हैं। एआई टेक्स्ट-टू-इमेज जेनरेशन मॉडल्स जैसे स्टेबल डिफ्यूजन और मिडजॉर्नी को बनाने के लिए उपयोग किए जाने वाले डेटासेट के साथ, यह एआई उद्योग के लिए विनाशकारी होगा यदि उपयोगकर्ता अवैध फोटोरियलिस्टिक छवियां बनाना शुरू कर देते हैं। इसके बजाय, डेटासेट की ओपन प्रकृति ने समुदाय को खतरनाक सामग्री को उजागर करने और एक समाधान, लायसन बी को प्रेरित करने की अनुमति दी।

इसके अलावा, उस पहले डेटासेट का अधिकांश हिस्सा विशाल कॉमन क्रॉल द्वारा किए गए वेब स्क्रैपिंग पर आधारित था, जिसे चैटजीपीटी और एलएएमए मॉडल्स के लिए भी उपयोग किया गया था। जैसे ही एआई क्रॉलर कॉपीराइट, गोपनीयता, और पूर्वाग्रहपूर्ण और नस्लवादी लेबलिंग के बारे में चिंताओं को उठाते हैं, हालांकि, एआई समुदाय के विकासकर्ता सुरक्षित उपयोग के लिए कॉमन क्रॉल के बढ़ते ओपन सोर्स डेटासेट के टुकड़ों को साफ करने के तरीकों पर काम कर रहे हैं

जैसे ही विकासकर्ता न केवल शक्तिशाली एआई बनाने की कोशिश करते हैं, बल्कि एआई जिस पर हम भरोसा कर सकते हैं, तो दोनों उपयोगकर्ता और उद्योग दोनों को वास्तविक ओपन सोर्स की पारदर्शिता और सहयोग से सुरक्षित किया जाता है।

ओपन सोर्स पथ को अपनाना

जैसे ही कई लोग इस बढ़ते प्रौद्योगिकी से सावधान हैं, बड़े एआई कमोडिटी मॉडल्स के आईओएस या एंड्रॉइड बनने की दौड़ जारी है – और जैसे ही वैश्विक एआई समुदाय वास्तव में भविष्य के मानक का निर्माण कर रहा है और एआई सिस्टम पहले से ही कारों को चला रहे हैं और चिकित्सा मूल्यांकन प्रदान कर रहे हैं, एआई को स्थापित करना कभी भी अधिक महत्वपूर्ण नहीं रहा है। अस्वीकरण, विश्वसनीय, और सुरक्षित।

चीन के एआई समुदाय द्वारा ओपन इनोवेशन के चैंपियन के रूप में खुद को स्थापित करने की कोशिश करते हुए, सुरक्षित एआई के लिए मार्ग केवल वास्तविक ओपन सोर्स की पारदर्शिता में है जो दशकों से सॉफ्टवेयर नवाचार के माध्यम से सिद्ध हुआ है। महत्वपूर्ण टुकड़ों जैसे डेटा को साझा नहीं करने वाले सिस्टम पर “ओपन सोर्स” शब्द का उपयोग करना अन्वेषण, प्रतिकृति और पुनरावृत्ति की अनुमति नहीं देता है। जबकि डीपसीक, ERNIE 4.5, किमी K2, और क्वेन3 जैसे तैयार मॉडलों का प्रलोभन अस्वीकार्य है, विकासकर्ता जो उन पर निर्भर करते हैं वे पारदर्शिता के लिए सुविधा का व्यापार करते हैं जो सहयोग और नवाचार को बढ़ावा देती है।

एआई समुदाय को चुनना होगा: वास्तविक ओपन सोर्स के माध्यम से कट्टरपंथी पारदर्शिता को अपनाना, या आज के ब्लैक बॉक्स पर कल की महत्वपूर्ण प्रणालियों का निर्माण जोखिम में।

рдбреЙ рдЬреЗрд╕рди рдХреЛрд░реНрд╕реЛ рд╡реЙрдХреНрд╕реЗрд▓51 рдореЗрдВ рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рдореБрдЦреНрдп рд╡рд┐рдЬреНрдЮрд╛рди рдЕрдзрд┐рдХрд╛рд░реА рд╣реИрдВ, рдФрд░ рдорд┐рд╢рд┐рдЧрди рд╡рд┐рд╢реНрд╡рд╡рд┐рджреНрдпрд╛рд▓рдп рдореЗрдВ рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдФрд░ рдЗрд▓реЗрдХреНрдЯреНрд░рд┐рдХрд▓ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдФрд░ рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдХреЗ рдкреНрд░реЛрдлреЗрд╕рд░ рд╣реИрдВред рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬрди рдХреЗ рдХреНрд╖реЗрддреНрд░ рдореЗрдВ рдПрдХ рджрд┐рдЧреНрдЧрдЬ, рдбреЙ рдХреЛрд░реНрд╕реЛ рдиреЗ рд╡реАрдбрд┐рдпреЛ рд╕рдордЭ, рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬреНрдЮрд╛рди рдХреЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рд╢реЛрдз рдореЗрдВ 20 рд╕реЗ рдЕрдзрд┐рдХ рд╡рд░реНрд╖реЛрдВ рдХрд╛ рд╕рдордп рджрд┐рдпрд╛ рд╣реИред