Connect with us

рдЪреАрди рдХрд╛ рдПрдЖрдИ рдорд┐рд░реЗрдЬ: рдХреИрд╕реЗ “рдУрдкрди рд╕реЛрд░реНрд╕” рд╕рдмрд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд╛рддреЛрдВ рдХреЛ рдЫреБрдкрд╛рддрд╛ рд╣реИ

рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛

рдЪреАрди рдХрд╛ рдПрдЖрдИ рдорд┐рд░реЗрдЬ: рдХреИрд╕реЗ “рдУрдкрди рд╕реЛрд░реНрд╕” рд╕рдмрд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд╛рддреЛрдВ рдХреЛ рдЫреБрдкрд╛рддрд╛ рд╣реИ

mm

बिग टेक खिलाड़ियों जैसे कि गूगल, माइक्रोसॉफ्ट और मेटा एआई बाजार पर हावी होने के लिए प्रतिस्पर्धा कर रहे हैं, चीन के हाई फ्लायर, बaidu, मूनशॉट और अलीबाबा ने अपने डीपसीक, ERNIE 4.5, किमी K2 और क्वेन3 बड़े भाषा मॉडल को ओपन सोर्स के रूप में जारी करने के लिए सुर्खियां बटोरी हैं। यह प्रोप्राइटरी जेनएआई मॉडल जारी करने से दूर करने का बदलाव चीन के एआई उद्योग को ओपन सोर्स की शक्ति को अपनाने और एआई विकास को लोकतांत्रिक बनाने और नवाचार को बढ़ावा देने के संकेत के रूप में देखा जा रहा है।

जैसे कि कई खिलाड़ी जो अपनी पेशकश को ओपन सोर्स के रूप में बताते हैं और यहां तक कि अपनी कंपनी के नाम में भी इसे शामिल करते हैं, हाई फ्लायर, बaidu और मूनशॉट ने वास्तव में अपने मॉडल के दिल में महत्वपूर्ण टुकड़े जैसे कि डेटासेट साझा नहीं किए हैं। जैसे कि ये बड़े मॉडल विकसित हो रहे हैं जिन पर डेवलपर्स निर्भर हैं, सच्चे ओपन सोर्स की पारदर्शिता जिसे परीक्षण, जांच और पुनरावृत्ति की जा सकती है, निष्पक्ष, नैतिक और लाभकारी प्रौद्योगिकी बनाने के लिए महत्वपूर्ण है जिस पर हम सभी भरोसा कर सकते हैं। इन सभी “ओपन सोर्स” मॉडल वास्तव में “ओपन वेट” हैं, जिसका अर्थ है कि वे डाउनलोड किए जा सकते हैं और उपयोग किए जा सकते हैं, लेकिन डेटा के बिना किसी भी अर्थपूर्ण तरीके से जांच नहीं की जा सकती है।

जैसे कि अमेरिकी खिलाड़ियों जैसे ओपन एआई और मेटा ओपन सोर्स से दूर होते दिख रहे हैं, बaidu के ERNIE 4.5 मॉडल के सुइट का मुफ्त में उपलब्ध होना वास्तव में नवाचार और डेवलपर्स के साथ सहयोग को बढ़ावा दे सकता है जो छोटे और शक्तिशाली अनुप्रयोग बनाने की तलाश में हैं। इसी समय, कंपनी ने जो चीन के गूगल के समान है, ने अपने मॉडल को अपनाने और एआई पारिस्थितिकी तंत्र में अपने मॉडल को स्थापित करके एक प्रतिस्पर्धी बढ़त दी है।

यही बात डीपसीक, कम कीमत वाले किमी K2 और अद्यतन क्वेन3 के लिए कही जा सकती है – जो बेंचमार्क को चुनौती देता है जैसे क्लॉड ओपस 4 और जीपीटी-4ओ-0327।

इन एआई खिलाड़ियों ने खुद को कमोडिटी मॉडल ऑफ चॉइस की दौड़ में अच्छी तरह से स्थापित किया है और क्वेन3 का नवीनतम अद्यतन वास्तव में ओपन सोर्स समुदाय की प्रतिक्रिया से प्रेरित था।

जैसे कि कई जो अपने बड़े एआई मॉडल को ओपन सोर्स के रूप में बताते हैं, चीनी एआई समुदाय वास्तव में अपने एआई सिस्टम के डेटा या अन्य महत्वपूर्ण टुकड़ों को साझा नहीं कर रहा है। इसके बजाय, वे वैश्विक डेवलपर्स से अपने मॉडल पर अंधविश्वास करने के लिए कह रहे हैं जिसे वे वास्तव में समझ नहीं सकते हैं या जांच नहीं कर सकते हैं।

ओपन सोर्स कमोडिटी एआई मॉडल के साथ भविष्य पर दावा

जब 2007 में आईफोन बाजार में आया, तो कुछ ने सोचा कि मैक आईओएस के साथ स्मार्टफोन खेल पर हावी होगा, लेकिन ओपन-सोर्स भागीदारी स्टार्टअप्स के लिए एकीकृत है, जबकि वैश्विक स्तर पर उद्यमी और आर्थिक विकास को भी बढ़ावा देता है – और एंड्रॉइड, जो 2005 में गूगल द्वारा अधिग्रहित एक स्टार्टअप था, इस मार्ग का अनुसरण करते हुए जीत हासिल की।

ओपन सोर्स सॉफ्टवेयर जारी करके जिसे देखा, संशोधित, अपनाया और साझा किया जा सकता है, एंड्रॉइड ने अकादमिकों, डेवलपर्स और यहां तक कि प्रतिस्पर्धियों को सॉफ्टवेयर पर सहयोग करने के लिए आमंत्रित किया। इससे नवाचार प्रक्रिया तेज हुई, खेल को लोकतांत्रिक बनाया और अंततः, कीमतें कम हुईं। एंड्रॉइड पहले आईफोन के एक साल बाद बाजार में आया और इस साल की शुरुआत में, 71.88 प्रतिशत वैश्विक बाजार के हिस्से के साथ आईओएस के 27.65 प्रतिशत के मुकाबले

एक तकनीकी क्रांति जो रातोंरात हुई, स्मार्टफोन सर्वव्यापी हो गए और जैसे ही सॉफ्टवेयर, हार्डवेयर और यूजर इंटरफेस में सुधार जारी है, उद्योग स्मार्टफोन के काम करने के तरीके को क्रांतिकारी बनाने से आगे बढ़ गया है। मोबाइल फोन अब एक कमोडिटी है, और हाथ में नवाचार वे ऐप्स हैं जो उन पर चलते हैं, और प्रतिस्पर्धियों के लिए, स्मार्टफोन प्रदाताओं को एक पारिस्थितिकी तंत्र बनाए रखना होगा जो डेवलपर्स को आमंत्रित करता है।

चैटजीपीटी के लॉन्च के तीन साल बाद, एआई उद्योग खुद को एक समान स्थिति में पाता है। एआई उद्योग के हर खिलाड़ी अपने मॉडल को अगले एंड्रॉइड या यहां तक कि आईओएस बनाने के लिए प्रतिस्पर्धा कर रहा है, और डीपसीक, ERNIE 4.5 और किमी K2 मॉडल को ओपन सोर्स के रूप में जारी करके, चीनी नवोन्मेषक एक नए पारिस्थितिकी तंत्र पर दावा करने की कोशिश कर रहे हैं।

हालांकि यह उनके पक्ष में काम कर सकता है, यह वास्तविक ओपन सोर्स की पारदर्शिता को बढ़ावा नहीं देता है जो न केवल नवाचार को जन्म देने के लिए आवश्यक है, बल्कि हमें विश्वास है कि नवाचार पर भरोसा किया जा सकता है।

ओपन सोर्स एआई में डेटा गायब है

एआई मॉडल को बनाने और साझा करने में पारंपरिक सॉफ्टवेयर की तुलना में अधिक जटिल होने के कारण, पूरी तरह से ओपन सोर्स एआई की मांग एक छोटी सी बात नहीं है। सिर्फ एक साधारण स्रोत कोड के बजाय, एआई सिस्टम सात घटकों से बने होते हैं – जिसमें स्रोत कोड, मॉडल पैरामीटर, डेटासेट, हाइपरपैरामीटर, प्रशिक्षण स्रोत कोड, रैंडम नंबर जेनरेशन और सॉफ्टवेयर फ्रेमवर्क शामिल हैं।

प्रत्येक टुकड़ा एक मॉडल को वांछित परिणाम देने के लिए एक साथ काम करने की आवश्यकता है, जिसका अर्थ है कि डेवलपर्स को साझा करने, संशोधित करने और एक प्रणाली को अपनाने और समझने के लिए पूरी दृश्यता की आवश्यकता है कि क्या हो रहा है। वैज्ञानिक विधि के आधार के रूप में पुनरुत्पादन के साथ, हालांकि, एआई उद्योग की आदत है ओपन सोर्स शब्द का उपयोग करने के लिए जो मुफ्त या कम कीमत वाले रिलीज को संदर्भित करता है जो कुछ टुकड़ों के साथ उपलब्ध हैं।

बaidu, उदाहरण के लिए, दस ERNIE 4.5 मॉडल मुफ्त में उपलब्ध कराए। मॉडल और पैरामीटर साझा करने के साथ, कंपनी ने ERNIEKit और FastDeploy डिप्लॉयमेंट टूलकिट को भी ओपन सोर्स के रूप में जारी किया। वे डेवलपर्स को शक्तिशाली एआई अनुप्रयोग बनाने के लिए उत्साहित करने वाले औद्योगिक-ग्रेड क्षमता, संसाधन-कुशल प्रशिक्षण और अनुमान प्रवाह और बहु-हार्डवेयर संगतता प्रदान करके डेवलपर्स को नवाचार को तेजी से छोड़ने में सक्षम बनाते हैं।

दूसरे शब्दों में, बaidu ने डेवलपर्स को रोमांचक उपकरण प्रदान किए हैं जो उन्हें तेजी से नवाचार को छोड़ने में सक्षम बनाते हैं, जो उन्हें प्रतिस्पर्धा से ERNIE 4.5 चुनने के लिए प्रेरित करेगा।

हालांकि, ERNIE 4.5 का लाभ उठाने वाले डेवलपर्स को अंधविश्वास से मॉडल पर विश्वास करने के लिए कहा जा रहा है, क्योंकि बaidu ने बहुत कुछ छुपाया है, जिसमें डेटासेट शामिल हैं जो इसके मॉडल को सूचित और सिखाते हैं।

पारदर्शी ओपन सोर्स एआई मॉडल की शक्ति

जबकि एआई पजल का प्रत्येक टुकड़ा एक मॉडल को काम करने के लिए महत्वपूर्ण है, 80 प्रतिशत एआई परियोजनाएं विफल हो जाती हैं, और डेटा समस्या के दिल में है। असटीक, अधूरी और पूर्वाग्रहपूर्ण डेटा सेट ऐसे मॉडल का कारण बनते हैं जो पूर्वानुमानित रूप से या वांछित रूप से व्यवहार नहीं करते हैं।

हाल ही में जारी 2023 टेस्ला फुल-सेल्फ-ड्राइविंग (एफएसडी) दुर्घटना वीडियो, उदाहरण के लिए, एक महिला की मौत के साथ एक दुर्भाग्यपूर्ण परिदृश्य को उजागर किया जब एक डेटासेट और मॉडल कम पड़ गए। जैसे ही टेस्ला मॉडल वाई एक सेटिंग सन में तेजी से बढ़ा, आंशिक रूप से स्वचालित प्रणाली अपने कैमरों द्वारा देखे जा रहे या नहीं देखे जा रहे की समझ या प्रतिक्रिया करने में सक्षम नहीं थी। जबकि मानव द्वारा संचालित कारें धीमी हो गईं और रुक गईं, एफएसडी की भ्रम का परिणाम एक महिला की मौत हुई।

यह विनाशकारी विफलता अधूरी दृश्य डेटा को दर्शाती है, साथ ही साथ एक सुरक्षा तंत्र की कमी जो ऐसे अंधे धब्बों के लिए खाता है। जब डेवलपर्स को अपने डेटा में देखने का अवसर नहीं मिलता है, तो वे यह नहीं देख सकते कि यह मॉडल के साथ कैसे बातचीत कर रहा है, जिसका अर्थ है कि वे ऐसी गलतियों का पता नहीं लगा सकते हैं और मजबूत प्रदर्शन के लिए पुनरावृत्ति नहीं कर सकते हैं।

और भी चिंताजनक, डेटा के बिना जो मॉडल को ईंधन देता है, उन्हें इस पर अंधविश्वास करने के लिए मजबूर किया जाता है।

जब डेटासेट ओपन सोर्स होते हैं, हालांकि, एआई समुदाय ने सिद्ध किया है कि यह परेशानी के मुद्दों को जड़ से निकाल देगा, जैसे कि 1,000 से अधिक यूआरएल का पता लगाना जो लायोन 5बी में सत्यापित बाल यौन शोषण सामग्री है। एआई टेक्स्ट-टू-इमेज जेनरेशन मॉडल के लिए उपयोग किए जाने वाले डेटासेट के साथ, जो स्टेबल डिफ्यूजन और मिडजॉर्नी जैसे ऐप्स बनाने में मूलभूत है, यह एआई उद्योग के लिए विनाशकारी होगा यदि उपयोगकर्ता अवैध फोटोरियलिस्टिक छवियां बनाना शुरू कर देते हैं। इसके बजाय, इस डेटासेट की खुली प्रकृति ने समुदाय को खतरनाक सामग्री का पता लगाने और एक समाधान, लायसन बी को प्रेरित करने की अनुमति दी।

इसके अलावा, उस पहले डेटासेट का अधिकांश हिस्सा वेब स्क्रैपिंग पर आधारित था जो कॉमन क्रॉल द्वारा किया गया था, जिसे चैटजीपीटी और एलएएमए मॉडल के लिए भी उपयोग किया गया था। हालांकि एआई क्रॉलर कॉपीराइट, गोपनीयता और पूर्वाग्रहपूर्ण और नस्लवादी लेबलिंग के बारे में चिंताओं को उठाते हैं, एआई समुदाय सुरक्षित उपयोग के लिए कॉमन क्रॉल के बढ़ते ओपन सोर्स डेटासेट के टुकड़ों को साफ करने के तरीके पर काम कर रहा है

जैसे ही डेवलपर्स शक्तिशाली एआई बनाने की कोशिश करते हैं, साथ ही हमें विश्वास है कि एआई पर भरोसा किया जा सकता है, दोनों उपयोगकर्ता और उद्योग दोनों को सच्चे ओपन सोर्स की पारदर्शिता और सहयोग से सुरक्षित किया जाता है।

ओपन सोर्स पथ को अपनाना

कई लोग इस बढ़ती प्रौद्योगिकी से सावधान हैं, एआई कमोडिटी मॉडल के मानक बनने की दौड़ जारी है – और जैसे ही वैश्विक एआई समुदाय साहसिक रूप से भविष्य का निर्माण कर रहा है और एआई प्रणाली पहले से ही कारों को चला रही हैं और चिकित्सा मूल्यांकन प्रदान कर रही हैं, निष्पक्ष, विश्वसनीय और सुरक्षित एआई बनाने के लिए विश्वास स्थापित करना कभी भी अधिक महत्वपूर्ण नहीं रहा है।

चीनी एआई समुदाय खुद को ओपन इनोवेशन के चैंपियन के रूप में स्थापित करने की कोशिश कर रहा है, सुरक्षित एआई के लिए मार्ग केवल दशकों से साबित हुए सॉफ्टवेयर नवाचार के माध्यम से सच्चे ओपन सोर्स की पारदर्शिता में है। महत्वपूर्ण टुकड़ों जैसे डेटा को साझा नहीं करने वाली प्रणालियों पर ओपन सोर्स शब्द फेंकना डेवलपर्स को जांच, प्रतिकृति और पुनरावृत्ति करने की अनुमति नहीं देता है। जबकि डीपसीक, ERNIE 4.5, किमी K2 और क्वेन3 जैसे तैयार मॉडल का आकर्षण अस्वीकार्य है, डेवलपर्स जो उन पर निर्भर करते हैं वे पारदर्शिता के लिए सुविधा का व्यापार करते हैं जो सहयोग और नवाचार को बढ़ावा देती है।

एआई समुदाय को चुनना होगा: वास्तविक ओपन सोर्स के माध्यम से कट्टरपंथी पारदर्शिता को अपनाना, या आज के ब्लैक बॉक्स पर कल की महत्वपूर्ण प्रणालियों का निर्माण जोखिम में।

рдбреЙ рдЬреЗрд╕рди рдХреЛрд░реНрд╕реЛ рд╡реЙрдХреНрд╕реЗрд▓51 рдореЗрдВ рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рдореБрдЦреНрдп рд╡рд┐рдЬреНрдЮрд╛рди рдЕрдзрд┐рдХрд╛рд░реА рд╣реИрдВ, рдФрд░ рдорд┐рд╢рд┐рдЧрди рд╡рд┐рд╢реНрд╡рд╡рд┐рджреНрдпрд╛рд▓рдп рдореЗрдВ рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдФрд░ рдЗрд▓реЗрдХреНрдЯреНрд░рд┐рдХрд▓ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдФрд░ рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдХреЗ рдкреНрд░реЛрдлреЗрд╕рд░ рд╣реИрдВред рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬрди рдХреЗ рдХреНрд╖реЗрддреНрд░ рдореЗрдВ рдПрдХ рджрд┐рдЧреНрдЧрдЬ, рдбреЙ рдХреЛрд░реНрд╕реЛ рдиреЗ рд╡реАрдбрд┐рдпреЛ рд╕рдордЭ, рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬреНрдЮрд╛рди рдХреЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рд╢реЛрдз рдореЗрдВ 20 рд╕реЗ рдЕрдзрд┐рдХ рд╡рд░реНрд╖реЛрдВ рдХрд╛ рд╕рдордп рджрд┐рдпрд╛ рд╣реИред