Connect with us

क्या एआई अंततः मोआत के बाहर फल-फूलेगा?

Anderson का एंगल

क्या एआई अंततः मोआत के बाहर फल-फूलेगा?

mm
A cartoon image of a SIMs-style game where a Scottish Laird in his castle is regarding the thriving villagers beyond his moat with puzzlement. GPT-1.5.

बिग एआई की लागत और प्रतिबंध, साथ ही साथ इसका हार्डवेयर लागत पर प्रभाव, उपयोगकर्ताओं को अपने सिस्टम बनाने के लिए मजबूर कर रहा है – जैसे कि बढ़ती नियमन इसके ‘शैडो एआई अर्थव्यवस्था’ को बंद करने की धमकी दे रहा है।

 

राय वैज्ञानिक अनुसंधान पत्रों में दिखने वाले कई ‘गोटचास’ में से एक यह है कि पत्र में संबोधित समस्या पहले से ही कहीं और हल हो गई है, और नई अनुसंधान का योगदान केवल आकस्मिक या क्रमिक है।

यह कई कारणों से हो सकता है: शोधकर्ता एक क्वांटम छलांग की उम्मीद कर रहे थे, लेकिन उन्हें एक क्वासी-हॉप मिला; समस्या के पहले के समाधान नए प्रस्ताव से अधिक संसाधन-गहन थे; या बस यह कि परियोजना के उद्देश्य पूरी तरह से विफल रहे, लेकिन शोधकार्य की ‘प्रकाशित-या-मरने’ संस्कृति ने टीम को इसे किसी भी तरह से जारी करने के लिए मजबूर किया (अक्सर एक पोर्टल के सबसे व्यस्त प्रकाशन दिवस के बीच में दफनाया गया)।

मशीन लर्निंग साहित्य में, हालांकि, एक अपेक्षाकृत नई और बिना माफी के कारण अधिक बार हो रहा है: यह कि प्रस्तावित विशेषता या कार्यक्षमता वर्तमान में केवल बंद-स्रोत, एपीआई-आबद्ध पोर्टलों के माध्यम से उपलब्ध है

मैं इस तरह के एक पत्र पर विचार कर रहा था – चीनी विश्वविद्यालयों और अमेज़ॅन के बीच एक सहयोग, जो कि प्रसार-आधारित छवि-संपादन प्रणालियों में वस्तु हटाने की विफलता की पुनरावृत्ति समस्या को संबोधित कर रहा है, जो अक्सर केवल लक्ष्य स्थान को एक समान वस्तु से भर देता है:

[कैप्शन आईडी = “अटैचमेंट_407380” संरेखित = “alignnone” चौड़ाई = “1200”] <img class = "size-full wp-image-407380" src="https://www.unite.ai/wp-content/uploads/2026/04/you-only-erase-once.jpg" alt = "बायें से दायें है मूल छवि, उसके दायें लाल सेगमेंटेशन मास्क जो एआई को बताता है कि छवि के किस हिस्से को हटाना है; अगला, 'हमारा', एक सफल वस्तु हटाने की दृष्टिकोण दिखाता है – और शेष दो छवियां समान प्रणालियों को दिखाती हैं जो बस को हटाने के बजाय एक अलग बस डालती हैं। स्रोत – https://arxiv.org/pdf/2603.27599v1 [/कैप्शन]

इस उदाहरण में, केंद्रीय छवि में नई दृष्टिकोण सफलतापूर्वक बस को हटाने और एक विश्वसनीय पृष्ठभूमि डालने को दिखाया गया है, जबकि दो पूर्व के तरीके (दो बायीं छवियां), जो प्रत्येक बस को हटा देते हैं, लेकिन फिर छवि में एक अलग बस डालते हैं!

गोटचा!

इस चुनौती के क्यों और कैसे को एक तरफ रखकर (और यह एक रोचक विषय है), मैंने फिर से एक क्लासिक ‘गोटचा’ का सामना किया, नए पत्र को पढ़ते हुए: लेखकों का स्वीकारोक्ति कि महंगे, प्रोप्राइटरी सिस्टम पहले से ही इस कार्य को बहुत विश्वसनीय रूप से कर सकते हैं – जो कि मुझे पता है, कुछ वर्षों से एडोब फायरफ्लाई का उपयोग करते हुए, फोटोशॉप में अन्य बंद-स्रोत सिस्टम के बीच में:

‘[प्रसार-आधारित] विधियां अक्सर अवांछित वस्तुओं को डालकर संदर्भिक रूप से असंगत [परिणाम] प्राप्त करने के लिए हॉलुसिनेट करती हैं।

‘दूसरी ओर, हाल के बंद-स्रोत बहु-मोडल मॉडल जैसे कि चैटजीपीटी और नैनो बानाना, वस्तु हटाने में अधिक शक्तिशाली हैं, लेकिन बड़े पैरामीटर गिनती और उच्च गणना ओवरहेड शामिल है, जो उन्हें एज डिवाइस पर व्यावहारिक रूप से तैनात करने से रोकता है। ‘

‘इसलिए, एक समर्पित वस्तु हटाने के मॉडल को विकसित करना बहुत जरूरी है जो न केवल श्रेष्ठ हटाने के प्रदर्शन को सक्षम बनाता है, बल्कि कम अनुमान लेटेंसी और काफी कम पैरामीटर भी享ाता है।’

यह व्याख्या तकनीकी बाधाओं पर केंद्रित है, जो यह तथ्य छुपाती है कि बंद-स्रोत वास्तुकला जैसे कि चैटजीपीटी और नैनो बानाना स्थानीय स्थापना के लिए बिल्कुल उपलब्ध नहीं हैं।

मूल रूप से, नए पत्र में यह意味ा है कि यद्यपि लक्ष्य समस्या व्यावसायिक प्रणालियों में हल हो गई है, यह हमारे लिए अप्रासंगिक हो सकता है, जिन्हें ‘वास्तविक दुनिया’ में – अर्थात, खुले स्रोत प्रणालियों में – इसे हल करने के तरीके सीखने होंगे – चाहे वे वास्तव में स्थानीय रूप से स्थापित किए जा सकते हों या नहीं।

सामांतर विकास

हालांकि, क्यों एक समस्या का समाधान करें जो अभी भी एक भुगतान प्रणाली पर निर्भर करता है, न कि प्रोप्राइटरी प्रतिबंधों के कारण, बल्कि इसलिए कि आवश्यक जीपीयू कंप्यूट vượtता है जो किसी भी स्थानीय सेटअप द्वारा वास्तव में बनाए रखा जा सकता है? अधिकांश नए ‘खुले’ पत्र और कोड रिपॉजिटरी प्रशिक्षण/अनुमान सेटअप को प्रदर्शित करते हैं जो अत्यधिक संसाधन मांग वाले हैं, जैसे कि ए100 के समूह।

यह इस बात पर निर्भर करता है कि आप इन सभी प्रतीक्षारत, अर्थव्यवस्था-विनाशक एआई डेटा सेंटर को क्या पूरा करने के लिए सोचते हैं जब वे अंततः ऑनलाइन होंगे। सामान्य लोगों के डर और अभिजात वर्ग की आशाओं को एक ही तरह से देखा जा सकता है – मोआटेड, चैटजीपीटी-स्तरीय प्रोप्राइटरी प्रणालियों को नौकरियों को विस्थापित करते हुए, लगातार सदस्यता लागत बढ़ाते हुए और सेवा स्तर को कम करते हुए, 3-5 साल तक प्रतीक्षा करने वाली शुरुआती वीसी पूंजी को संतुष्ट करने के लिए।

लेकिन साहित्य में एक बढ़ती हुई प्रवृत्ति एक वैकल्पिक भविष्य का समर्थन करती है, और ‘गो-इट-अलोन’, सीमांत भावना को कई ऑनलाइन समुदायों का समर्थन करती है, जैसे कि r/stablediffusion सबरेडिट, जो वर्तमान में 920,000 उपयोगकर्ताओं पर है, और जिसने बंद-स्रोत छवि/वीडियो पीढ़ी प्रणालियों से संबंधित पोस्टों पर प्रतिबंध लगा दिया है।

इस वैकल्पिक भविष्य में, नए वैश्विक एआई डेटा सेंटर की आपूर्ति उपयोगकर्ता-कॉन्फ़िगर, उपयोगकर्ता-परिभाषित प्रणालियों के लिए कच्चे कंप्यूट को सुविधा प्रदान करेगी, न कि चैटजीपीटी और एडोब फायरफ्लाई जैसे स्मारक ‘ब्लैक बॉक्स’ फ्रेमवर्क की मांगों को पूरा करने के लिए।

सतह घर्षण

r/stablediffusion पर जटिल, पेट्रॉन-खनन दूरस्थ जीपीयू वॉकथ्रू के माध्यम से देखते हुए, यह सभी वर्तमान में असंभव लगता है: मॉडल निरंतर रूप से लक्ष्यों को बदल रहे हैं प्रत्येक अद्यतन के साथ; वे स्थानीय रूप से तैनात करने में मुश्किल हैं, यहां तक कि सबसे आसान और सबसे उपयोगकर्ता-मित्र फ्रेमवर्क में भी; और सामान्य रूप से, शामिल घर्षण की मात्रा से पता चलता है कि यह एक ऐसा पीछा है जो केवल भावुक हॉबीइस्टों और उन कंपनियों के लिए है जो सीधे तौर पर एआई में शामिल नहीं हैं, लेकिन जो अपने स्थानीय प्रणालियों को विकसित और बनाए रखना चाहते हैं, किराए पर लेने के बजाय।

हालांकि, पिछले तीस वर्षों में, हर प्रौद्योगिकी में जहां खुले और लोकतांत्रिक सरलीकरण और कमोडिटीकरण की巨ी मांग थी, इसे प्राप्त करने की प्रवृत्ति है, जिसमें सबसे अधिक प्रसारित समाधान आमतौर पर व्यावसायिक प्रणालियों और खुले स्रोत विकल्पों और पहलों के बीच के तनाव से उत्पन्न होते हैं।

जो पीछा एक बार विशेषज्ञ ‘नर्ड’ एन्क्लेव थे, जैसे कि इंटरनेट कनेक्शन, सामग्री प्रबंधन प्रणाली और ब्लॉगिंग फ्रेमवर्क, साथ ही इंटरनेट सुरक्षा, फोटोग्राफी और मीडिया प्रबंधन, सभी जटिलता से सरलता और उपयोगिता की ओर विकसित हुए हैं।

इसलिए, बाद के एआई परिदृश्य में वर्तमान वांगार्ड एआई बाजार के नेताओं की तुलना में अधिक विविध और छोटे और वास्तविक प्रतिस्पर्धी खिलाड़ियों से भरा हो सकता है।

स्व-अभिव्यक्ति, आवश्यकता से

विडंबना यह है कि ‘बिग एआई’ अपने डेटा सेंटर के लिए सभी कंप्यूटर घटकों – विशेष रूप से DRAM – को खा रहा है, जो अन्यथा ‘सामान्य’ उपभोक्ताओं को जाने वाले थे, एंड-यूज़र्स के बीच स्वतंत्रता की एक उभरती हुई भावना को बहुत योगदान दे रहा है।

इसके परिणामस्वरूप, कई लोग एक भविष्य की कल्पना कर रहे हैं जहां बंद-स्रोत ‘वैश्विक एआई’ संसाधनों को कमजोर थिन क्लाइंट के माध्यम से एक्सेस किया जाएगा और उनके मौजूदा उपकरणों को बनाए रखने में रुचि विकसित कर रहे हैं।

एआई के तकनीकी आपूर्ति श्रृंखलाओं पर हमले ने तकनीकी सेवा प्रदाताओं को मूल्य वृद्धि करने के लिए प्रेरित किया है, या तो इसलिए कि छोटी कंपनियां वास्तव में हार्डवेयर सूखे से दबाव में हैं, या बस क्योंकि एआई

इसने स्व-होस्टिंग और ऑन-प्रीम – सहित स्व-होस्टिंग मशीन लर्निंग नेटवर्क में रुचि के विकास को जन्म दिया है।

मैं खुद हाल ही में इसमें शामिल हो गया, स्थानीय लैन स्टोरेज में फोटो और वीडियो के साथ-साथ फ़ाइल बैकअप के लिए स्थानांतरित हो गया। पूर्व के लिए, मैंने नि:शुल्क और खुले स्रोत इम्मिच मัลटी-प्लेटफ़ॉर्म मीडिया सर्वर का उपयोग किया है, जो मुझे आईक्लाउड और अन्य क्लाउड स्टोरेज प्रदाताओं की कीमत वृद्धि (और अन्य चिंताजनक मुद्दों) से दूर ले जाने में मदद कर रहा है:

[कैप्शन आईडी = “अटैचमेंट_407381” संरेखित = “alignnone” चौड़ाई = “671”] नि:शुल्क इम्मिच प्लेटफ़ॉर्म आपके मीडिया को आपके उपकरण पर रख सकता है और आपके अपने चैनलों के लिए निजी रख सकता है। इस मामले में, मैं डॉकर पर इम्मिच का भी उपयोग करता हूं ताकि मेरे एनवीडिया 3090 जीपीयू को एलएएन पर सेवा दी जा सके जहां फोटो और वीडियो सहेजे जाते हैं, ताकि अधिक शक्तिशाली जीपीयू भारी छवि/वीडियो प्रसंस्करण को संभाल सके। नि:शुल्क इम्मिच प्लेटफ़ॉर्म आपके मीडिया को आपके उपकरण पर रख सकता है और आपके अपने चैनलों के लिए निजी रख सकता है। इस मामले में, मैं डॉकर पर इम्मिच का भी उपयोग करता हूं ताकि मेरे एनवीडिया 3090 जीपीयू को एलएएन पर सेवा दी जा सके जहां फोटो और वीडियो सहेजे जाते हैं, ताकि अधिक शक्तिशाली जीपीयू भारी छवि/वीडियो प्रसंस्करण को संभाल सके।[/कैप्शन]

यदि मेरा अपना अनुभव कोई प्रतिनिधि संकेत है, तो वाइब-कोडिंग – वर्तमान में शापित कई बार ऑनलाइन समुदायों में – इस स्वतंत्रता की लहर को ईंधन दे रहा है (भले ही यह खुले स्रोत रिपॉजिटरी पर निर्भर करता है जिस पर यह निर्भर करता है)।

उदाहरण के लिए, नेटवर्किंग हमेशा मेरी कमजोरी रही है, इसलिए मुझे एक सुरक्षित वीपीएस चलाने के लिए एआई सहायता आवश्यक थी, जो एक समूह के नए स्व-होस्टेड सेवाओं का समर्थन करेगा।

इस तरह, ‘बिग एआई’ ‘छोटे एआई’ को सशक्त बना रहा है; इसलिए शायद हम वर्तमान वृद्धि को हाइपरस्केल, हाइपर-मूल्य वाली एआई कंपनियों के रूप में देख सकते हैं जो एक अधिक लोकतांत्रिक और उपयोगकर्ता-सशक्त एआई समाज के उदय से पहले एक आवश्यक लेकिन केवल संक्रमणकालीन अवस्था है, जो मोआट-खोज, किराए-खोज निगमों को त्यागे हुए बूस्टर रॉकेट की तरह त्यागते हैं – जैसे कि 2000 डॉट-कॉम बूस्ट पीछे छोड़ दिया जो वेब को तेजी से आगे बढ़ाने के लिए पर्याप्त बुनियादी ढांचा छोड़ दिया जाएगा, जो कंपनियों द्वारा भुगतान किया गया था जिन्हें 3-5 साल तक संचालन करने के लिए इंतजार करना पड़ा था।

अनुपालन का युग

खैर, यह शायद इस बार दोहराया नहीं जाएगा।

यहां तक कि अगर हम हैं एक प्रकार के एक्स-मोआट फ्रिंज समाज बनाने के लिए प्रवृत्त हैं, तो एआई के आसपास नियमन, साथ ही साथ वर्तमान वैश्विक प्रवृत्ति की ओर बढ़ते हुए आयु-प्रमाणीकरण, संभवतः इन विकास के मार्गों की प्रत्याशा करेगा और उन्हें ब्लॉक करेगा।

एक ‘शैडो एआई अर्थव्यवस्था’ को रोकने का लंगर नियमन है। पहले से ही, केंद्रीय रिपॉजिटरी जैसे गिटहब और हगिंग फेस अक्सर स्थानीय रूप से क्लोन करने से पहले ऑनलाइन लॉगिन की आवश्यकता होती है, रिपॉजिटरी की सेटिंग्स पर निर्भर करता है।

इसलिए, एआई फ्रेमवर्क की निगरानी को व्यापक रूप से वर्तमान अभ्यास से अधिक करने के लिए तंत्र पहले से ही मौजूद हैं; और वैश्विक प्रेरणा में निगरानी बढ़ाने की इच्छा अब व्यक्तिगत सरकारी पहलों से समेकित हो रही है।

तो अगर बाजार की ताकत और फॉस मूवमेंट की बुद्धिमत्ता आकस्मिक एआई तैनाती से घर्षण को दूर करती है, तो सड़कों पर वापसी के रूप में रुकावटें आ सकती हैं: अनुपालन की मांगें जो कंपनियों के लिए परेशानी से भरी हो सकती हैं, लेकिन व्यक्तियों के लिए नहीं – समान घर्षण जो उपभोक्ता-स्तर के ऑनलाइन भुगतान प्रणालियों में जोड़ा गया है 2000 के दशक में पेपैल के स्वर्ण युग के बाद से।

चाहे मेटा ने 2 अरब डॉलर ओएस-स्तर के आयु नियंत्रण के लिए लॉबिंग किया हो क्योंकि उनके महत्वपूर्ण एआई निवेश के कारण, या उनके डेटा संग्रह के हितों के कारण, बड़े प्रौद्योगिकी के समर्थन का परिणाम आयु नियंत्रण का है कि ‘स्थानीय’ एआई इतना नियमित हो सकता है जितना कि एक वर्ग-ए पदार्थ; और जैसे कि डीएमसीए को इरादा को आपराधिक बनाने के लिए डिज़ाइन किया गया था, न कि किसी विशिष्ट कॉपीराइट-एवासन तंत्र के लिए, अंतर्राष्ट्रीय एआई नियमों में सभी गैर-अनुपालन उपयोग को एक अपराधी अधिनियम बनाने की संभावना है, बहुत कम लागत (सक्रिय निगरानी के संदर्भ में) पर।

यह एक वर्ष पहले एक अत्यधिक दुर्योगी ले जाने की तरह लग सकता था – लेकिन यह कैलिफोर्निया और सिस्टमडी हार्डवेयर-स्तर के आयु प्रमाणीकरण के विचार के पीछे खड़े होने से पहले नहीं था।

निष्कर्ष

तो जबकि कानूनी और विधायी पृष्ठभूमि शायद एक उच्च नियमित स्थान में एआई को शामिल करने की तैयारी कर रही है, ताकि आकस्मिक उपयोगकर्ता अपना ‘ब्रू’ नहीं बना सकते हैं, जितना कि वे नियंत्रित पदार्थों को बढ़ा या ферमेंट नहीं कर सकते हैं अनुमति के बिना, अनुसंधान क्षेत्र अपने अधिक आशावादी दृष्टिकोण को बनाए रखता है – यह कि एआई एक लोकतांत्रिक और व्यापक समाज में एक लाभकारी बल बन जाएगा, न कि केवल सबसे लोकप्रिय बंद-स्रोत प्रदाता के अनुयायियों के लिए।

यह एआई बुलबुले के बाद के मलबे की स्थिति पर बहुत निर्भर करता है – कम से कम इतना है कि प्रदाता या तो समेकित होते हैं या बाजार लंबी अवधि में बाल्कनीकरण में बस जाता है – जो एक अधिक कोमल नियामक स्पर्श की आवश्यकता होगी।

 

पहली बार बुधवार, 1 अप्रैल, 2026 को प्रकाशित

लेखक मशीन लर्निंग पर, मानव छवि संश्लेषण में डोमेन विशेषज्ञ। Metaphysic.ai में पूर्व अनुसंधान सामग्री प्रमुख।
व्यक्तिगत साइट: martinanderson.ai
संपर्क: [email protected]
ट्विटर: @manders_ai