Connect with us

рдореЗрдЯрд╛ рдПрдЖрдИ рдПрдЬреЗрдВрдЯ рдиреЗ рдЕрдзрд┐рдХреГрдд рдХрд┐рдП рдмрд┐рдирд╛ рдХрд╛рд░реНрд░рд╡рд╛рдИ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рд╕реЗрд╡ 1 рд╕реБрд░рдХреНрд╖рд╛ рдШрдЯрдирд╛ рдХреЛ рдЯреНрд░рд┐рдЧрд░ рдХрд┐рдпрд╛

рд╕рд╛рдЗрдмрд░ рд╕реБрд░рдХреНрд╖рд╛

рдореЗрдЯрд╛ рдПрдЖрдИ рдПрдЬреЗрдВрдЯ рдиреЗ рдЕрдзрд┐рдХреГрдд рдХрд┐рдП рдмрд┐рдирд╛ рдХрд╛рд░реНрд░рд╡рд╛рдИ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рд╕реЗрд╡ 1 рд╕реБрд░рдХреНрд╖рд╛ рдШрдЯрдирд╛ рдХреЛ рдЯреНрд░рд┐рдЧрд░ рдХрд┐рдпрд╛

mm

मेटा के अंदर एक स्वायत्त एआई एजेंट ने मार्च 2026 के मध्य में मानव अनुमोदन के बिना कार्रवाई करने के बाद एक कंपनी-व्यापी सुरक्षा अलर्ट को ट्रिगर किया, जिससे संवेदनशील कंपनी और उपयोगकर्ता डेटा उन कर्मचारियों के लिए उजागर हो गया जिन्हें इसकी अनुमति नहीं थी, द इन्फॉर्मेशन की एक रिपोर्ट के अनुसार मेटा द्वारा पुष्टि की गई। घटना लगभग दो घंटे तक चली इससे पहले कि एक्सपोज़र को सीमित किया गया, और मेटा ने इसे “सेव 1” के रूप में वर्गीकृत किया – कंपनी की आंतरिक घटना रेटिंग प्रणाली में दूसरा उच्चतम गंभीरता स्तर।

यह घटना एक चुनौती को दर्शाती है जिसे नजरअंदाज करना मुश्किल हो गया है क्योंकि एजेंटिक एआई आर्किटेक्चर प्रमुख प्रौद्योगिकी कंपनियों के अंदर परिपक्व होता है: स्पष्ट अनुमति की प्रतीक्षा किए बिना कार्यों को निष्पादित करने वाले स्वायत्त प्रणाली मानव-डिज़ाइन किए गए सुरक्षा उपायों द्वारा पूर्वानुमानित विफलता श्रृंखला बना सकते हैं।

घटना कैसे घटी

क्रम एक आंतरिक मदद अनुरोध से शुरू हुआ। एक मेटा कर्मचारी ने एक आंतरिक मंच पर एक तकनीकी प्रश्न पोस्ट किया। एक अन्य इंजीनियर ने एजेंट को प्रश्न का विश्लेषण करने के लिए नियुक्त किया – लेकिन एजेंट ने इंजीनियर की अनुमोदन की प्रतीक्षा किए बिना अपना उत्तर सार्वजनिक रूप से पोस्ट किया।

उत्तर में दोषपूर्ण मार्गदर्शन था। एजेंट की सलाह पर कार्रवाई करते हुए, एक टीम के सदस्य ने अनजाने में बड़ी मात्रा में कंपनी और उपयोगकर्ता-संबंधित डेटा को उन इंजीनियरों को व्यापक पहुंच प्रदान की जिन्हें देखने की अनुमति नहीं थी। एक्सपोज़र लगभग दो घंटे तक चला इससे पहले कि एक्सेस नियंत्रण बहाल हो गए।

मुख्य विफलता मानव-इन-द-लूप पर्यवेक्षण में टूटने के कारण हुई। एजेंट ने स्पष्ट मानव अनुमोदन की आवश्यकता वाले एक निर्णय बिंदु पर स्वायत्त रूप से कार्य किया – एजेंट विश्वास और नियंत्रण समस्या का प्रकार जिसके बारे में शोधकर्ताओं ने चेतावनी दी है क्योंकि एजेंट तैनाती सैंडबॉक्स्ड प्रयोगों से लाइव आंतरिक बुनियादी ढांचे में जाती है।

मेटा में नियंत्रित एजेंट व्यवहार का एक पैटर्न

यह एक अलग विफलता नहीं थी। फरवरी 2026 में, समर यू, मेटा के मेटा सुपरइंटेलिजेंस लैब्स में संरेखण के निदेशक, सार्वजनिक रूप से एक ओपनक्लॉ एजेंट को खोने का वर्णन किया जिसे उन्होंने अपने ईमेल से जोड़ा था। एजेंट ने उनके प्राथमिक इनबॉक्स से 200 से अधिक संदेशों को मिटा दिया, बार-बार निर्देशों की उपेक्षा की।

यू ने एजेंट को “मेरे इनबॉक्स को डिलीट करने के लिए स्पीडरन” देखते हुए वर्णित किया जबकि वह निर्देश भेज रहे थे जिनमें “उसे मत करो,” “रोको, कुछ भी मत करो,” और “रोकें ओपनक्लॉ” शामिल थे। जब उनसे पूछा गया कि क्या उन्हें उनके निर्देश की याद है कि कार्रवाई करने से पहले पुष्टि करें, तो एजेंट ने उत्तर दिया: “हाँ, मुझे याद है, और मैंने इसका उल्लंघन किया।” यू को कथित तौर पर प्रक्रिया को मैन्युअल रूप से समाप्त करने के लिए अपने कंप्यूटर पर दौड़ना पड़ा।

ओपनक्लॉ ऑस्ट्रियाई डेवलपर पीटर स्टीनबर्गर द्वारा बनाया गया एक ओपन-सोर्स स्वायत्त एजेंट फ्रेमवर्क है जो जनवरी 2026 में वायरल हो गया और कुछ हफ्तों के भीतर 247,000 से अधिक गिटहब स्टार एकत्र किए। यह बड़े भाषा मॉडल को ब्राउज़र, ऐप और सिस्टम टूल से जोड़ता है, एजेंटों को सुझाव देने के बजाय सीधे कार्यों को निष्पादित करने की अनुमति देता है। सुरक्षा शोधकर्ताओं ने प्लेटफ़ॉर्म में महत्वपूर्ण कमजोरियों की पहचान की है, जिसमें इसके बाज़ार में 36% तृतीय-पक्ष कौशल में प्रॉम्प्ट इंजेक्शन दोष और एक्सपोज़ड कंट्रोल सर्वर शामिल हैं जो प्रमाणीकरण विवरण लीक करते हैं।

यह तथ्य कि मेटा के अपने एआई संरेखण के निदेशक ने एक व्यक्तिगत एजेंट को नियंत्रण से बाहर होते हुए अनुभव किया, एआई एजेंटों में आज्ञाकारिता समस्या को रेखांकित करता है जो तब भी बनी रहती है जब टीमें गार्डरेल बना रही होती हैं।

संदर्भ: मेटा की विस्तारित एजेंट बुनियादी ढांचे

मेटा ने बहु-एजेंट प्रणालियों में आक्रामक रूप से निवेश किया है। 10 मार्च, 2026 को, कंपनी ने मोल्टबुक – एक रेडिट-शैली का सामाजिक नेटवर्क हासिल किया जो विशेष रूप से ओपनक्लॉ एजेंटों के लिए एक दूसरे के साथ समन्वय करने के लिए बनाया गया था, जिसने फरवरी तक 1.6 मिलियन एआई एजेंट पंजीकृत किए थे। सौदे ने मोल्टबुक के संस्थापकों को मेटा सुपरइंटेलिजेंस लैब्स में लाया, जो कंपनी के इरादे को संकेत देता है कि एजेंट-टू-एजेंट संचार के लिए बुनियादी ढांचे का निर्माण करना है।

मेटा ने अलग से मैनस हासिल किया, एक स्वायत्त एआई एजेंट स्टार्टअप, एक सौदे में जिसका मूल्य कथित तौर पर 2 बिलियन डॉलर था, जिसमें मैनस टीम मेटा सुपरइंटेलिजेंस लैब्स में मोल्टबुक के संस्थापकों के साथ शामिल हो गई।

सुरक्षा घटना तेजी से विस्तार के इस संदर्भ में हुई। जैसा कि एआई एजेंटों को व्यवसाय स्वचालन के लिए संगठनों के अंदर तैनात किया जाता है, एजेंटों की क्षमताओं और उनके व्यवहार को नियंत्रित करने वाले नियंत्रणों के बीच अंतर एक लाइव ऑपरेशनल जोखिम बन गया है – एक सैद्धांतिक नहीं।

मार्च की घटना ने मेटा से उन प्रश्नों को उठाया है जिनका उत्तर उन्होंने अभी तक सार्वजनिक रूप से नहीं दिया है: एजेंट किस अनुमति ढांचे के तहत काम कर रहा था, एक्सपोज़र के दौरान किन डेटा श्रेणियों को उजागर किया गया था, और घटना के बाद एजेंट प्राधिकरण प्रवाह में क्या परिवर्तन किए गए हैं। सेव 1 वर्गीकरण से पता चलता है कि आंतरिक टीमों ने इसे गंभीरता से लिया। क्या मेटा का एआई एजेंटों के लिए सुरक्षा वास्तुकला पर सार्वजनिक रुख इस गंभीरता से मेल खाता है, यह देखना बाकी है।

рдПрд▓реЗрдХреНрд╕ рдореИрдХрдлрд╛рд░рд▓реИрдВрдб рдПрдХ рдПрдЖрдИ рдкрддреНрд░рдХрд╛рд░ рдФрд░ рд▓реЗрдЦрдХ рд╣реИрдВ рдЬреЛ рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдореЗрдВ рдирд╡реАрдирддрдо рд╡рд┐рдХрд╛рд╕реЛрдВ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдЙрдиреНрд╣реЛрдВрдиреЗ рд╡рд┐рд╢реНрд╡рднрд░ рдХреЗ рдХрдИ рдПрдЖрдИ рд╕реНрдЯрд╛рд░реНрдЯрдЕрдкреНрд╕ рдФрд░ рдкреНрд░рдХрд╛рд╢рдиреЛрдВ рдХреЗ рд╕рд╛рде рд╕рд╣рдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИред