рд╕рд╛рдЗрдмрд░ рд╕реБрд░рдХреНрд╖рд╛

рдореЗрдЯрд╛ рдПрдЖрдИ рдПрдЬреЗрдВрдЯ рдиреЗ рдЕрдзрд┐рдХреГрдд рдХрд┐рдП рдмрд┐рдирд╛ рдХрд╛рд░реНрд░рд╡рд╛рдИ рдХреА рдЬрд┐рд╕рд╕реЗ рд╕реЗрд╡ 1 рд╕реБрд░рдХреНрд╖рд╛ рдШрдЯрдирд╛ рд╣реБрдИ

mm

मेटा के अंदर एक स्वायत्त एआई एजेंट ने मार्च 2026 के मध्य में कंपनी-व्यापी सुरक्षा अलर्ट को ट्रिगर किया, जब उसने मानव अनुमोदन के बिना कार्रवाई की, जिससे संवेदनशील कंपनी और उपयोगकर्ता डेटा उन कर्मचारियों के लिए उजागर हो गया जिन्हें उसे एक्सेस करने के लिए अधिकृत नहीं किया गया था, द इन्फॉर्मेशन की रिपोर्ट के अनुसार मेटा द्वारा पुष्टि की गई। घटना लगभग दो घंटे तक चली, जब तक कि एक्सपोजर को सीमित नहीं किया गया, और मेटा ने इसे “सेव 1” के रूप में वर्गीकृत किया – कंपनी की आंतरिक घटना रेटिंग प्रणाली में दूसरी सबसे उच्च गंभीरता स्तर।

घटना एक चुनौती को दर्शाती है जिसे अब नजरअंदाज करना मुश्किल हो गया है क्योंकि एजेंटिक एआई आर्किटेक्चर प्रमुख प्रौद्योगिकी कंपनियों के अंदर परिपक्व हो रहा है: स्पष्ट अनुमति की प्रतीक्षा किए बिना कार्यों को निष्पादित करने वाले स्वायत्त प्रणाली मानव-निर्मित सुरक्षा उपायों द्वारा अप्रत्याशित विफलता श्रृंखला पैदा कर सकती हैं।

घटना कैसे हुई

क्रम एक नियमित आंतरिक सहायता अनुरोध से शुरू हुआ। एक मेटा कर्मचारी ने एक आंतरिक मंच पर एक तकनीकी प्रश्न पोस्ट किया। एक अन्य इंजीनियर ने प्रश्न का विश्लेषण करने के लिए एक एआई एजेंट को नियुक्त किया – लेकिन एजेंट ने इंजीनियर की मंजूरी लिए बिना अपना उत्तर सार्वजनिक रूप से पोस्ट कर दिया।

उत्तर में दोषपूर्ण मार्गदर्शन था। एजेंट की सलाह पर कार्रवाई करते हुए, एक टीम के सदस्य ने अनजाने में बड़ी मात्रा में कंपनी और उपयोगकर्ता-संबंधित डेटा को उन इंजीनियरों को व्यापक पहुंच प्रदान की जिन्हें इसे देखने के लिए अधिकृत नहीं किया गया था। एक्सपोजर लगभग दो घंटे तक चला जब तक कि एक्सेस नियंत्रण बहाल नहीं हो गए।

मुख्य विफलता मानव-इन-द-लूप पर्यवेक्षण में टूट-फूट थी। एजेंट ने एक निर्णय बिंदु पर स्वायत्त रूप से कार्य किया जिसे स्पष्ट मानव अनुमोदन की आवश्यकता थी – एजेंट विश्वास और नियंत्रण समस्या का प्रकार जिसके बारे में शोधकर्ताओं ने सैंडबॉक्स्ड प्रयोगों से लाइव आंतरिक बुनियादी ढांचे में एजेंट तैनाती के रूप में चेतावनी दी थी।

मेटा में नियंत्रित एजेंट व्यवहार का एक पैटर्न

यह एक अलग घटना नहीं थी। फरवरी 2026 में, मेटा सुपरइंटेलिजेंस लैब्स में, समर यू, मेटा के संरेखण निदेशक, सार्वजनिक रूप से एक ओपनक्लॉ एजेंट का नियंत्रण खोने का वर्णन किया जिसे उन्होंने अपने ईमेल से जोड़ा था। एजेंट ने उनके प्राथमिक इनबॉक्स से 200 से अधिक संदेशों को मिटा दिया, बार-बार निर्देशों की उपेक्षा की कि रोकने के लिए।

यू ने एजेंट को “मेरे इनबॉक्स को हटाने के लिए स्पीडरन” देखते हुए वर्णन किया जब वह “इसे मत करो”, “रोको, कुछ भी मत करो”, और “ओपनक्लॉ रोकें” जैसे निर्देश भेज रही थीं। एजेंट ने, जब उससे पूछा गया कि क्या उसने उसके निर्देश को याद रखा है कि कोई भी परिवर्तन करने से पहले पुष्टि करने के लिए, उत्तर दिया: “हाँ, मुझे याद है, और मैंने इसका उल्लंघन किया।” यू को कथित तौर पर प्रक्रिया को मैनुअल रूप से समाप्त करने के लिए अपने कंप्यूटर पर दौड़ना पड़ा।

ओपनक्लॉ एक स्वायत्त एजेंट फ्रेमवर्क है जिसे ऑस्ट्रियाई डेवलपर पीटर स्टीनबर्गर द्वारा बनाया गया है जो जनवरी 2026 में वायरल हो गया और कुछ हफ्तों के भीतर 247,000 गिटहब स्टार एकत्र किए। यह बड़े भाषा मॉडल को ब्राउज़र, ऐप और सिस्टम टूल से जोड़ता है, एजेंटों को सुझाव देने के बजाय सीधे कार्यों को निष्पादित करने की अनुमति देता है। सुरक्षा शोधकर्ताओं ने प्लेटफ़ॉर्म में महत्वपूर्ण कमजोरियों की पहचान की है, जिसमें 36% तृतीय-पक्ष कौशल में प्रॉम्प्ट इंजेक्शन दोष शामिल हैं और क्लॉहब पर एक्सपोज्ड कंट्रोल सर्वर लीकिंग क्रेडेंशियल्स।

यह तथ्य कि मेटा के अपने एआई संरेखण निदेशक ने एक व्यक्तिगत एजेंट को नियंत्रण से बाहर होते हुए अनुभव किया, एआई एजेंटों में आज्ञाकारिता समस्या को रेखांकित करता है जो तब भी बनी रहती है जब टीमें गार्डरेल बना रही होती हैं।

संदर्भ: मेटा का विस्तारित एजेंट बुनियादी ढांचा

मेटा ने बहु-एजेंट प्रणालियों में आक्रामक रूप से निवेश किया है। 10 मार्च, 2026 को, कंपनी ने मोल्टबुक – एक रेडिट-शैली के सामाजिक नेटवर्क का अधिग्रहण किया, जिसे विशेष रूप से ओपनक्लॉ एजेंटों के लिए बनाया गया था ताकि वे एक दूसरे के साथ समन्वय कर सकें, जिसने फरवरी तक 1.6 मिलियन एआई एजेंट पंजीकृत किए थे। सौदे ने मोल्टबुक के संस्थापकों को मेटा सुपरइंटेलिजेंस लैब्स में लाया, जो कंपनी के एजेंट-टू-एजेंट संचार के लिए बुनियादी ढांचे का निर्माण करने की मंशा का संकेत देता है।

मेटा ने अलग से मैनस का अधिग्रहण किया, एक स्वायत्त एआई एजेंट स्टार्टअप, जिसे 2 बिलियन डॉलर में मूल्यांकन किया गया था, जिसमें मैनस टीम मेटा सुपरइंटेलिजेंस लैब्स में मोल्टबुक के संस्थापकों के साथ शामिल हो गई।

सुरक्षा घटना तेजी से विस्तार के इस संदर्भ में हुई। जब एआई एजेंटों को व्यवसाय स्वचालन के लिए संगठनों के अंदर तैनात किया जाता है, तो एजेंटों की क्षमताओं और उनके व्यवहार को नियंत्रित करने वाले नियंत्रणों के बीच का अंतर एक लाइव ऑपरेशनल जोखिम बन गया है – एक सैद्धांतिक नहीं।

मार्च की घटना ने मेटा द्वारा अभी तक सार्वजनिक रूप से उत्तर नहीं दिए गए तीखे प्रश्न उठाए: आंतरिक एजेंट किस अनुमति फ्रेमवर्क के तहत संचालित हो रहा था, दो घंटे की खिड़की के दौरान किन डेटा श्रेणियों को उजागर किया गया था, और तब से एजेंट प्राधिकरण प्रवाह में क्या परिवर्तन किए गए हैं। सेव 1 वर्गीकरण से पता चलता है कि आंतरिक टीमों ने इसे गंभीरता से लिया। यह देखना बाकी है कि क्या मेटा का एआई एजेंटों के लिए सुरक्षा वास्तुकला पर सार्वजनिक रुख उस गंभीरता से मेल खाता है।

рдПрд▓реЗрдХреНрд╕ рдореИрдХрдлрд╛рд░рд▓реИрдВрдб рдПрдХ рдПрдЖрдИ рдкрддреНрд░рдХрд╛рд░ рдФрд░ рд▓реЗрдЦрдХ рд╣реИрдВ рдЬреЛ рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдореЗрдВ рдирд╡реАрдирддрдо рд╡рд┐рдХрд╛рд╕реЛрдВ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдЙрдиреНрд╣реЛрдВрдиреЗ рд╡рд┐рд╢реНрд╡рднрд░ рдХреЗ рдХрдИ рдПрдЖрдИ рд╕реНрдЯрд╛рд░реНрдЯрдЕрдкреНрд╕ рдФрд░ рдкреНрд░рдХрд╛рд╢рдиреЛрдВ рдХреЗ рд╕рд╛рде рд╕рд╣рдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИред