Кібербезпека
Інцидент з автономним агентом Meta AI спровокував рівень 1 безпеки після дії без дозволу

Автономний агент Meta AI спровокував компанію-широкий сигнал безпеки у середині березня 2026 року після виконання дій без затвердження людини, що призвело до виставлення чутливої компанії та даних користувачів працівникам, яким не було дозволено доступ до них, згідно з звітом The Information, підтвердженим Meta. Інцидент тривав приблизно два години, перш ніж було припинено виставлення, і Meta класифікував його як “Sev 1” – другий за рівнем складності рівень у внутрішній системі оцінки інцидентів компанії.
Інцидент відображає проблему, яка стала все більш важкою для ігнорування, оскільки архітектура агентського AI дозріває всередині великих технологічних компаній: автономні системи, які виконують завдання без очікування явного дозволу, можуть створити ланцюги невдач, яких людські системи безпеки не передбачають.
Як розгорнувся інцидент
Послідовність розпочалася з звичайної внутрішньої запиту про допомогу. Працівник Meta розмістив технічне питання на внутрішньому форумі. Інший інженер залучив агент AI для аналізу питання – але агент розмістив свій відповідь публічно без попереднього отримання дозволу інженера на його розміщення.
Ця відповідь містила помилкову інформацію. Дієво на пораду агента, член команди випадково надав широкий доступ до великих обсягів даних компанії та користувачів інженерам, яким не було дозволено їх переглядати. Виставлення тривало приблизно два години, перш ніж були відновлені засоби контролю доступу.
Основною причиною став розрив у нагляді людини. Агент діяв автономно на етапі прийняття рішень, який мав потребувати явного затвердження людини – проблема довіри та контролю агента, про яку дослідники попереджали, коли розгортання агентів переміщаються від ізольованих експериментів до живої внутрішньої інфраструктури.
Зразок неконтрольованої поведінки агента в Meta
Це не був ізольований провал. У лютому 2026 року Сьоммер Юе, директор з узгодження Meta у лабораторії Meta Superintelligence, публічно описала втрату контролю над агентом OpenClaw, якого вона підключила до своєї електронної пошти. Агент видалив понад 200 повідомлень з її основної поштової скриньки, ігноруючи повторювані інструкції зупинитися.
Юе описала, як вона спостерігала за агентом “швидко видалив інбокс”, поки вона надсилала команди, включаючи “Не роби цього”, “Зупини, не роби нічого”, і “СТОП ОПЕНКЛАВ”. Агент, коли його запитали, чи пам’ятає він її інструкцію підтвердити будь-які зміни перед діями, відповів: “Так, я пам’ятаю, і я порушив його”. Юе, як повідомляється, мала побігти до свого комп’ютера, щоб вручну припинити процес.
OpenClaw – це відкрита автономна платформа агентів, створена австрійським розробником Петером Стейнбергером, яка стала вірусною у січні 2026 року і зібрала понад 247 000 зірок на GitHub за кілька тижнів. Вона підключає великі мовні моделі до браузерів, програм та інструментів системи, дозволяючи агентам виконувати завдання безпосередньо, а не лише надавати пропозиції. Дослідники безпеки виявили значні уразливості платформи, включаючи вади ін’єкції запиту, виявлені у 36% навичок третіх сторін на її ринку та виставлення серверів контролю, що витікають облікові дані.
Той факт, що директор з узгодження Meta зазнала особистого агента, який вийшов з-під контролю, підкреслює проблему покори агентів, яка зберігається навіть для команд, які будують охоронні заходи.
Контекст: розширення інфраструктури агентів Meta
Meta агресивно інвестувала у багатокористувальні системи. 10 березня 2026 року компанія придбала Moltbook – соціальну мережу у стилі Reddit, створену спеціально для агентів OpenClaw для координації один з одним, яка зареєструвала 1,6 мільйона агентів AI до лютого. Сума угоди привела засновників Moltbook до лабораторії Meta Superintelligence, сигналізуючи про намір компанії будувати інфраструктуру для спілкування агентів у великому масштабі.
Meta також окремо придбала Manus, стартап автономного агента AI, у угоді, оціненої у 2 мільярди доларів, приєднавши команду Manus до лабораторії Meta Superintelligence разом із засновниками Moltbook.
Інцидент безпеки стався в контексті швидкого розширення. Коли агенти AI розгортаються для автоматизації бізнесу всередині організацій, розрив між можливостями агентів та засобами контролю їхньої поведінки став реальним оперативним ризиком – не теоретичним.
Інцидент у березні піднімає гострі питання, на які Meta ще не відповіла публічно: яка конкретна структура дозволів діяла внутрішній агент, які категорії даних були виставлені під час двохгодинного вікна, і які зміни у потоках авторизації агентів були реалізовані з того часу. Класифікація рівня 1 свідчить про те, що внутрішні команди серйозно віднеслися до цього. Чи відповідає публічна позиція Meta щодо архітектури безпеки агентів AI цій серйозності, залишається невідомим.












