Информационная безопасность

Агент Meta AI спровоцировал инцидент безопасности Sev 1, действуя без разрешения.

опубликованный 19 марта 2026

Алекс МакФарланд

Согласно сообщениям, в середине марта 2026 года автономный агент искусственного интеллекта внутри Meta вызвал общекорпоративное оповещение о безопасности, совершив действия без одобрения человека и раскрыв конфиденциальные данные компании и пользователей сотрудникам, не имевшим к ним доступа. репортаж из информационного Подтверждено Meta. Инцидент продолжался около двух часов, прежде чем утечка была локализована, и Meta классифицировала его как «Sev 1» — второй по величине уровень серьезности во внутренней системе оценки инцидентов компании.

Этот инцидент отражает проблему, которую становится все труднее игнорировать, поскольку агентная архитектура ИИ Внутри крупных технологических компаний наблюдается тенденция к развитию автономных систем, которые выполняют задачи, не дожидаясь явного разрешения. Это может привести к цепочкам сбоев, которые не предусмотрены разработанными человеком средствами защиты.

Как развивался инцидент

Все началось с обычного внутреннего запроса о помощи. Сотрудник Meta задал технический вопрос на внутреннем форуме. Другой инженер привлек ИИ-агента для анализа вопроса, но тот опубликовал свой ответ публично, не получив предварительного разрешения инженера на его распространение.

В этом ответе содержались ошибочные указания. Действуя по совету агента, член команды по ошибке предоставил инженерам, не имевшим на это полномочий, широкий доступ к большим объемам данных компании и пользователей. Утечка данных продолжалась примерно два часа, после чего контроль доступа был восстановлен.

Основная причина сбоя заключалась в отсутствии контроля со стороны человека. Агент действовал автономно в момент принятия решения, которое должно было потребовать явного одобрения человека — своего рода... доверие и контроль агентов проблема, о которой предупреждали исследователи по мере перехода развертывания агентов от изолированных экспериментов к работе во внутренней действующей инфраструктуре.

Модель неконтролируемого поведения агентов в Meta

Это не был единичный случай. В феврале 2026 года Саммер Юэ, директор по согласованию в Meta Superintelligence Labs, публично описал потерю контроля над агентом OpenClaw. Она подключилась к своей электронной почте. Агент удалил более 200 сообщений из ее основного почтового ящика, игнорируя неоднократные указания прекратить это.

Юэ описала, как наблюдала, как агент «быстро удалял мои входящие сообщения», пока она отправляла команды, в том числе «Не делай этого», «Стоп, ничего не делай» и «СТОП, ОТКРЫТЫЙ КОГТЬ». На вопрос, помнит ли агент ее указание подтверждать любые изменения перед действием, агент ответил: «Да, помню, и я нарушила его». Сообщается, что Юэ пришлось бежать к компьютеру, чтобы вручную прервать процесс.

OpenClaw Это платформа для создания автономных агентов с открытым исходным кодом, разработанная австрийским программистом Петером Штайнбергером, которая стала вирусной в январе 2026 года и за несколько недель набрала более 247 000 звезд на GitHub. Она связывает большие языковые модели с браузерами, приложениями и системными инструментами, позволяя агентам выполнять задачи напрямую, а не просто предлагать варианты. Исследователи безопасности выявили значительные уязвимости в этой платформе. включая обнаруженные в 36% сторонних навыков на своей торговой площадке уязвимости, связанные с мгновенной инъекцией. и уязвимые серверы управления, допускающие утечку учетных данных.

Тот факт, что собственный директор Meta по согласованию ИИ столкнулся с тем, что персональный агент вышел из-под контроля, подчеркивает Проблема подчинения у агентов ИИ Это сохраняется даже в командах, занимающихся установкой ограждений.

Контекст: Расширение агентской инфраструктуры Meta

Компания Meta активно инвестирует в многоагентные системы. 10 марта 2026 года компания приобрела Moltbook — социальную сеть в стиле Reddit, созданную специально для координации действий агентов OpenClaw, которая к февралю зарегистрировала 1.6 миллиона агентов ИИ. Эта сделка позволила основателям Moltbook войти в состав Meta Superintelligence Labs, что свидетельствует о намерении компании создать инфраструктуру для масштабной коммуникации между агентами.

Компания Meta также приобрела этот товар отдельно. МанусКомпания Manus, занимающаяся разработкой автономных ИИ-агентов, заключила сделку, стоимость которой, по сообщениям, оценивается в 2 миллиарда долларов. Команда Manus присоединилась к Meta Superintelligence Labs вместе с основателями Moltbook.

Инцидент, связанный с безопасностью, произошел в контексте стремительного развития. Искусственный интеллект используется для автоматизации бизнес-процессов. Внутри организаций разрыв между возможностями агентов и механизмами контроля, регулирующими их поведение, стал реальным операционным риском, а не теоретическим.

Инцидент в марте поднимает острые вопросы, на которые Meta пока не дала публичных ответов: в рамках какой конкретной системы разрешений работал внутренний агент, какие категории данных были раскрыты в течение двухчасового периода и какие изменения в потоках авторизации агентов были внесены с тех пор. Классификация Sev 1 предполагает, что внутренние команды отнеслись к этому серьезно. Соответствует ли публичная позиция Meta в отношении архитектуры безопасности для агентов ИИ этой серьезности, покажет время.

Похожие темы:информационной безопасности цель открытый коготь

Алекс МакФарланд

Алекс МакФарланд — журналист и писатель, занимающийся искусственным интеллектом. Он сотрудничал с многочисленными стартапами и публикациями в области искусственного интеллекта по всему миру.

Unite.ИИ

Агент Meta AI спровоцировал инцидент безопасности Sev 1, действуя без разрешения.

Как развивался инцидент

Модель неконтролируемого поведения агентов в Meta

Контекст: Расширение агентской инфраструктуры Meta

Вам может понравиться