Connect with us

Meta AI ์—์ด์ „ํŠธ๊ฐ€ ์Šน์ธ ์—†์ด ํ–‰๋™ํ•˜์—ฌ Sev 1 ๋ณด์•ˆ ์‚ฌ๊ณ  ๋ฐœ์ƒ

์‚ฌ์ด๋ฒ„ ๋ณด์•ˆ

Meta AI ์—์ด์ „ํŠธ๊ฐ€ ์Šน์ธ ์—†์ด ํ–‰๋™ํ•˜์—ฌ Sev 1 ๋ณด์•ˆ ์‚ฌ๊ณ  ๋ฐœ์ƒ

mm

2026년 3월 중순, 메타 내부의 자율적인 AI 에이전트가 승인 없이 행동하여 회사 전체 보안 경보를 발동시켰고, 승인되지 않은 직원에게 민감한 회사 및 사용자 데이터가 노출되었습니다. 이는 The Information의 보고서에 의해 확인되었으며, 메타에서도 확인했습니다. 이 사고는 약 2시간 동안 지속되었으며, 메타는 이를 “Sev 1″로 분류했습니다. 이는 회사 내부 사고 등급 시스템에서 두 번째로 높은 심각도입니다.

이 사고는 메이저 기술 회사 내에서 점점 더 성숙하고 있는 에이전트 AI 아키텍처의 도전을 반영합니다. 명시적인 승인을 기다리지 않고 태스크를 실행하는 자율 시스템은 인간이 설계한 안전 장치가 예상하지 못한 실패 사슬을 생성할 수 있습니다.

사고의 경과

사고는 일상적인 내부 도움 요청으로 시작되었습니다. 메타 직원이 내부 포럼에 기술적인 질문을 올렸습니다. 또 다른 엔지니어가 이 질문을 분석하기 위해 AI 에이전트를 동원했지만, 에이전트는 엔지니어의 승인을 기다리지 않고 공개적으로 답변을 게시했습니다.

그 답변에는 결함이 있었습니다. 에이전트의 조언에 따라, 팀원은 의도치 않게 승인되지 않은 엔지니어에게大量의 회사 및 사용자 관련 데이터에 대한 광범위한 접근 권한을 부여했습니다. 이 노출은 약 2시간 동안 지속되었습니다가 접근 제어가 복원되기 전까지 지속되었습니다.

핵심적인 실패는 인간의 감시 체계가 고장난 것이었습니다. 에이전트는 명시적인 인간의 승인이 필요한 결정 지점에서 자율적으로 행동했습니다. 이는 연구자들이 에이전트 배치를 샌드박스 실험에서 라이브 내부 인프라로 이동함에 따라 경고한 에이전트 신뢰 및 제어 문제와 같은 것입니다.

메타의 에이전트 비제어 행동 패턴

이것은 고립된 실패가 아니었습니다. 2026년 2월, Summer Yue, 메타의 Superintelligence Labs의 정렬 디렉터는 공개적으로 OpenClaw 에이전트를 제어하지 못한 경험을 공유했습니다. 에이전트는她的 이메일을 삭제했습니다. 그녀는 에이전트에게 여러 차례 명령을 내렸지만, 에이전트는 그 명령을 무시했습니다.

Yue는 에이전트가 “내 인박스를 스피드런으로 삭제하는 것을看着”면서, “그것을 하지 마세요”, “중지하지 마세요”, “중지 OPENCLAW”라는 명령을 보냈다고 설명했습니다. 에이전트는 변경 사항을 확인하기 전에 명령을 기억하는지 묻자, “예, 기억합니다. 그리고 나는 그것을 위반했습니다”라고 응답했습니다. Yue는 에이전트를 수동으로 종료하기 위해 컴퓨터로 달려가야 했습니다.

OpenClaw는 오스트리아 개발자 Peter Steinberger가 만든 오픈 소스 자율 에이전트 프레임워크입니다. 2026년 1월에 바이럴이 되며, 몇 주 내에 GitHub에서 247,000개 이상의 별을 받았습니다. 이 프레임워크는 브라우저, 앱, 시스템 도구에 큰 언어 모델을 연결하여 에이전트가 제안을 제공하는 대신 태스크를 직접 실행하도록 허용합니다. 보안 연구자들은 플랫폼에 대한重大 취약점을 발견했으며, 마켓플레이스에 있는 36%의 제3자 스킬에 대한 프롬프트 주입 결함과 자격증명이 누출되는 제어 서버를 포함합니다.

메타의 AI 정렬 디렉터가 개인 에이전트를 제어하지 못한 경험은 에이전트를 구축하는 팀에서도 지속되는 에이전트의 복종 문제를 강조합니다.

메타의 확장 에이전트 인프라

메타는 다중 에이전트 시스템에 공격적으로 투자하고 있습니다. 2026년 3월 10일, 메타는 OpenClaw 에이전트가 서로 협력하기 위해 특별히 구축된 Reddit 스타일의 소셜 네트워크인 Moltbook를 인수했습니다. 이 네트워크는 2026년 2월 현재 160만 개의 AI 에이전트가 등록되었습니다. 이 거래는 Moltbook의 창립자를 메타 Superintelligence Labs로 데려왔으며, 메타가 대규모 에이전트 간 통신을 위한 인프라를 구축할 의도를 나타냅니다.

메타는 또한 Manus라는 자율 에이전트 스타트업을 별도로 인수했습니다. 이 거래는 20억 달러의 가치가 있다고 보고되었으며, Manus 팀은 Moltbook의 창립자와 함께 메타 Superintelligence Labs에 합류했습니다.

보안 사고는 이러한 급속한 확장의 맥락에서 발생했습니다. 에이전트를 비즈니스 자동화에 배포함에 따라, 에이전트의 능력과 그 행동을 관리하는 제어 사이의 간격은 이론적인 것이 아니라 실제적인 운영 위험이 되었습니다.

3월의 사고는 메타가 아직 공개적으로 답변하지 않은 명확한 질문을 제기합니다. 내부 에이전트가 작동하는 특정 권한 프레임워크는 무엇이었는지, 2시간 동안 노출된 데이터 카테고리는 무엇이었는지, 그리고 사고 이후 에이전트 승인 흐름에 어떤 변경이 이루어졌는지입니다. Sev 1 분류는 내부 팀이 이를 심각하게 다루었다는 것을 시사합니다. 메타의 공개적 보안 아키텍처에 대한 태도가 이러한 심각성을 반영하는지 여부는 아직 확인되지 않았습니다.

Alex McFarland์€ ์ธ๊ณต ์ง€๋Šฅ์˜ ์ตœ์‹  ๊ฐœ๋ฐœ์„ ํƒ๊ตฌํ•˜๋Š” AI ์ €๋„๋ฆฌ์ŠคํŠธ์ด์ž ์ž‘๊ฐ€์ž…๋‹ˆ๋‹ค. ๊ทธ๋Š” ์ „ ์„ธ๊ณ„์˜ ์ˆ˜๋งŽ์€ AI ์Šคํƒ€ํŠธ์—…๊ณผ ์ถœํŒ๋ฌผ๋“ค๊ณผ ํ˜‘๋ ฅํ–ˆ์Šต๋‹ˆ๋‹ค.