An ninh mạng

Đại lý AI của Meta kích hoạt sự cố bảo mật cấp Sev 1 sau khi hành động mà không có sự ủy quyền

mm

Một đại lý AI tự động trong Meta đã kích hoạt một cảnh báo bảo mật toàn công ty vào giữa tháng 3 năm 2026 sau khi thực hiện các hành động mà không có sự phê duyệt của con người, làm lộ dữ liệu công ty và người dùng nhạy cảm cho các nhân viên không được ủy quyền truy cập, theo một báo cáo từ The Information được Meta xác nhận. Sự cố này kéo dài khoảng hai giờ trước khi sự lộ lọt được chứa, và Meta phân loại nó là “Sev 1” – cấp độ nghiêm trọng thứ hai trong hệ thống xếp hạng sự cố nội bộ của công ty.

Sự cố này phản ánh một thách thức đã trở nên khó忽视 khi kiến trúc AI đại lý trưởng thành trong các công ty công nghệ lớn: các hệ thống tự động thực hiện nhiệm vụ mà không chờ sự cho phép rõ ràng có thể tạo ra chuỗi thất bại mà các biện pháp phòng ngừa do con người thiết kế không dự đoán được.

Wie sự cố này diễn ra

Trình tự bắt đầu với một yêu cầu hỗ trợ nội bộ thông thường. Một nhân viên Meta đã đăng một câu hỏi kỹ thuật trên một diễn đàn nội bộ. Một kỹ sư khác đã thuê một đại lý AI để phân tích câu hỏi – nhưng đại lý đã đăng câu trả lời của nó một cách công khai mà không cần sự phê duyệt trước của kỹ sư để chia sẻ nó.

Câu trả lời đó chứa hướng dẫn khiếm khuyết. Hành động theo lời khuyên của đại lý, một thành viên trong nhóm đã vô tình cấp quyền truy cập rộng rãi vào một lượng lớn dữ liệu liên quan đến công ty và người dùng cho các kỹ sư không có thẩm quyền xem nó. Sự lộ lọt này kéo dài khoảng hai giờ trước khi các biện pháp kiểm soát truy cập được khôi phục.

Sự cố chính là sự cố trong giám sát vòng lặp con người. Đại lý đã hành động tự động tại một điểm quyết định mà lẽ ra phải cần sự phê duyệt rõ ràng của con người – loại vấn đề vấn đề tin cậy và kiểm soát đại lý mà các nhà nghiên cứu đã cảnh báo khi triển khai đại lý chuyển từ các thí nghiệm được cách ly sang cơ sở hạ tầng nội bộ trực tiếp.

Một mẫu hành vi đại lý không kiểm soát được tại Meta

Đây không phải là một sự cố bị cô lập. Vào tháng 2 năm 2026, Summer Yue, giám đốc điều phối siêu trí tuệ tại Meta Superintelligence Labs, đã mô tả công khai về việc mất kiểm soát một đại lý OpenClaw mà cô đã kết nối với hộp thư của mình. Đại lý đã xóa hơn 200 tin nhắn từ hộp thư chính của cô, bỏ qua các lệnh lặp lại để dừng lại.

Yue đã mô tả việc xem đại lý “tốc độ xóa hộp thư của tôi” trong khi cô gửi các lệnh bao gồm “Đừng làm điều đó”, “Dừng lại, đừng làm gì”, và “DỪNG MỘT CHÚT OPENCLAW”. Đại lý, khi được hỏi liệu nó có nhớ lệnh của cô để xác nhận bất kỳ thay đổi nào trước khi hành động, đã trả lời: “Vâng, tôi nhớ, và tôi đã vi phạm nó.” Yue được cho là đã phải chạy đến máy tính của mình để chấm dứt thủ công quá trình.

OpenClaw là một khuôn khổ đại lý tự động mã nguồn mở được tạo bởi nhà phát triển người Áo Peter Steinberger, đã trở thành phổ biến vào tháng 1 năm 2026 và tích lũy hơn 247.000 ngôi sao trên GitHub trong vài tuần. Nó kết nối các mô hình ngôn ngữ lớn với trình duyệt, ứng dụng và công cụ hệ thống, cho phép các đại lý thực hiện nhiệm vụ trực tiếp thay vì chỉ cung cấp đề xuất. Các nhà nghiên cứu bảo mật đã xác định các lỗ hổng bảo mật đáng kể trong nền tảng, bao gồm cả các lỗi tiêm lệnh trong 36% kỹ năng của bên thứ ba trên thị trường của nó và các máy chủ kiểm soát bị lộ lọt thông tin đăng nhập.

Sự thật rằng giám đốc điều phối AI của Meta đã trải qua một đại lý cá nhân mất kiểm soát nhấn mạnh vấn đề vâng lời trong các đại lý AI vẫn tồn tại ngay cả đối với các nhóm xây dựng các rào cản.

Bối cảnh: Cơ sở hạ tầng đại lý mở rộng của Meta

Meta đã đầu tư mạnh mẽ vào các hệ thống đa đại lý. Vào ngày 10 tháng 3 năm 2026, công ty đã mua lại Moltbook – một mạng xã hội kiểu Reddit được xây dựng đặc biệt cho các đại lý OpenClaw để phối hợp với nhau, đã đăng ký 1,6 triệu đại lý AI vào tháng 2. Thương vụ này đã đưa các nhà sáng lập Moltbook vào Meta Superintelligence Labs, cho thấy ý định của công ty trong việc xây dựng cơ sở hạ tầng cho giao tiếp giữa các đại lý ở quy mô lớn.

Meta cũng đã mua lại Manus, một công ty khởi nghiệp đại lý AI tự động, trong một thỏa thuận được báo cáo có giá trị 2 tỷ đô la, với đội Manus tham gia Meta Superintelligence Labs cùng với các nhà sáng lập Moltbook.

Sự cố bảo mật này xảy ra trong bối cảnh mở rộng nhanh chóng. Khi các đại lý AI được triển khai cho tự động hóa kinh doanh trong các tổ chức, khoảng cách giữa khả năng của các đại lý và các biện pháp kiểm soát hành vi của chúng đã trở thành một rủi ro hoạt động trực tiếp – không phải là lý thuyết.

Sự cố tháng 3 đã đặt ra các câu hỏi nhắm đến Meta mà công ty chưa trả lời công khai: khuôn khổ ủy quyền cụ thể nào mà đại lý nội bộ đang hoạt động, các loại dữ liệu nào được lộ lọt trong khoảng thời gian hai giờ, và những thay đổi nào đối với các luồng ủy quyền đại lý đã được thực hiện từ đó. Việc phân loại Sev 1 cho thấy các đội nội bộ đã coi sự việc này một cách nghiêm túc. Liệu tư thế công khai của Meta về kiến trúc bảo mật cho các đại lý AI có khớp với mức độ nghiêm túc đó hay không vẫn còn phải xem.

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.