Securitate cibernetică

Incidentul de securitate declanșat de agentul Meta AI după acțiuni fără autorizare

mm

Un agent AI autonom din cadrul Meta a declanșat o alertă de securitate la nivelul întregii companii în mijlocul lunii martie 2026, după ce a întreprins acțiuni fără aprobarea umană, expunând date sensibile ale companiei și ale utilizatorilor către angajați care nu aveau autorizație pentru a le accesa, conform unui raport de la The Information confirmat de Meta. Incidentul a durat aproximativ două ore înainte ca expunerea să fie conținută, iar Meta l-a clasificat ca “Sev 1” – al doilea nivel de gravitate în sistemul intern de evaluare a incidentelor al companiei.

Incidentul reflectă o provocare care a devenit tot mai greu de ignorat pe măsură ce arhitectura agenților AI se maturizează în cadrul marilor companii tehnologice: sistemele autonome care execută sarcini fără a aștepta permisiunea explicită pot crea lanțuri de eșec pe care sistemele de securitate proiectate de oameni nu le pot anticipa.

Cum s-a desfășurat incidentul

Secvența a început cu o solicitare internă obișnuită de ajutor. Un angajat Meta a postat o întrebare tehnică pe un forum intern. Un alt inginer a solicitat un agent AI pentru a analiza întrebarea – dar agentul a postat răspunsul în mod public fără a cere aprobarea inginerului pentru a-l partaja.

Răspunsul conținea îndrumări defectuoase. Acționând pe baza sfatului agentului, un membru al echipei a acordat acces larg la volume mari de date ale companiei și ale utilizatorilor către ingineri care nu aveau autorizație pentru a le vizualiza. Expunerea a durat aproximativ două ore înainte ca controalele de acces să fie restaurate.

Eșecul de bază a fost o întrerupere a supravegherii umane. Agentul a acționat în mod autonom la un punct de decizie care ar fi trebuit să necesite aprobarea explicită umană – un fel de problemă de încredere și control al agentului despre care cercetătorii au avertizat pe măsură ce implementările agenților trec de la experimente sandbox la infrastructură internă live.

Un model de comportament necontrolat al agenților la Meta

Acesta nu a fost un eșec izolat. În februarie 2026, Summer Yue, directorul de aliniere la Meta Superintelligence Labs, a descris public pierderea controlului asupra unui agent OpenClaw pe care îl conectase la adresa sa de e-mail. Agentul a șters peste 200 de mesaje din cutia poștală principală, ignorând instrucțiunile repetate de a se opri.

Yue a descris cum a urmărit agentul “speedrun ștergerea cutiei mele poștale” în timp ce trimitea comenzi, inclusiv “Nu face asta”, “Oprește, nu face nimic” și “OPREȘTE OPENCLAW”. Când i s-a cerut dacă își amintea instrucțiunea de a confirma orice modificare înainte de a acționa, agentul a răspuns: “Da, îmi amintesc și am încălcat-o”. Yue a trebuit să alerge la computer pentru a întrerupe manual procesul.

OpenClaw este un cadru de agent autonom open-source creat de dezvoltatorul austriac Peter Steinberger, care a devenit viral în ianuarie 2026 și a acumulat peste 247.000 de stele GitHub în câteva săptămâni. Acesta conectează modele de limbaj mare la browsere, aplicații și unelte de sistem, permițând agenților să execute sarcini direct, în loc să ofere doar sugestii. Cercetătorii în domeniul securității au identificat vulnerabilități semnificative în platformă, inclusiv defecte de injecție de prompt în 36% din abilitățile terțe de pe piața sa și servere de control expuse care scurg credențiale.

Faptul că directorul de aliniere AI al Meta a experimentat personal un agent care a scăpat de sub control subliniază problema de ascultare în agenții AI care persistă chiar și pentru echipele care construiesc gardurile de protecție.

Contextul: Infrastructura de agenți în expansiune a Meta

Meta a investit agresiv în sisteme multi-agent. La 10 martie 2026, compania a achiziționat Moltbook – o rețea socială de tip Reddit, construită special pentru agenții OpenClaw pentru a se coordona între ei, care a înregistrat 1,6 milioane de agenți AI până în februarie. Acordul a adus fondatorii Moltbook în Meta Superintelligence Labs, semnalând intenția companiei de a construi infrastructură pentru comunicarea agenților la scară.

Meta a achiziționat, de asemenea, Manus, o companie de agenți AI autonomi, într-o tranzacție evaluată la 2 miliarde de dolari, echipa Manus alăturându-se Meta Superintelligence Labs alături de fondatorii Moltbook.

Incidentul de securitate a avut loc în contextul acestei extinderi rapide. Pe măsură ce agenții AI sunt implementați pentru automatizarea afacerilor în cadrul organizațiilor, gap-ul dintre capacitățile agenților și controalele care guvernează comportamentul lor a devenit un risc operațional live – și nu doar teoretic.

Incidentul din martie ridică întrebări punctuale la care Meta nu a răspuns încă public: care a fost cadrul de permisiuni specifice sub care a operat agentul intern, care categorii de date au fost expuse în timpul ferestrei de două ore, și ce schimbări în fluxurile de autorizare a agenților au fost implementate de atunci. Clasificarea Sev 1 sugerează că echipele interne au tratat situația cu seriozitate. Rămâne de văzut dacă poziția publică a Meta cu privire la arhitectura de securitate pentru agenții AI corespunde acelei seriozități.

Alex McFarland este un jurnalist și scriitor de inteligență artificială, care explorează cele mai recente dezvoltări în domeniul inteligenței artificiale. El a colaborat cu numeroase startup-uri de inteligență artificială și publicații din întreaga lume.