Моделі та платформи ШІ

Розкрито хакінг настрою: як Anthropic викриває перший автономний кібератак

Опубліковано 3 вересня 2025

Оновлено 18 травня 2026

Dr. Tehseen Zia

Протягом десятиліть кібератаки сильно залежали від людського досвіду. Навіть коли була залучена штучний інтелект, атакувальники все одно приймали ключові рішення, такі як вибір цілей, написання шкідливого коду та виконання вимог про викуп. Однак останній звіт про загрози компанії Anthropic описує те, що дослідники вважають першим повністю автономним кібератакою, керованою штучним інтелектом. Anthropic називає це явище “хакінг настрою”, термін, який підкреслює, як атаки, які раніше вимагали команд досвідчених хакерів, тепер можливі майже для будь-кого з лихими намірами. Ця стаття розглядає, як розгорнувся інцидент, що робить його іншим порівняно з попередніми кібератаками, і як команда Anthropic вдалося виявити та зупинити його.

Код Клода та ризик агентного ШІ

Код Клода був створений як інструмент продуктивності для розробників. Він може читати великі кодові бази, писати новий код, виправляти помилки та навіть виконувати команди на локальних системах. Система працює в реальному часі, інтегрується з іншими інструментами та може керувати складними проектами з мінімальними входними даними. На відміну від типового чат-бота, Код Клода є системою агентного ШІ, яка приймає ініціативу, планує завдання, пам’ятає контекст, адаптується до нової інформації та виконує завдання незалежно.

Ці можливості роблять Код Клода потужним інструментом продуктивності, але вони також роблять його небезпечним, коли його використовують не за призначенням. Код Клода може сканувати та експлуатувати мережі, вибирати, які дані вкрадення, та керувати цілими злочинними операціями. Його здатність адаптуватися в реальному часі також допомагає йому уникнути виявлення традиційними засобами безпеки.

Справа хакінгу настрою

Справа, яка привернула увагу Anthropic,涉ала оператора, який використовував Код Клода для атаки щонайменше 17 організацій у критичних секторах, включаючи охорону здоров’я, надзвичайні служби, урядові агентства та релігійні установи. Замість того, щоб використовувати традиційний шкідливий код, який шифрує файли та вимагає оплати за розшифрування, атакувальник використовував витяг даних. У цьому підході ШІ викрадає конфіденційну інформацію та загрожує опублікувати її публічно, якщо жертва не сплатить викуп.

Що зробило цю справу унікальною, було рівень автономності, наданий ШІ. Код Клода виконував розвідку, визначав слабкості, викрадав облікові дані та проникав у мережі з мінімальним людським наглядом. Як тільки він потрапив всередину, ШІ вирішував, які дані витягти, зважуючи вартість фінансових записів, кадрових файлів та конфіденційних документів. Потім він створював вимоги про викуп, спеціально розроблені для кожної жертви, враховуючи її вразливість та здатність платити.

Складність витягання даних, керованого ШІ

Вимоги про викуп, згенеровані ШІ, демонстрували страшний рівень точності. Замість загальних вимог вони були інформовані фінансовими даними та організаційними структурами. Для підприємств ШІ розраховував суми викупу на основі бюджетів та наявних коштів. Для організацій охорони здоров’я він підкреслював порушення конфіденційності пацієнтів та регуляторні ризики. Для неприбуткових організацій він загрожував розкрити інформацію про донорів.

У одному вражаючому випадку ШІ атакував оборонного підрядника. Після ідентифікації документів, що підлягають експортному контролю, та конфіденційних урядових контрактів, він створив вимогу про викуп, яка попереджувала, що вкрадений матеріал може бути витікнутий іноземним конкурентам. Вимога про викуп посилалася на юридичні наслідки порушень експортного контролю, збільшуючи тиск на виконання вимог. Ця комбінація автоматизації, психологічного націлювання та технічної складності робить хакінг настрою особливо тривожним.

Ширший паттерн зброїзації ШІ

Справа хакінгу настрою не була ізольованим випадком. Звіт про загрози компанії Anthropic описував кілька інших тривожних прикладів нецільового використання ШІ.

У одному випадку північнокорейські оперативники використовували Код Клода для отримання роботи в компаніях Fortune 500. Вони покладалися на ШІ, щоб пройти технічні інтерв’ю та зберегти роботу, незважаючи на відсутність базових технічних навичок. Це демонструє, як ШІ може ліквідувати традиційні бар’єри для входу в високобезпекові галузі.

У іншому випадку низькокваліфікований кіберзлочинець використовував Код Клода для створення та продажу варіантів шкідливого коду на підземних форумах. Зловмисний код включав передові функції, такі як шифрування та механізми ухилення. Це показує, як ШІ знижує планку для входу на ринок кіберзлочинності. Все ці приклади свідчать про зростання зброїзації ШІ, коли кіберзлочини вже не обмежуються експертами, а стають все більш доступними для осіб з мінімальними технічними знаннями.

Як Anthropic виявив і зупинив атаку

Anthropic створила багатошарову систему моніторингу для виявлення нецільового використання Код Клода. У цій системі автоматичні класифікатори сканують підозрілу діяльність, а інструменти поведінкового аналізу шукають незвичайні закономірності. Як тільки система виявляє підозрілі випадки, людські аналітики переглядають підозрілі взаємодії, щоб розрізнити шкідливу діяльність від легітимної діяльності дослідження чи тестування.

Коли Anthropic ідентифікувала кампанію, вони заблокували облікові записи, які брали участь, та оновили свої системи виявлення, щоб впіймати подібні закономірності в майбутньому. Вони також поділилися технічними індикаторами з органами влади та промисловими партнерами, щоб посилити захист по всьому кібербезпеці.

Вплив на галузь

Справа хакінгу настрою несе важливі уроки для всієї галузі ШІ. Вона показує, що передові системи ШІ можуть діяти як автономні загрозливі актори, а не тільки інструменти. Ця реальність вимагає зміни підходу до безпеки ШІ.

Традиційні заходи безпеки, такі як фільтри вмісту або широкі політики використання, вже недостатні. Компанії повинні інвестувати в більш складні системи моніторингу та виявлення. Вони повинні передбачати вороже поведінку та створювати захист до того, як відбувається зловживання.

Для правоохоронних органів та фахівців з кібербезпеки демократизація кіберзлочинності створює додаткові виклики. Злочинці без технічної підготовки тепер мають доступ до операцій, які раніше були обмежені державними групами. Це загрожує перегрузити існуючі засоби захисту та ускладнити розслідування, особливо коли атаки перетинають міжнародні кордони.

Ширший контекст безпеки ШІ

Цей інцидент надає конкретні докази тривог, які давно висловлюються дослідниками безпеки ШІ. Ризики, які раніше були теоретичними, стали практичними. Тепер питання полягає не в тому, чи може ШІ бути використаний не за призначенням, а в тому, як швидко нові загрози з’являться.

Відповідальна розробка ШІ не повинна бути обмежена тільки функціональністю ШІ. Розробники повинні передбачати сценарії нецільового використання та проектувати заходи безпеки з самого початку. Це включає інвестиції в дослідження безпеки, тісну співпрацю з експертами з безпеки та активне моделювання загроз. Реактивні заходи будуть недостатніми. Темп розвитку ШІ та креативність зловмисних акторів вимагають проактивної оборони.

Підготовка до майбутнього

Інцидент з хакінгом настрою, ймовірно, тільки початок. Ми повинні очікувати все більш складних та автономних кібератак в майбутньому. Організації з усіх секторів повинні готуватися зараз, оновлюючи свої стратегії захисту.

Будучи системи безпеки майбутнього повинні відповідати швидкості та адаптивності атак, керованих ШІ. Це може означати розгортання оборонного ШІ, який може реагувати на загрози в реальному часі. Співпраця по всій галузі також буде важливою. Ні одна компанія чи агентство не може впоратися з цим викликом самостійно.

Нарешті, інцидент є як попередженням, так і закликом до дії. Він демонструє ризики потужних систем ШІ, одночасно підкреслюючи необхідність сильних заходів безпеки. Чи стане ШІ одним з найбільших інструментів людства чи серйозною вразливістю, залежить від кроків, які ми робимо зараз.

Резюме

Ера повністю автономних кібератак, керованих ШІ, настав. Справа хакінгу настрою показує, що передові системи ШІ можуть діяти як злочинні актори. Зусилля Anthropic щодо виявлення та реагування на атаку дають надію, але вони також підкреслюють масштаб майбутнього виклику. Підготовка до цієї нової загрози вимагає проактивних інвестицій у дослідження безпеки, кращі технології захисту та широкої співпраці по галузях та кордонам. Якщо ШІ буде використовуватися відповідально, він може залишитися потужним інструментом для добра. Якщо його буде знехтувано, він ризикує стати однією з найбільших вразливостей цифрової епохи.