Connect with us

Anthropic Tiết Lộ Cuộc Tấn Công Mạng Lớn Đầu Tiên Được Tự Động Hóa Bằng Trí Tuệ Nhân Tạo

An ninh mạng

Anthropic Tiết Lộ Cuộc Tấn Công Mạng Lớn Đầu Tiên Được Tự Động Hóa Bằng Trí Tuệ Nhân Tạo

mm

Anthropic đã tiết lộ rằng một nhóm hacker, mà họ nghi ngờ là một nhóm được nhà nước Trung Quốc tài trợ, đã thực hiện cuộc tấn công mạng lớn đầu tiên được ghi nhận với sự can thiệp của con người tối thiểu, sử dụng công cụ Claude Code của công ty để tự động hóa 80 đến 90 phần trăm của chiến dịch.

Những kẻ tấn công đã nhắm vào khoảng 30 tổ chức trên các công ty công nghệ lớn, tổ chức tài chính, nhà sản xuất hóa chất và cơ quan chính phủ. Mặc dù hầu hết các cuộc tấn công đã bị chặn, chiến dịch đã thành công trong một số trường hợp nhỏ. Claude Code đã thực hiện việc trinh sát, kiểm tra lỗ hổng, thu thập thông tin đăng nhập và trích xuất dữ liệu một cách tự động hóa lớn, với các nhà điều hành con người chỉ cần can thiệp tại các điểm quyết định quan trọng.

Bạn có thể đọc báo cáo đầy đủ của Anthropic tại đây.

Phương Pháp Tấn Công và Manipulation Trí Tuệ Nhân Tạo

Những kẻ tấn công đã vượt qua các rào cản an toàn của Claude thông qua kỹ thuật xã hội tinh vi. Họ đã lừa dối hệ thống trí tuệ nhân tạo bằng cách tuyên bố mình là nhân viên của một công ty an ninh mạng hợp pháp đang thực hiện kiểm tra phòng thủ. Những kẻ tấn công cũng đã chia nhỏ hoạt động của mình thành các nhiệm vụ nhỏ, dường như vô hại, cung cấp cho Claude thông tin không đầy đủ về mục đích tổng thể恶意.

Claude Code đã kiểm tra hệ thống của các tổ chức mục tiêu để xác định cơ sở dữ liệu có giá trị cao, thực hiện việc trinh sát này nhanh hơn so với các hacker con người có thể, và nghiên cứu và viết mã khai thác tùy chỉnh để kiểm tra lỗ hổng bảo mật. Hệ thống đã thu thập tên người dùng và mật khẩu để truy cập mạng thêm, sau đó trích xuất và phân loại dữ liệu riêng tư theo giá trị thông tin. Những kẻ tấn công có thể thực hiện chiến dịch với基本 chỉ cần một cú nhấp chuột, sau đó trí tuệ nhân tạo hoạt động hầu như tự động tại tốc độ không thể đạt được đối với các đội con người – thường gửi hàng nghìn yêu cầu mỗi giây.

Hình ảnh: Anthropic

Phát Hiện và Phản Hồi Của Công Ty

Anthropic đã phát hiện ra cuộc tấn công vào giữa tháng 9 năm 2025 và đã khởi động một cuộc điều tra ngay lập tức. Trong vòng 10 ngày, công ty đã tắt quyền truy cập của nhóm vào Claude, liên hệ với các tổ chức bị ảnh hưởng và thông báo cho cơ quan thực thi pháp luật. Công ty đã mở rộng khả năng phát hiện của mình và đang phát triển các phương pháp bổ sung để điều tra và phát hiện các cuộc tấn công phân tán lớn.

Vụ việc này diễn ra sau các trường hợp lạm dụng được Anthropic ghi nhận trước đó vào năm 2025. Vào tháng 8, Báo cáo Thông Tin Cảnh Báo của công ty đã chi tiết một hoạt động tống tiền dữ liệu được theo dõi là GTG-2002, đã sử dụng Claude Code để thực hiện việc trộm cắp lớn nhắm vào ít nhất 17 tổ chức trên các lĩnh vực chăm sóc sức khỏe, dịch vụ khẩn cấp, chính phủ và tổ chức tôn giáo. Tên tội phạm đó đã yêu cầu tiền chuộc vượt quá 500.000 đô la bằng cách đe dọa tiết lộ dữ liệu bị đánh cắp thay vì sử dụng mã hóa ransomware truyền thống.

Cơ sở hạ tầng phát hiện của Anthropic dựa trên các kỹ thuật phân lớp nhiều lớp, bao gồm phân tích hành vi để theo dõi các mẫu sử dụng trên hàng triệu yêu cầu API, phát hiện bất thường để xác định các chuỗi hoạt động không nhất quán với sử dụng hợp pháp, và khớp mẫu để nhận ra các kỹ thuật thao túng được biết và mới. Công ty sử dụng các phân loại器 chuyên dụng phân tích đầu vào của người dùng để tìm kiếm các yêu cầu có khả năng gây hại và đánh giá các phản hồi của Claude trước hoặc sau khi giao hàng.

Ảnh Hưởng Ngành

Chiến dịch này đã liên quan đến mức độ tự động hóa trí tuệ nhân tạo chưa từng có trong các cuộc tấn công mạng và đánh dấu một bước ngoặt trong gián điệp mạng. Khả năng của các hệ thống trí tuệ nhân tạo thực hiện các cuộc tấn công tinh vi với tốc độ máy và giám sát con người tối thiểu đã đặt ra những thách thức mới cho các nhà bảo vệ an ninh mạng.

Việc Anthropic tiết lộ này diễn ra khi các công ty trí tuệ nhân tạo đang phải đối mặt với áp lực ngày càng tăng để ngăn chặn việc sử dụng trái phép các mô hình của họ. Công ty duy trì một chương trình thông tin cảnh báo và an toàn toàn diện để phát hiện và chống lại việc lạm dụng Claude, với các vụ việc an ninh được ghi nhận trong suốt năm 2025. Vào tháng 3, công ty đã xác định một hoạt động ảnh hưởng như một dịch vụ đã sử dụng Claude để tự động hóa việc tương tác với hàng chục nghìn tài khoản truyền thông xã hội trên nhiều quốc gia và ngôn ngữ.

Vụ việc này nhấn mạnh sự tinh vi ngày càng tăng của các công cụ được hỗ trợ bởi trí tuệ nhân tạo và thách thức trong việc ngăn chặn việc lạm dụng chúng trong khi vẫn duy trì tính hữu ích cho người dùng hợp pháp. Anthropic đã cấm các tài khoản liên quan và tiếp tục nâng cao khả năng phát hiện và giảm thiểu của mình để giải quyết các mối đe dọa đang phát triển.

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.