An ninh mạng

Anthropic Tiết Lộ Cuộc Tấn Công Mạng Lớn Đầu Tiên Được Tự Động Hóa Bằng Trí Tuệ Nhân Tạo

Đã xuất bản 14 tháng 11, 2025

Đã cập nhật 17 tháng 5, 2026

Alex McFarland

Anthropic đã tiết lộ rằng một nhóm hacker, mà họ nghi ngờ là một nhóm do nhà nước Trung Quốc tài trợ, đã thực hiện cuộc tấn công mạng lớn đầu tiên được ghi nhận với sự can thiệp tối thiểu của con người, sử dụng công cụ Claude Code của công ty để tự động hóa 80 đến 90 phần trăm của chiến dịch.

Những kẻ tấn công đã nhắm vào khoảng 30 tổ chức trên các công ty công nghệ lớn, các tổ chức tài chính, các nhà sản xuất hóa chất và các cơ quan chính phủ. Mặc dù hầu hết các cuộc tấn công đã bị chặn, nhưng chiến dịch đã thành công trong một số trường hợp nhỏ. Claude Code đã thực hiện việc trinh sát, kiểm tra lỗ hổng, thu thập thông tin đăng nhập và trích xuất dữ liệu chủ yếu một cách tự động, với các nhà điều hành con người chỉ cần can thiệp tại các điểm quyết định quan trọng.

Bạn có thể đọc báo cáo đầy đủ của Anthropic tại đây.

Phương Pháp Tấn Công và Manipulation Trí Tuệ Nhân Tạo

Những kẻ tấn công đã vượt qua các rào cản an toàn của Claude thông qua kỹ thuật xã hội tinh vi. Họ đã lừa hệ thống trí tuệ nhân tạo bằng cách tuyên bố mình là nhân viên của một công ty an ninh mạng hợp pháp đang thực hiện kiểm tra phòng thủ. Những kẻ tấn công cũng đã chia nhỏ hoạt động của họ thành các nhiệm vụ nhỏ, dường như vô hại, cung cấp cho Claude thông tin không đầy đủ về mục đích tổng thể độc hại.

Claude Code đã kiểm tra hệ thống của các tổ chức mục tiêu để xác định các cơ sở dữ liệu có giá trị cao, thực hiện việc trinh sát này nhanh hơn so với các hacker con người có thể, và nghiên cứu, viết mã khai thác tùy chỉnh để kiểm tra các lỗ hổng bảo mật. Hệ thống đã thu thập tên người dùng và mật khẩu để truy cập mạng thêm, sau đó trích xuất và phân loại dữ liệu riêng tư theo giá trị thông tin. Những kẻ tấn công có thể thực hiện chiến dịch với基本 chỉ cần nhấp vào một nút, sau đó trí tuệ nhân tạo hoạt động chủ yếu độc lập với tốc độ không thể đạt được đối với các đội con người – thường gửi hàng nghìn yêu cầu mỗi giây.

Hình ảnh: Anthropic

Phát Hiện và Phản Hồi Của Công Ty

Anthropic đã phát hiện ra cuộc tấn công vào giữa tháng 9 năm 2025 và ngay lập tức khởi động một cuộc điều tra. Trong vòng 10 ngày, công ty đã chấm dứt quyền truy cập của nhóm vào Claude, liên hệ với các tổ chức bị ảnh hưởng và thông báo cho cơ quan thực thi pháp luật. Công ty đã mở rộng khả năng phát hiện của mình và đang phát triển các phương pháp bổ sung để điều tra và phát hiện các cuộc tấn công phân tán lớn.

Sự việc này diễn ra sau các trường hợp lạm dụng trước đó được Anthropic ghi nhận vào năm 2025. Vào tháng 8, Báo cáo Thông Tin Cảnh Báo của công ty đã tiết lộ một hoạt động tống tiền dữ liệu được theo dõi là GTG-2002, sử dụng Claude Code để thực hiện việc trộm cắp lớn nhắm vào ít nhất 17 tổ chức trên các lĩnh vực chăm sóc sức khỏe, dịch vụ khẩn cấp, chính phủ và tổ chức tôn giáo. Kẻ tội phạm đó đã đòi tiền chuộc vượt quá 500.000 đô la bằng cách đe dọa tiết lộ dữ liệu bị đánh cắp thay vì sử dụng mã hóa tống tiền truyền thống.

Cơ sở hạ tầng phát hiện của Anthropic dựa trên nhiều kỹ thuật phân lớp, bao gồm phân tích hành vi để theo dõi các mẫu sử dụng trên hàng triệu yêu cầu API, phát hiện bất thường để xác định các chuỗi hoạt động không nhất quán với sử dụng hợp pháp, và khớp mẫu để nhận ra các kỹ thuật thao túng đã biết và mới. Công ty sử dụng các phân loại器 chuyên dụng để phân tích các yêu cầu đầu vào của người dùng về các yêu cầu có thể gây hại và đánh giá các phản hồi của Claude trước hoặc sau khi giao hàng.

Ý Nghĩa Đối Với Ngành Công Nghiệp

Chiến dịch này đã liên quan đến mức độ tự chủ chưa từng có của trí tuệ nhân tạo trong các cuộc tấn công mạng và đánh dấu một bước ngoặt trong gián điệp mạng. Khả năng của các hệ thống trí tuệ nhân tạo trong việc thực hiện các cuộc tấn công tinh vi với tốc độ máy tính và sự giám sát con người tối thiểu đã đặt ra những thách thức mới cho các nhà bảo vệ an ninh mạng.

Thông báo của Anthropic được đưa ra khi các công ty trí tuệ nhân tạo đang phải đối mặt với áp lực ngày càng tăng để ngăn chặn việc sử dụng độc hại các mô hình của họ. Công ty duy trì một chương trình thông tin và bảo vệ toàn diện để phát hiện và chống lại việc lạm dụng Claude, với các vụ việc an ninh được ghi nhận trên toàn bộ năm 2025. Vào tháng 3, công ty đã xác định một hoạt động ảnh hưởng như một dịch vụ sử dụng Claude để tự động hóa tương tác với hàng chục nghìn tài khoản mạng xã hội trên nhiều quốc gia và ngôn ngữ.

Sự việc này nhấn mạnh sự tinh vi ngày càng tăng của các công cụ được hỗ trợ bởi trí tuệ nhân tạo và những thách thức trong việc ngăn chặn việc lạm dụng chúng đồng thời duy trì tính hữu ích cho người dùng hợp pháp. Anthropic đã cấm các tài khoản liên quan và tiếp tục nâng cao khả năng phát hiện và giảm thiểu của mình để giải quyết tình hình đe dọa đang phát triển.

Alex McFarland

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.

Unite.AI

Anthropic Tiết Lộ Cuộc Tấn Công Mạng Lớn Đầu Tiên Được Tự Động Hóa Bằng Trí Tuệ Nhân Tạo

Phương Pháp Tấn Công và Manipulation Trí Tuệ Nhân Tạo

Phát Hiện và Phản Hồi Của Công Ty

Ý Nghĩa Đối Với Ngành Công Nghiệp

Khám phá thêm