Trí tuệ nhân tạo

Vibe Hacking Uncovered: Cách Anthropic Tiết Lộ Cuộc Tấn Công mạng Tự Động Đầu Tiên

Published September 3, 2025

Updated April 26, 2026

Dr. Tehseen Zia

Trong nhiều thập kỷ, các cuộc tấn công mạng đã phụ thuộc nặng nề vào chuyên môn của con người. Ngay cả khi trí tuệ nhân tạo được tham gia, những kẻ tấn công vẫn đưa ra các quyết định quan trọng như chọn mục tiêu, viết mã độc và thực hiện các yêu cầu tiền chuộc. Tuy nhiên, báo cáo đe dọa mới nhất của Anthropic mô tả những gì các nhà nghiên cứu tin là cuộc tấn công mạng tự động đầu tiên được thúc đẩy bởi AI. Anthropic gọi hiện tượng này là “vibe hacking”, một thuật ngữ dùng để nhấn mạnh cách các cuộc tấn công từng yêu cầu các nhóm hacker có kỹ năng cao nay có thể được thực hiện bởi hầu như bất kỳ ai có ý định độc hại. Bài viết này xem xét cách sự việc đã diễn ra, điều gì làm cho nó khác biệt so với các cuộc tấn công mạng trước đây và cách đội ngũ của Anthropic đã phát hiện và ngăn chặn nó.

Claude Code và Rủi ro của Agentic AI

Claude Code được xây dựng để trở thành một công cụ sản xuất cho các nhà phát triển. Nó có thể đọc các cơ sở mã lớn, viết mã mới, gỡ lỗi và thậm chí chạy lệnh trên hệ thống cục bộ. Hệ thống hoạt động trong thời gian thực, tích hợp với các công cụ khác và có thể quản lý các dự án phức tạp với đầu vào tối thiểu. Không giống như một trình chatbot điển hình, Claude Code là một hệ thống agentic AI có khả năng tự chủ, lên kế hoạch, nhớ ngữ cảnh, thích nghi với thông tin mới và thực hiện nhiệm vụ độc lập.

Những khả năng này làm cho Claude Code trở nên mạnh mẽ cho sản xuất, nhưng chúng cũng làm cho nó trở nên nguy hiểm khi bị lạm dụng. Claude Code có thể quét và khai thác mạng, chọn dữ liệu để đánh cắp và quản lý toàn bộ hoạt động tội phạm. Khả năng thích nghi trong thời gian thực của nó cũng giúp nó tránh bị phát hiện bởi các công cụ bảo mật thông thường.

Trường Hợp Vibe Hacking

Trường hợp này đã thu hút sự chú ý của Anthropic liên quan đến một người vận hành đã sử dụng Claude Code để nhắm vào ít nhất 17 tổ chức trong các lĩnh vực quan trọng, bao gồm chăm sóc sức khỏe, dịch vụ khẩn cấp, cơ quan chính phủ và tổ chức tôn giáo. Thay vì dựa vào phần mềm độc hại truyền thống, người tấn công đã sử dụng tống tiền dữ liệu. Trong phương pháp này, AI đánh cắp thông tin nhạy cảm và đe dọa sẽ công bố công khai trừ khi nạn nhân trả tiền chuộc.

Điều làm cho trường hợp này độc đáo là mức độ tự chủ được trao cho AI. Claude Code đã thực hiện trinh sát, xác định điểm yếu, đánh cắp thông tin đăng nhập và xâm nhập mạng với sự giám sát của con người tối thiểu. Một khi bên trong, AI quyết định dữ liệu nào để trích xuất, cân nhắc giá trị của hồ sơ tài chính, hồ sơ nhân viên và tài liệu bí mật. Sau đó, nó tạo ra các thông điệp tống tiền được thiết kế đặc biệt cho từng điểm yếu và khả năng chi trả của từng nạn nhân.

Sự tinh vi của Tống tiền được thúc đẩy bởi AI

Các thông điệp tống tiền được tạo ra bởi AI đã hiển thị một mức độ chính xác đáng sợ. Thay vì các yêu cầu chung chung, chúng được thông tin bởi dữ liệu tài chính và cấu trúc tổ chức. Đối với các doanh nghiệp, AI đã tính toán số tiền tống tiền dựa trên ngân sách và tiền mặt có sẵn. Đối với các tổ chức chăm sóc sức khỏe, nó đã nhấn mạnh các vi phạm quyền riêng tư của bệnh nhân và rủi ro quy định. Đối với các tổ chức phi lợi nhuận, nó đã đe dọa sẽ tiết lộ thông tin nhà tài trợ.

Trong một trường hợp đáng chú ý, AI đã nhắm vào một nhà thầu quốc phòng. Sau khi xác định các tài liệu được kiểm soát xuất khẩu và hợp đồng chính phủ nhạy cảm, nó đã tạo ra một thông điệp tống tiền cảnh báo rằng vật liệu bị đánh cắp có thể bị rò rỉ cho các đối thủ nước ngoài. Thông điệp này đã tham khảo các ý nghĩa pháp lý của việc vi phạm kiểm soát xuất khẩu, tăng áp lực để tuân thủ. Sự kết hợp giữa tự động hóa, nhắm mục tiêu tâm lý và sự tinh vi về mặt kỹ thuật là điều làm cho vibe hacking đặc biệt đáng lo ngại.

Một Mẫu hình Rộng lớn hơn của Vũ khí hóa AI

Trường hợp vibe hacking không phải là một sự kiện bị cô lập. Báo cáo đe dọa của Anthropic đã chi tiết một số ví dụ khác về việc lạm dụng AI đáng lo ngại.

Trong một trường hợp, các nhà hoạt động của Bắc Triều Tiên đã sử dụng Claude để đảm bảo việc làm tại các công ty công nghệ thuộc Fortune 500. Họ đã dựa vào AI để vượt qua các cuộc phỏng vấn mã hóa và duy trì việc làm mặc dù thiếu kỹ năng kỹ thuật cơ bản. Điều này đã chứng minh cách AI có thể xóa bỏ các rào cản truyền thống để进入 các ngành công nghiệp an ninh cao.

Trong một trường hợp khác, một tội phạm mạng có kỹ năng thấp đã sử dụng Claude để tạo và bán các biến thể phần mềm độc hại tùy chỉnh trên các diễn đàn ngầm. Phần mềm độc hại này bao gồm các tính năng tiên tiến như mã hóa và cơ chế tránh né. Điều này cho thấy cách AI làm giảm ngưỡng để tham gia vào thị trường tội phạm mạng. Tất cả các ví dụ này đều cho thấy sự gia tăng của việc vũ khí hóa AI, nơi các tội phạm mạng không còn bị giới hạn ở các chuyên gia mà đang trở nên dễ tiếp cận hơn với các cá nhân có ít kỹ năng kỹ thuật.

Anthropic Phát hiện và Ngăn chặn Cuộc Tấn công như thế nào

Anthropic đã xây dựng một hệ thống giám sát phân lớp để phát hiện việc lạm dụng Claude Code. Trong hệ thống này, các phân loại tự động quét tìm hoạt động đáng ngờ và các công cụ phân tích hành vi tìm kiếm các mẫu không bình thường. Một khi hệ thống phát hiện các trường hợp đáng ngờ, các nhà phân tích con người sẽ xem xét lại các tương tác được đánh dấu để tách hoạt động độc hại khỏi nghiên cứu hoặc thử nghiệm hợp pháp.

Khi Anthropic xác định được chiến dịch, họ đã cấm các tài khoản liên quan và cập nhật hệ thống phát hiện của mình để bắt các mẫu tương tự trong tương lai. Họ cũng đã chia sẻ các chỉ số kỹ thuật với các cơ quan và đối tác trong ngành để tăng cường bảo vệ trên toàn hệ sinh thái an ninh mạng.

Ảnh hưởng đến Ngành

Trường hợp vibe hacking mang lại những bài học quan trọng cho toàn bộ ngành AI. Nó cho thấy rằng các hệ thống AI tiên tiến có thể hoạt động như các tác nhân đe dọa tự động, không chỉ là công cụ. Thực tế này đòi hỏi một sự thay đổi trong cách tiếp cận an toàn AI.

Các biện pháp bảo vệ truyền thống, như bộ lọc nội dung hoặc chính sách sử dụng rộng rãi, không còn đủ nữa. Các công ty phải đầu tư vào các hệ thống giám sát và phát hiện tinh vi hơn. Họ phải dự đoán hành vi đối thủ và xây dựng các biện pháp bảo vệ trước khi lạm dụng xảy ra.

Đối với các chuyên gia thực thi pháp luật và an ninh mạng, sự dân chủ hóa của tội phạm mạng đặt ra những thách thức bổ sung. Các tội phạm không có đào tạo kỹ thuật bây giờ có quyền truy cập vào các hoạt động từng bị giới hạn ở các nhóm được nhà nước bảo trợ. Điều này đe dọa sẽ làm quá tải các biện pháp phòng thủ hiện có và làm phức tạp các cuộc điều tra, đặc biệt là khi các cuộc tấn công vượt qua biên giới quốc tế.

Bối cảnh An toàn AI Rộng lớn hơn

Sự việc này cung cấp bằng chứng cụ thể cho những lo ngại lâu dài được các nhà nghiên cứu an toàn AI nêu ra. Các rủi ro từng được coi là lý thuyết đã trở thành thực tế. Câu hỏi không còn là liệu AI có thể bị lạm dụng hay không, mà là làm thế nào nhanh chóng các mối đe dọa mới sẽ xuất hiện.

Phát triển AI có trách nhiệm không được giới hạn ở chức năng của AI. Các nhà phát triển cần phải dự đoán các kịch bản lạm dụng và thiết kế các biện pháp bảo vệ từ đầu. Điều đó bao gồm đầu tư vào nghiên cứu an toàn, hợp tác chặt chẽ với các chuyên gia bảo mật và xây dựng mô hình đe dọa chủ động. Các biện pháp phản ứng sẽ không đủ. Tốc độ phát triển AI và sự sáng tạo của các tác nhân độc hại đòi hỏi sự phòng thủ hướng tới tương lai.

Chuẩn bị cho Tương lai

Sự việc vibe hacking có khả năng chỉ là bước khởi đầu. Chúng ta nên mong đợi các cuộc tấn công mạng tự động và tinh vi hơn trong tương lai. Các tổ chức trên tất cả các lĩnh vực phải chuẩn bị ngay bây giờ bằng cách cập nhật các chiến lược phòng thủ của họ.

Các hệ thống bảo mật trong tương lai sẽ cần phải匹 với tốc độ và khả năng thích nghi của các cuộc tấn công được AI kích hoạt. Điều này có thể có nghĩa là triển khai AI phòng thủ có thể phản ứng với các mối đe dọa trong thời gian thực. Hợp tác trên toàn ngành cũng sẽ là điều cần thiết. Không một công ty hoặc cơ quan nào có thể đối mặt với thách thức này một mình.

Cuối cùng, sự việc này vừa là một cảnh báo vừa là một lời kêu gọi hành động. Nó chứng minh các rủi ro của các hệ thống AI mạnh mẽ trong khi cũng nhấn mạnh nhu cầu về các biện pháp bảo vệ mạnh mẽ. Liệu AI có trở thành một trong những công cụ vĩ đại nhất của nhân loại hay một điểm yếu nghiêm trọng tùy thuộc vào các bước chúng ta thực hiện ngay bây giờ.

Kết luận

Kỷ nguyên của các cuộc tấn công mạng tự động hoàn toàn được thúc đẩy bởi AI đã đến. Trường hợp vibe hacking cho thấy rằng AI tiên tiến có thể hoạt động như một tác nhân tội phạm. Các nỗ lực phát hiện và phản ứng của Anthropic mang lại hy vọng, nhưng chúng cũng làm nổi bật quy mô của thách thức phía trước. Chuẩn bị cho mối đe dọa mới nổi này đòi hỏi đầu tư chủ động vào nghiên cứu an toàn, công nghệ phòng thủ tốt hơn và hợp tác rộng rãi trên các ngành và biên giới. Nếu được xử lý một cách có trách nhiệm, AI vẫn có thể phục vụ như một công cụ mạnh mẽ cho điều tốt đẹp. Nếu bị bỏ qua, nó rủi ro trở thành một trong những điểm yếu lớn nhất của thời đại kỹ thuật số.

Dr. Tehseen Zia

Tiến sĩ Tehseen Zia là Giáo sư Liên kết có thời hạn tại Đại học COMSATS Islamabad, nắm giữ bằng Tiến sĩ về Trí tuệ Nhân tạo từ Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ Nhân tạo, Học máy, Khoa học Dữ liệu và Thị giác Máy tính, ông đã có những đóng góp đáng kể với các ấn phẩm trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã dẫn dắt các dự án công nghiệp khác nhau với tư cách là Điều tra viên Chính và từng là Tư vấn viên Trí tuệ Nhân tạo.