Báo cáo
Tình hình An ninh Trí tuệ Nhân tạo vào năm 2025: Những thông tin chính từ Báo cáo Cisco

Khi ngày càng nhiều doanh nghiệp áp dụng Trí tuệ Nhân tạo (AI), việc hiểu rõ về rủi ro an ninh của nó đã trở nên quan trọng hơn bao giờ hết. AI đang thay đổi các ngành công nghiệp và quy trình làm việc, nhưng nó cũng giới thiệu những thách thức an ninh mới mà các tổ chức phải giải quyết. Bảo vệ các hệ thống AI là điều cần thiết để duy trì niềm tin, bảo vệ quyền riêng tư và đảm bảo hoạt động kinh doanh trơn tru. Bài viết này tóm tắt những thông tin chính từ báo cáo “Tình hình An ninh Trí tuệ Nhân tạo vào năm 2025” của Cisco. Nó cung cấp một cái nhìn tổng quan về tình hình an ninh AI hiện tại và những gì các công ty nên xem xét cho tương lai.
Mối đe dọa An ninh đối với Trí tuệ Nhân tạo đang tăng
Nếu năm 2024 đã dạy cho chúng ta điều gì, thì đó là việc áp dụng AI đang diễn ra nhanh hơn so với khả năng bảo vệ an ninh của nhiều tổ chức. Báo cáo của Cisco cho biết khoảng 72% tổ chức hiện đang sử dụng AI trong các chức năng kinh doanh của họ, nhưng chỉ 13% cảm thấy hoàn toàn sẵn sàng để tối ưu hóa tiềm năng của nó một cách an toàn. Khoảng cách giữa việc áp dụng và sẵn sàng này chủ yếu được thúc đẩy bởi các lo ngại về an ninh, vẫn là rào cản chính đối với việc sử dụng AI rộng rãi hơn trong doanh nghiệp. Điều làm cho tình hình này trở nên đáng lo ngại hơn là AI giới thiệu những loại mối đe dọa mới mà các phương pháp an ninh truyền thống không được trang bị đầy đủ để xử lý. Không giống như an ninh mạng truyền thống, thường bảo vệ các hệ thống cố định, AI mang lại những mối đe dọa động và thích nghi mà khó dự đoán hơn. Báo cáo nhấn mạnh một số mối đe dọa mới mà các tổ chức nên biết:
- Các cuộc tấn công cơ sở hạ tầng: Cơ sở hạ tầng AI đã trở thành mục tiêu chính cho các kẻ tấn công. Một ví dụ đáng chú ý là sự xâm phạm của Công cụ Bộ chứa NVIDIA, cho phép các kẻ tấn công truy cập vào hệ thống tệp, chạy mã độc và tăng quyền. Tương tự, Ray, một khuôn khổ AI mã nguồn mở cho quản lý GPU, đã bị xâm phạm trong một trong những cuộc tấn công thực tế đầu tiên vào khuôn khổ AI. Những trường hợp này cho thấy làm thế nào các điểm yếu trong cơ sở hạ tầng AI có thể ảnh hưởng đến nhiều người dùng và hệ thống.
- Rủi ro trong chuỗi cung ứng: Các điểm yếu trong chuỗi cung ứng AI cũng là một mối quan ngại đáng kể. Khoảng 60% tổ chức phụ thuộc vào các thành phần hoặc hệ sinh thái AI mã nguồn mở. Điều này tạo ra rủi ro vì các kẻ tấn công có thể xâm phạm các công cụ được sử dụng rộng rãi này. Báo cáo đề cập đến một kỹ thuật gọi là “Sleepy Pickle,” cho phép các đối thủ có thể can thiệp vào các mô hình AI ngay cả sau khi phân phối. Điều này làm cho việc phát hiện trở nên cực kỳ khó khăn.
- Các cuộc tấn công cụ thể vào AI: Các phương pháp tấn công mới đang phát triển nhanh chóng. Các phương pháp như tiêm lệnh, jailbreaking và trích xuất dữ liệu đào tạo cho phép các kẻ tấn công vượt qua các biện pháp bảo vệ an toàn và truy cập vào thông tin nhạy cảm chứa trong các tập dữ liệu đào tạo.
Các Vector Tấn công nhắm vào Hệ thống Trí tuệ Nhân tạo
Báo cáo nhấn mạnh sự xuất hiện của các vector tấn công mà các tác nhân độc hại sử dụng để khai thác các điểm yếu trong các hệ thống AI. Những cuộc tấn công này có thể xảy ra tại các giai đoạn khác nhau của chu kỳ sống của AI, từ thu thập dữ liệu và đào tạo mô hình đến triển khai và suy luận. Mục tiêu thường là làm cho AI hoạt động theo những cách không mong muốn, tiết lộ dữ liệu riêng tư hoặc thực hiện các hành động có hại.
Trong những năm gần đây, các phương pháp tấn công này đã trở nên tinh vi và khó phát hiện hơn. Báo cáo nhấn mạnh một số loại vector tấn công:
- Jailbreaking: Kỹ thuật này liên quan đến việc tạo ra các lệnh đối thủ có thể vượt qua các biện pháp bảo vệ an toàn của mô hình. Mặc dù có những cải tiến trong các biện pháp bảo vệ AI, nghiên cứu của Cisco cho thấy rằng thậm chí các cuộc tấn công jailbreaking đơn giản vẫn có hiệu quả chống lại các mô hình tiên tiến như DeepSeek R1.
- Tiêm lệnh gián tiếp: Không giống như các cuộc tấn công trực tiếp, vector tấn công này liên quan đến việc thao túng dữ liệu đầu vào hoặc bối cảnh mà mô hình AI sử dụng một cách gián tiếp. Các kẻ tấn công có thể cung cấp các tài liệu nguồn bị xâm phạm như tệp PDF hoặc trang web độc hại, khiến AI tạo ra các đầu ra không mong muốn hoặc có hại. Những cuộc tấn công này đặc biệt nguy hiểm vì chúng không yêu cầu truy cập trực tiếp vào hệ thống AI, cho phép các kẻ tấn công vượt qua nhiều biện pháp bảo vệ truyền thống.
- Trích xuất và đầu độc dữ liệu đào tạo: Các nhà nghiên cứu của Cisco đã chứng minh rằng các rô-bốt trò chuyện có thể bị lừa để tiết lộ các đoạn của các bài viết tin tức, cho phép họ tái tạo nguồn gốc của tài liệu. Điều này đặt ra những lo ngại nghiêm trọng về quyền riêng tư của dữ liệu, tài sản trí tuệ và tuân thủ. Các kẻ tấn công cũng có thể đầu độc dữ liệu đào tạo bằng cách tiêm các đầu vào độc hại. Điều đáng lo ngại là đầu độc chỉ 0,01% các tập dữ liệu lớn như LAION-400M hoặc COYO-700M có thể ảnh hưởng đến hành vi của mô hình, và điều này có thể được thực hiện với một ngân sách nhỏ (khoảng 60 USD), làm cho những cuộc tấn công này trở nên dễ tiếp cận đối với nhiều tác nhân độc hại.
Báo cáo nhấn mạnh những lo ngại nghiêm trọng về tình hình hiện tại của những cuộc tấn công này, với các nhà nghiên cứu đạt được tỷ lệ thành công 100% chống lại các mô hình tiên tiến như DeepSeek R1 và Llama 2. Điều này tiết lộ những điểm yếu an ninh quan trọng và rủi ro tiềm ẩn liên quan đến việc sử dụng chúng. Ngoài ra, báo cáo xác định sự xuất hiện của những mối đe dọa mới như các cuộc tấn công jailbreaking dựa trên âm thanh được thiết kế đặc biệt để nhắm vào các mô hình AI đa phương thức.
Phát hiện từ Nghiên cứu An ninh Trí tuệ Nhân tạo của Cisco
Đội ngũ nghiên cứu của Cisco đã đánh giá các khía cạnh khác nhau của an ninh AI và tiết lộ một số phát hiện chính:
- Jailbreaking thuật toán: Các nhà nghiên cứu đã chứng minh rằng thậm chí các mô hình AI hàng đầu cũng có thể bị lừa một cách tự động. Sử dụng một phương pháp gọi là Cây tấn công với cắt tỉa (TAP), các nhà nghiên cứu đã vượt qua các biện pháp bảo vệ trên GPT-4 và Llama 2.
- Rủi ro trong việc tinh chỉnh: Nhiều doanh nghiệp tinh chỉnh các mô hình cơ bản để cải thiện sự liên quan cho các lĩnh vực cụ thể. Tuy nhiên, các nhà nghiên cứu đã tìm thấy rằng việc tinh chỉnh có thể làm suy yếu các thanh chắn an toàn nội bộ. Các phiên bản được tinh chỉnh dễ bị tấn công jailbreaking hơn ba lần và có khả năng tạo ra nội dung có hại gấp 22 lần so với các mô hình gốc.
- Trích xuất dữ liệu đào tạo: Các nhà nghiên cứu của Cisco đã sử dụng một phương pháp phân tích đơn giản để lừa các rô-bốt trò chuyện tái tạo các đoạn của các bài viết tin tức, cho phép họ tái tạo nguồn gốc của tài liệu. Điều này đặt ra những rủi ro cho việc tiết lộ dữ liệu nhạy cảm hoặc độc quyền.
- Đầu độc dữ liệu: Đầu độc dữ liệu: Đội ngũ của Cisco đã chứng minh rằng làm thế nào dễ dàng và không tốn kém để đầu độc các tập dữ liệu web lớn. Với khoảng 60 USD, các nhà nghiên cứu đã quản lý để đầu độc 0,01% các tập dữ liệu như LAION-400M hoặc COYO-700M. Hơn nữa, họ nhấn mạnh rằng mức độ đầu độc này đủ để gây ra những thay đổi đáng chú ý trong hành vi của mô hình.
Vai trò của Trí tuệ Nhân tạo trong Tội phạm mạng
AI không chỉ là mục tiêu – nó cũng đang trở thành một công cụ cho các tội phạm mạng. Báo cáo lưu ý rằng tự động hóa và kỹ thuật xã hội được thúc đẩy bởi AI đã làm cho các cuộc tấn công trở nên hiệu quả và khó phát hiện hơn. Từ các cuộc tấn công lừa đảo đến sao chép giọng nói, AI giúp các tội phạm tạo ra các cuộc tấn công cá nhân hóa và thuyết phục. Báo cáo cũng xác định sự xuất hiện của các công cụ AI độc hại như “DarkGPT,” được thiết kế đặc biệt để giúp tội phạm mạng bằng cách tạo ra các email lừa đảo hoặc khai thác các điểm yếu. Điều làm cho những công cụ này đặc biệt đáng lo ngại là sự dễ tiếp cận của chúng. Thậm chí các tội phạm có kỹ năng thấp cũng có thể tạo ra các cuộc tấn công cá nhân hóa cao mà có thể tránh được các biện pháp bảo vệ truyền thống.
Đactices tốt nhất để Bảo vệ Trí tuệ Nhân tạo
Dựa trên bản chất dễ thay đổi của an ninh AI, Cisco khuyến nghị một số bước thực tế cho các tổ chức:
- Quản lý Rủi ro trên Toàn bộ Chu kỳ sống của AI: Điều quan trọng là xác định và giảm thiểu rủi ro tại mọi giai đoạn của chu kỳ sống AI, từ việc thu thập dữ liệu và đào tạo mô hình đến triển khai và giám sát. Điều này cũng bao gồm việc bảo vệ các thành phần của bên thứ ba, áp dụng các thanh chắn an toàn mạnh mẽ và kiểm soát chặt chẽ các điểm truy cập.
- Sử dụng Các Thực hành An ninh Mạng đã Thành lập: Mặc dù AI là duy nhất, nhưng các thực hành an ninh mạng tốt nhất đã được thiết lập vẫn là rất quan trọng. Các kỹ thuật như kiểm soát truy cập, quản lý quyền và ngăn chặn mất dữ liệu có thể đóng vai trò quan trọng.
- Tập trung vào Các Khu vực Dễ bị Tấn công: Các tổ chức nên tập trung vào các khu vực dễ bị tấn công nhất, như chuỗi cung ứng và các ứng dụng AI của bên thứ ba. Bằng cách hiểu nơi các điểm yếu nằm, các doanh nghiệp có thể thực hiện các biện pháp phòng thủ được nhắm mục tiêu.
- Giáo dục và Đào tạo Nhân viên: Khi các công cụ AI trở nên phổ biến, điều quan trọng là đào tạo người dùng về sử dụng AI có trách nhiệm và nhận thức về rủi ro. Một lực lượng lao động được thông tin tốt giúp giảm thiểu việc phơi bày dữ liệu và lạm dụng vô tình.
Nhìn về Tương lai
Việc áp dụng AI sẽ tiếp tục tăng trưởng, và cùng với nó, các rủi ro an ninh sẽ phát triển. Các chính phủ và tổ chức trên toàn thế giới đang nhận ra những thách thức này và bắt đầu xây dựng các chính sách và quy định để hướng dẫn an toàn AI. Như báo cáo của Cisco nhấn mạnh, sự cân bằng giữa an toàn AI và tiến bộ sẽ định hình kỷ nguyên tiếp theo của phát triển và triển khai AI. Các tổ chức ưu tiên an ninh cùng với đổi mới sẽ được trang bị tốt nhất để xử lý các thách thức và tận dụng các cơ hội mới xuất hiện. chính sách và quy định để hướng dẫn an toàn AI. Như báo cáo của Cisco nhấn mạnh, sự cân bằng giữa an toàn AI và tiến bộ sẽ định hình kỷ nguyên tiếp theo của phát triển và triển khai AI. Các tổ chức ưu tiên an ninh cùng với đổi mới sẽ được trang bị tốt nhất để xử lý các thách thức và tận dụng các cơ hội mới xuất hiện.












