Connect with us

Mã được tạo bởi AI ở đây để tồn tại. Chúng ta có an toàn hơn không?

Lãnh đạo tư tưởng

Mã được tạo bởi AI ở đây để tồn tại. Chúng ta có an toàn hơn không?

mm

Lập trình vào năm 2025 không phải là làm việc chăm chỉ trên các mã nhỏ hoặc dành nhiều giờ để gỡ lỗi. Đó là một cảm giác hoàn toàn khác. Mã được tạo bởi AI sẽ chiếm đa số mã trong các sản phẩm tương lai và nó đã trở thành một công cụ thiết yếu cho các nhà phát triển hiện đại. Được gọi là “lập trình theo cảm giác”, việc sử dụng mã được tạo bởi các công cụ như Github Copilot, Amazon CodeWhisperer và Chat GPT sẽ trở thành tiêu chuẩn và không phải là ngoại lệ trong việc giảm thời gian xây dựng và tăng hiệu suất. Nhưng liệu sự tiện lợi của mã được tạo bởi AI có rủi ro về một mối đe dọa đen tối hơn không? Liệu AI tạo mã có tăng khả năng dễ bị tấn công trong kiến trúc bảo mật hay có cách nào để các nhà phát triển “lập trình theo cảm giác” một cách an toàn?

“Các sự kiện bảo mật do các lỗ hổng trong mã được tạo bởi AI là một trong những chủ đề ít được thảo luận nhất ngày nay,” Sanket Saurav, người sáng lập DeepSource, cho biết. “Vẫn còn nhiều mã được tạo bởi các nền tảng như Copilot hoặc Chat GPT không được xem xét bởi con người, và các vi phạm bảo mật có thể là thảm họa cho các công ty bị ảnh hưởng.”

Nhà phát triển của một nền tảng mã nguồn mở sử dụng phân tích tĩnh cho chất lượng mã và bảo mật, Saurav đã đề cập đến vụ tấn công SolarWinds vào năm 2020 như một loại “sự kiện tuyệt chủng” mà các công ty có thể phải đối mặt nếu họ không cài đặt các rào cản bảo mật đúng khi sử dụng mã được tạo bởi AI. “Phân tích tĩnh cho phép xác định các mẫu mã không an toàn và các thực hành mã hóa kém,” Saurav cho biết.

Được tấn công thông qua thư viện

Các mối đe dọa bảo mật đối với mã được tạo bởi AI có thể có nhiều hình thức và có thể được nhắm vào các thư viện. Các thư viện trong lập trình là mã có thể tái sử dụng hữu ích mà các nhà phát triển sử dụng để tiết kiệm thời gian khi viết mã.

Họ thường giải quyết các nhiệm vụ lập trình thường xuyên như quản lý các tương tác cơ sở dữ liệu và giúp các lập trình viên không phải viết lại mã từ đầu.

Một mối đe dọa như vậy đối với các thư viện được gọi là “ảo giác”, nơi mã tạo mã AI hiển thị một lỗ hổng thông qua việc sử dụng các thư viện hư cấu. Một loại tấn công mới hơn đối với mã được tạo bởi AI được gọi là “slopsquatting” nơi các kẻ tấn công có thể nhắm trực tiếp vào các thư viện để xâm nhập vào cơ sở dữ liệu.

Đáp ứng những mối đe dọa này một cách trực diện có thể đòi hỏi nhiều sự chú ý hơn so với những gì được gợi ý bởi thuật ngữ “lập trình theo cảm giác”. Phát biểu từ văn phòng của mình tại Université du Québec en Outaouais, Giáo sư Rafael Khoury đã theo dõi chặt chẽ các phát triển trong bảo mật của mã được tạo bởi AI và tự tin rằng các kỹ thuật mới sẽ cải thiện sự an toàn của nó.

Trong một bài báo năm 2023, Giáo sư Khoury đã điều tra kết quả của việc yêu cầu ChatGPT tạo mã mà không có thêm ngữ cảnh hoặc thông tin, một thực hành dẫn đến mã không an toàn. Đó là những ngày đầu của Chat GPT và Khoury hiện đang lạc quan về tương lai phía trước. “Kể từ đó, đã có rất nhiều nghiên cứu đang được xem xét và tương lai đang xem xét một chiến lược để sử dụng LLM có thể dẫn đến kết quả tốt hơn,” Khoury cho biết, thêm rằng “bảo mật đang trở nên tốt hơn, nhưng chúng tôi không ở trong một vị trí mà chúng tôi có thể đưa ra một lời nhắc trực tiếp và nhận được mã an toàn.”

Khoury tiếp tục mô tả một nghiên cứu đầy hứa hẹn nơi họ tạo mã và sau đó gửi mã này đến một công cụ phân tích nó về các lỗ hổng. Phương pháp được sử dụng bởi công cụ này được gọi là Tìm kiếm các dị thường dòng với Trí tuệ nhân tạo tạo mã (hay FLAG ngắn gọn).

“Những công cụ này gửi FLAG có thể xác định một lỗ hổng ở dòng 24, ví dụ, mà một nhà phát triển có thể gửi lại cho LLM với thông tin và yêu cầu nó xem xét và sửa lỗi,” anh cho biết.

Khoury đề xuất rằng sự tương tác này có thể là rất quan trọng để sửa mã dễ bị tấn công. “Nghiên cứu này cho thấy rằng với năm lần lặp lại, bạn có thể giảm các lỗ hổng xuống zero.”

Điều này cho thấy, phương pháp FLAG không phải là không có vấn đề, đặc biệt là nó có thể dẫn đến cả các kết quả dương tính giả và âm tính giả. Ngoài ra, còn có những hạn chế về độ dài của mã mà LLM có thể tạo và việc kết hợp các mã nhỏ có thể thêm một lớp rủi ro khác.

Giữ con người trong vòng lặp

Một số người chơi trong “lập trình theo cảm giác” khuyên nên chia mã thành các phần nhỏ và đảm bảo rằng con người luôn ở vị trí trung tâm trong các chỉnh sửa quan trọng nhất của mã. “Khi viết mã, hãy nghĩ về các cam kết,” Kevin Hou, trưởng nhóm kỹ thuật sản phẩm tại Windsurf cho biết, ca ngợi sự khôn ngoan của các phần nhỏ.

“Chia một dự án lớn thành các phần nhỏ hơn mà thường sẽ là các cam kết hoặc yêu cầu kéo. Hãy để tác nhân xây dựng quy mô nhỏ, một tính năng cách ly tại một thời điểm. Điều này có thể đảm bảo rằng mã đầu ra được kiểm tra và hiểu rõ,” anh thêm.

Tại thời điểm viết, Windsurf đã tiếp cận hơn 5 tỷ dòng mã được tạo bởi AI (qua tên trước đó là Codeium). Hou cho biết câu hỏi quan trọng nhất họ đang trả lời là liệu nhà phát triển có nhận thức về quá trình hay không.

“Trí tuệ nhân tạo có khả năng thực hiện nhiều chỉnh sửa trên nhiều tệp cùng một lúc, vì vậy làm thế nào chúng ta có thể đảm bảo rằng nhà phát triển thực sự hiểu và xem xét những gì đang diễn ra chứ không chỉ đơn giản chấp nhận mọi thứ?” Hou hỏi, thêm rằng họ đã đầu tư rất nhiều vào UX của Windsurf “với rất nhiều cách trực quan để luôn ở cùng bước với những gì AI đang làm, và giữ con người luôn ở trong vòng lặp.”

Điều này cho thấy, khi “lập trình theo cảm giác” trở nên phổ biến hơn, con người trong vòng lặp phải cẩn thận hơn về các lỗ hổng của nó. Từ “ảo giác” đến các mối đe dọa “slopsquatting”, những thách thức là có thật, nhưng các giải pháp cũng có thật.

Các công cụ mới nổi như phân tích tĩnh, các phương pháp tinh chỉnh lặp lại như FLAG, và thiết kế UX cẩn thận cho thấy rằng bảo mật và tốc độ không phải là những thứ loại trừ lẫn nhau.

Chìa khóa nằm ở việc giữ cho các nhà phát triển tham gia, thông tin và kiểm soát. Với các rào cản bảo mật đúng và một tư duy “tin nhưng kiểm chứng”, mã hóa được hỗ trợ bởi AI có thể vừa cách mạng vừa có trách nhiệm.

Arjun Harindranath là một nhà báo tự do có trụ sở tại Medellin, Colombia, người viết về các câu chuyện xung đột, di cư và công nghệ cho khán giả toàn cầu. Các bài viết trước đây bao gồm Al Jazeera, TechCrunch, The Next Web và New York Times.