sơ khai DRM cho Bộ dữ liệu thị giác máy tính - Unite.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

DRM cho bộ dữ liệu thị giác máy tính

mm
cập nhật on

Lịch sử cho thấy rằng cuối cùng, thời đại 'mở' của nghiên cứu thị giác máy tính, trong đó khả năng tái tạo và đánh giá ngang hàng thuận lợi là trọng tâm cho sự phát triển của một sáng kiến ​​mới, phải nhường chỗ cho một kỷ nguyên mới về bảo vệ sở hữu trí tuệ - nơi các cơ chế khép kín và nền tảng có tường bao quanh ngăn cản các đối thủ cạnh tranh xâm nhập vào. làm giảm chi phí phát triển tập dữ liệu cao hoặc từ việc sử dụng một dự án tốn kém làm bước đệm đơn thuần để phát triển phiên bản (có lẽ ưu việt) của riêng họ.

Hiện tại, xu hướng ngày càng tăng đối với chủ nghĩa bảo hộ chủ yếu được hỗ trợ bằng cách tạo hàng rào cho các khung trung tâm độc quyền đằng sau quyền truy cập API, nơi người dùng gửi các mã thông báo hoặc yêu cầu thưa thớt và là nơi hoàn toàn ẩn các quy trình chuyển đổi làm cho các phản hồi của khung có giá trị.

Trong các trường hợp khác, bản thân mô hình cuối cùng có thể được phát hành, nhưng không có thông tin trung tâm làm cho nó có giá trị, chẳng hạn như các trọng số được đào tạo trước có thể có giá nhiều triệu để tạo ra; hoặc thiếu tập dữ liệu độc quyền hoặc chi tiết chính xác về cách một tập hợp con được tạo ra từ một loạt các tập dữ liệu mở. Trong trường hợp mô hình Ngôn ngữ tự nhiên biến đổi GPT-3 của OpenAI, cả hai biện pháp bảo vệ hiện đang được sử dụng, khiến những người bắt chước mô hình, chẳng hạn như GPT mới, để tập hợp một sản phẩm gần đúng nhất có thể.

Bộ dữ liệu hình ảnh chống sao chép

Tuy nhiên, mối quan tâm ngày càng tăng đối với các phương pháp mà khung học máy 'được bảo vệ' có thể lấy lại một số mức độ di động, bằng cách đảm bảo rằng chỉ những người dùng được ủy quyền (ví dụ: người dùng trả phí) mới có thể sử dụng hệ thống được đề cập một cách có lợi. Điều này thường liên quan đến việc mã hóa tập dữ liệu theo một số cách có lập trình để khung AI đọc 'sạch' trong thời gian đào tạo, nhưng bị xâm phạm hoặc theo cách nào đó không thể sử dụng được trong bất kỳ bối cảnh nào khác.

Một hệ thống như vậy vừa được đề xuất bởi các nhà nghiên cứu tại Đại học Khoa học và Công nghệ Trung Quốc tại An Huy và Đại học Phúc Đán tại Thượng Hải. có tiêu đề Bảo vệ bộ dữ liệu hình ảnh đảo ngược, Các giấy cung cấp một đường ống tự động thêm ví dụ nghịch cảnh nhiễu loạn vào một tập dữ liệu hình ảnh, do đó nó không thể được sử dụng một cách hữu ích cho việc đào tạo trong trường hợp vi phạm bản quyền, nhưng khi hệ thống được ủy quyền có chứa mã thông báo bí mật đã lọc bỏ hoàn toàn biện pháp bảo vệ.

Từ bài báo: hình ảnh nguồn 'có giá trị' được hiển thị một cách hiệu quả không thể huấn luyện được bằng các kỹ thuật ví dụ đối nghịch, với các nhiễu loạn được loại bỏ một cách có hệ thống và hoàn toàn tự động đối với người dùng 'được ủy quyền'. Nguồn: https://arxiv.org/pdf/2112.14420.pdf

Từ bài báo: hình ảnh nguồn 'có giá trị' được hiển thị một cách hiệu quả không thể huấn luyện được bằng các kỹ thuật ví dụ đối nghịch, với các nhiễu loạn được loại bỏ một cách có hệ thống và hoàn toàn tự động đối với người dùng 'được ủy quyền'. Nguồn: https://arxiv.org/pdf/2112.14420.pdf

Cơ chế cho phép bảo vệ được gọi là trình tạo ví dụ đối nghịch có thể đảo ngược (RAEG) và tương đương hiệu quả với việc mã hóa trên thực tế khả năng sử dụng của các hình ảnh cho mục đích phân loại, sử dụng Ẩn dữ liệu có thể đảo ngược (RĐH). Các tác giả tuyên bố:

'Đầu tiên, phương pháp này tạo ra hình ảnh đối nghịch bằng cách sử dụng các phương pháp AE hiện có, sau đó nhúng nhiễu loạn đối nghịch vào hình ảnh đối nghịch và tạo ra hình ảnh stego bằng RDH. Do đặc điểm của khả năng đảo ngược, nhiễu loạn nghịch cảnh và hình ảnh gốc có thể được phục hồi.'

Các hình ảnh gốc từ tập dữ liệu được đưa vào mạng thần kinh đảo ngược hình chữ U (INN) để tạo ra các hình ảnh bị ảnh hưởng bất lợi được tạo ra để đánh lừa các hệ thống phân loại. Điều này có nghĩa là quá trình trích xuất đặc điểm điển hình sẽ bị suy yếu, gây khó khăn cho việc phân loại các đặc điểm như giới tính và các đặc điểm dựa trên khuôn mặt khác (mặc dù kiến ​​trúc hỗ trợ nhiều lĩnh vực, thay vì chỉ tài liệu dựa trên khuôn mặt).

Thử nghiệm đảo ngược RAEG, trong đó các loại tấn công khác nhau được thực hiện trên hình ảnh trước khi tái tạo. Các phương thức tấn công bao gồm Gaussian Blur và JPEG artefacts.

Thử nghiệm đảo ngược RAEG, trong đó các loại tấn công khác nhau được thực hiện trên hình ảnh trước khi tái tạo. Các phương thức tấn công bao gồm Gaussian Blur và JPEG artefacts.

Do đó, nếu cố gắng sử dụng tập dữ liệu 'bị hỏng' hoặc 'được mã hóa' trong một khung được thiết kế để tạo khuôn mặt dựa trên GAN hoặc cho các mục đích nhận dạng khuôn mặt, thì mô hình kết quả sẽ kém hiệu quả hơn so với nếu nó được đào tạo trên hình ảnh không bị xáo trộn.

Khóa hình ảnh

Tuy nhiên, đó chỉ là một tác dụng phụ của khả năng ứng dụng chung của các phương pháp gây nhiễu phổ biến. Trên thực tế, trong trường hợp sử dụng được hình dung, dữ liệu sẽ bị tê liệt trừ trường hợp quyền truy cập được phép vào khung đích, vì 'chìa khóa' trung tâm của dữ liệu sạch là mã thông báo bí mật trong kiến ​​trúc đích.

Mã hóa này đi kèm với một mức giá; các nhà nghiên cứu mô tả việc mất chất lượng hình ảnh gốc là "biến dạng nhẹ" và nêu rõ '[Phương pháp] được đề xuất có thể khôi phục hình ảnh gốc gần như hoàn hảo, trong khi các phương pháp trước đó chỉ có thể khôi phục một phiên bản mờ.'

Các phương pháp trước đây được đề cập là từ tháng 2018 năm XNUMX giấy AI trái phép không thể nhận ra tôi: Ví dụ về đối thủ có thể đảo ngược, sự hợp tác giữa hai trường đại học Trung Quốc và Trung tâm RIKEN cho Dự án Trí tuệ Tiên tiến (AIP); Và Tấn công đối nghịch có thể đảo ngược dựa trên chuyển đổi hình ảnh có thể đảo ngược, Một giấy 2019 cũng từ lĩnh vực nghiên cứu học thuật Trung Quốc.

Các nhà nghiên cứu của bài báo mới tuyên bố đã có những cải tiến đáng chú ý về khả năng sử dụng của hình ảnh được khôi phục, so với các phương pháp trước đó, quan sát thấy rằng phương pháp đầu tiên quá nhạy cảm với sự can thiệp của trung gian và quá dễ dàng để phá vỡ, trong khi phương pháp thứ hai gây ra sự xuống cấp quá mức của các hình ảnh ban đầu tại thời điểm đào tạo (được ủy quyền), làm suy yếu khả năng ứng dụng của hệ thống.

Kiến trúc, dữ liệu và thử nghiệm

Hệ thống mới bao gồm một trình tạo, một lớp tấn công áp dụng nhiễu loạn, các bộ phân loại mục tiêu được đào tạo trước và một phần tử phân biệt đối xử.

Kiến trúc của RAEG. Ở giữa bên trái, chúng ta thấy mã thông báo bí mật 'Iprt', mã này sẽ cho phép khử nhiễu hình ảnh tại thời điểm đào tạo, bằng cách xác định các tính năng nhiễu loạn được đưa vào hình ảnh nguồn và chiết khấu chúng.

Kiến trúc của RAEG. Ở giữa bên trái, chúng ta thấy mã thông báo bí mật 'ISẵn sàng', điều này sẽ cho phép khử nhiễu hình ảnh tại thời điểm đào tạo, bằng cách xác định các tính năng nhiễu loạn được đưa vào hình ảnh nguồn và chiết khấu chúng.

Dưới đây là kết quả so sánh thử nghiệm với hai phương pháp trước đó, sử dụng ba bộ dữ liệu: CelebA-100; Caltech-101; Và Mini-ImageNet.

Ba bộ dữ liệu đã được đào tạo thành các mạng phân loại mục tiêu, với kích thước lô là 32, trên NVIDIA RTX 3090 trong suốt một tuần, trong 50 kỷ nguyên.

Các tác giả cho rằng RAEG là công trình đầu tiên cung cấp một mạng thần kinh không thể đảo ngược có thể chủ động tạo ra các ví dụ đối lập.

 

Xuất bản lần đầu vào ngày 4 tháng 2022 năm XNUMX.