Connect with us

Οι «Προστατευμένες» Εικόνες Είναι Ευκολότερες, Όχι Δυσκολότερες, να Κλαπεί με AI

Η γωνία του Anderson

Οι «Προστατευμένες» Εικόνες Είναι Ευκολότερες, Όχι Δυσκολότερες, να Κλαπεί με AI

mm
A shadowy man steals into an art gallery as the guard sleeps. Krita/Flux-1 Dev + Firefly

Νέα έρευνα υποδηλώνει ότι τα εργαλεία watermaking που προορίζονται για να μπλοκάρουν τις επεξεργασίες εικόνων AI μπορεί να έχουν αντίθετο αποτέλεσμα. Αντί να σταματούν τα μοντέλα όπως το Stable Diffusion από το να κάνουν αλλαγές, ορισμένες προστασίες στην πραγματικότητα βοηθούν το AI να ακολουθεί τις οδηγίες επεξεργασίας πιο στενά, καθιστώντας τις ανεπιθύμητες χειρισμοί ακόμη ευκολότερες.

 

Υπάρχει một αξιοσημείωτο και ισχυρό νήμα στην βιβλιογραφία της υπολογιστικής όρασης που ασχολείται με την προστασία των πνευματικών δικαιωμάτων των εικόνων από την εκπαίδευση σε μοντέλα AI ή από τη χρήση σε διαδικασίες εικόνας-προς-εικόνα AI. Τα συστήματα αυτού του είδους γενικά στοχεύουν στα Λατινικά Μοντέλα Διάχυσης (LDMs) όπως το Stable Diffusion και το Flux, τα οποία χρησιμοποιούν διαδικασίες με βάση το θόρυβο για να κωδικοποιήσουν και να αποκωδικοποιήσουν τις εικόνες.

Μέσω της εισαγωγής ανταγωνιστικού θορύβου σε αλλιώς φυσιολογικές εικόνες, είναι δυνατό να προκληθεί η εικόνα να ανιχνεύσει λανθασμένα το περιεχόμενο της εικόνας και να ακρωτηριάζει τα συστήματα δημιουργίας εικόνων από το να εκμεταλλεύονται πνευματικά δικαιώματα δεδομένων:

Από το/MIT paper 'Raising the Cost of Malicious AI-Powered Image Editing', παραδείγματα μιας πηγαίας εικόνας 'ανοσοποιημένης' ενάντια στη χειραγώγηση (κατώτερη σειρά). Πηγή: https://arxiv.org/pdf/2302.06588

Από το/MIT paper ‘Raising the Cost of Malicious AI-Powered Image Editing’, παραδείγματα μιας πηγαίας εικόνας ‘ανοσοποιημένης’ ενάντια στη χειραγώγηση (κατώτερη σειρά). Πηγή: https://arxiv.org/pdf/2302.06588

Από την αντίδραση των καλλιτεχνών ενάντια στη λίβερε χρήση του Stable Diffusion για web-σκαμμένα εικόνες (συμπεριλαμβανομένων πνευματικών δικαιωμάτων εικόνων) το 2023, η ερευνητική σκηνή έχει παράγει πολλές παραλλαγές του ίδιου θέματος – η ιδέα ότι οι εικόνες μπορούν να δηλητηριαστούν αόρατα ενάντια στη διδασκαλία σε συστήματα AI ή στην吸入 σε γεννητικά πipelines AI, χωρίς να επηρεάσουν αρνητικά την ποιότητα της εικόνας, για τον μέσο θεατή.

Σε όλες τις περιπτώσεις, υπάρχει μια άμεση συσχέτιση μεταξύ της έντασης της επιβαλλόμενης διαταραχής, του βαθμού στον οποίο η εικόνα προστατεύεται στη συνέχεια και του βαθμού στον οποίο η εικόνα δεν φαίνεται να είναι τόσο καλή όσο θα έπρεπε:

Αν και η ποιότητα του ερευνητικού PDF δεν εικονογραφεί πλήρως το πρόβλημα, μεγαλύτερες ποσότητες ανταγωνιστικής διαταραχής θυσιάζουν την ποιότητα για την ασφάλεια. Εδώ βλέπουμε το φάσμα των διαταραχών ποιότητας στο έργο 'Fawkes' του 2020 που ηγήθηκε το Πανεπιστήμιο του Σικάγου. Πηγή: https://arxiv.org/pdf/2002.08327

Αν και η ποιότητα του ερευνητικού PDF δεν εικονογραφεί πλήρως το πρόβλημα, μεγαλύτερες ποσότητες ανταγωνιστικής διαταραχής θυσιάζουν την ποιότητα για την ασφάλεια. Εδώ βλέπουμε το φάσμα των διαταραχών ποιότητας στο έργο ‘Fawkes’ του 2020 που ηγήθηκε το Πανεπιστήμιο του Σικάγου. Πηγή: https://arxiv.org/pdf/2002.08327

Ιδιαίτερου ενδιαφέροντος για καλλιτέχνες που επιδιώκουν να προστατεύσουν το στυλ τους από μη εξουσιοδοτημένη υιοθέτηση είναι η ικανότητα τέτοιων συστημάτων όχι μόνο να αποκρύπτουν την ταυτότητα και άλλες πληροφορίες, αλλά να ‘πείθουν’ μια διαδικασία εκπαίδευσης AI ότι βλέπει κάτι άλλο από ότι πραγματικά βλέπει, ώστε να μην σχηματίζονται συνδέσεις μεταξύ σεμαντικών και οπτικών περιοχών για ‘προστατευμένα’ δεδομένα εκπαίδευσης (π.χ. μια οδηγία όπως ‘Στυλ του Paul Klee’).

Mist και Glaze είναι δύο δημοφιλείς μεθόδους ένεσης που μπορούν να αποτρέψουν, ή τουλάχιστον να ακρωτηριάσουν τις προσπάθειες να χρησιμοποιηθούν πνευματικά δικαιώματα στυλ σε ροές εργασίας AI και ρουτίνες εκπαίδευσης. Πηγή: https://arxiv.org/pdf/2506.04394

Mist και Glaze είναι δύο δημοφιλείς μεθόδους ένεσης που μπορούν να αποτρέψουν, ή τουλάχιστον να ακρωτηριάσουν τις προσπάθειες να χρησιμοποιηθούν πνευματικά δικαιώματα στυλ σε ροές εργασίας AI και ρουτίνες εκπαίδευσης. Πηγή: https://arxiv.org/pdf/2506.04394

Δικό μας Γκολ

Τώρα, νέα έρευνα από τις ΗΠΑ βρήκε όχι μόνο ότι οι διαταραχές μπορούν να αποτύχουν στην προστασία μιας εικόνας, αλλά ότι η προσθήκη διαταραχής μπορεί στην πραγματικότητα να βελτιώσει την εκμεταλλευσιμότητα της εικόνας σε όλες τις διαδικασίες AI που η διαταραχή προορίζεται να ανοσοποιήσει.

Το έγγραφο αναφέρει:

‘Στις εξеримένους μας με διάφορες μεθόδους προστασίας εικόνων με βάση τη διαταραχή σε πολλαπλά домένια (φυσικές σκηνές εικόνων και έργα τέχνης) και εργασίες επεξεργασίας (γεννήτρια εικόνας-προς-εικόνα και επεξεργασία στυλ), ανακαλύψαμε ότι τέτοιου είδους προστασία δεν επιτυγχάνει πλήρως το στόχο.

‘Στις περισσότερες περιπτώσεις, η διάχυση-με-βασή-διαταραχή της επεξεργασίας προστατευμένων εικόνων παράγει μια επιθυμητή έξοδο εικόνας που ακολουθεί ακριβώς την οδηγία.

‘Τα ευρήματά μας υποδηλώνουν ότι η προσθήκη θορύβου σε εικόνες μπορεί παραδοξότατα να αυξήσει τη σύνδεσή τους με τις δοσμένες κειμενικές οδηγίες κατά τη διαδικασία γεννήτριας, οδηγώντας σε ανεπιθύμητες συνέπειες όπως καλύτερη τελική επεξεργασία.

‘Επομένως, υποστηρίζουμε ότι οι μεθόδους με βάση τη διαταραχή μπορεί να μην παρέχουν μια επαρκή λύση για ροβούστα προστασία εικόνων ενάντια στη διάχυση-με-βασή-διαταραχή.’

Σε δοκιμές, οι προστατευμένες εικόνες εκτέθηκαν σε δύο οικείες σκηνές επεξεργασίας AI: απλή γεννήτρια εικόνας-προς-εικόνα και μεταφορά στυλ. Αυτές οι διαδικασίες αντανακλούν τους κοινούς τρόπους με τους οποίους τα μοντέλα AI μπορεί να εκμεταλλευτούν προστατευμένο περιεχόμενο, είτε με άμεση τροποποίηση μιας εικόνας, είτε με δανεισμό των στιλιστικών χαρακτηριστικών της για χρήση αλλού.

Οι προστατευμένες εικόνες, που προέρχονται από τυποποιημένες πηγές φωτογραφίας και έργων τέχνης, διήχθησαν από αυτές τις διαδικασίες για να δουν εάν οι προστεθείσες διαταραχές θα μπορούσαν να μπλοκάρουν ή να υποβαθμίσουν τις επεξεργασίες.

Αντίθετα, η παρουσία προστασίας συχνά φαινόταν να τονώνει την ευθυγράμμιση του μοντέλου με τις οδηγίες, παράγοντας καθαρές, ακριβείς εξόδους όπου κάποια αποτυχία είχε αναμενθεί.

Οι συγγραφείς συμβουλεύουν, ουσιαστικά, ότι αυτή η πολύ δημοφιλής μέθοδος προστασίας μπορεί να παρέχει μια ψευδή αίσθηση ασφάλειας και ότι οποιαδήποτε τέτοια προσεγγισή προστασίας με βάση τη διαταραχή πρέπει να δοκιμαστεί πλήρως ενάντια στις μεθόδους των συγγραφέων.

Μέθοδος

Οι συγγραφείς έτρεξαν πειράματα χρησιμοποιώντας τρεις μεθόδους προστασίας που εφαρμόζουν προσεκτικά σχεδιασμένες ανταγωνιστικές διαταραχές: PhotoGuard; Mist; και Glaze.

Glaze, ένα από τα πλαίσια που δοκιμάστηκαν από τους συγγραφείς. Glaze παραδείγματα προστασίας για τρεις καλλιτέχνες. Η πρώτη στήλη δείχνει τα αρχικά έργα τέχνης. Η δεύτερη στήλη δείχνει τα αποτελέσματα μιμήσεως χωρίς προστασία. Η τρίτη στήλη δείχνει τις μεταφερόμενες εκδόσεις που χρησιμοποιούνται για βελτίωση κάλυψης, μαζί με το όνομα του στυλ. Η τέταρτη και η πέμπτη στήλη δείχνουν τα αποτελέσματα μιμήσεως με εφαρμογή κάλυψης σε επίπεδα διαταραχής p = 0.05 και p = 0.1. Όλα τα αποτελέσματα χρησιμοποιούν μοντέλα Stable Diffusion. https://arxiv.org/pdf/2302.04222

Glaze, ένα από τα πλαίσια που δοκιμάστηκαν από τους συγγραφείς, δείχνοντας Glaze παραδείγματα προστασίας για τρεις καλλιτέχνες. Η πρώτη στήλη δείχνει τα αρχικά έργα τέχνης. Η δεύτερη στήλη δείχνει τα αποτελέσματα μιμήσεως χωρίς προστασία. Η τρίτη στήλη δείχνει τις μεταφερόμενες εκδόσεις που χρησιμοποιούνται για βελτίωση κάλυψης, μαζί με το όνομα του στυλ. Η τέταρτη και η πέμπτη στήλη δείχνουν τα αποτελέσματα μιμήσεως με εφαρμογή κάλυψης σε επίπεδα διαταραχής p = 0.05 και p = 0.1. Όλα τα αποτελέσματα χρησιμοποιούν μοντέλα Stable Diffusion. https://arxiv.org/pdf/2302.04222

Το PhotoGuard εφαρμόστηκε σε φυσικές σκηνές εικόνων, ενώ οι Mist και Glaze χρησιμοποιήθηκαν σε έργα τέχνης (δηλαδή, ‘artistically-styled’ domains).

Οι δοκιμές κάλυψαν τόσο φυσικές όσο και καλλιτεχνικές εικόνες για να αντανακλούν πιθανές πραγματικές χρήσεις. Η αποτελεσματικότητα κάθε μεθόδου αξιολογήθηκε ελέγχοντας εάν ένα μοντέλο AI θα μπορούσε ακόμη να παράγει ρεαλιστικές και σχετικές με την οδηγία επεξεργασίες όταν εργαζόταν σε προστατευμένες εικόνες. Εάν οι αποτέλεσες εικόνες φαίνονταν πειστικές και ταιριαστές με τις οδηγίες, η προστασία κρίθηκε ότι είχε αποτύχει.

Το Stable Diffusion v1.5 χρησιμοποιήθηκε ως προ-εκπαιδευμένος γεννήτωρ εικόνας για τις εργασίες επεξεργασίας των ερευνητών. Πέντε σπόροι επιλέχθηκαν για να διασφαλιστεί η αναπαραγωγιμότητα: 9222, 999, 123, 66, και 42. Όλες οι άλλες ρυθμίσεις γεννήτριας, όπως η κλίμακα οδηγίας, η δύναμη και τα συνολικά βήματα, ακολούθησαν τις προεπιλεγμένες τιμές που χρησιμοποιήθηκαν στις πειράματα PhotoGuard.

Το PhotoGuard δοκιμάστηκε σε φυσικές σκηνές εικόνων χρησιμοποιώντας το Flickr8k dataset, το οποίο περιέχει πάνω από 8.000 εικόνες που ζευγαρώνουν με μέχρι και πέντε λεζάντες η καθεμία.

Αντιτιθέμενες Σκέψεις

Δύο σύνολα τροποποιημένων λεζάντων δημιουργήθηκαν από την πρώτη λεζάντα κάθε εικόνας με τη βοήθεια Claude Sonnet 3.5. Ένα σύνολο περιείχε οδηγίες που ήταν περιβαλλοντικά κοντά στις αρχικές λεζάντες. Το άλλο σύνολο περιείχε οδηγίες που ήταν περιβαλλοντικά μακρινές.

Για παράδειγμα, από την αρχική λεζάντα ‘Μια νεαρή κοπέλα σε ένα ροζ φόρεμα που μπαίνει σε ένα ξύλινο σπίτι’, μια κοντή οδηγία θα ήταν ‘Μια νεαρή κοπέλα σε ένα μπλε πουκάμισο που μπαίνει σε ένα τοίχωμα από τούβλα’. Από την άλλη πλευρά, μια μακρινή οδηγία θα ήταν ‘Δύο γάτες που ξαπλώνονται σε ένα καναπέ’.

Οι κοντές οδηγίες κατασκευάστηκαν αντικαθιστώντας ουσιαστικά και επιθέματα με σεμαντικά παρόμοιους όρους. Οι μακρινές οδηγίες δημιουργήθηκαν με την οδηγία του μοντέλου να δημιουργήσει λεζάντες που ήταν σεμαντικά πολύ διαφορετικές.

Όλες οι γεννημένες λεζάντες ελέγχθηκαν χειροκίνητα για ποιότητα και σεμαντική συσχέτιση. Η Universal Sentence Encoder της Google χρησιμοποιήθηκε για να υπολογίσει σεμαντικές ομοιότητες μεταξύ των αρχικών και των τροποποιημένων λεζάντων:

Από το συμπληρωματικό υλικό, σεμαντικές ομοιότητες για τις τροποποιημένες λεζάντες που χρησιμοποιήθηκαν στις δοκιμές Flickr8k. Το γράφημα στα αριστερά δείχνει τις ομοιότητες για τις κοντές λεζάντες, με μέσο όρο γύρω στα 0.6. Το γράφημα στα δεξιά δείχνει τις εκτενώς τροποποιημένες λεζάντες, με μέσο όρο γύρω στα 0.1, που αντανακλούν μεγαλύτερη σεμαντική απόσταση από τις αρχικές λεζάντες. Οι τιμές υπολογίστηκαν χρησιμοποιώντας τον Universal Sentence Encoder της Google. Πηγή: https://sigport.org/sites/default/files/docs/IncompleteProtection_SM_0.pdf

Από το συμπληρωματικό υλικό, σεμαντικές ομοιότητες για τις τροποποιημένες λεζάντες που χρησιμοποιήθηκαν στις δοκιμές Flickr8k. Το γράφημα στα αριστερά δείχνει τις ομοιότητες για τις κοντές λεζάντες, με μέσο όρο γύρω στα 0.6. Το γράφημα στα δεξιά δείχνει τις εκτενώς τροποποιημένες λεζάντες, με μέσο όρο γύρω στα 0.1, που αντανακλούν μεγαλύτερη σεμαντική απόσταση από τις αρχικές λεζάντες. Οι τιμές υπολογίστηκαν χρησιμοποιώντας τον Universal Sentence Encoder της Google. Πηγή: https://sigport.org/sites/default/files/docs/IncompleteProtection_SM_0.pdf

Κάθε εικόνα, μαζί με την προστατευμένη της εκδοχή, επεξεργάστηκε χρησιμοποιώντας και τις κοντές και τις μακρινές οδηγίες. Ο Blind/Referenceless Image Spatial Quality Evaluator (BRISQUE) χρησιμοποιήθηκε για να αξιολογήσει την ποιότητα της εικόνας:

Αποτελέσματα γεννήτριας εικόνας-προς-εικόνα σε φυσικές φωτογραφίες που προστατεύονται από το PhotoGuard. Παρά την παρουσία διαταραχών, το Stable Diffusion v1.5 ακολούθησε επιτυχώς τόσο τις μικρές όσο και τις μεγάλες σεμαντικές αλλαγές στις οδηγίες επεξεργασίας, παράγοντας ρεαλιστικά αποτελέσματα που ταιρίαζαν με τις νέες οδηγίες.

Αποτελέσματα γεννήτριας εικόνας-προς-εικόνα σε φυσικές φωτογραφίες που προστατεύονται από το PhotoGuard. Παρά την παρουσία διαταραχών, το Stable Diffusion v1.5 ακολούθησε επιτυχώς τόσο τις μικρές όσο και τις μεγάλες σεμαντικές αλλαγές στις οδηγίες επεξεργασίας, παράγοντας ρεαλιστικά αποτελέσματα που ταιρίαζαν με τις νέες οδηγίες.

Μέτρηση

Για να κρίνουν πόσο καλά η προστασία εμπόδισε την επεξεργασία AI, οι ερευνητές μέτρησαν πόσο στενά τα τελικά αποτελέσματα της εικόνας ταιρίαζαν με τις οδηγίες που δόθηκαν, χρησιμοποιώντας συστήματα βαθμολόγησης που σύγκριναν το περιεχόμενο της εικόνας με την κειμενική οδηγία, για να δουν πόσο καλά ταιριάζουν.

Για αυτό, η CLIP-S χρησιμοποιήθηκε για να ελέγξει πόσο παρόμοιες ήταν οι εικόνες και το κείμενο, ενώ η PAC-S++ πρόσθεσε επιπλέον δείγματα που δημιουργήθηκαν από το AI για να συγχρονίσει την σύγκρισή της πιο στενά με την ανθρώπινη εκτίμηση.

Αυτοί οι δείκτες Συσχέτισης Εικόνας-Κειμένου (ITA) υποδηλώνουν πόσο ακριβώς το AI ακολούθησε τις οδηγίες όταν επεξεργαζόταν μια προστατευμένη εικόνα. Εάν μια προστατευμένη εικόνα οδηγούσε ακόμη σε ένα υψηλά συσχετισμένο αποτέλεσμα, σημαίνει ότι η προστασία κρίθηκε ότι απέτυχε να μπλοκάρει την επεξεργασία.

Επίδραση της προστασίας στο dataset Flickr8k σε πέντε σπόρους, χρησιμοποιώντας και κοντές και μακρινές οδηγίες. Η συσχέτιση εικόνας-κειμένου μετρήθηκε χρησιμοποιώντας CLIP-S και PAC-S++.

Επίδραση της προστασίας στο dataset Flickr8k σε πέντε σπόρους, χρησιμοποιώντας και κοντές και μακρινές οδηγίες. Η συσχέτιση εικόνας-κειμένου μετρήθηκε χρησιμοποιώντας CLIP-S και PAC-S++.

Οι ερευνητές σύγκριναν πόσο καλά το AI ακολούθησε τις οδηγίες όταν επεξεργαζόταν προστατευμένες εικόνες σε σχέση με μη προστατευμένες. Πρώτα, έλεγξαν τη διαφορά μεταξύ των δύο, που ονομάζεται Πραγματική Αλλαγή. Στη συνέχεια, η διαφορά κλιμακωτήθηκε για να δημιουργηθεί ένα Ποσοστό Αλλαγής, καθιστώντας ευκολότερη την σύγκριση των αποτελεσμάτων σε πολλές δοκιμές.

Αυτή η διαδικασία αποκάλυψε εάν οι προστασίες έκαναν πιο δύσκολο ή πιο εύκολο για το AI να ταιριάξει με τις οδηγίες. Οι δοκιμές επαναλήφθηκαν πέντε φορές χρησιμοποιώντας διαφορετικούς τυχαίους σπόρους, καλύπτοντας τόσο μικρές όσο και μεγάλες αλλαγές στις αρχικές λεζάντες.

Επίθεση Τέχνης

Για τις δοκιμές σε φυσικές φωτογραφίες, το dataset Flickr1024 χρησιμοποιήθηκε, το οποίο περιέχει πάνω από χίλιες υψηλής ποιότητας εικόνες. Κάθε εικόνα επεξεργάστηκε με οδηγίες που ακολουθούσαν το μοτίβο: ‘Αλλαγή του στυλ σε [V]’, όπου [V] αντιπροσώπευε ένα από τα επτά знаменίτα στυλ τέχνης: Κυβισμός, Μετα-ιμπρεσιονισμός, Ιμπρεσιονισμός, Σουρεαλισμός, Μπαρόκ, Φωβισμός και Αναγέννηση.

Η διαδικασία περιελάμβανε την εφαρμογή του PhotoGuard στις αρχικές εικόνες, τη δημιουργία προστατευμένων εκδόσεων και στη συνέχεια τη διέλευση και των προστατευμένων και των μη προστατευμένων εικόνων από την ίδια σειρά επεξεργασιών μεταφοράς στυλ:

Αρχικές και προστατευμένες εκδόσεις μιας φυσικής σκηνής εικόνας, κάθε μια επεξεργασμένη για να εφαρμόσει Κυβισμό, Σουρεαλισμό και Φωβισμό.

Αρχικές και προστατευμένες εκδόσεις μιας φυσικής σκηνής εικόνας, κάθε μια επεξεργασμένη για να εφαρμόσει Κυβισμό, Σουρεαλισμό και Φωβισμό.

Για να δοκιμαστεί η προστασία σε έργα τέχνης, η μεταφορά στυλ εφαρμόστηκε σε εικόνες από το WikiArt dataset, το οποίο συλλέγει ένα ευρύ φάσμα καλλιτεχνικών στυλ. Οι οδηγίες επεξεργασίας ακολούθησαν το ίδιο μοτίβο όπως και πριν, οδηγώντας το AI να αλλάξει το στυλ σε ένα τυχαία επιλεγμένο, μη σχετικό στυλ από τις ετικέτες WikiArt.

Και οι δύο μεθόδους προστασίας Glaze και Mist εφαρμόστηκαν στις εικόνες πριν από τις επεξεργασίες, επιτρέποντας στους ερευνητές να παρατηρήσουν πόσο καλά κάθε άμυνα θα μπορούσε να μπλοκάρει ή να διαστρέψει τα αποτελέσματα μεταφοράς στυλ:

Παραδείγματα του πώς οι μεθόδους προστασίας επηρεάζουν τη μεταφορά στυλ σε έργα τέχνης. Η αρχική Μπαρόκ εικόνα εμφανίζεται μαζί με εκδόσεις που προστατεύονται από το Mist και το Glaze. Μετά την εφαρμογή της μεταφοράς στυλ Κυβισμού, οι διαφορές στο πώς κάθε προστασία αλλάζει το τελικό αποτέλεσμα είναι ορατές.

Παραδείγματα του πώς οι μεθόδους προστασίας επηρεάζουν τη μεταφορά στυλ σε έργα τέχνης. Η αρχική Μπαρόκ εικόνα εμφανίζεται μαζί με εκδόσεις που προστατεύονται από το Mist και το Glaze. Μετά την εφαρμογή της μεταφοράς στυλ Κυβισμού, οι διαφορές στο πώς κάθε προστασία αλλάζει το τελικό αποτέλεσμα είναι ορατές.

Οι ερευνητές έκαναν επίσης ποσοτικές συγκρίσεις:

Αλλαγές στους δείκτες συσχέτισης εικόνας-κειμένου μετά από επεξεργασίες μεταφοράς στυλ.

Αλλαγές στους δείκτες συσχέτισης εικόνας-κειμένου μετά από επεξεργασίες μεταφοράς στυλ.

Από αυτά τα αποτελέσματα, οι συγγραφείς σχολιάζουν:

‘Τα αποτελέσματα υπογραμμίζουν μια σημαντική περιορισμό των ανταγωνιστικών διαταραχών για προστασία. Αντί να εμποδίζουν τη συσχέτιση, οι ανταγωνιστικές διαταραχές συχνά ενισχύουν την απόκριση του μοντέλου γεννήτριας σε οδηγίες, επιτρέποντας στους εκμεταλλευτές να παράγουν αποτελέσματα που ταιριάζουν πιο στενά με τους στόχους τους. Τέτοια προστασία δεν είναι διαταρακτική στη διαδικασία επεξεργασίας εικόνας και μπορεί να μην είναι σε θέση να αποτρέψει τους κακόβουλους πράκτορες από το να αντιγράψουν μη εξουσιοδοτημένο υλικό.

‘Οι ανεπιθύμητες συνέπειες της χρήσης ανταγωνιστικών διαταραχών αποκαλύπτουν ευπάθειες στις υφιστάμενες μεθόδους και υπογραμμίζουν την επείγουσα ανάγκη για πιο αποτελεσματικές τεχνικές προστασίας.’

Οι συγγραφείς εξηγούν ότι τα απροσδόκητα αποτελέσματα μπορούν να αποδοθούν στο πώς λειτουργούν τα μοντέλα διάχυσης. Τα LDMs επεξεργάζονται εικόνες μετατρέποντάς τες πρώτα σε μια συμπιεσμένη εκδοχή που ονομάζεται λατινική. Θόρυβος προστίθεται στη λατινική μέσω πολλών βημάτων, μέχρι τα δεδομένα να γίνουν σχεδόν τυχαία.

Το μοντέλο αντιστρέφει αυτή τη διαδικασία κατά τη γεννήτρια, αφαιρώντας τον θόρυβο βήμα προς βήμα. Σε κάθε στάδιο αυτής της αντίστροφης διαδικασίας, η κειμενική οδηγία βοηθά να καθοδηγήσει πώς ο θόρυβος πρέπει να καθαριστεί, διαμορφώνοντας σταδιακά την εικόνα για να ταιριάξει με την οδηγία:

Σύγκριση μεταξύ γεννήτριας από μια μη προστατευμένη εικόνα και μια εικόνα προστατευμένη με PhotoGuard, με ενδιάμεσες λατινικές καταστάσεις που μετατρέπονται πίσω σε εικόνες για οπτικοποίηση.

Σύγκριση μεταξύ γεννήτριας από μια μη προστατευμένη εικόνα και μια εικόνα προστατευμένη με PhotoGuard, με ενδιάμεσες λατινικές καταστάσεις που μετατρέπονται πίσω σε εικόνες για οπτικοποίηση.

Οι μεθόδους προστασίας προσθέτουν μικρές ποσότητες επιπλέον θορύβου στην αρχική εικόνα πριν εισέλθει σε αυτή τη διαδικασία. Αν και αυτές οι διαταραχές είναι ελάχιστες στην αρχή, συσσωρεύονται καθώς το μοντέλο εφαρμόζει τις δικές του στρώσεις θορύβου.

Αυτή η συσσώρευση αφήνει περισσότερα μέρη της εικόνας ‘αβέβαια’ όταν το μοντέλο αρχίζει να αφαιρεί τον θόρυβο. Με μεγαλύτερη αβεβαιότητα, το μοντέλο βασίζεται περισσότερο στην κειμενική οδηγία για να συμπληρώσει τα λείψανα λεπτά, δίνοντας στην οδηγία ακόμη περισσότερη επιρροή από ότι θα είχε κανονικά.

Στην ουσία, οι προστασίες κάνουν πιο εύκολο για το AI να αναμορφώσει την εικόνα για να ταιριάξει με την οδηγία, αντί να είναι πιο δύσκολο.

Τέλος, οι συγγραφείς διεξήγαγαν ένα τεστ που αντικατέστησε τις κατασκευασμένες διαταραχές από το ‘Raising the Cost of Malicious AI-Powered Image Editing’ paper για καθαρό Gaussian θόρυβο.

Τα αποτελέσματα ακολούθησαν το ίδιο μοτίβο που παρατηρήθηκε νωρίτερα. Σε όλες τις δοκιμές, οι τιμές Ποσοστού Αλλαγής παρέμειναν θετικές. Ακόμη και αυτός ο τυχαίος, μη δομημένος θόρυβος οδήγησε σε ισχυρότερη συσχέτιση μεταξύ των γεννημένων εικόνων και των οδηγιών.

Επίδραση της προσομοιωμένης προστασίας χρησιμοποιώντας Gaussian θόρυβο στο dataset Flickr8k.

Επίδραση της προσομοιωμένης προστασίας χρησιμοποιώντας Gaussian θόρυβο στο dataset Flickr8k.

Αυτή η υποστήριξε την υποκείμενη εξήγηση ότι οποιοσδήποτε προστεθεί θόρυβος, ανεξάρτητα από το σχεδιασμό του, δημιουργεί μεγαλύτερη αβεβαιότητα για το μοντέλο κατά τη γεννήτρια, επιτρέποντας στην κειμενική οδηγία να ασκήσει ακόμη περισσότερο έλεγχο στην τελική εικόνα.

Συμπέρασμα

Η ερευνητική σκηνή έχει πιέσει την ανταγωνιστική διαταραχή για το ζήτημα πνευματικών δικαιωμάτων LDM για σχεδόν όσο καιρό υπάρχουν LDM. Αλλά καμία ανθεκτική λύση δεν έχει προκύψει από το εξαιρετικό αριθμό δημοσιευμένων εργασιών σε αυτή τη γραμμή.

Είτε οι επιβαλλόμενες διαταραχές μειώνουν υπερβολικά την ποιότητα της εικόνας, είτε τα μοτίβα αποδεικνύονται ότι δεν είναι ανθεκτικά στη χειραγώγηση και τις μεταμορφώσεις.

Ωστόσο, είναι ένα δύσκολο όνειρο να εγκαταλειφθεί,既然 η εναλλακτική θα φαινόταν να είναι η τρίτη παρακολούθηση και πλαίσια προέλευσης όπως το σχήμα C2PA της Adobe, το οποίο επιδιώκει να διατηρήσει μια αλυσίδα κτήσης για εικόνες από τον αισθητήρα της κάμερας και μετά, αλλά δεν έχει εγγενή σύνδεση με το περιεχόμενο που απεικονίζεται.

Σε κάθε περίπτωση, εάν η ανταγωνιστική διαταραχή είναι στην πραγματικότητα χειρότερη, όπως υποδηλώνει το νέο έγγραφο, τότε η αναζήτηση για προστασία πνευματικών δικαιωμάτων μέσω τέτοιων μέσων μπορεί να θεωρηθεί ‘αλχημεία’.

 

Πρώτη δημοσίευση την Δευτέρα, 9 Ιουνίου 2025

Συγγραφέας για τη μηχανική μάθηση, ειδικός σε τομέα συνθέσεων εικόνων ανθρώπων. Πρώην επικεφαλής ερευνών περιεχομένου στη Metaphysic.ai.
Προσωπικός ιστότοπος: martinanderson.ai
Επικοινωνία: [email protected]

Γνωστοποίηση διαφημιζόμενων: Το Unite.AI δεσμεύεται σε αυστηρά συντακτικά πρότυπα για την παροχή ακριβών πληροφοριών και ειδήσεων στους αναγνώστες μας. Ενδέχεται να λάβουμε αποζημίωση όταν κάνετε κλικ σε συνδέσμους προς προϊόντα που έχουμε αξιολογήσει.