Connect with us

Οι Φίλτρα Ομορφιάς είναι ένα Πιθανό Εργαλείο Επίθεσης Deepfake

Η γωνία του Anderson

Οι Φίλτρα Ομορφιάς είναι ένα Πιθανό Εργαλείο Επίθεσης Deepfake

mm
Sources: https://www.youtube.com/watch?v=gtCpea_5qxw and https://www.youtube.com/watch?v=3wVpVH0Wa6E

Τα φίλτρα ομορφιάς δεν κρύβουν μόνο τις ελαττώματα: μπορούν επίσης να βοηθήσουν τις επιθέσεις deepfake και τις μεταμορφώσεις προσώπου να διαφεύγουν από τα συστήματα ανίχνευσης. Eine νέα μελέτη δείχνει ότι ακόμη και οι λεπτές επιδράσεις λείανσης μπορούν να συγχύσουν τους ανιχνευτές AI, καθιστώντας τις ψευδείς εικόνες να φαίνονται πραγματικές και τις πραγματικές να φαίνονται ψευδείς. Εάν η τάση συνεχιστεί, τα φίλτρα ομορφιάς μπορεί να υποβληθούν σε περιορισμούς σε υψηλό-κίνδυνο περιβάλλοντα, από τον έλεγχο συνόρων έως τις εταιρικές κλήσεις Zoom.

 

Σε μια ακαδημαϊκή συνεργασία του 2024 μεταξύ της Ισπανίας και της Ιταλίας, ερευνητές ανέφεραν ότι το 90% των γυναικών ηλικίας 18-30 ετών χρησιμοποιούσαν φίλτρα ομορφιάς πριν από την ανάρτηση εικόνων στα μέσα κοινωνικής δικτύωσης. Σε αυτό το πλαίσιο, τα φίλτρα ομορφιάς είναι αλγοριθμικές ή AI-βοηθούμενες μεθόδους για την αλλαγή της εμφάνισης του προσώπου, ώστε να φαίνεται βελτιωμένο σε σχέση με την αρχική πηγή:

Από τη μελέτη του 2024: παράδειγμα γυναικείων (αριστερά) και ανδρικών (δεξιά) προσώπων πριν και μετά την εφαρμογή φίλτρου ομορφιάς. Το φίλτρο άλλαξε χαρακτηριστικά όπως το χρώμα του δέρματος, τα μάτια, τη μύτη, τα χείλη, το πηγούνι και τα ζυγωματικά για να ενισχύσει την αντιλαμβανόμενη ομορφιά.

Από τη μελέτη του 2024: παράδειγμα γυναικείων (αριστερά) και ανδρικών (δεξιά) προσώπων πριν και μετά την εφαρμογή φίλτρου ομορφιάς. Το φίλτρο άλλαξε χαρακτηριστικά όπως το χρώμα του δέρματος, τα μάτια, τη μύτη, τα χείλη, το πηγούνι και τα ζυγωματικά για να ενισχύσει την αντιλαμβανόμενη ομορφιά. Source: https://arxiv.org/pdf/2407.11981

Τέτοια φίλτρα είναι επίσης ευρέως διαθέσιμα ως εγγενείς ή πρόσθετες λειτουργίες σε δημοφιλείς βίντεο-βασισμένα συστήματα, συμπεριλαμβανομένων των Snapchat και Zoom, προσφέροντας την ικανότητα λείανσης του “ατελούς” δέρματος και ακόμη και αλλαγής της ηλικίας του υποκειμένου, μέχρι το σημείο όπου η ταυτότητα θα μπορούσε να λεχθεί ότι έχει αλλάξει σημαντικά:

Πατήστε για αναπαραγωγή: τρεις γυναίκες απενεργοποιούν τα φίλτρα “ομορφιάς” του βίντεο, αποκαλύπτοντας το βαθμό στον οποίο οι φυσιογνωμίες τους αλλάζουν από τους αλγορίθμους ή την AI. Source: https://www.youtube.com/watch?v=gtCpea_5qxw

Το φαινόμενο φαίνεται να έχει φτάσει στο σημείο κορύφωσης από τότε που η τεχνολογία ήταν σχετικά ώριμη· μια μελέτη του 2020 από το City University του Λονδίνου αποκάλυψε ότι το 90% των νέων χρηστών του Snapchat στις Ηνωμένες Πολιτείες, τη Γαλλία και το Ηνωμένο Βασίλειο χρησιμοποιούσαν φίλτρα στις εφαρμογές τους, ενώ η Meta ανέφερε ότι περισσότεροι από 600 εκατομμύρια νέοι άνθρωποι είχαν χρησιμοποιήσει φίλτρα στο Facebook ή το Instagram.

Εξερευνώντας τις αντίθετες επιδράσεις των φίλτρων αυτών στην ψυχική υγεία, μια αναφορά του Psychology Today επανέλαβε ότι από εκείνους που μελετήθηκαν, το 90% των νέων γυναικών, με μέση ηλικία 20 ετών, είτε χρησιμοποιούσαν φίλτρα είτε σε κάποιο τρόπο επεξεργάζονταν τις φωτογραφίες τους. Τα πιο δημοφιλή φίλτρα ήταν αυτά που χρησιμοποιούνταν για να εξομαλύνουν τους τόνους του δέρματος· να δώσουν μια ηλιοκαμένη εμφάνιση· να ασπρίσουν τα δόντια· και ακόμη και να μειώσουν το μέγεθος του σώματος.

Αντιμέτωπος

Όπως τα φίλτρα προσώπου είναι έτοιμα να επωφεληθούν από την επανάσταση του 2025 στις βίντεο-συνθέσεις και γενικότερα από το συνεχιζόμενο ενδιαφέρον σε αυτόν τον ερευνητικό τομέα, το βαθμό στον οποίο μπορούμε να “αναδημιουργήσουμε” ή να φανταστούμε τους εαυτούς μας σε ζωντανές βίντεο-κλήσεις είναι ολοένα και πιο συνεχής με την ανησυχία της κοινότητας ασφαλείας για απάτες ή εγκληματικές τεχνικές βίντεο-deepfake.

Ένα ζήτημα είναι ότι το εύρος των “εύκολων” τεστ που έχουν αναπτυχθεί τα τελευταία χρόνια για να αποκαλύψουν einen βίντεο-deepfaker, ο οποίος μπορεί να επιδιώκει να απάτησει μεγάλα ποσά χρημάτων σε εταιρικό περιβάλλον, γίνεται αναπόφευκτα λιγότερο αποτελεσματικό καθώς αυτά τα αδύνατα σημεία λαμβάνονται υπόψη στα δεδομένα εκπαίδευσης και κατά τον χρόνο συλλογής:

Πατήστε για αναπαραγωγή: πριν από τρία ή τέσσερα χρόνια, το να κουνάτε το χέρι σας μπροστά σε ένα deepfaked πρόσωπο ήταν ένα αξιόπιστο τεστ για βίντεο-κλήσεις, αλλά μπορούμε να δούμε ότι οι αφοσιωμένες προσπάθειες από εταιρείες όπως το TikTok κάνουν βαθιά είσοδο στα κλασικά “παραμύθια”. Πηγές: Ibid και https://archive.is/mofRV#wavehands

Περισσότερο κριτικά, η ευρεία χρήση φίλτρων αλλαγής/αλλαγής ομορφιάς confuses τα νερά για μια νέα και αναδυόμενη γενιά ανιχνευτών deepfake που έχουν ανατεθεί να κρατούν τους ψεύτες έξω από τις εταιρικές βίντεο-κλήσεις και μακριά από ευάλωτους πιθανούς θύματα απάτης “απαγωγής” και “ψεύτη”.

Είναι ευκολότερο να κάνετε ένα deepfake πειστικό, είτε φωτογραφία είτε βίντεο, εάν η ανάλυση της εικόνας είναι χαμηλή ή η εικόνα είναι σε κάποιο τρόπο υποβαθμισμένη, поскольку το υποκείμενο σύστημα απάτης μπορεί να κρύψει τις δικές του ελαττώματα πίσω από αυτά που φαίνονται να είναι προβλήματα σύνδεσης ή πλατφόρμας.

Στην ουσία, τα πιο δημοφιλή φίλτρα ομορφιάς αφαιρούν κάποιο από το πιο χρήσιμο υλικό για την αναγνώριση βίντεο-deepfake, όπως η текстούρα του δέρματος και άλλες περιοχές λεπτομέρειας του προσώπου – και αξίζει να ληφθεί υπόψη ότι το παλαιότερο ένα πρόσωπο είναι, το περισσότερο λεπτομέρεια είναι πιθανό να περιέχει, και επομένως η χρήση φίλτρων ομορφιάς μπορεί να είναι μια ιδιαίτερη πειρασμός σε τέτοιες περιπτώσεις.

Εάν μια εμφάνιση χωρίς λεπτομέρειες 'android'-στυλ είναι το στυλ, οι ανιχνευτές deepfake μπορεί να λείπουν του υλικού που χρειάζονται για να διακρίνουν μεταξύ πραγματικών και ψευδών εικόνων και βίντεο-προσώπων. Source: https://www.instagram.com/reel/DMyGerPtTPF/?hl=en

Εάν μια εμφάνιση χωρίς λεπτομέρειες ‘android’-στυλ είναι το στυλ, οι ανιχνευτές deepfake μπορεί να λείπουν του υλικού που χρειάζονται για να διακρίνουν μεταξύ πραγματικών και ψευδών εικόνων και βίντεο-προσώπων. Source: https://www.instagram.com/reel/DMyGerPtTPF/?hl=en

Η μελέτη του Royal Society του 2024 Τι είναι όμορφο είναι ακόμη καλό: η αύρα ομορφιάς στην εποχή των φίλτρων ομορφιάς επιβεβαίωσε ότι η χρήση φίλτρων αυξάνει καθολικά την γενική ομορφιά και για τα δύο φύλα (αν και η αυξημένη ομορφιά έχει την τάση να μειώνει την γενική εκτίμηση της νοημοσύνης σε γυναίκες με φίλτρα ομορφιάς).

Επομένως, είναι δίκαιο να πούμε ότι αυτή είναι μια δημοφιλής τεχνολογία· ότι λειτουργεί· και ότι θα ήταν κάτι σαν κультουρικό σοκ εάν突然 γινόταν αντικείμενο ασφαλειών ή απαγορευόταν σε διάφορα περιβάλλοντα.

Ωστόσο, σε μια περίοδο όπου τα βίντεο-deepfake απειλούν να γίνουν αδιακρίτως από γνήσιες βίντεο-συμμετέχοντες, και σε εμφάνιση και ομιλία, είναι πιθανό ότι ο παγκόσμιος “θόρυβος” από τα φίλτρα ομορφιάς μπορεί να χρειαστεί να μειωθεί στο μέλλον, για λόγους ασφαλείας.

Λείοι Εγκληματίες

Το ζήτημα έχει εξεταστεί πιο πρόσφατα σε μια νέα μελέτη από το Πανεπιστήμιο της Καλιαρίου στην Ιταλία, με τίτλο Απατηλή Ομορφιά: Αξιολόγηση της Επίδρασης των Φίλτρων Ομορφιάς στην Ανίχνευση Deepfake και Морфινγκ Επίθεσης.

Στη νέα μελέτη, ερευνητές εφαρμόστηκαν φίλτρα ομορφιάς σε πρόσωπα από δύο benchmark datasets και έτεσταν διάφορους ανιχνευτές deepfake και مورφινγκ επίθεσης σε cả τις αρχικές και τις αλλαγμένες εικόνες.

Σχεδόν σε κάθε περίπτωση, η ακρίβεια ανίχνευσης έπεσε μετά την ομορφιά· οι πιο δραματικές πτώσεις συνέβησαν όταν τα φίλτρα εξομάλυναν τις ρυτίδες, έλαμψαν το χρώμα του δέρματος ή υποβλητικά μετέβαλλαν τα χαρακτηριστικά του προσώπου. Αυτές οι αλλαγές αφαίρεσαν ή διαστρέψαν τις ίδιες τις ενδείξεις που οι μοντέλα ανίχνευσης βασίζονται.

Για παράδειγμα, το κορυφαίο μοντέλο στο MorphDB έχασε περισσότερο από 9% ακρίβεια μετά την ομορφιά, και το πρόβλημα παρέμεινε σε πολλαπλά ανιχνευτικά αρχιτεκτονικά, υποδεικνύοντας ότι τα τρέχοντα συστήματα δεν είναι ανθεκτικά στις κοινές κοσμητικές βελτιώσεις.

Οι συγγραφείς καταλήγουν:

‘[Τα φίλτρα ομορφιάς] αποτελούν μια απειλή για την ακεραιότητα των συστημάτων βιομετρικής αυθεντικοποίησης και της νομικής ανάλυσης, καθιστώντας την ανίχνευση deepfake και مورφινγκ επίθεσης υπό αυτές τις συνθήκες μια κρίσιμη ανοιχτή πρόκληση.

‘Η μελλοντική εργασία πρέπει να προτεραιοποιήσει την ανάπτυξη συστημάτων ανίχνευσης ψηφιακής χειραγώγησης που είναι ανθεκτικά σε τέτοιες λεπτές, πραγματικές αλλοιώσεις, είτε κακόβουλες είτε όχι, για να διασφαλίσουν την αξιόπιστη αναγνώριση ταυτότητας και επαλήθευση περιεχομένου σε καθημερινά και ασφαλή περιβάλλοντα.’

Μέθοδος και Δεδομένα

Για να αξιολογήσουν πώς τα φίλτρα ομορφιάς επηρεάζουν την ανίχνευση deepfake και مورφινγκ, οι ερευνητές εφαρμόστηκαν ένα προοδευτικό φίλτρο λείανσης και έτεσταν τα αποτελέσματα σε δύο benchmark convolutional νευρωνικά δίκτυα (CNN) που σχετίζονται με το στόχο πρόβλημα: AlexNet και VGG19.

Κάθε δίκτυο εκπαιδεύτηκε στο 80% του συνόλου δεδομένων deepfake ή مورφινγκ, με το υπόλοιπο 20% να χρησιμοποιείται για επιβεβαίωση. Για να δοκιμάσουν την ανθεκτικότητα έναντι της ομορφιάς, οι ερευνητές εφαρμόστηκαν ένα προοδευτικό φίλτρο λείανσης στις εικόνες δοκιμής, αυξάνοντας την ακτίνα λείανσης από 3% έως 5% του ύψους του προσώπου:

Παράδειγμα προσώπων από τα datasets CelebDF (πάνω) και AMSL (κάτω), που εμφανίζονται πριν και μετά την εφαρμογή ενός φίλτρου ομορφιάς. Η ακτίνα του φίλτρου κλιμακώθηκε σε σχέση με το ύψος του προσώπου, με c = 3% και c = 5% που παράγουν προοδευτικά ισχυρότερες επιδράσεις.

Παράδειγμα προσώπων από τα datasets CelebDF (πάνω) και AMSL (κάτω), που εμφανίζονται πριν και μετά την εφαρμογή ενός φίλτρου ομορφιάς. Η ακτίνα του φίλτρου κλιμακώθηκε σε σχέση με το ύψος του προσώπου, με c = 3% και c = 5% που παράγουν προοδευτικά ισχυρότερες επιδράσεις.

Σχετικά με τα μετρικά, κάθε μοντέλο αξιολογήθηκε χρησιμοποιώντας τον δείκτη Equal Error Rate (EER) και στις αρχικές και στις ομορφιά-εικόνες δοκιμής. Η ανάλυση ανέφερε επίσης τον δείκτη Bona Fide Presentation Classification Error Rate (BPCER) ή το ποσοστό ψευδών θετικών, και τον Attack Presentation Classification Error Rate (APCER) ή το ποσοστό ψευδών αρνητικών, χρησιμοποιώντας το όριο που ορίστηκε στις αρχικές δεδομένα.

Μορφωμένα πρόσωπα από το dataset AMSL.

Για να αξιολογήσουν περαιτέρω την απόδοση, η περιοχή υπό την καμπύλη ROC (AUC) και οι κατανομές βαθμολογίας για πραγματικές και ψευδείς εικόνες εξετάστηκαν.

Δοκιμές

Στα αποτελέσματα ανίχνευσης deepfake, και τα δύο δίκτυα έδειξαν αύξηση του δείκτη Equal Error Rate καθώς η ομορφιά αυξανόταν. Το EER του AlexNet αυξήθηκε από 22,3% στις αρχικές εικόνες σε 28,1% στο υψηλότερο επίπεδο λείανσης, ενώ το EER του VGG19 αυξήθηκε από 30,2% σε 35,2%. Η πτώση της απόδοσης ακολούθησε διαφορετικά μοτίβα σε κάθε περίπτωση:

Αποτελέσματα ανίχνευσης deepfake στο dataset CelebDF χρησιμοποιώντας AlexNet και VGG19. Και τα δύο μοντέλα δοκιμάστηκαν σε αρχικές και ομορφιά-εικόνες με αυξανόμενα επίπεδα λείανσης του προσώπου. Μετρικά που εμφανίζονται περιλαμβάνουν Equal Error Rate (EER), Bona Fide Presentation Classification Error Rate (BPCER) και Attack Presentation Classification Error Rate (APCER), χρησιμοποιώντας όρια που ορίστηκαν από το αρχικό σύνολο δοκιμής. Η ακρίβεια ανίχνευσης μειώθηκε καθώς η ομορφιά αυξανόταν, αν και το μοτίβο της υποβάθμισης διέφερε μεταξύ αρχιτεκτονικών.

Αποτελέσματα ανίχνευσης deepfake στο dataset CelebDF χρησιμοποιώντας AlexNet και VGG19. Και τα δύο μοντέλα δοκιμάστηκαν σε αρχικές και ομορφιά-εικόνες με αυξανόμενα επίπεδα λείανσης του προσώπου. Μετρικά που εμφανίζονται περιλαμβάνουν Equal Error Rate (EER), Bona Fide Presentation Classification Error Rate (BPCER) και Attack Presentation Classification Error Rate (APCER), χρησιμοποιώντας όρια που ορίστηκαν από το αρχικό σύνολο δοκιμής. Η ακρίβεια ανίχνευσης μειώθηκε καθώς η ομορφιά αυξανόταν, αν και το μοτίβο της υποβάθμισης διέφερε μεταξύ αρχιτεκτονικών.

Όταν η ομορφιά αυξανόταν, το AlexNet έγινε πιο πιθανό να ошибηθεί πραγματικά πρόσωπα ως ψευδείς. Το VGG19, από την άλλη πλευρά, είχε δυσκολία να πιάσει τις ψευδείς εικόνες. Το ποσοστό ψευδών θετικών του AlexNet αυξήθηκε σταθερά. Το VGG19 είχε αυξανόμενο ποσοστό ψευδών αρνητικών.

Για να κατανοηθεί καλύτερα αυτή η απόδοση, οι ερευνητές εφαρμόστηκαν το φίλτρο ομορφιάς ξεχωριστά σε πραγματικές και ψευδείς εικόνες και μετρούσαν την επίδραση στην απόδοση ανίχνευσης. Αυτή η ανάλυση, που εμφανίζεται στον παρακάτω πίνακα, διευκρινίζει την πηγή της ευαλότητας κάθε μοντέλου:

Ακρίβεια ανίχνευσης για AlexNet και VGG19 υπό μερική ομορφιά στο dataset CelebDF. Ο πίνακας αναφέρει τρεις σενάρια: ομορφιά-πραγματικά vs ομορφιά-ψευδείς (F-Real vs F-Fake)· ομορφιά-πραγματικά vs αρχικές ψευδείς (F-Real vs O-Fake)· και αρχικά πραγματικά vs ομορφιά-ψευδείς (O-Real vs F-Fake), με μείωση της ακρίβειας που υποδηλώνει μειωμένη απόδοση ανιχνευτή. Το AlexNet επηρεάστηκε περισσότερο όταν οι πραγματικές εικόνες ομορφιάζονταν, ενώ το VGG19 είχε δυσκολία όταν οι ψευδείς εικόνες ομορφιάζονταν.

Ακρίβεια ανίχνευσης για AlexNet και VGG19 υπό μερική ομορφιά στο dataset CelebDF. Ο πίνακας αναφέρει τρεις σενάρια: ομορφιά-πραγματικά vs ομορφιά-ψευδείς (F-Real vs F-Fake)· ομορφιά-πραγματικά vs αρχικές ψευδείς (F-Real vs O-Fake)· και αρχικά πραγματικά vs ομορφιά-ψευδείς (O-Real vs F-Fake), με μείωση της ακρίβειας που υποδηλώνει μειωμένη απόδοση ανιχνευτή. Το AlexNet επηρεάστηκε περισσότερο όταν οι πραγματικές εικόνες ομορφιάζονταν, ενώ το VGG19 είχε δυσκολία όταν οι ψευδείς εικόνες ομορφιάζονταν.

Διαγράμματα κουτιού που δείχνουν τις κατανομές βαθμολογίας του AlexNet και του VGG19 σε πραγματικές και ψευδείς δείγματα από το dataset CelebDF, υπό αυξανόμενα επίπεδα ομορφιάς. Όσο η λείανση εντείνεται, οι κατανομές βαθμολογίας για πραγματικές και ψευδείς εικόνες γίνονται λιγότερο διαχωρίσιμες, υποδεικνύοντας μειωμένη αξιοπιστία ανίχνευσης. Το AlexNet γίνεται λιγότερο βέβαιο στην αναγνώριση πραγματικών προσώπων, ενώ το VGG19 γίνεται πιο πιθανό να λανθασμένα ταξινομήσει ψευδείς εικόνες.

Διαγράμματα κουτιού που δείχνουν τις κατανομές βαθμολογίας του AlexNet και του VGG19 σε πραγματικές και ψευδείς δείγματα από το dataset CelebDF, υπό αυξανόμενα επίπεδα ομορφιάς. Όσο η λείανση εντείνεται, οι κατανομές βαθμολογίας για πραγματικές και ψευδείς εικόνες γίνονται λιγότερο διαχωρίσιμες, υποδεικνύοντας μειωμένη αξιοπιστία ανίχνευσης. Το AlexNet γίνεται λιγότερο βέβαιο στην αναγνώριση πραγματικών προσώπων, ενώ το VGG19 γίνεται πιο πιθανό να λανθασμένα ταξινομήσει ψευδείς εικόνες.

Η μελέτη αναφέρει:

‘Αυτά τα αποτελέσματα έχουν σημαντικές επιπτώσεις και αποκαλύπτουν ότι είναι απαραίτητο να ληφθεί υπόψη η πιθανή χρήση φίλτρων ομορφιάς στην ανίχνευση deepfake,既然 αυτά μπορεί να έχουν μια απρόβλεπτη επίδραση στην απόδοση. Συγκεκριμένα, διαφορετικές αρχιτεκτονικές ανταποκρίνονται διαφορετικά στις κοσμητικές αλλαγές, ακόμη και αν αυτές οι αλλαγές δεν προορίζονται να εξαπατήσουν.

‘Για παράδειγμα, με βάση τον συγκεκριμένο ανιχνευτή deepfake, τα φίλτρα ομορφιάς θα μπορούσαν να αλλάξουν σημαντικά την έξοδο, καθιστώντας τις πραγματικές εικόνες να αναγνωρίζονται ως ψευδείς και, πιο κρίσιμα, επιτρέποντας στις ψευδείς εικόνες να εξαπατούν την ανίχνευση.

‘Επομένως, είναι απαραίτητο να επικεντρωθούμε στην ανάπτυξη ανιχνευτών που είναι πιο ανθεκτικοί σε τέτοιες λεπτές, πραγματικές αλλοιώσεις που θα μπορούσαν να χρησιμεύσουν ως καμουφλάζ για κακόβουλες αλλοιώσεις deepfake.’

Στην περίπτωση της επίθεσης μορφώματος, μια συνθετική εικόνα δημιουργήθηκε με τη συγχώνευση χαρακτηριστικών προσώπου από δύο άτομα. Αυτή η εικόνα χρησιμοποιήθηκε για να εξαπατήσει συστήματα αναγνώρισης προσώπου, επιτρέποντας και στα δύο πρόσωπα να αυθεντικοποιηθούν ως το ίδιο άτομο. Τέτοιες επιθέσεις θεωρούνται ιδιαίτερα σχετικές σε περιβάλλοντα ασφαλείας, όπου τα βιομετρικά συστήματα μπορούν να εξαπατηθούν να αποδεχθούν την μορφωμένη εικόνα για επίσημη ταυτοποίηση.

Αποτελέσματα ανίχνευσης επίθεσης μορφώματος στο dataset AMSL πριν και μετά την ομορφιά, με και τα δύο δίκτυα να δείχνουν απότομη αύξηση του σφάλματος καθώς η λείανση αυξάνεται.

Αποτελέσματα ανίχνευσης επίθεσης μορφώματος στο dataset AMSL πριν και μετά την ομορφιά, με και τα δύο δίκτυα να δείχνουν απότομη αύξηση του σφάλματος καθώς η λείανση αυξάνεται.

Στην περίπτωση της επίθεσης μορφώματος, η απόδοση υποβαθμίστηκε πιο δραματικά από ότι στην ανίχνευση deepfake. Το EER του AlexNet αυξήθηκε από 27,6% σε 41,2%, και του VGG19 από 19,0% σε 37,3%, με κύρια αιτία τα ψευδώς θετικά: γνήσιες εικόνες που ταξινομήθηκαν ως μορφωμένες. Με ακτίνα λείανσης 3%, το ποσοστό ψευδών θετικών του VGG19 έφτασε το 90%.

Αυτό το μοτίβο διατηρήθηκε όταν τα φίλτρα εφαρμόστηκαν επιλεκτικά. Η λείανση των πραγματικών προσώπων υποβάθμισε την ανίχνευση, ενώ η λείανση μόνο των μορφωμένων εικόνων βελτίωσε τα αποτελέσματα. Όσο η λείανση εντείνωσε, και τα δύο δίκτυα έδειξαν μειωμένη διάκριση μεταξύ πραγματικών και ψευδών βαθμολογιών, με το VGG19 να γίνεται ιδιαίτερα ασταθές.

Αυτά τα ευρήματα, οι συγγραφείς υπογραμμίζουν, υποδεικνύουν ότι τα φίλτρα ομορφιάς θα μπορούσαν να βοηθήσουν τις μορφωμένες εικόνες να εξαπατήσουν την ανίχνευση ακόμη πιο αποτελεσματικά από τις ψευδείς εικόνες, αυξάνοντας τις ανησυχίες για την ασφάλεια.

Μερικά παραδείγματα (λόγω έλλειψης χώρου) του πώς η ελάσσων ομορφιά (ακτίνα λείανσης 3%) άλλαξε τις ταξινομήσεις του AlexNet. Στα αριστερά, μια πραγματική εικόνα ταξινομείται λανθασμένα ως επίθεση μετά την ομορφιά, και στα δεξιά, μια μορφωμένη εικόνα ταξινομείται λανθασμένα ως γνήσια μετά την ομορφιά.

Μερικά παραδείγματα (λόγω έλλειψης χώρου) του πώς η ελάσσων ομορφιά (ακτίνα λείανσης 3%) άλλαξε τις ταξινομήσεις του AlexNet. Στα αριστερά, μια πραγματική εικόνα ταξινομείται λανθασμένα ως επίθεση μετά την ομορφιά, και στα δεξιά, μια μορφωμένη εικόνα ταξινομείται λανθασμένα ως γνήσια μετά την ομορφιά.

Τελικά, οι ερευνητές βρήκαν ότι ακόμη και ελαφριά φίλτρα ομορφιάς μπορούν να μειώσουν σημαντικά την απόδοση των ανιχνευτών deepfake και μορφώματος.

Η επίδραση ποικίλλει ανάλογα με την αρχιτεκτονική, με το AlexNet να δείχνει σταδιακή πτώση, και το VGG19 να καταρρέει υπό ελάσσονες φίλτρους. Καθώς αυτά τα φίλτρα είναι κοινά και δεν είναι αναγκαστικά κακόβουλα, η ικανότητά τους να κρύψουν τις επιθέσεις αποτελεί, οι συγγραφείς υπογραμμίζουν, μια πρακτική απειλή, ιδιαίτερα σε βιομετρικά συστήματα. Η μελέτη τονίζει την ανάγκη για μοντέλα ανίχνευσης που είναι ανθεκτικά σε τέτοιες λεπτές ψηφιακές αλλοιώσεις.

Συμπέρασμα

Ένας λόγος για τον οποίο μπορεί να είναι δύσκολο να εκπαιδευτούν συστήματα ανίχνευσης deepfake που μπορούν να αγνοήσουν τα φίλτρα ομορφιάς είναι η έλλειψη αντιθετικών υλικών· τελικά, η “ομορφιά-εικόνα” είναι αυτή που διανέμεται ευρέως, και, αντίθετα με το βίντεο που ενσωματώσαμε ως παράδειγμα, είναι πολύ σπάνιο για μια “πριν” εικόνα να εφαρμοστεί.

Ένα άλλο εμπόδιο είναι ότι πολλά από τα φίλτρα εκτελούν ακριβώς τον τύπο λείανσης που είναι τυπικός για τις επιχειρήσεις 압축 όταν αποθηκεύουν εικόνες ή συμπιέζουν βίντεο (ένα όφελος για τους παρόχους帯width, εκτός από την ψηφιακή σкин-μεイク για εκείνους που χρησιμοποιούν το φίλτρο).

Ο τομέας της ανίχνευσης deepfake είναι ήδη βαθιά εμπλεγμένος στην καταπολέμηση περιπτώσεων πραγματικής εικόνας υποβάθμισης λόγω προβλημάτων όπως κακής ποιότητας κάμερες, υπερβολικής συμπίεσης ή ασταθούς σύνδεσης δικτύου – όλα αυτά τα προβλήματα είναι ένα όφελος για τους deepfake απάτες που πρέπει να προσπαθούν πολύ πιο σκληρά σε ένα υψηλής ποιότητας, υψηλής ανάλυσης σενάριο.

Εάν τα φίλτρα ομορφιάς τελικά θα αντιμετωπιστούν ως ασφαλής ευθύνη φαίνεται να εξαρτάται από το βαθμό στον οποίο αποδεικνύονται ως εμπόδιο για τις μεθόδους ανίχνευσης deepfake, ή τελικά θα συνιστώνται ως ένα είδος de facto τείχους που ωφελεί τους κακόβουλους περισσότερο από εκείνους που τους καταπολεμούν.

 

Πρώτη δημοσίευση την Τετάρτη, 24 Σεπτεμβρίου 2025

Συγγραφέας για τη μηχανική μάθηση, ειδικός σε τομέα συνθέσεων εικόνων ανθρώπων. Πρώην επικεφαλής ερευνών περιεχομένου στη Metaphysic.ai.
Προσωπικός ιστότοπος: martinanderson.ai
Επικοινωνία: [email protected]