στέλεχος Deepfake Detectors Purse New Ground: Latent Diffusion Models and GANs - Unite.AI
Συνδεθείτε μαζί μας

Τεχνητή νοημοσύνη

Deepfake Detectors Purse New Ground: Latent Diffusion Models and GANs

mm
Ενημερώθηκε on

Γνώμη   Τελευταία, η ερευνητική κοινότητα ανίχνευσης deepfake, η οποία από τα τέλη του 2017 ασχολείται σχεδόν αποκλειστικά με αυτόματος κωδικοποιητής-βασισμένο πλαίσιο που έκανε πρεμιέρα εκείνη την εποχή με τέτοιο δημόσιο δέος (και φόβος), έχει αρχίσει να ενδιαφέρεται για τις λιγότερο στάσιμες αρχιτεκτονικές, συμπεριλαμβανομένων λανθάνουσα διάχυση μοντέλα όπως DALL-E2 και Σταθερή Διάχυση, καθώς και την έξοδο των Generative Adversarial Networks (GAN). Για παράδειγμα, τον Ιούνιο, στο UC Berkeley δημοσίευσε τα αποτελέσματα της έρευνάς της για την ανάπτυξη ενός ανιχνευτή για την έξοδο του κυρίαρχου τότε DALL-E 2.

Αυτό που φαίνεται να οδηγεί αυτό το αυξανόμενο ενδιαφέρον είναι το ξαφνικό εξελικτικό άλμα στην ικανότητα και τη διαθεσιμότητα μοντέλων λανθάνουσας διάχυσης το 2022, με κλειστή πηγή και περιορισμένη πρόσβαση απελευθερώνουν του DALL-E 2 την άνοιξη, ακολουθούμενο στα τέλη του καλοκαιριού από το συγκλονιστικό ανοικτής προέλευσης Σταθερής Διάχυσης από σταθερότητα.ai.

GAN έχουν επίσης πολυμελετημένος σε αυτό το πλαίσιο, αν και λιγότερο εντατικά, αφού είναι Πολύ δύσκολο να τα χρησιμοποιήσει για πειστικές και περίπλοκες αναψυχές ανθρώπων που βασίζονται σε βίντεο. τουλάχιστον, σε σύγκριση με τα μέχρι τώρα αξιοσέβαστα πακέτα αυτοκωδικοποιητών όπως Ανταλλαγή προσώπου και DeepFaceLab – και ο ξάδερφος του τελευταίου σε ζωντανή ροή, DeepFaceLive.

Κινούμενες εικόνες

Και στις δύο περιπτώσεις, ο παράγοντας γαλβανισμού φαίνεται να είναι η προοπτική ενός επόμενου αναπτυξιακού σπριντ για βίντεο σύνθεση. Η αρχή του Οκτωβρίου –και η μεγάλη σεζόν συνεδρίων του 2022– χαρακτηρίστηκε από μια χιονοστιβάδα ξαφνικών και απροσδόκητων λύσεων σε διάφορα μακροχρόνια σφάλματα σύνθεσης βίντεο: μόλις το Facebook είχε δείγματα που κυκλοφόρησαν της δικής της πλατφόρμας μετατροπής κειμένου σε βίντεο, η Google Research έπνιξε γρήγορα αυτή την αρχική αναγνώριση ανακοινώνοντας τη νέα της αρχιτεκτονική Imagen-to-Video T2V, ικανή να εξάγει πλάνα υψηλής ανάλυσης (αν και μόνο μέσω ενός δικτύου 7 επιπέδων αναβαθμιστών).

Εάν πιστεύετε ότι αυτό το είδος έρχεται σε τρία, σκεφτείτε επίσης την αινιγματική υπόσχεση του stability.ai ότι «έρχεται το βίντεο» στο Stable Diffusion, προφανώς αργότερα φέτος, ενώ ο συν-προγραμματιστής του Stable Diffusion Runway έχει έδωσε μια παρόμοια υπόσχεση, αν και δεν είναι σαφές εάν αναφέρονται στο ίδιο σύστημα. ο Μήνυμα διχόνοιας από τον Διευθύνοντα Σύμβουλο της Stability Emad Mostaque υποσχέθηκε επίσης 'ήχος, βίντεο [και] 3d'.

Τι συμβαίνει με μια ασυνήθιστη προσφορά πολλών νέων πλαίσια παραγωγής ήχου (ορισμένα βασίζονται σε λανθάνουσα διάχυση) και ένα νέο μοντέλο διάχυσης που μπορεί να δημιουργήσει αυθεντική κίνηση χαρακτήρων, η ιδέα ότι τα «στατικά» πλαίσια όπως τα GAN και οι διαχυτές θα πάρουν τελικά τη θέση τους ως υποστηρικτικά επικουρικά σε εξωτερικά πλαίσια κινουμένων σχεδίων αρχίζει να αποκτά πραγματική έλξη.

Εν ολίγοις, φαίνεται πιθανό ότι ο κόσμος των εμβρύων βίντεο που βασίζονται σε αυτόματο κωδικοποιητή, τα οποία μπορούν μόνο να υποκαταστήσουν αποτελεσματικά το κεντρικό τμήμα ενός προσώπου, θα μπορούσε μέχρι την επόμενη χρονιά να επισκιαστεί από μια νέα γενιά τεχνολογιών με δυνατότητα βαθιάς ψεύτικης διάχυσης – δημοφιλείς προσεγγίσεις ανοιχτού κώδικα με τη δυνατότητα να παραποιούνται φωτορεαλιστικά όχι μόνο ολόκληρα σώματα, αλλά ολόκληρες σκηνές.

Γι' αυτόν τον λόγο, ίσως, η ερευνητική κοινότητα κατά του βαθύ ψεύτικο έχει αρχίσει να παίρνει στα σοβαρά τη σύνθεση εικόνων και να συνειδητοποιεί ότι μπορεί να εξυπηρετεί περισσότερους σκοπούς από το να δημιουργεί απλώς ψεύτικες φωτογραφίες προφίλ LinkedIn; και ότι εάν όλοι οι δυσεπίλυτοι λανθάνοντες χώροι τους μπορούν να επιτύχουν από την άποψη της χρονικής κίνησης είναι να λειτουργεί ως πραγματικά εξαιρετικός αποδέκτης υφής, αυτό μπορεί στην πραγματικότητα να είναι περισσότερο από αρκετό.

Δρομέας λεπίδων

Τα δύο τελευταία έγγραφα που ασχολούνται, αντίστοιχα, με τη λανθάνουσα διάχυση και την ανίχνευση βαθιάς ψεύτικης βάσης που βασίζεται σε GAN, είναι, αντίστοιχα, DE-FAKE: Ανίχνευση και απόδοση ψευδών εικόνων που δημιουργούνται από μοντέλα διάχυσης κειμένου σε εικόνα, μια συνεργασία μεταξύ του CISPA Helmholtz Center for Information Security and Salesforce. και BLADERUNNER: Rapid Countermeasure for Synthetic (AI-Generated) StyleGAN Πρόσωπα, από τον Adam Dorian Wong στο Lincoln Laboratory του MIT.

Πριν εξηγήσει τη νέα του μέθοδο, το τελευταίο χαρτί χρειάζεται λίγο χρόνο για να εξετάσει προηγούμενες προσεγγίσεις για τον προσδιορισμό του εάν μια εικόνα δημιουργήθηκε ή όχι από ένα GAN (η εργασία ασχολείται συγκεκριμένα με την οικογένεια StyleGAN της NVIDIA).

Η μέθοδος «Brady Bunch» – ίσως α ανούσια αναφορά για οποιονδήποτε δεν έβλεπε τηλεόραση τη δεκαετία του 1970 ή έχασε τις κινηματογραφικές διασκευές της δεκαετίας του 1990 - προσδιορίζει περιεχόμενο πλαστογραφημένο από GAN με βάση τις σταθερές θέσεις που είναι βέβαιο ότι θα καταλαμβάνουν συγκεκριμένα μέρη ενός προσώπου GAN, λόγω της συνηθισμένης και τυποποιημένης φύσης του 'διαδικασία παραγωγής'.

Η μέθοδος «Brady Bunch» που προτάθηκε από μια διαδικτυακή μετάδοση από το ινστιτούτο SANS το 2022: μια γεννήτρια προσώπου που βασίζεται σε GAN θα πραγματοποιήσει απίθανα ομοιόμορφη τοποθέτηση ορισμένων χαρακτηριστικών του προσώπου, διαψεύδοντας την προέλευση της φωτογραφίας, σε ορισμένες περιπτώσεις. Πηγή: https://arxiv.org/ftp/arxiv/papers/2210/2210.06587.pdf

Η μέθοδος «Brady Bunch» που προτάθηκε από μια διαδικτυακή μετάδοση από το ινστιτούτο SANS το 2022: μια γεννήτρια προσώπου που βασίζεται σε GAN θα πραγματοποιήσει απίθανα ομοιόμορφη τοποθέτηση ορισμένων χαρακτηριστικών του προσώπου, διαψεύδοντας την προέλευση της φωτογραφίας, σε ορισμένες περιπτώσεις. Πηγή: https://arxiv.org/ftp/arxiv/papers/2210/2210.06587.pdf

Μια άλλη χρήσιμη γνωστή ένδειξη είναι η συχνή αδυναμία του StyleGAN να αποδίδει πολλαπλά πρόσωπα (πρώτη εικόνα παρακάτω), εάν είναι απαραίτητο, καθώς και η έλλειψη ταλέντου στον συντονισμό των αξεσουάρ (μέση εικόνα παρακάτω) και η τάση να χρησιμοποιεί μια γραμμή μαλλιών ως αρχή μιας αυτοσχέδιας καπέλο (τρίτη εικόνα παρακάτω).

Η τρίτη μέθοδος στην οποία εφιστά την προσοχή ο ερευνητής είναι επικάλυψη φωτογραφίας (ένα παράδειγμα του οποίου μπορείτε να δείτε στο το άρθρο μας του Αυγούστου σχετικά με τη διάγνωση διαταραχών ψυχικής υγείας με τη βοήθεια τεχνητής νοημοσύνης), το οποίο χρησιμοποιεί λογισμικό σύνθεσης «ανάμιξης εικόνας», όπως η σειρά CombineZ για τη σύνδεση πολλαπλών εικόνων σε μια ενιαία εικόνα, αποκαλύπτοντας συχνά υποκείμενα κοινά στοιχεία στη δομή - μια πιθανή ένδειξη σύνθεσης.

Η αρχιτεκτονική που προτείνεται στη νέα εργασία τιτλοφορείται (πιθανώς ενάντια σε όλες τις συμβουλές SEO) Δρομέας λεπίδων, αναφερόμενος στο Δοκιμή Voight-Kampff Αυτό καθορίζει εάν οι ανταγωνιστές στο franchise επιστημονικής φαντασίας είναι «ψεύτικοι» ή όχι.

Η διοχέτευση αποτελείται από δύο φάσεις, η πρώτη από τις οποίες είναι ο αναλυτής PapersPlease, ο οποίος μπορεί να αξιολογήσει δεδομένα που έχουν αφαιρεθεί από γνωστούς ιστότοπους GAN-face όπως ο thispersondoesnotexist.com ή το generated.photos.

Αν και μια περικομμένη έκδοση του κώδικα μπορεί να επιθεωρηθεί στο GitHub (δείτε παρακάτω), παρέχονται λίγες λεπτομέρειες σχετικά με αυτήν την ενότητα, εκτός από το ότι το OpenCV και DLIB χρησιμοποιούνται για το περίγραμμα και τον εντοπισμό προσώπων στο συγκεντρωμένο υλικό.

Η δεύτερη ενότητα είναι η Μεταξύ μας ανιχνευτής. Το σύστημα έχει σχεδιαστεί για να αναζητά συντονισμένη τοποθέτηση ματιών στις φωτογραφίες, ένα επίμονο χαρακτηριστικό της εξόδου προσώπου του StyleGAN, που χαρακτηρίζεται στο σενάριο «Brady Bunch» που περιγράφεται παραπάνω. Το AmongUs τροφοδοτείται από έναν τυπικό ανιχνευτή 68 ορόσημων.

Σχολιασμοί σημείων προσώπου μέσω της Intelligent Behavior Understanding Group (IBUG), της οποίας ο κώδικας σχεδίασης ορόσημου προσώπου χρησιμοποιείται στο πακέτο Blade Runner.

Σχολιασμοί σημείων προσώπου μέσω της Intelligent Behavior Understanding Group (IBUG), της οποίας ο κώδικας σχεδίασης ορόσημου προσώπου χρησιμοποιείται στο πακέτο Blade Runner.

Το AmongUs εξαρτάται από προεκπαιδευμένα ορόσημα που βασίζονται στις γνωστές συντεταγμένες «Brady buunch» από το PapersPlease και προορίζεται για χρήση έναντι ζωντανών δειγμάτων εικόνων προσώπου που βασίζονται στο StyleGAN.

Το Blade Runner, προτείνει ο συγγραφέας, είναι μια λύση plug-and-play που προορίζεται για εταιρείες ή οργανισμούς που δεν διαθέτουν πόρους για την ανάπτυξη εσωτερικών λύσεων για το είδος της ανίχνευσης deepfake που εξετάζεται εδώ, και ένα «μέτρο διακοπής για να κερδίσουν χρόνο για πιο μόνιμα αντίμετρα».

Στην πραγματικότητα, σε έναν τόσο ασταθή και ταχέως αναπτυσσόμενο τομέα ασφάλειας, δεν υπάρχουν πολλά κατά παραγγελία or off-the-rack λύσεις προμηθευτών cloud στις οποίες μπορεί να στραφεί με σιγουριά αυτή τη στιγμή μια εταιρεία που δεν διαθέτει πόρους.

Αν και το Blade Runner έχει κακή απόδοση απέναντι με γυαλιά Άτομα που προσποιούνται από το StyleGAN, αυτό είναι ένα σχετικά κοινό πρόβλημα σε παρόμοια συστήματα, τα οποία αναμένουν ότι θα μπορούν να αξιολογούν τις οριοθετήσεις των ματιών ως βασικά σημεία αναφοράς, που συγκαλύπτονται σε τέτοιες περιπτώσεις.

Έχει γίνει μια μειωμένη έκδοση του Blade Runner κυκλοφόρησε σε ανοιχτό κώδικα στο GitHub. Υπάρχει μια πιο πλούσια σε χαρακτηριστικά ιδιόκτητη έκδοση, η οποία μπορεί να επεξεργαστεί πολλές φωτογραφίες, αντί για μια φωτογραφία ανά λειτουργία του αποθετηρίου ανοιχτού κώδικα. Ο συγγραφέας σκοπεύει, λέει, να αναβαθμίσει την έκδοση GitHub στο ίδιο πρότυπο τελικά, όσο το επιτρέπει ο χρόνος. Παραδέχεται επίσης ότι το StyleGAN είναι πιθανό να εξελιχθεί πέρα ​​από τις γνωστές ή τις τρέχουσες αδυναμίες του και ότι το λογισμικό θα πρέπει επίσης να αναπτυχθεί παράλληλα.

DE-FAKE

Η αρχιτεκτονική DE-FAKE στοχεύει όχι μόνο στην επίτευξη «καθολικής ανίχνευσης» για εικόνες που παράγονται από μοντέλα διάχυσης κειμένου σε εικόνα, αλλά και στην παροχή μιας μεθόδου για τη διάκριση Ποιό Το μοντέλο λανθάνουσας διάχυσης (LD) παρήγαγε την εικόνα.

Το καθολικό πλαίσιο ανίχνευσης στο DE-FAKE απευθύνεται σε τοπικές εικόνες, ένα υβριδικό πλαίσιο (πράσινο) και εικόνες ανοιχτού κόσμου (μπλε). Πηγή: http://export.arxiv.org/pdf/2210.06998

Το καθολικό πλαίσιο ανίχνευσης στο DE-FAKE απευθύνεται σε τοπικές εικόνες, ένα υβριδικό πλαίσιο (πράσινο) και εικόνες ανοιχτού κόσμου (μπλε). Πηγή: http://export.arxiv.org/pdf/2210.06998

Για να είμαι ειλικρινής, αυτή τη στιγμή, αυτό είναι ένα αρκετά εύκολο έργο, καθώς όλα τα δημοφιλή μοντέλα LD – κλειστού ή ανοιχτού κώδικα – έχουν αξιοσημείωτα διακριτικά χαρακτηριστικά.

Επιπλέον, οι περισσότεροι μοιράζονται ορισμένες κοινές αδυναμίες, όπως η προδιάθεση για αποκοπή κεφαλιών, λόγω του αυθαίρετο τρόπο ότι οι μη τετράγωνες εικόνες που έχουν αφαιρεθεί από τον ιστό ενσωματώνονται στα τεράστια σύνολα δεδομένων που συστήματα ισχύος όπως το DALL-E 2, το Stable Diffusion και το MidJourney:

Τα μοντέλα λανθάνουσας διάχυσης, όπως όλα τα μοντέλα υπολογιστικής όρασης, απαιτούν είσοδο τετραγώνου. αλλά η συνολική απόξεση ιστού που τροφοδοτεί το σύνολο δεδομένων LAION5B δεν προσφέρει «έξτρα πολυτέλειας», όπως η δυνατότητα αναγνώρισης και εστίασης σε πρόσωπα (ή οτιδήποτε άλλο), και περικόπτει τις εικόνες αρκετά βάναυσα αντί να τις συμπληρώνει (που θα διατηρούσε ολόκληρη την πηγή εικόνα, αλλά σε χαμηλότερη ανάλυση). Μόλις εκπαιδευτούν, αυτές οι «καλλιέργειες» κανονικοποιούνται και πολύ συχνά εμφανίζονται στην έξοδο συστημάτων λανθάνουσας διάχυσης όπως το Stable Diffusion. Πηγές: https://blog.novelai.net/novelai-improvements-on-stable-diffusion-e10d38db82ac και Stable Diffusion.

Τα μοντέλα λανθάνουσας διάχυσης, όπως όλα τα μοντέλα υπολογιστικής όρασης, απαιτούν είσοδο τετράγωνου σχήματος. αλλά η συνολική απόξεση ιστού που τροφοδοτεί το σύνολο δεδομένων LAION5B δεν προσφέρει «έξτρα πολυτέλειας», όπως η δυνατότητα αναγνώρισης και εστίασης σε πρόσωπα (ή οτιδήποτε άλλο), και περικόπτει τις εικόνες αρκετά βάναυσα αντί να τις συμπληρώνει (που θα διατηρούσε ολόκληρη την πηγή εικόνα, αλλά σε χαμηλότερη ανάλυση). Μόλις εκπαιδευτούν, αυτές οι «καλλιέργειες» κανονικοποιούνται και πολύ συχνά εμφανίζονται στην έξοδο συστημάτων λανθάνουσας διάχυσης όπως το Stable Diffusion. Πηγές: https://blog.novelai.net/novelai-improvements-on-stable-diffusion-e10d38db82ac και Stable Diffusion.

Το DE-FAKE προορίζεται να είναι αλγόριθμο-αγνωστικιστικό, ένας μακροχρόνιος στόχος των ερευνητών anti-deepfake του αυτόματου κωδικοποιητή και, αυτή τη στιγμή, αρκετά εφικτός όσον αφορά τα συστήματα LD.

Η αρχιτεκτονική χρησιμοποιεί το Contrastive Language-Image Pretraining του OpenAI (CLIP) πολυτροπική βιβλιοθήκη – ουσιαστικό στοιχείο στη Σταθερή Διάχυση και γίνεται γρήγορα η καρδιά του νέου κύματος συστημάτων σύνθεσης εικόνας/βίντεο – ως ένας τρόπος εξαγωγής ενσωματώσεων από «πλαστές» εικόνες LD και εκπαίδευσης ενός ταξινομητή στα παρατηρούμενα μοτίβα και κλάσεις.

Σε ένα πιο «μαύρο κουτί» σενάριο, όπου τα κομμάτια PNG που περιέχουν πληροφορίες σχετικά με τη διαδικασία παραγωγής έχουν αφαιρεθεί εδώ και πολύ καιρό από διαδικασίες φόρτωσης και για άλλους λόγους, οι ερευνητές χρησιμοποιούν το Salesforce Πλαίσιο BLIP (επίσης συστατικό σε τουλάχιστον ένα κατανομή της σταθερής διάχυσης) για «τυφλή» δημοσκόπηση των εικόνων για την πιθανή σημασιολογική δομή των προτροπών που τις δημιούργησαν.

Οι ερευνητές χρησιμοποίησαν το Stable Diffusion, το Latent Diffusion (το ίδιο ένα διακριτό προϊόν), το GLIDE και το DALL-E 2 για να συμπληρώσουν ένα σύνολο δεδομένων εκπαίδευσης και δοκιμής αξιοποιώντας τα MSCOCO και Flickr30k.

Οι ερευνητές χρησιμοποίησαν το Stable Diffusion, το Latent Diffusion (το ίδιο ένα διακριτό προϊόν), το GLIDE και το DALL-E 2 για να συμπληρώσουν ένα σύνολο δεδομένων εκπαίδευσης και δοκιμής αξιοποιώντας τα MSCOCO και Flickr30k.

Κανονικά θα εξετάζαμε αρκετά εκτενώς τα αποτελέσματα των πειραμάτων των ερευνητών για ένα νέο πλαίσιο. αλλά στην πραγματικότητα, τα ευρήματα του DE-FAKE φαίνεται πιθανό να είναι πιο χρήσιμα ως μελλοντικό σημείο αναφοράς για μεταγενέστερες επαναλήψεις και παρόμοια έργα, παρά ως ουσιαστική μέτρηση της επιτυχίας του έργου, λαμβάνοντας υπόψη το ασταθές περιβάλλον στο οποίο λειτουργεί και ότι το σύστημα που που ανταγωνίζεται στις δοκιμές της εφημερίδας είναι σχεδόν τριών ετών – από τότε που η σκηνή σύνθεσης εικόνας ήταν πραγματικά εκκολαπτόμενη.

Οι δύο πιο αριστερές εικόνες: το «προκλητικό» προηγούμενο πλαίσιο, που δημιουργήθηκε το 2019, είναι αναμενόμενα λιγότερο καλά σε σχέση με το DE-FAKE (δεξιές δύο εικόνες) στα τέσσερα συστήματα LD που δοκιμάστηκαν.

Αριστερά δύο εικόνες: το «αμφισβητούμενο» προηγούμενο πλαίσιο, που δημιουργήθηκε το 2019, ήταν αναμενόμενα λιγότερο καλά σε σχέση με το DE-FAKE (δεξιές δύο εικόνες) στα τέσσερα συστήματα LD που δοκιμάστηκαν.

Τα αποτελέσματα της ομάδας είναι συντριπτικά θετικά για δύο λόγους: υπάρχει ελάχιστη προηγούμενη εργασία με την οποία μπορεί να γίνει σύγκριση (και καθόλου που να προσφέρει δίκαιη σύγκριση, δηλαδή, που καλύπτει μόλις δώδεκα εβδομάδες από την κυκλοφορία του Stable Diffusion σε ανοιχτό κώδικα).

Δεύτερον, όπως αναφέρθηκε παραπάνω, παρόλο που το πεδίο σύνθεσης εικόνας LD αναπτύσσεται με εκθετική ταχύτητα, το περιεχόμενο εξόδου των τρεχουσών προσφορών ουσιαστικά υδατογραφεί τον εαυτό του λόγω των δικών του δομικών (και πολύ προβλέψιμων) ελλείψεων και εκκεντροτήτων – πολλές από τις οποίες είναι πιθανό να αποκατασταθούν. στην περίπτωση του Stable Diffusion τουλάχιστον, με την απελευθέρωση του σημείου ελέγχου 1.5 με καλύτερη απόδοση (δηλαδή το εκπαιδευμένο μοντέλο 4 GB που τροφοδοτεί το σύστημα).

Ταυτόχρονα, η Stability έχει ήδη επισημάνει ότι έχει έναν σαφή οδικό χάρτη για τα V2 και V3 του συστήματος. Δεδομένων των πρωτοσέλιδων γεγονότων των τελευταίων τριών μηνών, οποιαδήποτε εταιρική ταλαιπωρία από την πλευρά του OpenAI και άλλων ανταγωνιστικών παικτών στον χώρο σύνθεσης εικόνας είναι πιθανό να έχει εξατμιστεί, πράγμα που σημαίνει ότι μπορούμε να περιμένουμε έναν παρόμοιο γρήγορο ρυθμό προόδου και στον χώρος σύνθεσης εικόνας κλειστού κώδικα.

 

Πρώτη δημοσίευση 14 Οκτωβρίου 2022.