Τεχνητή νοημοσύνη

Έρευνα: Οι Αλγόριθμοι Κατά του Spam Έδειξαν Πολιτική Προκατάληψη κατά τις Εκλογές των ΗΠΑ το 2020

Published April 4, 2022

Updated April 28, 2026

Martin Anderson

Σύμφωνα με μια νέα μελέτη, οι αλγόριθμοι φιλτραρίσματος spam (SFAs) από τρεις από τους μεγαλύτερους παγκόσμιους παρόχους email εμφάνισαν πολιτική προκατάληψη κατά τις εκλογές των Ηνωμένων Πολιτειών το 2020, με το Gmail της Google να προκαλύπτει προς τα αριστερά, και το Microsoft Outlook και το Yahoo Mail να ευνοούν emails από υποψήφιους της δεξιάς πτέρυγας.

Το έγγραφο αναφέρει:

‘Οι παρατηρήσεις μας αποκάλυψαν ότι όλες οι SFAs εμφάνισαν πολιτικές προκαταλήψεις τους μήνες που προηγήθηκαν των εκλογών των ΗΠΑ το 2020. Το Gmail έτεινε προς τα αριστερά (Δημοκρατικοί) ενώ το Outlook και το Yahoo έτειναν προς τα δεξιά (Ρεπουμπλικανοί). Το Gmail σημείωσε 59,3% περισσότερα emails από τους υποψήφιους της δεξιάς πτέρυγας ως spam σε σύγκριση με τους υποψήφιους της αριστεράς πτέρυγας, ενώ το Outlook και το Yahoo σημείωσαν 20,4% και 14,2% περισσότερα emails από τους υποψήφιους της αριστεράς πτέρυγας ως spam σε σύγκριση με τους υποψήφιους της δεξιάς πτέρυγας, αντίστοιχα.’

Η ανάλυση των συγγραφέων, όπως ισχυρίζονται, αποδεικνύει ‘συγκεντρωτικές προκαταλήψεις’ στην δραστηριότητα των SFAs.

Το έγγραφο αναγνωρίζει επίσης τη δυνατότητα ‘καλλιέργειας’ σημείωσης spam, όπου ηθοποιοί που επιδιώκουν να σιωπήσουν αντιτιθέμενες φωνές θα μπορούσαν να ζητήσουν ή να αποκτήσουν πρόσβαση σε επίσημες επικοινωνίες από ‘εχθρικές’ πλευρές και συσχετίσεις με την πρόθεση να αναφέρουν την επικοινωνία ως spam, επηρεάζοντας τους αλγόριθμους που καθορίζουν την πιθανότητα προέλευσης spam από έναν συγκεκριμένο αποστολέα.

Ωστόσο, οι ερευνητές παρατηρούν ότι αυτό δεν εξηγεί τις σημειωμένες διακυμάνσεις στον τρόπο με τον οποίο οι διαφορετικοί παρόχοι email φαίνεται να έχουν ρυθμίσει τις ενέργειες με βάση τις ανατροφοδοτήσεις από τους τελικούς χρήστες:

‘Επιχείρημα, υπάρχει επίσης η δυνατότητα ότι οι SFAs των υπηρεσιών email έμαθαν από τις επιλογές ορισμένων ψηφοφόρων που σημείωσαν ορισμένα emails εκστρατείας ως spam και άρχισαν να σημείωναν αυτά/παρόμοια emails εκστρατείας ως spam για άλλους ψηφοφόρους. Ενώ δεν έχουμε κανένα λόγο να πιστεύουμε ότι υπήρχαν επιθετικές προσπάθειες από αυτές τις υπηρεσίες email να δημιουργήσουν αυτές τις προκαταλήψεις για να επηρεάσουν τους ψηφοφόρους, το γεγονός παραμένει ότι οι SFAs τους έχουν μάθει να σημείωναν περισσότερα emails από μια πολιτική συσχέτιση ως spam σε σύγκριση με την άλλη. ‘

‘Καθώς αυτές οι εξέχουσες υπηρεσίες email χρησιμοποιούνται ενεργά από ένα σημαντικό τμήμα του εκλογικού σώματος και καθώς πολλοί από τους ψηφοφόρους σήμερα βασίζονται στις πληροφορίες που βλέπουν (ή δεν βλέπουν) στο διαδίκτυο, τέτοιες προκαταλήψεις μπορεί να έχουν μια μη αγνοητή επίδραση στα αποτελέσματα μιας εκλογής.’

Το έγγραφο έχει τον τίτλο Μια Ματιά στις Πολιτικές Προκαταλήψεις στους Αλγόριθμους Φιλτραρίσματος Spam κατά τις Εκλογές των ΗΠΑ το 2020, και προέρχεται από τέσσερις ερευνητές από το Τμήμα Επιστήμης Υπολογιστών του Πανεπιστημίου της Βόρειας Καρολίνας.

Γύρω από τα Σπίτια

Η μελέτη των ερευνητών καλύπτει einen περίοδο πέντε μηνών από τον Ιούλιο του 2020 έως το τέλος του Νοεμβρίου της ίδιας χρονιάς, κατά την οποία δημιούργησαν 102 νέες διευθύνσεις email σε τρεις πλατφόρμες email, και εγγράφηκαν σε δύο προεδρικές, 78 γερουσιακές και 156 οικικές λίστες email υποψηφίων.

Για να αποκλείσουν δημογραφικούς παράγοντες, οι λογαριασμοί email δημιουργήθηκαν με διαφορετικούς δημογραφικούς παράγοντες για κάθε (ψευδές) τελικό χρήστη, και χωρίστηκαν σε δύο ρεύματα: το πρώτο μελέτησε τις γενικές τάσεις προκατάληψης στους αλγόριθμους φιλτραρίσματος spam σε όλες τις συνδυασμένες υπηρεσίες email για προεδρικούς, οικιακούς και γερουσιακούς υποψήφιους· και το δεύτερο εξέτασε τους τρόπους με τους οποίους διάφορες αλληλεπιδράσεις email (όπως η σημείωση ή η απαλλαγή από spam από τον τελικό χρήστη) φαίνονταν να επηρεάζουν τη συμπεριφορά των αλγορίθμων φιλτραρίσματος spam.

Πολλές κρίσιμες παρατηρήσεις ήρθαν στο προσκήνιο κατά τη διάρκεια της μελέτης. Οι συγγραφείς αναφέρουν ότι το Gmail ‘έτεινε προς τα αριστερά’, ενώ το Outlook και το Yahoo έτειναν προς τα δεξιά. Το Yahoo διατήρησε το 55,2% όλων των πολιτικών email στη γραμματοθυρίδα του χρήστη, ενώ το Outlook φίλτράρε 71,8% των email από πολιτικούς υποψήφιους όλων των χρωμάτων.

‘Το Gmail, ωστόσο, διατήρησε την πλειοψηφία των email υποψηφίων της αριστεράς πτέρυγας στη γραμματοθυρίδα (< 10,12% σημειώθηκαν ως spam) ενώ [στέλνει] την πλειοψηφία των email υποψηφίων της δεξιάς πτέρυγας στο φάκελο spam (έως 77,2% σημειώθηκαν ως spam). ‘

‘Παρατηρήσαμε επίσης ότι το ποσοστό των email που σημειώθηκαν από το Gmail ως spam από τους υποψήφιους της δεξιάς πτέρυγας αυξήθηκε σταθερά καθώς η ημερομηνία των εκλογών approached ενώ το ποσοστό των email που σημειώθηκαν ως spam από τους υποψήφιους της αριστεράς πτέρυγας παρέμεινε περίπου το ίδιο.’

Επιλογή Υποψηφίων

Ενώ οι προεδρικοί υποψήφιοι που εγγράφηκαν για τη μελέτη ήταν περιορισμένοι στους Τζο Μπάιντεν και Ντόναλντ Τραμπ, οι ερευνητές φρόντισαν να κάνουν αντιπροσωπευτικές επιλογές όταν λάμβαναν υπόψη την εγγραφή σε email επικοινωνιών από γερουσιακούς και οικιακούς υποψήφιους, για μια σειρά από λόγους.

Πρώτον, οι πολιτείες έχουν διαφορετικό αριθμό εδρών στη Βουλή, με βάση τον πληθυσμό της πολιτείας. Δεύτερον, ο αριθμός των γερουσιακών και οικιακών υποψηφίων στα δύο κύρια πολιτικά κόμματα διαφέρει μεταξύ των πολιτειών. Επιπλέον, ορισμένοι υποψήφιοι αντιπροσωπεύονταν μόνο από επίσημες ιστοσελίδες .gov, οι οποίες είναι νομικά απαγορευμένες να στέλνουν emails εκστρατείας· και τέλος, ορισμένες λίστες εγγραφής υποψηφίων προστατεύονταν από CAPTCHAs, τις οποίες δεν μπορούσε να αυτοματοποιήσει το πλαίσιο συλλογής δεδομένων των ερευνητών.

Ανάλυση Δεδομένων

Οι ερευνητές συλλέγαν 318.108 emails στις τρεις υπηρεσίες email κατά τη διάρκεια της περιόδου συλλογής δεδομένων της μελέτης, η οποία έληξε μετά τις 20 Νοεμβρίου λόγω της ταχείας πτώσης του όγκου των emails μετά από αυτή τη ημερομηνία. Το περιεχόμενο δεδομένων που συλλέχθηκε για κάθε email περιελάμβανε MIME-Version, Content Type, Subject, From, To, Date, Message-ID, Delivered-To, Received-SPF, και Received-By.

Λόγω των προκλήσεων που涉ονται στην αντιπρόσωπη επικοινωνίας και των δύο πολιτικών κομμάτων, η Ανάλυση Ισχύος Προσδιορισμού (PSA) επιλέχθηκε ως η στατιστική μέθοδος για τα δεδομένα. Η PSA γεννά covariates από μη ισορροπημένα δεδομένα που ισοπεδώνουν τις διανομές σε εξαιρετικές περιπτώσεις όπου οι ομάδες ελέγχου και οι παραδοσιακές στατιστικές διαιρέσεις δεν είναι εύκολα εφαρμόσιμες.

Οι συγγραφείς καταλήγουν στο συμπέρασμα ότι οι SFAs για τις υπηρεσίες email που μελετήθηκαν εμφανίζουν πολιτική προκατάληψη, και ότι η πρώιμη σχετική σταθερότητα μεταξύ των υπηρεσιών διαφοροποιείται σε πιο συγκεκριμένη συμπεριφορά με την πάροδο του χρόνου.

Το Gmail σημείωσε ένα υψηλότερο ποσοστό (67,6%) των δεξιάς πτέρυγας πολιτικών email ως spam, σε σύγκριση με ένα απλό 8,2% των email της αριστεράς πτέρυγας, αλλά ανταποκρίνεται πιο δυναμικά στις αλληλεπιδράσεις των χρηστών που απαλλάσσουν emails ως spam από τους ομολόγους του.

Απάντηση σε Αλληλεπίδραση Χρήστη

Όταν σημειώνουμε ένα email spam ως ‘Όχι spam’, η πρόθεση είναι να εκπαιδεύσουμε το σύστημα email να μην σημείωνε παρόμοια emails στο μέλλον, αν και ο υποκείμενος τύπος κανόνα (βασισμένος σε email, περιεχόμενο, κ.λπ.) δεν είναι πάντα εντελώς σαφής.

Τα αποτελέσματα της μελέτης βρήκαν ότι από τις τρεις υπηρεσίες email που εξετάστηκαν, μόνο το Gmail ανταποκρίθηκε αξιοσημείωτα σε μια είσοδο ‘όχι spam’ από τον χρήστη. Από την άλλη πλευρά, αυτή η αλληλεπίδραση spam-to-inbox (S→I) είχε πολύ περιορισμένη μακροπρόθεσμη επίδραση στο Outlook και το Yahoo.

Συμπέρασμα

Οι συγγραφείς καταλήγουν στο συμπέρασμα ότι το Gmail ανταποκρίνεται ‘σημαντικά’ στην αλληλεπίδραση του χρήστη σε σύγκριση με το Outlook και το Yahoo, παρά την δική του προκατάληψη προς τα αριστερά.

Οι συγγραφείς αναφέρουν:

‘Ενώ η πολιτική προκατάληψη στο Gmail παρέμεινε αμετάβλητη μετά την αλληλεπίδραση ανάγνωσης, μειώθηκε σημαντικά λόγω των αλληλεπιδράσεων I→S και S→I.’

Και συνεχίζουν:

‘Ενώ οι πολιτικές προκαταλήψεις άλλαξαν ως απάντηση σε διάφορες αλληλεπιδράσεις, το Gmail διατήρησε την προκατάληψή του προς τα αριστερά ενώ το Outlook και το Yahoo διατήρησαν την προκατάληψή τους προς τα δεξιά σε όλες τις περιπτώσεις.’

Οι ερευνητές αναγνωρίζουν μια γενική προσδοκία από τον τελικό χρήστη ότι τα φίλτρα spam μπορούν και θα προσαρμόσουν τη συμπεριφορά τους με βάση την παρέμβαση του χρήστη (όπως η μετακίνηση ενός email από τον φάκελο spam στη γραμματοθυρίδα, ή η σημείωση ενός email ως ‘όχι spam’), αλλά ότι αυτό το μηχανισμό δεν είναι αξιόπιστος, και σίγουρα δεν είναι συνεπής μεταξύ των τριών υπηρεσιών email που μελετήθηκαν.

Το έγγραφο σημειώνει:

‘[Δεν] βρήκαμε καμία συνεχή ενέργεια που θα μπορούσαμε να προτείνουμε στους χρήστες για να τους βοηθήσουμε να μειώσουν την προκατάληψη στον τρόπο με τον οποίο η SFA αντιμετωπίζει τα πολιτικά emails που τους αποστέλλονται.’

Πρώτη δημοσίευση 4ης Απριλίου 2022.