Connect with us

Araştırma: Spam Algoritmaları 2020 ABD Seçimleri Sırasında Siyasi Yanlılık Gösterdi

Yapay Zekâ

Araştırma: Spam Algoritmaları 2020 ABD Seçimleri Sırasında Siyasi Yanlılık Gösterdi

mm

Yeni bir çalışmaya göre, dünyanın üç büyük e-posta sağlayıcısının spam filtreleme algoritmaları (SFAs), 2020 ABD seçimlerinde siyasi yanlılık gösterdi. Google’ın Gmail’i sol yana, Microsoft Outlook ve Yahoo Mail’in ise sağ yanlı adayların e-postalarını favori ettiği görüldü.

Çalışmada şöyle deniyor:

‘Gözlemlerimiz, tüm SFAların 2020 ABD seçimlerine giden aylarda siyasi yanlılık gösterdiğini ortaya koydu. Gmail sol yana (Demokratlar) eğilirken, Outlook ve Yahoo sağ yana (Cumhuriyetçiler) eğildi. Gmail, sağ yanlı adayların e-postalarını %59,3 daha fazla spam olarak işaretlerken, Outlook ve Yahoo da sol yanlı adayların epostalarını sırasıyla %20,4 ve %14,2 daha fazla spam olarak işaretledi.’

Yazarların analizi, SFA faaliyetlerinde ‘toplu yanlılıklar’ olduğunu iddia ediyor.

Çalışma ayrıca, karşıt sesleri susturmak isteyen aktörlerin resmi iletişimlere erişerek veya bunları raporlayarak spam olarak işaretleyebilecekleri ve böylece belirli bir göndericiden gelen spam olasılığını belirleyen algoritmaları etkileyebilecekleri olasılığını da kabul ediyor.

Ancak araştırmacılar, farklı e-posta sağlayıcılarının kullanıcı geri bildirimlerine dayalı olarak eylemlerini yapılandırdıkları şekilde belirgin varyasyonların bu durumu açıklamadığını gözlemliyor:

‘Arguably, e-posta hizmetlerinin SFAlarının bazı seçmenlerin belirli kampanya epostalarını spam olarak işaretlemesinden ve bu/benzer kampanya epostalarını diğer seçmenler için de spam olarak işaretlemeye başlamasından da bu durum oluşmuş olabilir. Bizim bu e-posta hizmetlerinin kasıtlı olarak bu yanlılıkları yaratmak için bir girişimi olduğuna dair hiçbir nedenimiz yok, ancak gerçekte SFAlarının bir siyasi bağlantılı epostaları diğerine göre daha fazla spam olarak işaretlediği ortaya çıktı.’

‘Bu nổi bật e-posta hizmetleri, önemli bir seçmen kitlesi tarafından aktif olarak kullanılmakta ve birçok seçmen bugün gördükleri (veya görmedikleri) bilgilere dayanmaktadır, bu nedenle bu yanlılıkların seçim sonuçları üzerinde göz ardı edilemeyecek bir etkisi olabilir.’

Çalışma makale olarak adlandırılmış ve Kuzey Carolina Eyalet Üniversitesi Bilgisayar Bilimi Bölümü’nden dört araştırmacı tarafından yapılmıştır.

Evreler

Araştırmacıların çalışması, Temmuz 2020’den aynı yılın Kasım ayının sonuna kadar beş aylık bir dönemi kapsıyor. Bu süre zarfında, üç e-posta platformunda 102 yeni e-posta adresi oluşturularak, iki başkanlık, 78 senato ve 156 meclis adayı e-posta bildirim listelerine abone oldular.

Demografik faktörleri göz ardı etmek için, e-posta hesapları her bir (kurgusal) son kullanıcı için farklı demografik faktörlerle oluşturuldu ve iki dalga halinde bölündü: ilki, tüm birleşik e-posta hizmetleri için genel yanlılık eğilimlerini incelemeye yönelik olarak başkanlık, Meclis ve Senato adayları için spam filtreleme algoritmalarında genel yanlılık eğilimlerini inceledi; ikincisi ise e-posta etkileşimlerinin (kullanıcı tarafından spam olarak işaretlenmesi veya işaretlerinin kaldırılması gibi) algoritmik spam filtrelerinin davranışını nasıl etkilediğini inceledi.

Çalışma sırasında beberapa önemli gözlem yapıldı. Yazarlar, Gmail’in ‘sol yana’ eğildiğini, Outlook ve Yahoo’nun ise sağ yana eğildiğini bildirdi. Yahoo, tüm siyasi e-postaların %55,2’sini kullanıcıların posta kutusunda tutarken, Outlook tüm siyasi adayların e-postalarının %71,8’ini filtreledi.

‘Gmail, sol yanlı adayların epostalarını posta kutusunda tuttu (%10,12’den azı spam olarak işaretlendi) ve sağ yanlı adayların epostalarının çoğunu spam klasörüne gönderdi (buna kadar %77,2’si spam olarak işaretlendi). ‘

‘Ayrıca, sağ yanlı adaylardan gelen epostaların Gmail tarafından spam olarak işaretlenme yüzdesinin seçim tarihine yaklaştıkça sürekli arttığını gözlemledik, sol yanlı adaylardan gelen epostaların spam olarak işaretlenme yüzdesi ise yaklaşık aynı kaldı.’

Aday Seçimi

Çalışmada yer alan başkanlık adayları sınırlı olarak Joe Biden ve Donald Trump ile sınırlı tutuldu, araştırmacılar ise Senato ve Meclis adaylarından e-posta iletişimlerine abone olurken dikkatli bir seçim yaptılar.

İlk olarak, eyaletlerin nüfus sayımına dayalı olarak Temsilciler Meclisi’ndeki sandalye sayısı değişkenlik gösteriyor. İkincisi, iki büyük siyasi parti arasındaki Senato ve Temsilciler Meclisi adayları sayısı eyaletlere göre değişiyor. Ayrıca, bazı adaylar yalnızca resmi .gov web siteleri ile temsil ediliyor ve kampanya e-postaları göndermelerine ilişkin yasal kısıtlamalar vardı ve bazı adayların abonelik listeleri, araştırmacıların özel veri toplama çerçevesi tarafından otomatikleştirilemeyen CAPTCHAlar tarafından korunuyor.

Demokrat ve Cumhuriyetçi adaylar arasındaki dengesizliği dengelemek için, araştırmacılar her bir eyalette eşit sayıda sol ve sağ yanlı aday bulunan eyaletlerdeki adayların kampanya e-posta bilgilerine abone oldular, Alaska gibi yalnızca bir Cumhuriyetçi Senato adayı bulunan eyaletler hariç.

Toplamda, yazarlar 11 böyle eyaleti adil bir şekilde temsil etmek zorunda kaldılar ve sonunda tüm 50 eyaleti temsil ettiler. 36 eyalette 78 abonelik, 44 Demokrat ve 34 Cumhuriyetçi Senato adayı listelerini oluşturdu, 42 eyalette ise 156 abonelik, 81 Demokrat ve 75 Cumhuriyetçi Meclis adayı listelerini oluşturdu.

Veri Analizi

Araştırmacılar, çalışmanın aktif veri toplama döneminde, Kasım 20’den sonra e-posta hacminin hızlı düşüşü nedeniyle 318.108 e-posta topladı. Toplanan her bir e-posta için içerik, MIME-Sürüm, İçerik Türü, Konu, Gönderen, Alıcı, Tarih, İleti-Kimliği, Teslim Edilen, Alınan-SPF ve Alınan tarafından içeriyordu.

Her iki siyasi partinin iletişimlerini adil bir şekilde temsil etme zorlukları nedeniyle, İstatistiksel Yöntem olarak Eğilim Puanı Analizi (PSA) seçildi. PSA, kontrol grupları ve geleneksel istatistiksel bölünmeler kolayca uygulanamayan olağanüstü durumlarda dengesiz verilerden kovaryantlar oluşturur.

Yazarlar, çalışmanın sonuçlarına dayanarak, e-posta hizmetlerinin SFAlarının siyasi yanlılık gösterdiğini ve hizmetlerin zaman içinde daha spesifik bir davranış sergilediğini belirtiyorlar.

Gmail, sağ yanlı siyasi e-postaların %67,6’sını spam olarak işaretlerken, yalnızca %8,2’sini sol yanlı e-posta olarak işaretliyor, ancak spam olarak işaretlenen e-postaları geri çekme konusunda diğer hizmetlere kıyasla daha dinamik bir şekilde tepki veriyor. Outlook, %95,8 sol yanlı siyasi e-postaları spam olarak işaretlerken, %75,4’ü sağ yanlı e-postaları spam olarak işaretliyor ve Yahoo, sol yanlı e-postaların %14,2’sini daha fazla spam olarak işaretliyor.

Distribution of political affiliation of email subscriptions from Senate and House candidates. Source: https://arxiv.org/pdf/2203.16743.pdf

Senato ve Meclis adaylarının e-posta aboneliklerinin siyasi bağlantılı dağılımı. Kaynak: https://arxiv.org/pdf/2203.16743.pdf

Araştırmaların sonuçları, çalışmanın süresince Gmail’in tüm siyasi bağlantılara ait artan e-posta hacmine genel olarak spam olarak işaretleyerek tepki verdiğini, ancak Yahoo’nun sol yanlı e-postaları spam olarak işaretlemeye devam ettiğini ve sağ yanlı e-postaların sayısını azalttığını gösteriyor. Outlook, her iki siyasi partiden gelen e-postalara karşı genel olarak sağ yanlı bir tutum sergiliyor.

Percentage of emails marked as spam across both political parties and all three email providers over the 153 days of the study period.

Çalışma süresince her iki siyasi parti ve tüm üç e-posta sağlayıcısı için spam olarak işaretlenen e-postaların yüzdesi.

Kullanıcı Etkileşimine Tepki

Bir spam e-postayı ‘Spam Değil’ olarak işaretlediğimizde, e-posta sisteminin benzer e-postaları gelecekte spam olarak işaretlememesini sağlamak amacındayız, ancak altta yatan kural türü her zaman tam olarak açık olmayabilir.

Çalışmanın sonuçları, üç e-posta sağlayıcısı arasında yalnızca Gmail’in ‘Spam Değil’ girdisine đáng kể bir şekilde tepki verdiğini gösteriyor. Buna karşılık, bu kullanıcı tarafından yönlendirilen spamdan posta kutusuna (S→I) etkileşimi, Outlook ve Yahoo’da çok sınırlı bir uzun vadeli etkiye sahip.

Araştırmacılar gözlemliyor:

‘S→I etkileşimi nedeniyle, Gmail’deki siyasi yanlılık önemli ölçüde azaldı. Ancak beklenmedik bir şekilde, Outlook ve Yahoo’da arttı, çünkü bu iki hizmet de spam olarak işaretledikleri e-postaları spam olarak işaretlememek için kullanıcıların isteğine dikkat çekici bir şekilde tepki vermedi.’

Sonuç

Yazarlar, Gmail’in Outlook ve Yahoo’ya kıyasla kullanıcı etkileşimine önemli ölçüde tepki verdiğini, kendi sol yanlı eğilimine rağmen, kếtüller.

Yazarlar şöyle diyor:

‘Gmail’deki siyasi yanlılık, okuma etkileşimi之后 değişmedi, ancak I→S ve S→I etkileşimleri之后 önemli ölçüde azaldı.’

Ve devam ediyor:

‘Siyasi yanlılıklar çeşitli etkileşimlere tepki olarak değişse de, Gmail sol yanlı eğilimini korurken, Outlook ve Yahoo tüm senaryolarda sağ yanlı eğilimlerini korudu.’

Araştırmacılar, son kullanıcıların spam filtrelerinin davranışını değiştirmek için kullanıcı müdahalesine (örneğin, bir e-postayı spam klasöründen posta kutusuna taşıma veya bir e-postayı ‘Spam Değil’ olarak işaretleme) güvenmelerini beklediğini kabul ediyor, ancak bu mekanizmanın güvenilir olmadığını ve üç e-posta sağlayıcısı arasında tutarlı olmadığını belirtiyorlar.

Makalede şöyle deniyor:

‘Kullanıcıların siyasi e-postaların SFA tarafından nasıl işlendiğine ilişkin yanlılığı azaltmalarına yardımcı olmak için önerilebilecek tutarlı bir eylem bulunamadı.’

 

İlk olarak 4 Nisan 2022’de yayımlandı.

Makine öğrenimi üzerine yazar, insan görüntü sentezinde alan uzmanı. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel site: martinanderson.ai
İletişim: [email protected]