الذكاء الاصطناعي
البحث: أظهرت خوارزميات مكافحة البريد العشوائي تحيزًا سياسيًا خلال انتخابات 2020 بالولايات المتحدة الأمريكية

وفقًا لدراسة جديدة ، أظهرت خوارزميات تصفية البريد العشوائي (SFAs) من ثلاثة من أكبر مزودي خدمات البريد الإلكتروني في العالم تحيزًا سياسيًا خلال انتخابات الولايات المتحدة لعام 2020 ، مع انحراف Gmail إلى اليسار ، وتفضيل Microsoft Outlook و Yahoo Mail رسائل البريد الإلكتروني الواردة من المرشحين اليمينيين.
تقول الورقة:
كشفت [ملاحظاتنا] عن أن جميع الاتحادات المالية الجزئية أظهرت تحيزًا سياسيًا في الأشهر التي سبقت انتخابات الولايات المتحدة لعام 2020. مال Gmail نحو اليسار (الديمقراطيون) بينما اتجه Outlook و Yahoo نحو اليمين (الجمهوريون). وضع Gmail علامة على 59.3٪ من رسائل البريد الإلكتروني الواردة من المرشحين المناسبين كرسائل غير مرغوب فيها مقارنةً بالمرشحين على اليسار ، في حين وضع Outlook و Yahoo علامة 20.4٪ و 14.2٪ على رسائل البريد الإلكتروني من المرشحين الأيسر كرسائل غير مرغوب فيها مقارنةً بالمرشحين المناسبين ، على التوالي.
يزعمون أن تحليل المؤلفين يوضح "التحيزات الإجمالية" في نشاط SFA.
تقر الورقة أيضًا بإمكانية وضع علامة على الرسائل غير المرغوب فيها "المزروعة" ، حيث يمكن للجهات الفاعلة التي تسعى إلى إسكات أصوات المعارضة طلب أو الوصول إلى الاتصالات الرسمية من الأطراف والانتماءات "المعادية" بهدف الإبلاغ عن الاتصال على أنه بريد عشوائي ، وبالتالي التأثير على الخوارزميات التي تحديد احتمالية مصدر البريد العشوائي من مرسل معين.
ومع ذلك ، لاحظ الباحثون أن هذا لا يفسر الاختلافات المحددة في الطريقة التي يبدو أن موفري البريد الإلكتروني المختلفين قد قاموا بتكوين الإجراءات بناءً على التعليقات الواردة من المستخدمين النهائيين:
يمكن القول ، أن هناك أيضًا احتمال أن تكون SFA لخدمات البريد الإلكتروني قد تعلمت من اختيارات بعض الناخبين الذين قاموا بوضع علامة على رسائل بريد إلكتروني معينة للحملة على أنها بريد عشوائي وبدأت في تمييز رسائل البريد الإلكتروني / المماثلة للحملة على أنها رسائل غير مرغوب فيها للناخبين الآخرين. على الرغم من أنه ليس لدينا سبب للاعتقاد بأن هناك محاولات متعمدة من خدمات البريد الإلكتروني هذه لخلق هذه التحيزات للتأثير على الناخبين ، إلا أن الحقيقة تبقى هناك أن SFA قد تعلموا تمييز المزيد من رسائل البريد الإلكتروني من أحد الانتماءات السياسية كرسائل غير مرغوب فيها مقارنة بالآخر.
نظرًا لأن خدمات البريد الإلكتروني البارزة هذه تُستخدم بنشاط من قبل شريحة كبيرة من الناخبين ، وبما أن العديد من الناخبين يعتمدون اليوم على المعلومات التي يرونها (أو لا يرونها) عبر الإنترنت ، فقد يكون لمثل هذه التحيزات تأثير لا يمكن تجاهله على نتائج انتخاب.'
ال ورقة بعنوان نظرة خاطفة على التحيزات السياسية في خوارزميات تصفية البريد الإلكتروني العشوائي أثناء انتخابات الولايات المتحدة 2020، ويأتي من أربعة باحثين في قسم علوم الكمبيوتر في جامعة ولاية كارولينا الشمالية.
جولة في البيوت
تغطي دراسة الباحثين فترة خمسة أشهر من يوليو 2020 حتى نهاية نوفمبر من نفس العام ، حيث أنشأوا 102 عنوان بريد إلكتروني جديد عبر منصات البريد الإلكتروني الثلاثة ، واشتركوا في إشعارين بالبريد الإلكتروني للرئاسة و 78 مجلس الشيوخ و 156 مرشحًا لمنزلهم. القوائم.
لخصم العوامل الديموغرافية ، تم إنشاء حسابات البريد الإلكتروني مع عوامل ديموغرافية مختلفة لكل مستخدم نهائي (وهمي) ، ومقسمة على شقين: أول اتجاهات التحيز العام المدروسة في خوارزميات تصفية البريد العشوائي عبر جميع خدمات البريد الإلكتروني المدمجة للرئاسة ومجلس النواب ومجلس الشيوخ مرشحين؛ وفحصت الدراسة الثانية الطرق التي يبدو أن تفاعلات البريد الإلكتروني المختلفة (مثل وضع العلامات أو إلغاء العلامات كرسائل غير مرغوب فيها من قبل المستخدم النهائي) تؤثر على سلوك مرشحات البريد العشوائي الخوارزمية.
تم التركيز على العديد من الملاحظات الرئيسية خلال الدراسة. أفاد المؤلفون أن Gmail "يميل نحو اليسار" ، بينما اتجه Outlook و Yahoo إلى اليمين. احتفظ موقع Yahoo بـ 55.2٪ من جميع رسائل البريد الإلكتروني السياسية في صندوق الوارد الخاص بالمستخدم ، بينما قام Outlook بتصفية 71.8٪ من رسائل البريد الإلكتروني من المرشحين السياسيين من جميع الأطياف.
"ومع ذلك ، احتفظ Gmail بأغلبية رسائل البريد الإلكتروني المرشحة اليسارية في البريد الوارد (<10.12٪ تم تمييزها كرسائل غير مرغوب فيها) بينما [إرسال] غالبية رسائل البريد الإلكتروني المرشحة من اليمين إلى مجلد الرسائل غير المرغوب فيها (تم تصنيف ما يصل إلى 77.2٪ على أنها رسائل غير مرغوب فيها).
"لاحظنا أيضًا أن النسبة المئوية لرسائل البريد الإلكتروني التي تم تمييزها بواسطة Gmail كرسائل غير مرغوب فيها من المرشحين اليمينيين نمت بشكل مطرد مع اقتراب موعد الانتخابات ، بينما ظلت النسبة المئوية لرسائل البريد الإلكتروني التي تم تمييزها كرسائل غير مرغوب فيها من المرشحين اليساريين كما هي تقريبًا."
اختيار المرشحين
في حين أن المرشحين للرئاسة الذين اشتركوا في الدراسة اقتصروا على جو بايدن ودونالد ترامب ، حرص الباحثون على اتخاذ خيارات تمثيلية عند التفكير في الاشتراك في رسائل البريد الإلكتروني من مرشحي مجلس الشيوخ ومجلس النواب ، لعدد من الأسباب.
أولاً ، لدى الولايات أعداد متفاوتة من المقاعد في مجلس النواب ، بناءً على عدد سكان الولاية. ثانيًا ، يختلف عدد المرشحين في مجلسي الشيوخ والنواب عبر الحزبين السياسيين الرئيسيين عبر الولايات. علاوة على ذلك ، تم تمثيل بعض المرشحين فقط من خلال مواقع الويب الرسمية .gov ، والتي يحظر قانونًا إرسال رسائل البريد الإلكتروني الخاصة بالحملة ؛ وأخيرًا ، تمت حماية بعض قوائم الاشتراك الخاصة بالمرشحين بواسطة اختبارات CAPTCHA ، والتي لا يمكن أتمتتها بواسطة إطار عمل جمع البيانات المخصص للباحثين.

توزيع الانتماءات السياسية لاشتراكات البريد الإلكتروني من مرشحي مجلسي الشيوخ والنواب. المصدر: https://arxiv.org/pdf/2203.16743.pdf
لمعادلة عدم التوازن الناتج بين المرشحين الديمقراطيين والجمهوريين ، اشترك الباحثون في معلومات البريد الإلكتروني الخاصة بالحملة من أكبر عدد ممكن من المرشحين في أي ولاية حيث كان المرشحون من اليسار واليمين متساويين في العدد ، باستثناء ولايات مثل ألاسكا ، التي كان لديها مجلس شيوخ جمهوري واحد فقط. مُرَشَّح.
في المجموع ، كان على المؤلفين أن يحاسبوا بشكل عادل على 11 ولاية من هذا القبيل ، وانتهى بهم الأمر في النهاية إلى تمثيل جميع الولايات الخمسين. 50 من الاشتراكات عبر 78 ولاية بلغت 36 قائمة لمرشحي الديمقراطيين و 44 الجمهوريين في مجلس الشيوخ ، بينما كان هناك 34 اشتراكًا عبر 156 ولاية لمرشحي مجلس النواب - 42 ديمقراطيًا و 81 جمهوريًا.
تحليل البيانات
جمع الباحثون 318,108 بريدًا إلكترونيًا عبر خدمات البريد الإلكتروني الثلاثة في فترة جمع البيانات النشطة للدراسة والتي تم اقتطاعها بعد 20 نوفمبر بسبب الانخفاض السريع في حجم الرسائل بعد ذلك التاريخ. تم تضمين محتوى البيانات المجمعة لكل بريد إلكتروني نسخة MIME, نوع المحتوى, الموضوع, من, إلى, التاريخ, معرف الرسالة, سلمت ل, استقبالا SPFو استلمت من قبل.
نظرًا للتحديات التي ينطوي عليها تمثيل كل من اتصالات الأحزاب السياسية بشكل عادل ، فإن تحليل درجة الميل (PSA) كأسلوب إحصائي للبيانات. يولد PSA المتغيرات المشتركة من البيانات غير المتوازنة التي تعادل التوزيعات في ظروف استثنائية حيث لا يمكن تطبيق مجموعات المراقبة والتقسيمات الإحصائية التقليدية بسهولة.
استنتج المؤلفون أن SFA لخدمات البريد الإلكتروني التي تمت دراستها تظهر تحيزًا سياسيًا ، وأن الاتساق النسبي المبكر عبر الخدمات يتباعد إلى سلوك أكثر تحديدًا بمرور الوقت.
يصنف Gmail نسبة أعلى (67.6٪) من رسائل البريد الإلكتروني السياسية اليمينية كرسائل غير مرغوب فيها ، مقارنة بـ 8.2٪ فقط من رسائل البريد الإلكتروني التابعة لليسار ، ولكنه يستجيب بشكل ديناميكي أكثر لتفاعلات المستخدم التي تلغي تمييز الرسائل كرسائل غير مرغوب فيها من مجموعاتها. وبدلاً من ذلك ، يصنف Outlook 95.8٪ من رسائل البريد الإلكتروني السياسية ذات الميول اليسارية كرسائل غير مرغوب فيها ، مقارنة بـ 75.4٪ لرسائل البريد الإلكتروني اليمينية ، ويضع موقع Yahoo على 14.2٪ أكثر من رسائل البريد الإلكتروني اليسارية كرسائل غير مرغوب فيها من رسائل البريد الإلكتروني اليمينية.

التوزيع التراكمي للنسبة المئوية لرسائل البريد الإلكتروني الخاصة بالديمقراطيين (الأزرق) والجمهوري (الأحمر) التي تم تمييزها كرسائل غير مرغوب فيها في حسابات البريد الإلكتروني لكل خدمة.
علاوة على ذلك ، تشير النتائج إلى أنه على مدار فترة الدراسة ، يستجيب Gmail بشكل عام إلى حجم متزايد من رسائل البريد الإلكتروني عبر جميع الانتماءات السياسية من خلال تمييزها بشكل متزايد كرسائل غير مرغوب فيها ، بغض النظر عن مصدرها. أبلغت Yahoo باستمرار عن رسائل البريد الإلكتروني ذات الميول اليسارية كرسائل غير مرغوب فيها مع تقدم الحملات ، وفي نفس الوقت قللت من عدد رسائل البريد الإلكتروني اليمينية التي تم وضع علامة عليها كرسائل غير مرغوب فيها. يبدو أن النظرة العامة هي الأقل تأثراً بزيادة حجم الرسائل الإلكترونية من أي من الحزبين السياسيين ، مما يحافظ على التحيز العام لليمين.

النسبة المئوية لرسائل البريد الإلكتروني التي تم وضع علامة عليها كرسائل غير مرغوب فيها عبر كل من الأحزاب السياسية وموفري البريد الإلكتروني الثلاثة على مدار 153 يومًا من فترة الدراسة.
الاستجابة لتفاعل المستخدم
عندما نضع علامة على رسالة بريد إلكتروني غير مرغوب فيها على أنها "ليست بريدًا عشوائيًا" ، فإن الهدف هو تدريب نظام البريد الإلكتروني على عدم وضع علامة على رسائل بريد إلكتروني مماثلة في المستقبل ، على الرغم من أن النوع الأساسي للقاعدة (مستند إلى البريد الإلكتروني ، أو مستند إلى المحتوى ، وما إلى ذلك) لا يكون دائمًا بالكامل واضح.
وجدت نتائج الدراسة أنه من بين مزودي خدمة البريد الإلكتروني الثلاثة الذين تم فحصهم ، استجاب Gmail فقط بشكل ملحوظ لإدخال "ليس بريدًا عشوائيًا" من المستخدم. على النقيض من ذلك ، فإن هذا البريد العشوائي إلى البريد الوارد (S → أنا) كان للتفاعل تأثير محدود للغاية طويل المدى في Outlook و Yahoo.
لاحظ الباحثون:
[بسبب] تفاعل S → I ، انخفض التحيز السياسي في Gmail بشكل كبير. ومع ذلك ، بشكل غير متوقع ، زادت في كل من Outlook و Yahoo لأن أيا من الخدمتين لم تتفاعل بشكل ملحوظ مع رغبة المستخدم في عدم وضع علامة على رسائل البريد الإلكتروني كرسائل غير مرغوب فيها كانت هاتان الخدمتان تضعان علامة عليها كرسائل غير مرغوب فيها.
الخاتمة
استنتج المؤلفون أن Gmail يستجيب "بشكل كبير" لتفاعل المستخدم مقارنةً بـ Outlook و Yahoo ، على الرغم من ميوله اليسارية.
يذكر المؤلفون:
"بينما ظل التحيز السياسي في Gmail دون تغيير بعد تفاعل القراءة ، فقد انخفض بشكل كبير بسبب تفاعلات I → S و S → I."
وتواصل:
"بينما تغيرت التحيزات السياسية استجابة للتفاعلات المختلفة ، حافظ Gmail على ميله الأيسر بينما حافظ Outlook و Yahoo على ميلهما الصحيح في جميع السيناريوهات."
يقر الباحثون بتوقع عام للمستخدم النهائي بأن عوامل تصفية البريد العشوائي يمكنها وستقوم بتعديل سلوكهم بناءً على تدخل المستخدم (مثل نقل بريد إلكتروني من مجلد البريد العشوائي إلى البريد الوارد ، أو وضع علامة على البريد على أنه "ليس بريدًا عشوائيًا") ، ولكن هذا هذه الآلية ليست موثوقة ، وبالتأكيد ليست متسقة عبر مزودي البريد الإلكتروني الثلاثة الذين تمت دراستهم.
الملاحظات الورقية:
"لم نجد أي إجراءات متسقة يمكن للمرء أن يوصي بها للمستخدمين لمساعدتهم على تقليل التحيز في الطريقة التي يتعامل بها SFA مع رسائل البريد الإلكتروني السياسية التي يتم إرسالها إليهم."
نُشر لأول مرة في 4 أبريل 2022.