ปัญญาประดิษฐ์

ตรวจจับคำพูดที่แสดงความเกลียดชังด้วย AI เพื่อต่อต้านการเหมารวมและข้อมูลที่ไม่ถูกต้อง

mm
Featured Blog Image-AI Hate Speech Detection to Combat Stereotyping & Disinformation

ในปัจจุบัน อินเทอร์เน็ตเป็นเส้นเลือดหลักของการสื่อสารและเชื่อมต่อทั่วโลก อย่างไรก็ตาม การเชื่อมต่อออนไลน์ที่ไม่เคยเกิดขึ้นมาก่อนนี้ก็ทำให้เราเห็นด้านมืดของพฤติกรรมมนุษย์ เช่น คำพูดที่แสดงความเกลียดชัง การเหมารวม และเนื้อหาที่เป็นอันตราย ปัญหาที่กล่าวมาเหล่านี้ได้แพร่กระจายไปทั่วโซเชียลมีเดีย ฟอรัมออนไลน์ และพื้นที่เสมือนอื่นๆ ทำให้เกิดความเสียหายที่ยาวนานต่อบุคคลและสังคม ดังนั้น จึงจำเป็นต้องมีการตรวจจับคำพูดที่แสดงความเกลียดชัง

ตามรายงานของ ศูนย์วิจัยพิว 41% ของผู้ใหญ่ชาวอเมริกันระบุว่าพวกเขาเคยพบกับการละเมิดทางอินเทอร์เน็ต และ 25% เป็นเหยื่อของการข่มขู่รุนแรง

เพื่อสร้างสภาพแวดล้อมออนไลน์ที่มีความเคารพและเป็นบวกมากขึ้น การใช้มาตรการเชิงรุกและใช้พลังของเทคโนโลยีก็จำเป็นเช่นกัน ในด้านนี้ เทคโนโลยี AI มีแนวทางแก้ไขที่สร้างสรรค์ในการตรวจจับและต่อต้านคำพูดที่แสดงความเกลียดชังและเหมารวม

ข้อจำกัดของเทคนิคการบรรเทาที่ใช้อยู่ในปัจจุบัน และความจำเป็นของมาตรการเชิงรุก

มาตรการปัจจุบันในการบรรเทาคำพูดที่แสดงความเกลียดชังมีข้อจำกัด ไม่สามารถหยุดยั้งการแพร่กระจายของเนื้อหาที่เป็นอันตรายได้อย่างมีประสิทธิภาพ ข้อจำกัดเหล่านี้รวมถึง

  • แนวทางเชิงรับซึ่งพึ่งพาการดูแลของมนุษย์และอัลกอริทึมแบบคงที่ ต่อสู้เพื่อตามทันการแพร่กระจายของคำพูดที่แสดงความเกลียดชังที่รวดเร็ว
  • ปริมาณเนื้อหาออนไลน์ที่มากเกินไปทำให้ผู้ดูแลของมนุษย์เหนื่อยหน่าย ส่งผลให้มีการตอบสนองช้าและพลาดการตรวจจับคำพูดที่แสดงความเกลียดชัง
  • นอกจากนี้ การทำความเข้าใจในบริบทและความแตกต่างของภาษาเป็นเรื่องที่ท้าทายสำหรับระบบอัตโนมัติในการระบุและตีความคำพูดที่แสดงความเกลียดชังได้อย่างแม่นยำ

เพื่อแก้ไขข้อจำกัดเหล่านี้และสร้างสภาพแวดล้อมออนไลน์ที่ปลอดภัยยิ่งขึ้น การเปลี่ยนไปใช้มาตรการเชิงรุกจึงจำเป็น โดยการนำเทคโนโลยี AI มาใช้ เราสามารถเสริมสร้างชุมชนดิจิทัลของเราได้ โดยส่งเสริมการรวมเป็นหนึ่งเดียวและสร้างโลกออนไลน์ที่มีความสามัคคี

การระบุและติดป้ายคำพูดที่แสดงความเกลียดชังโดยใช้ AI

ในสงครามต่อต้านคำพูดที่แสดงความเกลียดชัง AI เป็นพันธมิตรที่ทรงพลัง โดยใช้อัลกอริทึมการเรียนรู้ของเครื่อง (ML) เพื่อระบุและติดป้ายเนื้อหาที่เป็นอันตรายอย่างรวดเร็วและแม่นยำ โดยการวิเคราะห์ข้อมูลจำนวนมาก AI สามารถเรียนรู้เพื่อระบุรูปแบบและความแตกต่างของภาษาที่เกี่ยวข้องกับคำพูดที่แสดงความเกลียดชัง ทำให้สามารถจัดประเภทและตอบสนองต่อเนื้อหาที่เป็นอันตรายได้อย่างมีประสิทธิภาพ

เพื่อ ฝึกอบรมโมเดล AI สำหรับการตรวจจับคำพูดที่แสดงความเกลียดชังที่แม่นยำ เทคนิคการเรียนรู้แบบมีคำแนะนำและไม่มีคำแนะนำถูกใช้ การเรียนรู้แบบมีคำแนะนำเกี่ยวข้องกับการให้ตัวอย่างที่มีคำแนะนำของคำพูดที่แสดงความเกลียดชังและเนื้อหาที่ไม่เป็นอันตรายเพื่อสอนโมเดลให้แยกแยะระหว่างสองประเภท ในทางกลับกัน การเรียนรู้แบบไม่มีคำแนะนำและแบบกึ่งมีคำแนะนำใช้ข้อมูลที่ไม่มีคำแนะนำเพื่อพัฒนาความเข้าใจของโมเดลเกี่ยวกับคำพูดที่แสดงความเกลียดชัง

การใช้เทคนิคการโต้กลับด้วย AI เพื่อต่อต้านคำพูดที่แสดงความเกลียดชัง

การโต้กลับด้วย AI เป็นกลยุทธ์ที่ทรงพลังในการต่อต้านคำพูดที่แสดงความเกลียดชังโดยการท้าทายและตอบโต้เรื่องราวที่เป็นอันตรายโดยตรง มันเกี่ยวข้องกับการสร้างเนื้อหาที่มีข้อมูลและเชิญชวนเพื่อส่งเสริมความเห็นอกเห็นใจ ความเข้าใจ และความอดทน มันทำให้บุคคลและชุมชนสามารถมีส่วนร่วมอย่างแข็งขันในการสร้างสภาพแวดล้อมดิจิทัลที่เป็นบวก

แม้ว่ารายละเอียดเฉพาะของโมเดลการโต้กลับด้วย AI อาจแตกต่างกันไปขึ้นอยู่กับเทคโนโลยี AI และแนวทางพัฒนา แต่ก็มีคุณลักษณะและเทคนิคทั่วไปที่ใช้ เช่น

  • การสร้างภาษาแบบธรรมชาติ (NLG): โมเดลการโต้กลับด้วย AI ใช้ NLG เพื่อสร้างคำตอบที่เหมือนมนุษย์ในรูปแบบเขียนหรือพูด คำตอบเหล่านี้มีความสอดคล้องกันและเหมาะสมกับบริบทของคำพูดที่แสดงความเกลียดชังที่กำลังตอบโต้
  • การวิเคราะห์ความรู้สึก: โมเดลการโต้กลับด้วย AI ใช้การวิเคราะห์ความรู้สึกเพื่อประเมินสภาพทางอารมณ์ของคำพูดที่แสดงความเกลียดชังและปรับคำตอบให้เหมาะสมตามนั้น ทำให้การโต้กลับมีประสิทธิภาพและเห็นอกเห็นใจ
  • การทำความเข้าใจบริบท: โดยการวิเคราะห์บริบทที่เกี่ยวข้องกับคำพูดที่แสดงความเกลียดชัง โมเดลการโต้กลับสามารถสร้างคำตอบที่ตอบสนองต่อประเด็นหรือความเข้าใจผิดเฉพาะเจาะจง ทำให้การโต้กลับมีประสิทธิภาพและเน้นเป้าหมายมากขึ้น
  • ความหลากหลายของข้อมูล: เพื่อหลีกเลี่ยงอคติและรับประกันความยุติธรรม โมเดลการโต้กลับด้วย AI ถูกฝึกอบรมด้วยชุดข้อมูลที่หลากหลายซึ่งแสดงถึงมุมมองและความแตกต่างทางวัฒนธรรมต่างๆ ทำให้สามารถสร้างคำตอบที่ครอบคลุมและไวต่อวัฒนธรรม
  • การเรียนรู้จากข้อเสนอแนะของผู้ใช้: โมเดลการโต้กลับด้วย AI สามารถปรับปรุงอย่างต่อเนื่องโดยการเรียนรู้จากข้อเสนอแนะของผู้ใช้ โมเดลการโต้กลับสามารถปรับคำตอบให้เหมาะสมยิ่งขึ้นตามปฏิสัมพันธ์จริงในโลกแห่งความเป็นจริง ทำให้มีประสิทธิภาพมากขึ้นเมื่อเวลาผ่านไป

ตัวอย่างการต่อต้านคำพูดที่แสดงความเกลียดชังด้วย AI

ตัวอย่างหนึ่งของเทคนิคการโต้กลับด้วย AI คือ “วิธีการเปลี่ยนเส้นทาง” ที่พัฒนาโดย Moonshot และ Jigsaw ของ Google วิธีการเปลี่ยนเส้นทางใช้การโฆษณาที่มุ่งเป้าเพื่อเข้าถึงบุคคลที่อ่อนไหวต่ออุดมการณ์หัวรุนแรงและคำพูดที่แสดงความเกลียดชัง วิธีการนี้มีจุดมุ่งหมายเพื่อป้องกันไม่ให้บุคคลเหล่านั้นเข้าถึงเนื้อหาที่เป็นอันตรายและส่งเสริมความเห็นอกเห็นใจ ความเข้าใจ และการเปลี่ยนแปลงความคิดเห็นออกห่างจากความเชื่อหัวรุนแรง

นักวิจัยได้พัฒนาโมเดล AI ใหม่ชื่อ BiCapsHate ซึ่งเป็นเครื่องมือที่มีประสิทธิภาพในการต่อต้านคำพูดที่แสดงความเกลียดชังออนไลน์ ตามที่รายงานใน IEEE Transactions on Computational Social Systems โมเดลนี้สนับสนุนการวิเคราะห์ภาษาที่มีทิศทางสองทาง เพิ่มความเข้าใจบริบทสำหรับการกำหนดคำพูดที่แสดงความเกลียดชังที่แม่นยำ โมเดลนี้มีจุดมุ่งหมายเพื่อลดผลกระทบอันตรายของคำพูดที่แสดงความเกลียดชางในโซเชียลมีเดีย โดยมีศักยภาพในการนำไปสู่การโต้ตอบออนไลน์ที่ปลอดภัยยิ่งขึ้น

ในทำนองเดียวกัน นักวิจัยที่ มหาวิทยาลัยมิชิแกน ได้ใช้ AI เพื่อต่อต้านคำพูดที่แสดงความเกลียดชังออนไลน์โดยใช้วิธีการที่เรียกว่า การปกครองโดยตัวอย่าง (RBE) โดยใช้การเรียนรู้ลึก วิธีการนี้เรียนรู้กฎของการจำแนกคำพูดที่แสดงความเกลียดชังจากตัวอย่างของเนื้อหาที่เป็นอันตราย กฎเหล่านี้ถูกนำไปใช้กับข้อความที่เข้ามาเพื่อระบุและคาดการณ์คำพูดที่แสดงความเกลียดชังออนไลน์ได้อย่างแม่นยำ

ข้อพิจารณาทางจริยธรรมสำหรับโมเดลการตรวจจับคำพูดที่แสดงความเกลียดชัง

เพื่อเพิ่มประสิทธิภาพของโมเดลการโต้กลับด้วย AI ที่ใช้ AI ควรพิจารณาเรื่อง ข้อพิจารณาทางจริยธรรม อย่างรอบคอบ อย่างไรก็ตาม การสร้างสมดุลระหว่างเสรีภาพในการพูดและข้อห้ามในการเผยแพร่เนื้อหาที่เป็นอันตรายเพื่อหลีกเลี่ยงการเซ็นเซอร์เป็นสิ่งสำคัญ

ความโปร่งใสในการพัฒนาและใช้โมเดลการโต้กลับด้วย AI เป็นสิ่งจำเป็นในการสร้างความไว้วางใจและความรับผิดชอบในหมู่ผู้ใช้และผู้มีส่วนได้ส่วนเสีย นอกจากนี้ การรับรองความยุติธรรมมีความสำคัญเช่นกัน เนื่องจาก อคติในโมเดล AI สามารถทำให้เกิดการเลือกปฏิบัติและการกีดกัน

ตัวอย่างเช่น AI ที่ออกแบบมาเพื่อระบุคำพูดที่แสดงความเกลียดชังอาจทำให้ อคติทางเชื้อชาติ เพิ่มขึ้น การวิจัยพบว่าโมเดล AI ที่มีชื่อเสียงในการตรวจจับคำพูดที่แสดงความเกลียดชังมีแนวโน้มที่จะระบุคำพูดที่เขียนโดยชาวแอฟริกันอเมริกันเป็นคำพูดที่แสดงความเกลียดชังมากกว่า 1.5 เท่า พวกเขายังมีแนวโน้มที่จะระบุคำพูดที่เขียนใน ภาษาอังกฤษของชาวแอฟริกันอเมริกัน เป็นคำพูดที่แสดงความเกลียดชังมากกว่า 2.2 เท่า หลักฐานที่คล้ายกันปรากฏในหนึ่งการศึกษาที่วิเคราะห์โพสต์ทวิตเตอร์ที่เกี่ยวข้องกับคำพูดที่แสดงความเกลียดชัง 155,800 โพสต์ โดยเน้นถึงความท้าทายในการจัดการกับอคติทางเชื้อชาติในการดูแลเนื้อหาของ AI

ในอีกหนึ่ง การศึกษา นักวิจัยทดสอบระบบ AI สี่ระบบสำหรับการตรวจจับคำพูดที่แสดงความเกลียดชังและพบว่าทั้งสี่ระบบต้องดิ้นรนในการระบุประโยคที่เป็นอันตรายได้อย่างแม่นยำ เพื่อวินิจฉัยปัญหาเฉพาะเจาะจงในโมเดลการตรวจจับคำพูดที่แสดงความเกลียดชัง พวกเขาสร้างระบบการจำแนกประเภทของคำพูดที่แสดงความเกลียดชัง 18 ประเภท รวมถึงคำดูถูกและภาษาที่คุกคาม พวกเขายังเน้นถึงสถานการณ์ 11 สถานการณ์ที่ทำให้ AI ต้องดิ้นรน เช่น การใช้คำหยาบคายในข้อความที่ไม่เป็นอันตราย ในที่สุด การศึกษานี้ได้ผลิตชุดข้อมูลที่เปิดเผยต่อสาธารณะชื่อ HateCheck ซึ่งมีตัวอย่างเกือบ 4,000 ตัวอย่าง โดยมีจุดมุ่งหมายเพื่อปรับปรุงความเข้าใจของโมเดล AI เกี่ยวกับคำพูดที่แสดงความเกลียดชัง

การสร้างความตระหนักและการมีไหวพริบดิจิทัล

การต่อต้านคำพูดที่แสดงความเกลียดชังและเหมารวมต้องการแนวทางเชิงรุกและหลายมิติ ดังนั้น การสร้างความตระหนักและการส่งเสริมการมีไหวพริบดิจิทัลจึงมีความสำคัญในการต่อต้านคำพูดที่แสดงความเกลียดชัง

การให้ความรู้แก่บุคคลเกี่ยวกับผลกระทบของเนื้อหาที่เป็นอันตรายช่วยสร้างวัฒนธรรมแห่งความเห็นอกเห็นใจและพฤติกรรมออนไลน์ที่รับผิดชอบ กลยุทธ์ที่ส่งเสริมการคิดอย่างมีวิจารณญาณทำให้ผู้ใช้สามารถแยกแยะระหว่างการอภิปรายที่ถูกต้องและคำพูดที่แสดงความเกลียดชังได้ ลดการแพร่กระจายของเรื่องราวที่เป็นอันตราย นอกจากนี้ การให้ทักษะแก่ผู้ใช้ในการระบุและตอบสนองต่อคำพูดที่แสดงความเกลียดชังอย่างมีประสิทธิภาพเป็นสิ่งจำเป็น จะทำให้พวกเขามีพลังในการท้าทายและตอบโต้คำพูดที่เป็นอันตราย ส่งผลให้เกิดสภาพแวดล้อมดิจิทัลที่ปลอดภัยและให้ความเคารพมากขึ้น

เมื่อเทคโนโลยี AI พัฒนาไป การต่อต้านคำพูดที่แสดงความเกลียดชังและเหมารวมด้วยความแม่นยำและผลกระทบที่เพิ่มขึ้นก็เพิ่มขึ้นเช่นกัน ดังนั้น จึงมีความสำคัญที่จะทำให้การโต้กลับด้วย AI เป็นเครื่องมือที่มีประสิทธิภาพในการส่งเสริมความเห็นอกเห็นใจและการมีส่วนร่วมเชิงบวกออนไลน์

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเทรนด์ AI และเทคโนโลยี โปรดเยี่ยมชม unite.ai

Haziqa เป็นนักวิทยาศาสตร์ข้อมูลที่มีประสบการณ์อย่างกว้างขวางในการเขียนเนื้อหาทางเทคนิคสำหรับบริษัท AI และ SaaS