ปัญญาประดิษฐ์

การตรวจจับคำพูดแสดงความเกลียดชังของ AI เพื่อต่อต้านการเหมารวมและการบิดเบือนข้อมูล

การตีพิมพ์

9 เดือนที่ผ่านมา

สิงหาคม 13, 2023

บล็อกเด่น Image-AI การตรวจจับคำพูดแสดงความเกลียดชังเพื่อต่อต้านการเหมารวมและการบิดเบือนข้อมูล

ทุกวันนี้ อินเทอร์เน็ตเป็นส่วนสำคัญของการสื่อสารและการเชื่อมต่อทั่วโลก อย่างไรก็ตาม ด้วยการเชื่อมต่อออนไลน์ที่ไม่เคยมีมาก่อนนี้ เรายังได้เห็นด้านมืดของพฤติกรรมมนุษย์ เช่น คำพูดแสดงความเกลียดชัง การเหมารวม และเนื้อหาที่เป็นอันตราย ปัญหาเหล่านี้แทรกซึมอยู่ในสื่อสังคมออนไลน์ ฟอรัมออนไลน์ และพื้นที่เสมือนจริงอื่นๆ ก่อให้เกิดความเสียหายต่อบุคคลและสังคมอย่างถาวร ดังนั้นความจำเป็นในการตรวจจับคำพูดแสดงความเกลียดชัง

จากการวิเคราะห์เพื่อบรรลุเป้าหมายของ ศูนย์ Pew Research41% ของผู้ใหญ่ชาวอเมริกันกล่าวว่าพวกเขาเคยเผชิญกับการละเมิดทางอินเทอร์เน็ตเป็นการส่วนตัว และ 25% ตกเป็นเหยื่อของการคุกคามที่รุนแรง

เพื่อส่งเสริมสภาพแวดล้อมออนไลน์ในเชิงบวกและให้เกียรติกันมากขึ้น การยอมรับมาตรการเชิงรุกและการใช้ประโยชน์จากพลังของเทคโนโลยีเป็นสิ่งจำเป็น ในเรื่องนี้ ปัญญาประดิษฐ์ (AI) นำเสนอโซลูชั่นที่เป็นนวัตกรรมในการตรวจจับและจัดการกับคำพูดแสดงความเกลียดชังและแบบเหมารวม

ข้อจำกัดของเทคนิคการบรรเทาผลกระทบในปัจจุบัน & ความจำเป็นสำหรับมาตรการเชิงรุก

มาตรการปัจจุบันเพื่อบรรเทาคำพูดแสดงความเกลียดชังมีจำกัด พวกเขาไม่สามารถยับยั้งการแพร่กระจายของเนื้อหาที่เป็นอันตรายทางออนไลน์ได้อย่างมีประสิทธิภาพ ข้อจำกัดเหล่านี้รวมถึง:

แนวทางเชิงโต้ตอบ ซึ่งส่วนใหญ่อาศัยการกลั่นกรองของมนุษย์และอัลกอริธึมแบบคงที่ พยายามดิ้นรนเพื่อให้ทันกับการแพร่กระจายอย่างรวดเร็วของคำพูดแสดงความเกลียดชัง
เนื้อหาออนไลน์จำนวนมากท่วมท้นผู้ดูแลที่เป็นมนุษย์ ส่งผลให้การตอบสนองล่าช้าและพลาดสำนวนที่เป็นอันตราย
นอกจากนี้ ความเข้าใจในบริบทและความแตกต่างของภาษาที่พัฒนาขึ้นยังสร้างความท้าทายให้กับระบบอัตโนมัติในการระบุและตีความกรณีคำพูดแสดงความเกลียดชังได้อย่างถูกต้อง

เพื่อแก้ไขข้อจำกัดเหล่านี้และส่งเสริมสภาพแวดล้อมออนไลน์ที่ปลอดภัยยิ่งขึ้น การเปลี่ยนมาใช้มาตรการเชิงรุกจึงมีความจำเป็น ด้วยการใช้มาตรการที่ขับเคลื่อนโดย AI เราสามารถเสริมสร้างชุมชนดิจิทัลของเรา ส่งเสริมการมีส่วนร่วมและโลกออนไลน์ที่เหนียวแน่น

การระบุและตั้งค่าสถานะคำพูดแสดงความเกลียดชังโดยใช้ AI

ในการต่อสู้กับคำพูดแสดงความเกลียดชัง AI กลายเป็นพันธมิตรที่น่าเกรงขาม ด้วยอัลกอริธึมการเรียนรู้ของเครื่อง (ML) เพื่อระบุและทำเครื่องหมายเนื้อหาที่เป็นอันตรายอย่างรวดเร็วและแม่นยำ ด้วยการวิเคราะห์ข้อมูลจำนวนมหาศาล โมเดล AI สามารถเรียนรู้ที่จะจดจำรูปแบบและความแตกต่างทางภาษาที่เกี่ยวข้องกับคำพูดแสดงความเกลียดชัง ทำให้สามารถจัดหมวดหมู่และตอบสนองต่อเนื้อหาที่ไม่เหมาะสมได้อย่างมีประสิทธิภาพ

ไปยัง ฝึกโมเดล AI เพื่อความถูกต้อง ความเกลียดชัง ใช้เทคนิคการเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแล การเรียนรู้แบบมีผู้สอนเกี่ยวข้องกับการยกตัวอย่างคำพูดแสดงความเกลียดชังและเนื้อหาที่ไม่เป็นอันตรายที่มีป้ายกำกับ เพื่อสอนโมเดลให้แยกความแตกต่างระหว่างสองหมวดหมู่ ในทางตรงกันข้าม วิธีการเรียนรู้แบบไม่มีผู้ดูแลและกึ่งกำกับดูแลใช้ประโยชน์จากข้อมูลที่ไม่มีป้ายกำกับเพื่อพัฒนาความเข้าใจของแบบจำลองเกี่ยวกับคำพูดแสดงความเกลียดชัง

ใช้ประโยชน์จากเทคนิคการตอบโต้คำพูดของ AI เพื่อต่อสู้กับคำพูดแสดงความเกลียดชัง

คำพูดตอบโต้กลายเป็นกลยุทธ์ที่ทรงพลังในการต่อสู้ ความเกลียดชัง โดยการท้าทายโดยตรงและจัดการกับเรื่องเล่าที่เป็นอันตราย มันเกี่ยวข้องกับการสร้างเนื้อหาที่โน้มน้าวใจและให้ข้อมูลเพื่อส่งเสริมความเห็นอกเห็นใจ ความเข้าใจ และความอดทน ช่วยให้บุคคลและชุมชนมีส่วนร่วมในการสร้างสภาพแวดล้อมดิจิทัลในเชิงบวก

แม้ว่ารายละเอียดเฉพาะของรูปแบบการโต้กลับแต่ละแบบอาจแตกต่างกันไปตามเทคโนโลยี AI และแนวทางการพัฒนา แต่คุณสมบัติและเทคนิคทั่วไปบางอย่าง ได้แก่:

การสร้างภาษาธรรมชาติ (NLG): แบบจำลองคำพูดโต้ตอบใช้ NLG เพื่อสร้างการตอบสนองที่เหมือนมนุษย์ในรูปแบบการเขียนหรือการพูด การตอบสนองมีความสอดคล้องกันและเกี่ยวข้องกับบริบทเฉพาะของคำพูดแสดงความเกลียดชังที่กำลังตอบโต้
การวิเคราะห์ความรู้สึก: แบบจำลองคำพูดโต้กลับของ AI ใช้การวิเคราะห์ความรู้สึกเพื่อประเมินน้ำเสียงทางอารมณ์ของคำพูดแสดงความเกลียดชังและปรับแต่งการตอบสนองให้เหมาะสม สิ่งนี้ทำให้มั่นใจได้ว่าคำพูดโต้กลับนั้นมีทั้งผลกระทบและความเห็นอกเห็นใจ
ความเข้าใจตามบริบท: ด้วยการวิเคราะห์บริบทรอบๆ คำพูดแสดงความเกลียดชัง แบบจำลองคำพูดโต้กลับสามารถสร้างการตอบสนองที่กล่าวถึงประเด็นเฉพาะหรือความเข้าใจผิด ซึ่งช่วยให้การโต้เถียงมีประสิทธิภาพและมุ่งเน้นมากขึ้น
ความหลากหลายของข้อมูล: เพื่อหลีกเลี่ยงอคติและรับประกันความเป็นธรรม แบบจำลองคำพูดโต้กลับได้รับการฝึกอบรมในชุดข้อมูลที่หลากหลายซึ่งแสดงถึงมุมมองและความแตกต่างทางวัฒนธรรมที่หลากหลาย สิ่งนี้ช่วยในการสร้างการตอบสนองที่ครอบคลุมและละเอียดอ่อนทางวัฒนธรรม
เรียนรู้จากคำติชมของผู้ใช้: รูปแบบการโต้ตอบสามารถปรับปรุงได้อย่างต่อเนื่องโดยการเรียนรู้จากความคิดเห็นของผู้ใช้ ลูปความคิดเห็นนี้ช่วยให้โมเดลสามารถปรับแต่งการตอบสนองตามการโต้ตอบในโลกแห่งความเป็นจริง เพิ่มประสิทธิภาพเมื่อเวลาผ่านไป

ตัวอย่างของการต่อสู้กับคำพูดแสดงความเกลียดชังโดยใช้ AI

ตัวอย่างจริงของเทคนิคการตอบโต้ด้วย AI คือ “วิธีการเปลี่ยนเส้นทาง" พัฒนาโดย จิ๊กซอว์ของ Google และ มูนช็อต CVE. วิธีการเปลี่ยนเส้นทางใช้การโฆษณาที่กำหนดเป้าหมายเพื่อเข้าถึงบุคคลที่อ่อนแอต่ออุดมการณ์สุดโต่งและคำพูดแสดงความเกลียดชัง แนวทางที่ขับเคลื่อนโดย AI นี้มีจุดมุ่งหมายเพื่อห้ามปรามบุคคลไม่ให้มีส่วนร่วมกับเนื้อหาที่เป็นอันตราย และส่งเสริมความเห็นอกเห็นใจ ความเข้าใจ และเปลี่ยนจากความเชื่อสุดโต่ง

นักวิจัยยังได้พัฒนาโมเดล AI ใหม่ที่เรียกว่า BiCapsเกลียด ที่ทำหน้าที่เป็นเครื่องมือที่มีศักยภาพในการต่อต้านคำพูดแสดงความเกลียดชังทางออนไลน์ ดังที่รายงานใน ธุรกรรม IEEE บนระบบสังคมคอมพิวเตอร์. รองรับการวิเคราะห์ภาษาแบบสองทิศทาง เพิ่มความเข้าใจในบริบทเพื่อการพิจารณาเนื้อหาที่แสดงความเกลียดชังอย่างแม่นยำ ความก้าวหน้านี้พยายามที่จะลดผลกระทบที่เป็นอันตรายของคำพูดแสดงความเกลียดชังบนสื่อสังคมออนไลน์ นำเสนอศักยภาพในการโต้ตอบทางออนไลน์ที่ปลอดภัยยิ่งขึ้น

ในทำนองเดียวกันนักวิจัยที่ มหาวิทยาลัยมิชิแกน ได้ใช้ประโยชน์จาก AI เพื่อต่อสู้กับคำพูดแสดงความเกลียดชังออนไลน์โดยใช้วิธีการที่เรียกว่า กฎโดยตัวอย่าง (RBE). วิธีการนี้ใช้การเรียนรู้เชิงลึกเพื่อเรียนรู้กฎของการจำแนกคำพูดแสดงความเกลียดชังจากตัวอย่างเนื้อหาที่แสดงความเกลียดชัง กฎเหล่านี้ใช้กับข้อความที่ป้อนเพื่อระบุและคาดการณ์คำพูดแสดงความเกลียดชังทางออนไลน์ได้อย่างถูกต้อง

ข้อพิจารณาด้านจริยธรรมสำหรับรูปแบบการตรวจจับคำพูดแสดงความเกลียดชัง

เพื่อเพิ่มประสิทธิภาพสูงสุดของแบบจำลองคำพูดตอบโต้ที่ขับเคลื่อนด้วย AI ข้อพิจารณาด้านจริยธรรม เป็นสิ่งสำคัญยิ่ง อย่างไรก็ตาม สิ่งสำคัญคือต้องสร้างสมดุลระหว่างเสรีภาพในการพูดและการห้ามเผยแพร่เนื้อหาที่เป็นอันตรายเพื่อหลีกเลี่ยงการเซ็นเซอร์

ความโปร่งใสในการพัฒนาและปรับใช้โมเดลคำพูดโต้กลับของ AI เป็นสิ่งสำคัญในการเสริมสร้างความไว้วางใจและความรับผิดชอบระหว่างผู้ใช้และผู้มีส่วนได้ส่วนเสีย นอกจากนี้ การรับรองความยุติธรรมก็มีความสำคัญไม่แพ้กัน อคติในแบบจำลอง AI สามารถยืดเยื้อการเลือกปฏิบัติและการกีดกัน

ตัวอย่างเช่น AI ที่ออกแบบมาเพื่อระบุคำพูดแสดงความเกลียดชังสามารถขยายขอบเขตโดยไม่ได้ตั้งใจ อคติทางเชื้อชาติ. การวิจัยพบว่าโมเดล AI ที่ใช้คำพูดแสดงความเกลียดชังชั้นนำมีแนวโน้มที่จะตั้งค่าสถานะทวีตโดยชาวแอฟริกันอเมริกันเป็น 1.5 เท่า พวกเขามีแนวโน้มที่จะตั้งค่าสถานะทวีตเป็นคำพูดแสดงความเกลียดชังที่เขียนขึ้น 2.2 เท่า แอฟริกัน อเมริกัน อิงลิช. หลักฐานที่คล้ายกันนี้เกิดขึ้นจากการศึกษาโพสต์ Twitter ที่เกี่ยวข้องกับคำพูดแสดงความเกลียดชัง 155,800 รายการ โดยเน้นถึงความท้าทายในการจัดการกับอคติทางเชื้อชาติในการกลั่นกรองเนื้อหาของ AI

ในอีก ศึกษานักวิจัยได้ทดสอบระบบ AI สี่ระบบสำหรับการตรวจจับคำพูดแสดงความเกลียดชัง และพบว่าระบบทั้งหมดมีปัญหาในการระบุประโยคที่เป็นพิษอย่างแม่นยำ เพื่อวินิจฉัยปัญหาที่แน่ชัดในโมเดลการตรวจจับคำพูดแสดงความเกลียดชัง พวกเขาได้สร้างอนุกรมวิธานของคำพูดแสดงความเกลียดชัง 18 ประเภท ซึ่งรวมถึงคำสบประมาทและภาษาที่คุกคาม พวกเขายังเน้น 11 สถานการณ์ที่ทำให้ AI สะดุด เช่น การใช้คำหยาบคายในข้อความที่ไม่แสดงความเกลียดชัง เป็นผลให้เกิดการศึกษา เกลียดการตรวจสอบซึ่งเป็นชุดข้อมูลแบบโอเพ่นซอร์สที่มีตัวอย่างเกือบ 4,000 ตัวอย่าง โดยมีเป้าหมายเพื่อเพิ่มความเข้าใจเกี่ยวกับความแตกต่างของคำพูดแสดงความเกลียดชังสำหรับโมเดล AI

การรับรู้และการรู้หนังสือดิจิทัล

การต่อสู้กับคำพูดแสดงความเกลียดชังและการเหมารวมต้องใช้แนวทางเชิงรุกและหลายมิติ ดังนั้น การสร้างความตระหนักรู้และการส่งเสริมความรู้ทางดิจิทัลจึงมีความสำคัญอย่างยิ่งในการต่อสู้กับคำพูดแสดงความเกลียดชังและการเหมารวม

การให้ความรู้แก่บุคคลเกี่ยวกับผลกระทบของเนื้อหาที่เป็นอันตรายช่วยส่งเสริมวัฒนธรรมแห่งความเห็นอกเห็นใจและพฤติกรรมออนไลน์ที่มีความรับผิดชอบ กลยุทธ์ที่ส่งเสริมการคิดเชิงวิพากษ์ช่วยให้ผู้ใช้แยกแยะระหว่างวาทกรรมที่ถูกต้องตามกฎหมายกับคำพูดแสดงความเกลียดชัง ช่วยลดการแพร่กระจายของเรื่องเล่าที่เป็นอันตราย นอกจากนี้ การให้ผู้ใช้มีทักษะในการระบุและตอบสนองต่อคำพูดแสดงความเกลียดชังได้อย่างมีประสิทธิภาพก็มีความสำคัญเช่นกัน จะช่วยให้พวกเขาท้าทายและต่อต้านวาทศิลป์ที่เป็นอันตราย เอื้อต่อสภาพแวดล้อมดิจิทัลที่ปลอดภัยและให้เกียรติกันมากขึ้น

เมื่อเทคโนโลยี AI พัฒนาขึ้น ศักยภาพในการจัดการกับคำพูดแสดงความเกลียดชังและการเหมารวมด้วยความแม่นยำและผลกระทบที่เพิ่มขึ้นอย่างทวีคูณ ดังนั้น สิ่งสำคัญคือต้องทำให้คำพูดโต้กลับที่ขับเคลื่อนด้วย AI เป็นเครื่องมือที่มีศักยภาพในการส่งเสริมการเอาใจใส่และการมีส่วนร่วมในเชิงบวกทางออนไลน์

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับแนวโน้มและเทคโนโลยี AI โปรดไปที่ unite.ai.