มุมมองของ Anderson

AI บอกเราถึงวาระซ่อนเร้นในข่าวได้อย่างไร

Published July 16, 2025

Updated May 18, 2026

Martin Anderson

โมเดล ChatGPT-style ได้รับการฝึกฝนเพื่อตรวจจับสิ่งที่บทความข่าว แท้จริง คิดเกี่ยวกับปัญหา – แม้ว่าความก้าวหน้านั้นจะถูกฝังอยู่ภายใต้คำพูด การสร้างเฟรม หรือ (บางครั้งไม่ซื่อสัตย์) ‘ความเป็นกลาง’

ความสามารถในการเข้าใจมุมมองแท้จริงของนักเขียนหรือผู้พูด – ซึ่งเป็นเรื่องที่รู้จักกันในเอกสารวิชาการว่าเป็น การตรวจจับกระแส – จัดการกับปัญหาการตีความที่ยากที่สุดในภาษา: การทำความเข้าใจเจตนาจากเนื้อหาที่อาจถูกออกแบบมาเพื่อซ่อนหรือบดบังเจตนา

ตั้งแต่ คำเสนอที่สุภาพ ของ Jonathan Swift ถึงการแสดงล่าสุดของนักการเมืองที่ ยืมการโพลา ของฝ่ายตรงข้ามอุดมการณ์ของตน พื้นผิวของคำสั่งไม่ใช่ตัวบ่งชี้ที่เชื่อถือได้ของเจตนา; การเพิ่มขึ้นของความขำขัน การติดตาม และการให้ข้อมูลที่ไม่ชัดเจน ทำให้ยากกว่าที่จะระบุว่าข้อความใดอยู่ในด้านใดหรือไม่

มักจะเกิดว่าสิ่งที่ไม่ได้กล่าวถึงมีน้ำหนักเท่ากับสิ่งที่กล่าวถึง และการเลือกที่จะครอบคลุมหัวข้อใดหัวข้อหนึ่งสามารถส่งสัญญาณถึงตำแหน่งของผู้เขียน

สิ่งนี้ทำให้การตรวจจับกระแสโดยอัตโนมัติเป็นเรื่องที่ท้าทาย เนื่องจากระบบตรวจจับที่มีประสิทธิภาพต้องทำมากกว่าการระบุประโยคที่แยกออกเป็น ‘สนับสนุน’ หรือ ‘ต่อต้าน’ แต่ต้องวนผ่านชั้นของความหมาย โดยชั่งน้ำหนักสัญญาณเล็กๆ เทียบกับ आकารและทิศทางของบทความทั้งหมด และสิ่งนี้ยากกว่าในหนังสือพิมพ์ประเภทยาว ซึ่งโทนอาจเปลี่ยนแปลงและความคิดเห็นอาจไม่ถูกกล่าวถึงโดยตรง

ตัวแทนการเปลี่ยนแปลง

เพื่อแก้ไขปัญหาบางอย่างเหล่านี้ นักวิจัยในเกาหลีใต้ได้พัฒนาระบบใหม่เรียกว่า JOA-ICL (การเรียนรู้แบบบริบทที่มีแนวทางจากสื่อสารมวลชน ) สำหรับการตรวจจับกระแสของบทความข่าวประเภทยาว

แนวคิดหลักเบื้องหลัง JoA-ICL คือการอนุมานกระแสระดับบทความโดยการรวมการคาดการณ์ระดับเซ็กเมนต์จากตัวแทนแบบจำลองภาษาที่แยกออก Source: https://arxiv.org/pdf/2507.11049

แทนที่จะพิจารณาบทความเป็นชิ้นเดียว JOA-ICL หั่นออกเป็นชิ้นส่วนโครงสร้าง (หัวข้อ เริ่มต้น คำพูด และสรุป) และมอบหมายให้ตัวแทนแบบจำลองภาษาแต่ละชิ้นเพื่อระบุเซ็กเมนต์เหล่านั้น การคาดการณ์ระดับท้องถิ่นเหล่านี้จะถูกส่งไปยังตัวแทนแบบจำลองที่ใหญ่ขึ้น ซึ่งใช้เพื่อกำหนดกระแสของบทความ

วิธีนี้ได้รับการทดสอบในฐานข้อมูลเกาหลีใหม่ที่มีบทความข่าว 2,000 ชิ้นซึ่งได้รับการทำเครื่องหมายสำหรับทั้งกระแสระดับบทความและเซ็กเมนต์

ตามเอกสาร ระบุว่า JOA-ICL มีประสิทธิภาพเหนือกว่าแบบจำลองที่มีฐานและแบบจำลองที่ได้รับการปรับให้เหมาะสม โดยเฉพาะอย่างยิ่งในการตรวจจับกระแสที่สนับสนุน

วิธีการ

ส่วนหนึ่งของความท้าทายของการตรวจจับกระแสที่ได้รับการปรับปรุงจาก AI คือเชิงลอจิสติกส์ และเกี่ยวข้องกับจำนวนสัญญาณที่ระบบการเรียนรู้ของเครื่องสามารถรักษาและรวบรวมได้ในเวลาเดียวกัน

บทความข่าวมักจะหลีกเลี่ยงการแสดงความคิดเห็นโดยตรง โดยอาศัย ความชัดเจน หรือ สมมติ แทน ซึ่งบ่งบอกผ่านการเลือกแหล่งข้อมูลที่จะอ้างถึง วิธีการสร้างเรื่องราว และรายละเอียดที่ถูกปล่อยออกไป

แม้ว่าบทความจะแสดงความคิดเห็นอย่างชัดเจน สัญญาณมักจะกระจายไปทั่วข้อความ โดยมีเซ็กเมนต์ต่างๆ ที่ชี้ไปในทิศทางต่างๆ

JoA-ICL

แทนที่จะพิจารณาบทความเป็นชิ้นเดียว ระบบที่เสนอโดยผู้เขียนแบ่งออกเป็นชิ้นส่วนโครงสร้างหลักๆ (หัวข้อ เริ่มต้น คำพูด และสรุป) และมอบหมายให้ตัวแทนแบบจำลองภาษาแต่ละชิ้นเพื่อระบุเซ็กเมนต์เหล่านั้น

การคาดการณ์ระดับท้องถิ่นเหล่านี้จะถูกส่งไปยังตัวแทนแบบจำลองที่ใหญ่ขึ้น ซึ่งใช้เพื่อกำหนดกระแสของบทความ

ข้อมูลและการทดสอบ

ในการทดสอบ ผู้วิจัยใช้ มาโคร F1 และความถูกต้องในการประเมินประสิทธิภาพ โดยเฉลี่ยผลลัพธ์จากการทดสอบสิบครั้งโดยใช้เมล็ดสุ่มจาก 42 ถึง 51 และรายงานข้อผิดพลาดมาตรฐาน

JOA-ICL มีประสิทธิภาพเหนือกว่าแบบจำลองที่มีฐานและแบบจำลองที่ได้รับการปรับให้เหมาะสม โดยเฉพาะอย่างยิ่งในการตรวจจับกระแสที่สนับสนุน

สรุป

ไม่มีงานใดในด้านการเรียนรู้ของเครื่องจักรที่มีการเมืองมากกว่าการคาดการณ์กระแส แต่การคาดการณ์กระแสมักจะถูกจัดการในลักษณะที่เย็นชาและกลไก ในขณะที่ให้ความสนใจกับปัญหาที่ซับซ้อนน้อยกว่าใน AI ที่สร้างสรรค์ เช่น การสร้างวิดีโอและรูปภาพ ซึ่งทำให้เกิดความสนใจมากกว่า

สิ่งที่น่าสนใจที่สุดในการทำงานใหม่ของเกาหลีคือการมีส่วนร่วมในการวิเคราะห์ เนื้อหาที่มีความยาวเต็ม แทนที่จะเป็นข้อความสั้นๆ ในโซเชียลมีเดีย ซึ่งมีผลกระทบเชิงลบมากกว่า

สิ่งที่ขาดไปในงานใหม่และในองค์ประกอบการคาดการณ์กระแสโดยทั่วไปคือการไม่พิจารณา ไฮเปอร์ลิงก์ ซึ่งมักจะแทนที่คำพูดเป็นทรัพยากรที่ไม่จำเป็นสำหรับผู้อ่าน แต่การมีไฮเปอร์ลิงก์สามารถมีความเป็นกลางและเป็นทางการได้

สิ่งนี้ทำให้ไฮเปอร์ลิงก์ยากต่อการวัดมากกว่าคำพูดที่ชัดเจน หัวข้อ หรือส่วนอื่นๆ ของบทความที่อาจพยายามมีอิทธิพลต่อความคิดเห็นของผู้อ่าน

ที่น่าสนใจคือ การตีพิมพ์ครั้งแรกเมื่อวันพุธที่ 16 กรกฎาคม 2025