มุมมองของ Anderson
AI บอกเราถึงวาระซ่อนเร้นในข่าวได้อย่างไร

โมเดล ChatGPT-style ได้รับการฝึกฝนเพื่อตรวจจับสิ่งที่บทความข่าว แท้จริง คิดเกี่ยวกับปัญหา – แม้ว่าความก้าวหน้านั้นจะถูกฝังอยู่ภายใต้คำพูด การสร้างเฟรม หรือ (บางครั้งไม่ซื่อสัตย์) ‘ความเป็นกลาง’
ความสามารถในการเข้าใจมุมมองแท้จริงของนักเขียนหรือผู้พูด – ซึ่งเป็นเรื่องที่รู้จักกันในเอกสารวิชาการว่าเป็น การตรวจจับกระแส – จัดการกับปัญหาการตีความที่ยากที่สุดในภาษา: การทำความเข้าใจเจตนาจากเนื้อหาที่อาจถูกออกแบบมาเพื่อซ่อนหรือบดบังเจตนา
ตั้งแต่ คำเสนอที่สุภาพ ของ Jonathan Swift ถึงการแสดงล่าสุดของนักการเมืองที่ ยืมการโพลา ของฝ่ายตรงข้ามอุดมการณ์ของตน พื้นผิวของคำสั่งไม่ใช่ตัวบ่งชี้ที่เชื่อถือได้ของเจตนา; การเพิ่มขึ้นของความขำขัน การติดตาม และการให้ข้อมูลที่ไม่ชัดเจน ทำให้ยากกว่าที่จะระบุว่าข้อความใดอยู่ในด้านใดหรือไม่
มักจะเกิดว่าสิ่งที่ไม่ได้กล่าวถึงมีน้ำหนักเท่ากับสิ่งที่กล่าวถึง และการเลือกที่จะครอบคลุมหัวข้อใดหัวข้อหนึ่งสามารถส่งสัญญาณถึงตำแหน่งของผู้เขียน
สิ่งนี้ทำให้การตรวจจับกระแสโดยอัตโนมัติเป็นเรื่องที่ท้าทาย เนื่องจากระบบตรวจจับที่มีประสิทธิภาพต้องทำมากกว่าการระบุประโยคที่แยกออกเป็น ‘สนับสนุน’ หรือ ‘ต่อต้าน’ แต่ต้องวนผ่านชั้นของความหมาย โดยชั่งน้ำหนักสัญญาณเล็กๆ เทียบกับ आकารและทิศทางของบทความทั้งหมด และสิ่งนี้ยากกว่าในหนังสือพิมพ์ประเภทยาว ซึ่งโทนอาจเปลี่ยนแปลงและความคิดเห็นอาจไม่ถูกกล่าวถึงโดยตรง
ตัวแทนการเปลี่ยนแปลง
เพื่อแก้ไขปัญหาบางอย่างเหล่านี้ นักวิจัยในเกาหลีใต้ได้พัฒนาระบบใหม่เรียกว่า JOA-ICL (การเรียนรู้แบบบริบทที่มีแนวทางจากสื่อสารมวลชน ) สำหรับการตรวจจับกระแสของบทความข่าวประเภทยาว

แนวคิดหลักเบื้องหลัง JoA-ICL คือการอนุมานกระแสระดับบทความโดยการรวมการคาดการณ์ระดับเซ็กเมนต์จากตัวแทนแบบจำลองภาษาที่แยกออก Source: https://arxiv.org/pdf/2507.11049
แทนที่จะพิจารณาบทความเป็นชิ้นเดียว JOA-ICL หั่นออกเป็นชิ้นส่วนโครงสร้าง (หัวข้อ เริ่มต้น คำพูด และสรุป) และมอบหมายให้ตัวแทนแบบจำลองภาษาแต่ละชิ้นเพื่อระบุเซ็กเมนต์เหล่านั้น การคาดการณ์ระดับท้องถิ่นเหล่านี้จะถูกส่งไปยังตัวแทนแบบจำลองที่ใหญ่ขึ้น ซึ่งใช้เพื่อกำหนดกระแสของบทความ
วิธีนี้ได้รับการทดสอบในฐานข้อมูลเกาหลีใหม่ที่มีบทความข่าว 2,000 ชิ้นซึ่งได้รับการทำเครื่องหมายสำหรับทั้งกระแสระดับบทความและเซ็กเมนต์
ตามเอกสาร ระบุว่า JOA-ICL มีประสิทธิภาพเหนือกว่าแบบจำลองที่มีฐานและแบบจำลองที่ได้รับการปรับให้เหมาะสม โดยเฉพาะอย่างยิ่งในการตรวจจับกระแสที่สนับสนุน
วิธีการ
ส่วนหนึ่งของความท้าทายของการตรวจจับกระแสที่ได้รับการปรับปรุงจาก AI คือเชิงลอจิสติกส์ และเกี่ยวข้องกับจำนวนสัญญาณที่ระบบการเรียนรู้ของเครื่องสามารถรักษาและรวบรวมได้ในเวลาเดียวกัน
บทความข่าวมักจะหลีกเลี่ยงการแสดงความคิดเห็นโดยตรง โดยอาศัย ความชัดเจน หรือ สมมติ แทน ซึ่งบ่งบอกผ่านการเลือกแหล่งข้อมูลที่จะอ้างถึง วิธีการสร้างเรื่องราว และรายละเอียดที่ถูกปล่อยออกไป
แม้ว่าบทความจะแสดงความคิดเห็นอย่างชัดเจน สัญญาณมักจะกระจายไปทั่วข้อความ โดยมีเซ็กเมนต์ต่างๆ ที่ชี้ไปในทิศทางต่างๆ
JoA-ICL
แทนที่จะพิจารณาบทความเป็นชิ้นเดียว ระบบที่เสนอโดยผู้เขียนแบ่งออกเป็นชิ้นส่วนโครงสร้างหลักๆ (หัวข้อ เริ่มต้น คำพูด และสรุป) และมอบหมายให้ตัวแทนแบบจำลองภาษาแต่ละชิ้นเพื่อระบุเซ็กเมนต์เหล่านั้น
การคาดการณ์ระดับท้องถิ่นเหล่านี้จะถูกส่งไปยังตัวแทนแบบจำลองที่ใหญ่ขึ้น ซึ่งใช้เพื่อกำหนดกระแสของบทความ
ข้อมูลและการทดสอบ
ในการทดสอบ ผู้วิจัยใช้ มาโคร F1 และความถูกต้องในการประเมินประสิทธิภาพ โดยเฉลี่ยผลลัพธ์จากการทดสอบสิบครั้งโดยใช้เมล็ดสุ่มจาก 42 ถึง 51 และรายงานข้อผิดพลาดมาตรฐาน
JOA-ICL มีประสิทธิภาพเหนือกว่าแบบจำลองที่มีฐานและแบบจำลองที่ได้รับการปรับให้เหมาะสม โดยเฉพาะอย่างยิ่งในการตรวจจับกระแสที่สนับสนุน
สรุป
ไม่มีงานใดในด้านการเรียนรู้ของเครื่องจักรที่มีการเมืองมากกว่าการคาดการณ์กระแส แต่การคาดการณ์กระแสมักจะถูกจัดการในลักษณะที่เย็นชาและกลไก ในขณะที่ให้ความสนใจกับปัญหาที่ซับซ้อนน้อยกว่าใน AI ที่สร้างสรรค์ เช่น การสร้างวิดีโอและรูปภาพ ซึ่งทำให้เกิดความสนใจมากกว่า
สิ่งที่น่าสนใจที่สุดในการทำงานใหม่ของเกาหลีคือการมีส่วนร่วมในการวิเคราะห์ เนื้อหาที่มีความยาวเต็ม แทนที่จะเป็นข้อความสั้นๆ ในโซเชียลมีเดีย ซึ่งมีผลกระทบเชิงลบมากกว่า
สิ่งที่ขาดไปในงานใหม่และในองค์ประกอบการคาดการณ์กระแสโดยทั่วไปคือการไม่พิจารณา ไฮเปอร์ลิงก์ ซึ่งมักจะแทนที่คำพูดเป็นทรัพยากรที่ไม่จำเป็นสำหรับผู้อ่าน แต่การมีไฮเปอร์ลิงก์สามารถมีความเป็นกลางและเป็นทางการได้
สิ่งนี้ทำให้ไฮเปอร์ลิงก์ยากต่อการวัดมากกว่าคำพูดที่ชัดเจน หัวข้อ หรือส่วนอื่นๆ ของบทความที่อาจพยายามมีอิทธิพลต่อความคิดเห็นของผู้อ่าน
ที่น่าสนใจคือ การตีพิมพ์ครั้งแรกเมื่อวันพุธที่ 16 กรกฎาคม 2025












