รายงาน
อะไรคือ AI Reading? ด้านกลไกที่ซ่อนอยู่ของการอ้างอิงที่สร้างขึ้น

เมื่อ AI ที่สร้างขึ้นใหม่เปลี่ยนแปลงภูมิทัศน์ดิจิทัล คำถามใหม่เกิดขึ้นที่จุดศูนย์กลางของการสร้างและค้นหาคอนเทนต์: อะไรคือ AI Reading จริงๆ บทความที่มีแนวคิดใหม่เรื่อง อะไรคือ AI Reading จาก Generative Pulse โดย Muck Rack วิเคราะห์มากกว่า 1 ล้านการอ้างอิง จากระบบ AI หลัก รวมถึง OpenAI’s ChatGPT (4o และ 4o-mini), Google’s Gemini (Flash และ Pro) และ Anthropic’s Claude (Sonnet และ Haiku) เพื่อเปิดเผยกลไกที่ซ่อนอยู่เบื้องหลังลิงก์ที่โมเดลเหล่านี้ใช้เมื่อสร้างคำตอบ
ผลการวิจัยไม่เพียงแต่เปิดเผยเท่านั้น แต่ยังเปลี่ยนแปลงสำหรับทุกคนในด้านสื่อ การสื่อสารองค์กร SEO หรือกลยุทธ์ยี่ห้อ
การอ้างอิงไม่ใช่แค่ส่วนเสริม – มันเปลี่ยนแปลงพฤติกรรมของ AI
สำหรับทุกคนที่อยู่ในโลกของ AI การเปิดใช้งานหรือปิดใช้งานฟังก์ชันการอ้างอิง เปลี่ยนคำตอบเอง เมื่อการอ้างอิงถูกปิด AI พึ่งพาข้อมูลการฝึกอบรมแบบคงที่มากกว่า แต่เมื่อการอ้างอิงถูกเปิดใช้งาน โมเดลจะสร้างผลลัพธ์ที่แตกต่างอย่างมาก ซึ่งถูกกำหนดโดยแหล่งข้อมูลแบบเรียลไทม์ที่ดึงมาจาก
ตัวอย่างสำคัญ: ถูกถามเกี่ยวกับทีมเบสบอลที่แย่ที่สุด AI ที่ไม่สามารถอ้างอิงได้กล่าวถึงทีม Mets ในปี 1962 แต่เมื่อการอ้างอิงถูกเปิดใช้งาน มันจะอัปเดตคำตอบเพื่อรวม ชิคาโก้ไวท์โซ็กซ์ในปี 2024 พร้อมสถิติ 41–121 ซึ่งอ้างอิงอย่างชัดเจนจาก CBS Sports
การครอบงำของสื่อที่ได้รับ
มากกว่า 95% ของแหล่งอ้างอิงทั้งหมด มาจาก สื่อที่ไม่ได้จ่ายเงิน รวมถึง:
- 27% คอนเทนต์สื่อ (เช่น Reuters, AP, Financial Times)
- 18% เว็บไซต์รัฐบาล/องค์กรพัฒนาเอกชน
- 13% แหล่งวิจัยหรือวิชาการ
- 10% แพลตฟอร์มรวมข้อมูลหรือวิกิพีเดีย เช่น Wikipedia หรือ Visual Capitalist
ในทางตรงกันข้าม คอนเทนต์ที่จ่ายเงินหรือโฆษณา คิดเป็นน้อยกว่า 5% ของการอ้างอิง ทำให้ชัดเจนว่าโมเดล AI มีความลำเอียง ต่อต้าน คอนเทนต์ที่ขับเคลื่อนด้วยการตลาด
ความลำเอียงของความใหม่: ทำไมคอนเทนต์ใหม่จึงชนะ
ความสดใหม่มีความสำคัญอย่างยิ่ง – โดยเฉพาะสำหรับโมเดลของ OpenAI ในคอนเทนต์สื่อ 56% ของการอ้างอิงที่ทำโดย ChatGPT ถูกตีพิมพ์ภายใน 12 เดือนที่ผ่านมา เมื่อเทียบกับ 36% สำหรับ Claude ความลำเอียงนี้เรียกว่าความลำเอียงของความใหม่ ซึ่งหมายถึงการชอบแหล่งที่มาที่ใหม่กว่าและตีพิมพ์最近มากกว่าแหล่งที่มาเก่าๆ แม้ว่าแหล่งที่มาเก่าจะยังคงมีความถูกต้องหรือเกี่ยวข้องก็ตาม
ในบริบทของ AI ที่สร้างขึ้น ความลำเอียงของความใหม่หมายความว่าโมเดลภาษา – โดยเฉพาะโมเดลเช่น ChatGPT ที่เชื่อมต่อกับข้อมูลแบบเรียลไทม์ – มีแนวโน้มที่จะอ้างอิงและเชื่อถือวัสดุที่ตีพิมพ์ใหม่ๆ โดยเฉพาะเมื่อตอบคำถามที่เกี่ยวข้องกับเหตุการณ์ปัจจุบัน เทคโนโลยีที่เกิดขึ้นใหม่ หรือการเปลี่ยนแปลงนโยบาย สำหรับคำถามที่ต้องการความเร็วเช่น “ความก้าวหน้าล่าสุดในการรักษาในโรงพยาบาล” หรือ “นวัตกรรมการบันทึกเสียงล่าสุด” โมเดลจะให้น้ำหนักมากขึ้นสำหรับคอนเทนต์ที่ตีพิมพ์ในช่วงไม่กี่เดือนที่ผ่านมา โดยถือว่ามีข้อมูลที่เกี่ยวข้องหรืออัปเดตมากกว่า
สิ่งนี้เป็นข้อคิดสำคัญสำหรับผู้สร้างคอนเทนต์และนักยุทธศาสตร์ยี่ห้อ: หากคอนเทนต์ของคุณล้าสมัย – แม้เพียงหนึ่งปี – มันจะน้อยกว่าที่จะปรากฏในคำตอบที่ AI สร้างขึ้น การรักษาคอนเทนต์ของคุณให้ใหม่ไม่เพียงแต่ดีสำหรับ SEO เท่านั้น แต่ยังจำเป็นต่อการมองเห็นในยุค AI ด้วย
คำถามที่แตกต่างกันทำให้เกิดแหล่งที่มาที่แตกต่างกัน
โมเดล AI ไม่อ้างอิงแหล่งที่มาแบบสุ่ม – มันเลือกตามประเภทของคำถามที่ถาม คำถามที่แตกต่างกันนำไปสู่แหล่งที่มาที่แตกต่างกันที่ถูกอ้างอิง:
- การค้นหาข้อมูลและคำถามเชิง百科 มักจะดึงมาจากเว็บไซต์อ้างอิงแบบคงที่ เช่น วิกิพีเดีย และ บริตานิกา โดยพึ่งพาข้อมูลที่มีการจัดตั้งขึ้นแต่อาจเป็นข้อมูลเก่า
- คำถามเกี่ยวกับเหตุการณ์ใหม่ๆ มักจะกระตุ้นให้เกิดการอ้างอิงจากสำนักข่าวใหญ่ๆ เช่น AP, รอยเตอร์ หรือ Axios โดยที่ความเร็วและความใหม่ถือเป็นสิ่งสำคัญ
- คำถามที่ขอคำแนะนำหรือความคิดเห็น ทำให้โมเดลเปลี่ยนไปสู่แหล่งที่มาที่มีชีวิตชีวาและสามารถสนทนาได้ เช่น บล็อก ฟอรัม หรือแพลตฟอร์ม เช่น Reddit หรือ Medium
- งานวิจัยหรืองานวิชาการ นำ AI ไปสู่การอ้างอิงจากวารสาร เซิร์ฟเวอร์พรินต์ เช่น arXiv หรือคลังข้อมูลที่ได้รับการสนับสนุนจากรัฐบาล เช่น PubMed หรือ NCBI
- คำขอสร้างสรรค์หรือคำแนะนำแบบขั้นตอน บ่อยครั้งนำไปสู่คอนเทนต์ที่สร้างโดยผู้ใช้ การสอนแบบไม่ทางการ หรือการอภิปรายในที่สาธารณะจากแพลตฟอร์ม เช่น Quora หรือฟอรัมเทคโนโลยีเฉพาะทาง
ความแตกต่างนี้หมายความว่าวิธีการถามคำถามสามารถมีผลกระทบโดยตรงต่อโดเมนที่ถูกยกย่อง – และโดเมนที่ถูกทอดทิ้ง
Claude ตัวอย่างเช่น มีโอกาสน้อยที่จะอ้างอิงสำนักข่าวใหญ่ๆ เช่น Reuters มากกว่า ChatGPT หรือ Gemini โดยอ้างอิง Reuters 50 เท่า น้อยกว่า ChatGPT
ความสำคัญของอำนาจและโดเมน – แต่ไม่สม่ำเสมอ
ในขณะที่แหล่งที่มาที่มีอำนาจสูงครอบงำ แต่ก็ไม่ใช่ผู้เล่นเพียงอย่างเดียว แหล่งที่มาที่ถูกอ้างอิงสูงสุดเพียง 15% ปรากฏใน 10 อันดับแรกในหลายอุตสาหกรรม ซึ่งหมายความว่า คอนเทนต์เฉพาะทางได้รับการตอบแทน ตัวอย่างเช่น:
- ใน การเงิน แหล่งที่มา เช่น Bankrate และ NerdWallet ได้รับการยกย่อง
- ใน สุขภาพ แหล่งที่มาของรัฐบาล เช่น CDC.gov และ NIH.gov ครอบงำ
- ใน เทคโนโลยี แพลตฟอร์มการเรียนรู้ เช่น Udemy, Coursera และ Medium ขึ้นสู่จุดสูงสุด
ใน หน้า 15 แผนที่ความร้อนแสดงให้เห็นว่า Claude แสดงความหลากหลายของโดเมนมากที่สุด โดยเลือกแหล่งที่มาเฉพาะอุตสาหกรรมบ่อยๆ ในขณะที่ ChatGPT และ Gemini มักจะพึ่งพาสื่อแบบทั่วไปมากกว่า
ข้อมูลเชิงลึกเฉพาะอุตสาหกรรม: สิ่งที่ AI อ้างอิงตามภาคส่วน
การเงินและประกัน
- สื่อเป็น 37% ของการอ้างอิง มากกว่าอุตสาหกรรมอื่นๆ
- แหล่งที่มา 10 อันดับแรกของ Claude เป็น 90% เป็นแหล่งที่มาเฉพาะตัว ซึ่งบ่งบอกถึงการสำรวจเฉพาะทางที่ลึกซึ้งยิ่งขึ้น
สุขภาพ
- เว็บไซต์ของรัฐบาลและองค์กรพัฒนาเอกชนถูกอ้างอิง 18% ของเวลา มากกว่าค่าเฉลี่ยของอุตสาหกรรมทั้งหมดถึงสองเท่า
- Gemini มีความหลากหลายของแหล่งที่มาเป็นจำนวนมากที่สุดในภาคส่วนนี้
การเดินทาง/การบิน
- น่าประหลาดใจที่ การอ้างอิงทางวิชาการเกือบจะหายไป (เพียง 0.7%)
- แหล่งที่มา เช่น FAA.gov และ IATA.org ครอบงำ โดยมีการพึ่งพาสื่อข่าวน้อยลง
ค้าปลีกและอีคอมเมิร์ซ
- เครื่องมือรวบรวมข้อมูล เช่น วิกิพีเดีย ถูกอ้างอิงน้อยกว่าในอุตสาหกรรมอื่นๆ (36% เทียบกับ 28%)
- Claude อ้างอิงคอนเทนต์เฉพาะทางมากที่สุด
สื่อ/ความบันเทิง
-
สื่อเป็น 37% อีกครั้ง โดยมีแพลตฟอร์มเฉพาะทาง เช่น TVTechnology และ Radioking ถูกอ้างอิงบ่อยๆ โดย Claude
เทคโนโลยี
- แทบไม่มีแหล่งที่มาเชิง百科หรือวิชาการที่ถูกใช้
- แพลตฟอร์ม เช่น Medium, Coursera และ SproutSocial ปรากฏอย่างเด่นชัด โดยสะท้อนถึงการเอียงเข็มไปที่ ความรู้ของนักปฏิบัติ
ผลกระทบต่อทีมสื่อสารและ SEO
ผลการวิจัยของรายงานนี้แสดงให้เห็นว่า การเพิ่มประสิทธิภาพเครื่องยนต์สร้างสรรค์ (GEO) กำลังจะกลายเป็นสิ่งสำคัญเช่นเดียวกับการเพิ่มประสิทธิภาพ SEO แบบดั้งเดิม AI ไม่ได้แค่สรุปฐานข้อมูลแบบคงที่ – มัน เชื่อมโยงแหล่งที่มาในแบบเรียลไทม์ และแหล่งที่มาเหล่านั้นถูกกำหนดโดย:
- ความใหม่: อัปเดตคอนเทนต์ของคุณเป็นประจำ
- อำนาจโดเมน: สร้างลิงก์ย้อนกลับและความน่าเชื่อถือ
- ความเกี่ยวข้องเฉพาะทาง: สร้างคอนเทนต์ที่เหมาะกับอุตสาหกรรมของคุณ ไม่ใช่แค่หัวข้อทั่วไป
- ประเภทคอนเทนต์: มุ่งเน้นไปที่คอนเทนต์ที่ได้รับและคอนเทนต์ให้ข้อมูล มากกว่าเพจการตลาดบริสุทธิ์
สิ่งนี้เปลี่ยนการคำนวณสำหรับนักการตลาดคอนเทนต์ ผู้เชี่ยวชาญด้านสื่อสารและผู้จัดพิมพ์ หากเป้าหมายของคุณคือการปรากฏในผลลัพธ์ที่ AI สร้างขึ้น คุณจะต้องสร้างคอนเทนต์ที่ AI พบว่ามีค่า – ไม่ใช่แค่ผู้ใช้หรือ Google
สรุป: ผลที่ตามมาของการถูกอ่าน (หรือเพิกเฉย) โดย AI
รายงานนี้เน้นถึงการเปลี่ยนแปลงพื้นฐานวิธีการที่ข้อมูลถูกนำเสนอออนไลน์: โมเดล AI ไม่ได้เพียงแค่ดึงคอนเทนต์ – แต่เลือกคอนเทนต์อย่างมีเลือกสรร และการเลือกคอนเทนต์นี้กำลังเปลี่ยนความหมายของการมองเห็นในยุคดิจิทัล
สำหรับผู้จัดพิมพ์ นักวิจัย และยี่ห้อ การถูกอ้างอิงโดย AI หมายถึงการเป็นส่วนหนึ่งของรุ่นต่อไปของการค้นหา ซึ่งนำคอนเทนต์ของคุณไปสู่ผู้ใช้ที่อาจไม่เคยเยี่ยมชมเว็บไซต์ของคุณ แต่เชื่อถือโมเดลที่อ้างอิงมัน แหล่งที่มาเหล่านั้นที่ถูกอ้างอิงจะถูกขยายใหญ่ขึ้น ในขณะที่แหล่งที่มา那些ที่ไม่ได้ – ไม่ว่าจะมีคุณภาพอย่างไร – ก็เสี่ยงต่อการถูกละเว้นจากการสนทนาโดยสิ้นเชิง
การเปลี่ยนแปลงนี้สร้างผู้ชนะและผู้แพ้ใหม่ๆ แหล่งที่มาที่มีอำนาจสูงและคอนเทนต์ที่ได้รับและใหม่ๆ ได้รับการยกย่อง ในขณะที่คอนเทนต์ที่จ่ายเงิน บล็อกที่อัปเดตไม่บ่อย หรือเสียงที่ไม่ค่อยได้ยินมักจะถูกละเลย – ไม่เพียงแต่โดยผู้คนเท่านั้น แต่ยังรวมถึงระบบที่กำหนดสิ่งที่ผู้คนเห็นอีกด้วย
เมื่อ AI ที่สร้างขึ้น ยังคงเล่นบทบาทสำคัญในการส่งมอบความรู้ คำถามหลักจะเปลี่ยนจากวิธีการจัดอันดับในผลการค้นหาไปเป็น: คุณจะกลายเป็นส่วนหนึ่งของสิ่งที่ AI พิจารณาว่ามีค่าในการอ้างอิงได้อย่างไร?












