Báo cáo
AI Đọc Gì? Bên Trong Cơ Chế Ẩn của Trích Dẫn Tạo

Khi trí tuệ nhân tạo tạo ra lại cảnh quan kỹ thuật số, một câu hỏi mới đang xuất hiện ở trung tâm của việc tạo và khám phá nội dung: Chính xác thì AI đọc gì? Một nghiên cứu đột phá có tiêu đề AI Đọc Gì từ Generative Pulse bởi Muck Rack đã phân tích hơn 1 triệu trích dẫn từ các hệ thống AI lớn – bao gồm OpenAI’s ChatGPT (4o và 4o-mini), Google’s Gemini (Flash và Pro) và Anthropic’s Claude (Sonnet và Haiku) – để tiết lộ các động lực ẩn phía sau các liên kết mà các mô hình này sử dụng khi tạo ra câu trả lời.
Những phát hiện không chỉ tiết lộ mà còn biến đổi cho bất kỳ ai trong lĩnh vực báo chí, truyền thông doanh nghiệp, SEO hoặc chiến lược thương hiệu.
Trích Dẫn Không Phải Là Phụ Trợ – Chúng Tái Định Hình Hành Vi Của AI
Như là rõ ràng với bất kỳ ai đắm chìm trong thế giới của AI, việc đơn giản bật hoặc tắt chức năng trích dẫn thay đổi chính các câu trả lời. Khi trích dẫn bị tắt, AI dựa nhiều hơn vào dữ liệu đào tạo tĩnh. Nhưng khi trích dẫn được bật, các mô hình tạo ra đầu ra khác biệt về mặt vật chất, được định hình trực tiếp bởi các nguồn thời gian thực mà chúng kéo từ đó.
Ví Dụ Quan Trọng: Khi được hỏi về đội bóng chày Major League tệ nhất, một AI bị tắt trích dẫn đã đề cập đến đội Mets năm 1962. Nhưng với trích dẫn được bật, nó đã cập nhật câu trả lời để bao gồm đội Chicago White Sox năm 2024 với mùa giải 41–121 kỷ lục -明确 trích dẫn CBS Sports.
Sự Đominance của Truyền Thông Được Kiếm Được
Hơn 95% tất cả các nguồn trích dẫn đến từ truyền thông không phải trả tiền. Điều này bao gồm:
- 27% nội dung báo chí (ví dụ: Reuters, AP, Financial Times)
- 18% trang web của chính phủ/NGO
- 13% nguồn học thuật hoặc nghiên cứu
- 10% nền tảng tổng hợp/bách khoa như Wikipedia hoặc Visual Capitalist
Ngược lại, nội dung trả tiền hoặc quảng cáo chiếm ít hơn 5% trong số các trích dẫn, làm rõ rằng các mô hình AI có thiên vị hệ thống chống lại nội dung marketing.
Thiên Vị Tính Mới: Tại Sao Nội Dung Mới Là Người Chiến Thắng
Tính mới mẻ rất quan trọng – đặc biệt là đối với các mô hình của OpenAI. Trong nội dung báo chí, 56% trích dẫn được thực hiện bởi ChatGPT đã được xuất bản trong vòng 12 tháng qua, so với 36% đối với Claude. Xu hướng này, được gọi là thiên vị tính mới, đề cập đến sự ưu tiên cho các nguồn mới hơn, được xuất bản gần đây hơn so với các nguồn cũ hơn, ngay cả khi các nguồn cũ hơn vẫn có thể chính xác hoặc liên quan.
Trong bối cảnh AI tạo ra, thiên vị tính mới có nghĩa là các mô hình ngôn ngữ – đặc biệt là những mô hình như ChatGPT được kết nối với dữ liệu thời gian thực – có nhiều khả năng tham chiếu và tin tưởng vào vật liệu được xuất bản gần đây, đặc biệt là khi trả lời các yêu cầu liên quan đến sự kiện hiện tại, công nghệ mới nổi hoặc thay đổi chính sách. Đối với các yêu cầu thời gian nhạy cảm như “các tiến bộ mới nhất trong điều trị ngoại trú” hoặc “các đổi mới ghi âm gần đây”, mô hình nặng về nội dung được xuất bản trong vài tháng qua, giả định rằng nó mang lại thông tin mới hơn hoặc cập nhật.
Đây là một thông tin quan trọng cho các nhà tạo nội dung và nhà chiến lược thương hiệu: nếu vật liệu của bạn đã lỗi thời – ngay cả chỉ một năm – thì nó sẽ ít có khả năng xuất hiện trong các câu trả lời được tạo ra bởi AI. Giữ cho nội dung của bạn luôn mới mẻ không chỉ là một chiến lược SEO tốt – nó là điều cần thiết cho khả năng hiển thị trong thời đại AI.
Các Yêu Cầu Khác Nhau Kích Hoạt Các Nguồn Khác Nhau
Các mô hình AI không trích dẫn nguồn một cách ngẫu nhiên – chúng chọn dựa trên loại câu hỏi được hỏi. Các phong cách yêu cầu khác nhau dẫn đến các loại nguồn khác nhau được tham chiếu:
- Tra cứu事 thực và yêu cầu bách khoa thường rút ra từ các trang web tham chiếu tĩnh như Wikipedia và Britannica, dựa vào thông tin đã được thiết lập nhưng thường cũ hơn.
- Câu hỏi về sự kiện gần đây thường kích hoạt trích dẫn từ các phòng báo lớn như AP, Reuters hoặc Axios, nơi tốc độ và tính mới là chìa khóa.
- Yêu cầu tư vấn hoặc tìm kiếm ý kiến chuyển mô hình sang các nguồn động và đối thoại hơn như blog, diễn đàn hoặc nền tảng như Reddit hoặc Medium.
- Nhiệm vụ nghiên cứu học thuật dẫn AI đến trích dẫn từ tạp chí, máy chủ trước như arXiv hoặc kho lưu trữ được chính phủ hỗ trợ như PubMed hoặc NCBI.
- Yêu cầu sáng tạo hoặc hướng dẫn từng bước thường xuyên hiển thị nội dung do người dùng tạo, hướng dẫn không chính thức hoặc luồng thảo luận của cộng đồng từ các nền tảng như Quora hoặc diễn đàn công nghệ chuyên dụng.
Sự đa dạng này có nghĩa là cách một câu hỏi được đặt ra có thể có tác động trực tiếp đến哪 các miền được nâng cao – và哪 các miền bị bỏ lại phía sau.
Claude, ví dụ, ít có khả năng trích dẫn các hãng thông tấn lớn như Reuters hơn ChatGPT hoặc Gemini, trích dẫn Reuters 50 lần ít hơn so với ChatGPT.
Ủy Quyền và Miền Quan Trọng – Nhưng Không Đồng Đều
Mặc dù các hãng thông tấn có thẩm quyền cao thống trị, chúng không phải là những người chơi duy nhất. Chỉ 15% nguồn trích dẫn hàng đầu xuất hiện trong top 10 trên nhiều ngành công nghiệp. Điều này có nghĩa là nội dung chuyên ngành được thưởng. Ví dụ:
- Trong Tài Chính, các nguồn như Bankrate và NerdWallet được ưa chuộng.
- Trong Chăm Sóc Sức Khỏe, các nguồn chính phủ như CDC.gov và NIH.gov thống trị.
- Trong Công Nghệ, các nền tảng học tập như Udemy, Coursera và Medium vươn lên hàng đầu.
Trên trang 15, một bản đồ nhiệt trực quan cho thấy Claude thể hiện sự đa dạng về miền chuyên ngành nhiều nhất, thường chọn các nguồn duy nhất cho ngành, trong khi ChatGPT và Gemini có xu hướng dựa nhiều hơn vào truyền thông tổng quát.
Thông Tin Chuyên Ngành: Những Gì AI Trích Dẫn Theo Ngành
Tài Chính & Bảo Hiểm
- Báo chí chiếm 37% trong số các trích dẫn, nhiều hơn bất kỳ ngành nào khác.
- 10 nguồn hàng đầu của Claude là 90% duy nhất, cho thấy sự khám phá chuyên sâu hơn.
Chăm Sóc Sức Khỏe
- Trang web của chính phủ và tổ chức phi chính phủ được trích dẫn 18% thời gian, nhiều hơn gấp đôi trung bình trên nhiều ngành.
- Gemini dẫn đầu về đa dạng nguồn trong lĩnh vực này.
Du Lịch/Hàng Không
- Điều đáng ngạc nhiên là trích dẫn học thuật gần như vắng mặt (chỉ 0,7%).
- Các nguồn như FAA.gov và IATA.org thống trị, với sự phụ thuộc ít hơn vào các hãng thông tấn.
Bán Lẻ & Thương Mại Điện Tử
- Các tổng hợp như Wikipedia được trích dẫn ít hơn ở đây so với các ngành khác (36% so với 28%).
- Claude trích dẫn nhiều nội dung chuyên ngành nhất.
Truyền Thông/Giải Trí
-
Báo chí dẫn đầu một lần nữa ở 37%, với các nền tảng chuyên ngành như TVTechnology và Radioking được Claude trích dẫn thường xuyên.
Công Nghệ
- Gần như không có nguồn bách khoa hoặc học thuật nào được sử dụng.
- Các nền tảng như Medium, Coursera và SproutSocial xuất hiện nổi bật, phản ánh sự nghiêng về kiến thức của người hành nghề.
Hậu Quả Đối Với Truyền Thông và Các Đội Nhóm SEO
Những phát hiện của báo cáo này cho thấy rằng Tối Ưu Hóa Động Cơ Tạo (GEO) đang trở nên quan trọng như SEO truyền thống. AI không chỉ tóm tắt các cơ sở dữ liệu tĩnh – nó hoạt động liên kết đến các nguồn trong thời gian thực. Và những liên kết này được ảnh hưởng bởi:
- Tính Mới: Cập nhật nội dung của bạn thường xuyên.
- Thẩm Quyền Miền: Xây dựng các liên kết trở lại và niềm tin.
- Sự Liên Quan Chuyên Ngành: Tạo nội dung được thiết kế cho ngành của bạn, không chỉ là chủ đề chung.
- Loại Nội Dung: Tập trung vào truyền thông kiếm được và nội dung thông tin hơn là các trang marketing thuần túy.
Điều này thay đổi cách tính toán cho các nhà tiếp thị nội dung, chuyên gia quan hệ công chúng và nhà xuất bản. Nếu mục tiêu của bạn là xuất hiện trong kết quả được tạo bởi AI, bạn phải tạo nội dung mà AI coi là có giá trị – không chỉ người dùng hoặc Google.
Kết Luận: Hậu Quả Của Việc Được Đọc (Hoặc Bỏ Qua) Bởi AI
Báo cáo này nhấn mạnh một sự thay đổi cơ bản trong cách thông tin được hiển thị trực tuyến: Các mô hình AI không chỉ truy xuất nội dung – chúng chọn lọc và biên tập nó. Và việc biên tập này đang định nghĩa lại khả năng hiển thị trong thời đại kỹ thuật số.
Đối với các nhà xuất bản, nhà nghiên cứu và thương hiệu, việc được AI trích dẫn có nghĩa là trở thành một phần của thế hệ tiếp theo của tìm kiếm. Nó đặt nội dung của bạn trước mặt người dùng những người có thể không bao giờ truy cập trang web của bạn nhưng lại tin tưởng vào mô hình tham chiếu nó. Các nguồn được trích dẫn được khuếch đại. Những nguồn không – bất kể chất lượng – rủi ro bị loại khỏi cuộc trò chuyện hoàn toàn.
Sự thay đổi này tạo ra những người chiến thắng và kẻ thua mới. Các hãng thông tấn có thẩm quyền cao và truyền thông kiếm được, kịp thời được ưa chuộng. Trong khi đó, nội dung trả tiền, blog cập nhật nhẹ hoặc các tiếng nói ít được thành lập thường bị bỏ qua – không chỉ bởi con người, mà còn bởi các hệ thống định hình những gì người ta nhìn thấy.
Khi trí tuệ nhân tạo tạo ra tiếp tục đóng một vai trò trung tâm trong cách kiến thức được cung cấp, câu hỏi chính trở nên ít hơn về cách xếp hạng trong tìm kiếm và nhiều hơn về: Làm thế nào bạn trở thành một phần của những gì AI coi là đáng trích dẫn?












