Informes
¿Qué es la lectura de IA? Los mecanismos ocultos de las citas generativas

A medida que la IA generativa transforma el panorama digital, surge una nueva pregunta en el centro de la creación y el descubrimiento de contenido: ¿Qué lee exactamente la IA? Un estudio pionero titulado ¿Qué es la lectura con IA? Desde Pulso generativo por Muck Rack analizado durante 1 millón de citas de los principales sistemas de IA, incluidos ChatGPT de OpenAI (4o y 4o-mini), Gemini de Google (Flash y Pro) y Claude de Anthropic (Sonnet y Haiku), para descubrir la dinámica oculta detrás de los vínculos que estos modelos utilizan al generar respuestas.
Los hallazgos no sólo son reveladores sino también transformadores para cualquier persona en el ámbito del periodismo, las comunicaciones corporativas, el SEO o la estrategia de marca.
Las citas no son solo complementos: transforman el comportamiento de la IA
Como es obvio para cualquiera que esté inmerso en el mundo de la IA, simplemente habilitar o deshabilitar la funcionalidad de citas cambia las respuestas en síCuando las citas están desactivadas, las IA dependen más de los datos de entrenamiento estáticos. Pero cuando las citas están activadas, los modelos generan resultados sustancialmente diferentes, moldeados directamente por las fuentes en tiempo real de las que extraen información.
Ejemplo clave:Cuando se le preguntó sobre el peor equipo de las Grandes Ligas de Béisbol, una IA con citas desactivadas mencionó a los Mets de 1962. Pero con las citas activadas, actualizó la respuesta para incluir a los 2024 Medias Blancas de Chicago con una temporada récord de 41-121, citando explícitamente Deportes CBS.
El predominio de los medios ganados
Más de 95% de todas las fuentes citadas venir de no pagado Medios de comunicación. Esto incluye:
- 27% contenido periodístico (por ejemplo, Reuters, AP, Financial Times)
- 18% sitios gubernamentales/ONG
- 13% fuentes académicas o de investigación
- 10% plataformas agregadoras/enciclopédicas como Wikipedia o Visual Capitalist
Por el contrario, El contenido pagado o publicitario representa menos del 5% de citas, dejando claro que los modelos de IA están sistemáticamente sesgados en contra contenido impulsado por el marketing.
Sesgo de actualidad: por qué triunfa el contenido nuevo
La frescura es importante, especialmente para los modelos de OpenAI. En el contenido periodístico, El 56% de las citas realizadas por ChatGPT se publicaron en los últimos 12 meses, En comparación con los 36% para ClaudeEsta tendencia, conocida como sesgo de actualidad, se refiere a la preferencia por fuentes más nuevas y publicadas más recientemente en lugar de las más antiguas, incluso cuando estas últimas aún puedan ser precisas o relevantes.
En el contexto de la IA generativa, el sesgo de actualidad implica que los modelos de lenguaje, especialmente aquellos como ChatGPT, que se conectan a datos en tiempo real, tienen mayor probabilidad de consultar y confiar en material recién publicado, sobre todo al responder a consultas sobre eventos actuales, tecnologías emergentes o cambios de políticas. Para solicitudes urgentes, como "últimos avances en tratamiento ambulatorio" o "innovaciones recientes en grabación de sonido", el modelo prioriza el contenido publicado en los últimos meses, asumiendo que ofrece información más relevante o actualizada.
Esta es una idea crucial para los creadores de contenido y los estrategas de marca: si su material está desactualizado, incluso por un año, es mucho menos probable que aparezca en las respuestas generadas por IA. Mantener su contenido actualizado no solo es bueno... SEO—Es esencial para la visibilidad en la era de la IA.
Diferentes indicaciones desencadenan diferentes fuentes
Los modelos de IA no citan fuentes al azar, sino que las eligen según el tipo de pregunta. Los diferentes estilos de indicaciones dan lugar a diferentes tipos de fuentes referenciadas:
- Búsquedas de hechos y consultas enciclopédicas tienden a recurrir a sitios de referencia estáticos como Wikipedia británico, basándose en información bien establecida pero a menudo antigua.
- Preguntas sobre eventos recientes Suelen provocar citas de importantes salas de redacción como AP, Reuters o Axios, donde la velocidad y la actualidad son clave.
- Consejos o sugerencias para pedir opiniones cambiar el modelo hacia fuentes más dinámicas y conversacionales como blogs, foros o plataformas como Reddit or Mediana.
- Tareas académicas o de investigación Liderar la IA para citar revistas, servidores de preimpresión como arXiv, o repositorios respaldados por el gobierno como PubMed or NCBI.
- Solicitudes creativas o instrucciones paso a paso Con frecuencia aparecen contenidos generados por los usuarios, instructivos informales o hilos de discusión de la comunidad de plataformas como Quora o foros tecnológicos especializados.
Esta variación significa que la forma en que se formula una pregunta puede tener un impacto directo en qué dominios se elevan y cuáles se dejan atrás.
Claude, por ejemplo, es mucho menos propenso a citar a medios importantes como Reuters que ChatGPT o Gemini, citando a Reuters. 50 veces menos frecuentemente que ChatGPT.
La autoridad y el dominio importan, pero no de manera uniforme
Si bien los medios de comunicación de alta autoridad dominan, no son los únicos actores. Solo 15% de las fuentes más citadas Aparecen entre los 10 primeros en múltiples industrias. Esto significa que El contenido específico de un nicho es recompensado. Por ejemplo:
- In Finanzas, fuentes como Bankrate NerdWallet son favorecidos.
- In Salud, fuentes gubernamentales como CDC.gov NIH.gov dominar.
- In Tecnología, plataformas de aprendizaje como Udemy, Courseray Mediana sube a la cima.
On la página de 15Un mapa de calor visual muestra que Claude exhibe la diversidad más específica del dominio, seleccionando con frecuencia fuentes exclusivas de la industria, mientras que ChatGPT y Gemini tienden a depender más de medios generalistas.
Perspectivas específicas de la industria: Qué cita la IA por sector
Finanzas y Seguros
- El periodismo representa el 37% de citas, más que cualquier otra industria.
- Las 10 principales fuentes de Claude son 90% único, lo que indica una exploración de nicho más profunda.
Salud
- Los sitios web gubernamentales y de ONG son citados el 18% de las veces, más del doble del promedio intersectorial.
- Gemini es líder en diversidad de fuentes para este sector.
Viajes/Aerolíneas
- Asombrosamente, Las citas académicas son casi inexistentes (sólo el 0.7%).
- Fuentes como FAA.gov IATA.org dominar, con menos dependencia de los medios de comunicación.
Comercio minorista y comercio electrónico
- Los agregadores como Wikipedia son menos citados aquí que en otras industrias (36% frente a 28%).
- Claude cita el contenido más especializado.
Medios / Entretenimiento
-
El periodismo vuelve a liderar con un 37%, con plataformas de nicho como Tecnología de televisión Radioking citado frecuentemente por Claude.
Tecnología
- Prácticamente no se utilizan fuentes enciclopédicas ni académicas.
- Plataformas como Mediana, Courseray SproutSocial aparecen de forma destacada, lo que refleja una inclinación hacia conocimiento basado en la práctica.
Implicaciones para los equipos de comunicación y SEO
Los resultados de este informe revelan que Optimización generativa del motor (GEO) se está volviendo tan importante como el SEO tradicional. La IA no solo resume bases de datos estáticas, sino que también... vinculación activa con fuentes en tiempo realY esos vínculos están influenciados por:
- Frescura:Actualice su contenido periódicamente.
- Autoridad de dominio:Genere vínculos de retroceso y confianza.
- Relevancia de nicho:Cree contenido adaptado a su industria, no solo a temas generales.
- Tipo de contenido:Céntrese en los medios ganados y en el contenido informativo en lugar de en páginas de marketing puro.
Esto cambia las reglas del juego para los profesionales del marketing de contenidos, las relaciones públicas y los editores. Si su objetivo es aparecer en los resultados generados por IA, debe crear contenido que la IA considere valioso, no solo para los usuarios o Google.
Conclusión: Las consecuencias de ser leído (o ignorado) por la IA
Este informe destaca un cambio fundamental en la forma en que la información se presenta en línea: los modelos de IA no solo recuperan contenido, sino que lo seleccionan selectivamente. Y esta selección está redefiniendo la visibilidad en la era digital.
Para editores, investigadores y marcas, ser citado por la IA significa formar parte de la próxima generación de búsquedas. Pone su contenido a disposición de usuarios que quizá nunca visiten su sitio, pero que confían en el modelo que lo referencia. Las fuentes citadas se amplifican. Las que no, independientemente de su calidad, corren el riesgo de quedar completamente excluidas de la conversación.
Este cambio crea nuevos ganadores y perdedores. Se favorecen los medios de alta autoridad y los medios de comunicación oportunos y ganados. Mientras tanto, el contenido de pago, los blogs poco actualizados o las voces menos consolidadas suelen pasar desapercibidos, no solo para la gente, sino también para los sistemas que configuran lo que la gente ve.
As IA generativa sigue desempeñando un papel central en cómo se entrega el conocimiento, la pregunta clave es menos sobre cómo posicionarse en la búsqueda y más sobre: ¿cómo convertirse en parte de lo que la IA considera que vale la pena citar?