Report
Che cosa legge l’AI? All’interno della meccanica nascosta delle citazioni generative

Mentre l’AI generativa ridisegna il paesaggio digitale, una nuova domanda emerge al centro della creazione e della scoperta di contenuti: Che cosa legge esattamente l’AI? Uno studio innovativo intitolato Che cosa legge l’AI di Generative Pulse di Muck Rack ha analizzato oltre 1 milione di citazioni da importanti sistemi di intelligenza artificiale, tra cui ChatGPT (4o e 4o-mini) di OpenAI, Gemini (Flash e Pro) di Google e Claude (Sonnet e Haiku) di Anthropic, per scoprire la dinamica nascosta dietro i collegamenti che questi modelli utilizzano quando generano risposte.
I risultati non sono solo rivelatori, ma anche trasformativi per chiunque lavori nel giornalismo, nelle comunicazioni aziendali, nel SEO o nella strategia del marchio.
Le citazioni non sono solo aggiunte – ridisegnano il comportamento dell’AI
Come è ovvio a chiunque sia immerso nel mondo dell’AI, abilitare o disabilitare la funzionalità di citazione cambia le risposte stesse. Quando le citazioni sono disabilitate, le AI si affidano maggiormente ai dati di training statici. Ma quando le citazioni sono abilitate, i modelli generano output materialmente diversi, direttamente plasmati dalle fonti in tempo reale che attingono.
Esempio chiave: Chiesto quale sia la peggiore squadra di baseball della Major League, un’AI con citazioni disabilitate ha menzionato i Mets del 1962. Ma con le citazioni abilitate, ha aggiornato la risposta per includere i Chicago White Sox del 2024 con una stagione da record di 41-121, citando esplicitamente CBS Sports.
La supremazia dei media guadagnati
Oltre il 95% di tutte le fonti citate provengono da media non pagati. Ciò include:
- 27% di contenuti giornalistici (ad es. Reuters, AP, Financial Times)
- 18% di siti di governo/ONG
- 13% di fonti accademiche o di ricerca
- 10% di piattaforme di aggregazione/enciclopediche come Wikipedia o Visual Capitalist
Al contrario, il contenuto pagato o pubblicitario rappresenta meno del 5% delle citazioni, rendendo chiaro che i modelli di AI sono sistematicamente prevenuti contro il contenuto guidato dal marketing.
Bias di recentità: perché il nuovo contenuto vince
La freschezza conta – in particolare per i modelli di OpenAI. Nei contenuti giornalistici, 56% delle citazioni fatte da ChatGPT sono state pubblicate nell’ultimo anno, rispetto al 36% per Claude. Questa tendenza, nota come bias di recentità, si riferisce alla preferenza per fonti più recenti e pubblicate di recente rispetto a quelle più vecchie, anche quando le fonti più vecchie potrebbero ancora essere accurate o rilevanti.
Nel contesto dell’AI generativa, il bias di recentità significa che i modelli linguistici – in particolare quelli come ChatGPT connessi a dati in tempo reale – sono più propensi a fare riferimento e a fidarsi di materiali pubblicati di recente, in particolare quando rispondono a query che coinvolgono eventi attuali, tecnologie emergenti o cambiamenti di politica. Per prompt sensibili al tempo come “ultimi progressi nel trattamento ambulatoriale” o “recenti innovazioni nella registrazione del suono”, il modello pesa fortemente il contenuto pubblicato negli ultimi mesi, supponendo che contenga informazioni più rilevanti o aggiornate.
Questa è un’insight critica per i creatori di contenuti e gli strateghi del marchio: se il tuo materiale è obsoleto – anche solo di un anno – è molto meno probabile che appaia nelle risposte generate dall’AI. Mantenere il tuo contenuto fresco non è solo una buona SEO – è essenziale per la visibilità nell’era dell’AI.
Prompt diversi attivano fonti diverse
I modelli di AI non citano fonti in modo casuale – scelgono in base al tipo di domanda posta. Stili di prompt diversi portano a fonti diverse che vengono citate:
- Ricerche di fatti e query enciclopediche tendono a attingere da siti di riferimento statici come Wikipedia e Britannica, affidandosi a informazioni ben stabilite ma spesso più vecchie.
- Domande su eventi recenti scatenano tipicamente citazioni da importanti redazioni come AP, Reuters o Axios, dove velocità e recentità sono fondamentali.
- Prompt di richiesta di consiglio o di opinione spostano il modello verso fonti più dinamiche e conversazionali come blog, forum o piattaforme come Reddit o Medium.
- Compiti accademici o di ricerca portano l’AI a citare da riviste, server di pre-stampa come arXiv o repository governative come PubMed o NCBI.
- Richieste creative o istruzioni passo dopo passo fanno frequentemente emergere contenuti generati dagli utenti, come how-to informali o thread di discussione da piattaforme come Quora o forum tecnici di nicchia.
Questa variazione significa che il modo in cui una domanda è formulata può avere un impatto diretto sulle fonti che vengono elevate – e su quelle che vengono lasciate indietro.
Claude, ad esempio, è molto meno propenso a citare importanti testate come Reuters rispetto a ChatGPT o Gemini, citando Reuters 50 volte meno frequentemente di ChatGPT.
L’autorità e il dominio contano – ma non in modo uniforme
Mentre le testate ad alta autorità dominano, non sono gli unici giocatori. Solo 15% delle fonti più citate appaiono nelle prime 10 in più settori. Ciò significa che il contenuto specifico di nicchia viene premiado. Ad esempio:
- Nel settore finanziario, fonti come Bankrate e NerdWallet sono preferite.
- Nel settore sanitario, fonti governative come CDC.gov e NIH.gov dominano.
- Nel settore tecnologico, piattaforme di apprendimento come Udemy, Coursera e Medium salgono in cima.
A pagina 15, una heatmap visiva mostra che Claude esibisce la maggiore diversità specifica di dominio, selezionando frequentemente fonti uniche per ogni industria, mentre ChatGPT e Gemini tendono a fare affidamento più pesantemente su media generalisti.
Insight specifici per settore: cosa cita l’AI per settore
Finanza e assicurazioni
- Il giornalismo rappresenta il 37% delle citazioni, più di qualsiasi altro settore.
- Le prime 10 fonti di Claude sono 90% uniche, indicando un’esplorazione di nicchia più approfondita.
Sanità
- I siti di governo e ONG sono citati il 18% delle volte, più del doppio della media intersettoriale.
- Gemini guida nella diversità di fonti per questo settore.
Viaggio/aereo
- Sorprendentemente, le citazioni accademiche sono quasi assenti (solo lo 0,7%).
- Fonti come FAA.gov e IATA.org dominano, con minore affidamento su testate giornalistiche.
Retail e commercio elettronico
- Gli aggregator come Wikipedia sono citati meno qui che in altri settori (36% vs 28%).
- Claude cita il maggior numero di contenuti di nicchia.
Media/intrattenimento
-
Il giornalismo guida nuovamente al 37%, con piattaforme di nicchia come TVTechnology e Radioking citate frequentemente da Claude.
Tecnologia
- Quasi nessuna fonte enciclopedica o accademica viene utilizzata.
- Piattaforme come Medium, Coursera e SproutSocial appaiono prominentemente, riflettendo una tendenza verso conoscenze basate su pratiche.
Implicazioni per i team di comunicazione e SEO
I risultati di questo rapporto rivelano che l’Ottimizzazione del motore generativo (GEO) sta diventando altrettanto importante quanto la tradizionale SEO. L’AI non sta solo riassumendo database statici – sta attivamente collegandosi a fonti in tempo reale. E quei collegamenti sono influenzati da:
- Recentità: aggiorna regolarmente il tuo contenuto.
- Autorità del dominio: costruisci collegamenti di ritorno e fiducia.
- Rilevanza della nicchia: crea contenuti adattati al tuo settore, non solo argomenti generali.
- Tipo di contenuto: concentra l’attenzione sui media guadagnati e sui contenuti informativi piuttosto che sulle pagine di marketing puro.
Ciò cambia la logica per i marketer di contenuti, i professionisti delle PR e gli editori. Se il tuo obiettivo è apparire nei risultati generati dall’AI, devi creare contenuti che l’AI trova preziosi – non solo gli utenti o Google.
Conclusione: le conseguenze dell’essere letto (o ignorato) dall’AI
Questo rapporto mette in luce un fondamentale spostamento su come le informazioni vengono presentate online: i modelli di AI non recuperano solo contenuti – li curano selettivamente. E questa cura sta ridefinendo la visibilità nell’era digitale.
Per gli editori, i ricercatori e i marchi, essere citati dall’AI significa essere parte della prossima generazione di ricerca. Ciò mette il tuo contenuto di fronte agli utenti che potrebbero non visitare mai il tuo sito, ma che si fidano del modello che lo cita. Le fonti citate vengono amplificate. Quelle che non lo fanno – indipendentemente dalla qualità – rischiano di essere escluse dalla conversazione interamente.
Questo spostamento crea nuovi vincitori e perdenti. Le testate ad alta autorità e i media guadagnati in tempo reale sono favoriti. Nel frattempo, il contenuto pagato, i blog poco aggiornati o le voci meno stabilite spesso vengono letti – non solo dalle persone, ma dai sistemi che plasmano ciò che le persone vedono.
Mentre l’AI generativa continua a svolgere un ruolo centrale nel modo in cui la conoscenza viene consegnata, la chiave diventa meno su come classificarsi nella ricerca e più su: come diventare parte di ciò che l’AI considera degno di citazione?












