Rapporten
Wat leest AI? De verborgen mechanismen van generatieve citaten

Nu generatieve AI het digitale landschap vormgeeft, komt er een nieuwe vraag naar voren die centraal staat in de creatie en ontdekking van content: wat is AI-lezen precies? Een baanbrekende studie getiteld Wat is AI-lezen? vanaf generatieve puls door Muck Rack geanalyseerd over 1 miljoen citaties van belangrijke AI-systemen, waaronder ChatGPT van OpenAI (4o en 4o-mini), Gemini van Google (Flash en Pro) en Claude van Anthropic (Sonnet en Haiku), om de verborgen dynamiek te onthullen achter de koppelingen die deze modellen gebruiken bij het genereren van reacties.
De bevindingen zijn niet alleen onthullend, maar ook transformerend voor iedereen die werkzaam is in de journalistiek, bedrijfscommunicatie, SEO of merkstrategie.
Citaten zijn niet zomaar toevoegingen, ze veranderen het AI-gedrag
Zoals voor iedereen die zich in de wereld van AI bevindt duidelijk is, is het eenvoudig om de citatiefunctionaliteit in of uit te schakelen verandert de antwoorden zelfWanneer citaties zijn uitgeschakeld, vertrouwen AI's zwaarder op statische trainingsdata. Maar wanneer citaties zijn ingeschakeld, genereren de modellen wezenlijk andere uitkomsten, die direct worden beïnvloed door de realtime bronnen waaruit ze putten.
Sleutelvoorbeeld: Gevraagd naar het slechtste Major League Baseball-team, noemde een AI met uitgeschakelde citaten de Mets van 1962. Maar met de citaten ingeschakeld, werd het antwoord bijgewerkt met de Chicago White Sox 2024 met een recordbrekend seizoen van 41-121, waarbij expliciet wordt verwezen naar CBS Sports.
De dominantie van earned media
Over 95% van alle geciteerde bronnen komt van niet betaald media. Dit omvat:
- 27% journalistieke content (bijv. Reuters, AP, Financial Times)
- 18% overheids-/ngo-sites
- 13% academische of onderzoeksbronnen
- 10% aggregator-/encyclopedische platforms zoals Wikipedia of Visual Capitalist
Daarentegen betaalde of advertoriale content is goed voor minder dan 5% van citaten, waardoor duidelijk wordt dat AI-modellen systematisch bevooroordeeld zijn tegen marketinggedreven content.
Recency Bias: Waarom nieuwe content wint
Versheid is belangrijk, vooral voor de modellen van OpenAI. In journalistieke content, 56% van de citaten die door ChatGPT zijn gemaakt, zijn gepubliceerd in de afgelopen 12 maanden, Vergeleken 36% voor ClaudeDeze tendens, ook wel 'recency bias' genoemd, verwijst naar de voorkeur voor nieuwere, meer recent gepubliceerde bronnen boven oudere, zelfs als oudere bronnen mogelijk nog steeds accuraat of relevant zijn.
In de context van generatieve AI betekent recency bias dat taalmodellen – met name modellen zoals ChatGPT die verbonden zijn met realtime data – eerder geneigd zijn om te verwijzen naar en te vertrouwen op recent gepubliceerd materiaal, met name bij het beantwoorden van vragen over actuele gebeurtenissen, opkomende technologieën of beleidswijzigingen. Voor tijdgevoelige vragen zoals "de nieuwste ontwikkelingen in poliklinische zorg" of "recente innovaties op het gebied van geluidsopnames" weegt het model zwaar mee in content die in de afgelopen maanden is gepubliceerd, ervan uitgaande dat deze relevantere of actuelere inzichten biedt.
Dit is een cruciaal inzicht voor contentmakers en merkstrategen: als je materiaal verouderd is – zelfs met een jaar – is de kans aanzienlijk kleiner dat het in door AI gegenereerde antwoorden naar voren komt. Je content actueel houden is niet alleen goed SEO—het is essentieel voor zichtbaarheid in het tijdperk van AI.
Verschillende prompts activeren verschillende bronnen
AI-modellen citeren bronnen niet willekeurig – ze kiezen op basis van het type vraag dat wordt gesteld. Verschillende promptstijlen leiden tot verschillende soorten bronnen waarnaar wordt verwezen:
- Feiten opzoeken en encyclopedische zoekopdrachten hebben de neiging om te putten uit statische referentie-sites zoals Wikipedia en Brits, gebaseerd op algemeen bekende, maar vaak oudere informatie.
- Vragen over recente evenementen leiden doorgaans tot citaten van grote nieuwsredacties zoals AP, Reutersof Axios, waarbij snelheid en actualiteit van cruciaal belang zijn.
- Advies- of meningvragen verschuif het model naar meer dynamische en conversationele bronnen zoals blogs, forums of platforms zoals Reddit or Medium.
- Academische of onderzoeksgerichte taken AI leiden om te citeren uit tijdschriften, preprintservers zoals arXivof door de overheid ondersteunde opslagplaatsen zoals PubMed or NCBI.
- Creatieve verzoeken of stapsgewijze instructies vaak door gebruikers gegenereerde inhoud, informele handleidingen of discussiethreads van de community van platforms zoals Quora of niche-techforums.
Deze variatie betekent dat de manier waarop een vraag wordt geformuleerd, direct van invloed kan zijn op welke domeinen worden verhoogd en welke achterblijven.
Claude zal bijvoorbeeld veel minder snel grote media als Reuters citeren dan ChatGPT of Gemini, waarbij hij Reuters citeert 50x minder vaak dan ChatGPT.
Autoriteit en domein zijn van belang, maar niet uniform
Hoewel gezaghebbende media domineren, zijn zij niet de enige spelers. 15% van de meest geciteerde bronnen in de top 10 van meerdere sectoren voorkomen. Dit betekent dat nichespecifieke content wordt beloond. Bijvoorbeeld:
- In Finance, bronnen zoals Bankrente en NerdWallet zijn favoriet.
- In Gezondheidszorgoverheidsbronnen zoals CDC.gov en NIH.gov domineren.
- In Technologie, leerplatformen zoals Udemy, Courseraen Medium naar de top stijgen.
On pagina 15een visuele heatmap laat zien dat Claude vertoont de meeste domeinspecifieke diversiteit en selecteert vaak branchespecifieke bronnen, terwijl ChatGPT en Gemini de neiging hebben om meer te vertrouwen op generalistische media.
Branchespecifieke inzichten: wat AI per sector aanhaalt
Financiën en verzekeringen
- Journalistiek is goed voor 37% van citaten, meer dan welke andere sector dan ook.
- De top 10 bronnen van Claude zijn 90% uniek, wat duidt op een diepere niche-exploratie.
Gezondheidszorg
- Overheids- en NGO-sites worden in 18% van de gevallen geciteerd, meer dan het dubbele van het gemiddelde tussen sectoren.
- Gemini is koploper op het gebied van brondiversiteit voor deze sector.
Reizen/Luchtvaartmaatschappij
- Verrassend, academische citaten zijn vrijwel afwezig (slechts 0.7%).
- Bronnen zoals FAA.gov en IATA.org domineren en minder afhankelijk zijn van nieuwskanalen.
Detailhandel en e-commerce
- Aggregators zoals Wikipedia worden minder geciteerd hier dan in andere sectoren (36% vs. 28%).
- Claude noemt de meest nichecontent.
Media / entertainment
-
Journalistiek staat opnieuw bovenaan met 37%, met nicheplatforms zoals TVTechnologie en Radioking Vaak door Claude geciteerd.
Technologie
- Er worden vrijwel geen encyclopedische of academische bronnen gebruikt.
- Platforms zoals Medium, Courseraen SproutSocial prominent aanwezig zijn, wat een neiging naar Praktijkgerichte kennis.
Implicaties voor communicatie- en SEO-teams
De bevindingen van dit rapport laten zien dat Generatieve motoroptimalisatie (GEO) wordt net zo belangrijk als traditionele SEO. AI vat niet alleen statische databases samen, het is actief linken naar bronnen in realtimeEn die links worden beïnvloed door:
- nieuwheid: Werk uw inhoud regelmatig bij.
- Domain Authority: Bouw backlinks en vertrouw.
- Niche-relevantie: Maak content die is afgestemd op uw branche, niet alleen algemene onderwerpen.
- Inhoudstype: Concentreer u op verdiende media en informatieve content in plaats van op pure marketingpagina's.
Dit verandert de rekensom voor contentmarketeers, PR-professionals en uitgevers. Als je wilt verschijnen in door AI gegenereerde resultaten, moet je content creëren die door AI waardevol wordt gevonden – niet alleen door gebruikers of Google.
Conclusie: de gevolgen van het gelezen (of genegeerd) worden door AI
Dit rapport benadrukt een fundamentele verschuiving in de manier waarop informatie online beschikbaar komt: AI-modellen halen content niet alleen op, maar cureren deze ook selectief. En die curatie herdefinieert zichtbaarheid in het digitale tijdperk.
Voor uitgevers, onderzoekers en merken betekent geciteerd worden door AI dat je deel uitmaakt van de volgende generatie zoekmachines. Het brengt je content onder de aandacht van gebruikers die je website misschien nooit bezoeken, maar wel vertrouwen op het model dat ernaar verwijst. De bronnen die geciteerd worden, worden versterkt. Degenen die dat niet doen, lopen het risico volledig buiten de discussie te worden gesloten – ongeacht de kwaliteit.
Deze verschuiving creëert nieuwe winnaars en verliezers. Topmedia en actuele, verdiende media krijgen de voorkeur. Betaalde content, licht bijgewerkte blogs of minder gevestigde stemmen blijven daarentegen vaak ongelezen – niet alleen door mensen, maar ook door de systemen die bepalen wat mensen zien.
As generatieve AI blijft een centrale rol spelen in de manier waarop kennis wordt overgedragen, gaat het steeds minder om hoe je scoort in zoekmachines en steeds meer om: hoe word je onderdeel van wat AI de moeite waard vindt om te citeren?