Spojte se s námi

zprávy

Co je čtení pomocí umělé inteligence? Skrytý mechanismus generativních citací

mm

Vzhledem k tomu, že generativní umělá inteligence přetváří digitální krajinu, vyvstává nová otázka v centru tvorby a objevování obsahu: Co přesně umělá inteligence čte? Průlomová studie s názvem Co je čtení s umělou inteligencí od Generativní puls analyzoval Muck Rack více než 1 milion citací z hlavních systémů umělé inteligence – včetně ChatGPT (4o a 4o-mini) od OpenAI, Gemini (Flash a Pro) od Googlu a Claude (Sonnet a Haiku) od Anthropic – s cílem odhalit skrytou dynamiku za odkazy, které tyto modely používají při generování odpovědí.

Zjištění jsou nejen odhalující, ale také transformativní pro kohokoli v oblasti žurnalistiky, firemní komunikace, SEO nebo brand strategie.

Citace nejsou jen doplňky – mění chování umělé inteligence

Jak je zřejmé každému, kdo se pohybuje ve světě umělé inteligence, pouhé povolení nebo zakázání funkce citace mění samotné odpovědiKdyž jsou citace vypnuté, umělá inteligence se více spoléhá na statická trénovací data. Když jsou však citace zapnuté, modely generují podstatně odlišné výstupy, které jsou přímo formovány zdroji v reálném čase, ze kterých čerpají.

Příklad klíčeNa otázku o nejhorším týmu Major League Baseball umělá inteligence s vypnutými citacemi zmínila Mets z roku 1962. Ale s citacemi zapnutými odpověď aktualizovala tak, aby zahrnovala 2024 Chicago White Sox s rekordní sezónou 41–121 – s výslovným odkazem CBS Sports.

Dominance získaných médií

Přes 95 % všech citovaných zdrojů pocházet z neplacené média. To zahrnuje:

  • 27% novinářský obsah (např. Reuters, AP, Financial Times)
  • 18% vládní/nevládní weby
  • 13% akademické nebo výzkumné zdroje
  • 10% agregátorské/encyklopedické platformy jako Wikipedie nebo Visual Capitalist

Naproti tomu placený nebo reklamní obsah tvoří méně než 5 % citací, což jasně ukazuje, že modely umělé inteligence jsou systematicky zkreslené proti marketingově zaměřený obsah.

Zkreslení aktuálnosti: Proč vítězí nový obsah

Na čerstvosti záleží – zejména u modelů OpenAI. V novinářském obsahu 56 % citací provedených ChatGPT bylo publikováno v posledních 12 měsících., ve srovnání s 36 % pro ClaudaTato tendence, známá jako zkreslení aktuálnosti, označuje preferenci novějších, nedávno publikovaných zdrojů před staršími, a to i v případě, že starší zdroje mohou být stále přesné nebo relevantní.

V kontextu generativní umělé inteligence znamená zkreslení aktuálnosti, že jazykové modely – zejména ty, jako je ChatGPT, které jsou propojeny s daty v reálném čase – s větší pravděpodobností odkazují na nově publikovaný materiál a důvěřují mu, a to zejména při odpovídání na dotazy týkající se aktuálního dění, nových technologií nebo změn politik. U časově citlivých otázek, jako jsou „nejnovější pokroky v ambulantní léčbě“ nebo „nedávné inovace v oblasti nahrávání zvuku“, model silně zvažuje obsah, který byl publikován v posledních několika měsících, za předpokladu, že obsahuje relevantnější nebo aktualizovanější poznatky.

Toto je klíčový poznatek pro tvůrce obsahu a stratégy značky: pokud je váš materiál zastaralý – byť jen o rok – je výrazně méně pravděpodobné, že se objeví v odpovědích generovaných umělou inteligencí. Udržovat obsah aktuální není jen dobré SEO—je to nezbytné pro viditelnost ve věku umělé inteligence.

Různé podněty spouštějí různé zdroje

Modely umělé inteligence necitují zdroje náhodně – vybírají je na základě typu kladené otázky. Různé styly výzev vedou k odkazům na různé typy zdrojů:

  • Vyhledávání faktů a encyklopedické dotazy mají tendenci čerpat ze statických referenčních webů, jako je Wikipedia si Britannica, opírající se o osvědčené, ale často starší informace.
  • Dotazy k nedávným událostem obvykle vyvolávají citace z velkých redakcí, jako například AP, Reutersnebo Axios, kde klíčová je rychlost a aktuálnost.
  • Výzvy k vyhledání rady nebo názoru posunout model směrem k dynamičtějším a konverzačním zdrojům, jako jsou blogy, fóra nebo platformy, jako je reddit or Střední.
  • Akademické nebo výzkumně orientované úkoly vést umělou inteligenci k citování z časopisů, preprintových serverů jako arXivnebo vládou podporované repozitáře, jako například PubMed or NCBI.
  • Kreativní požadavky nebo podrobné pokyny často se objevuje obsah generovaný uživateli, neformální návody nebo diskusní vlákna komunity z platforem jako Quora nebo specializovaná technologická fóra.

Tato variace znamená, že způsob formulace otázky může mít přímý vliv na to, které domény budou povýšeny – a které zůstanou pozadu.

Například Claude mnohem méně pravděpodobně cituje velké média jako Reuters než ChatGPT nebo Gemini, kteří citují Reuters. 50x méně často než ChatGPT.

Autorita a doména jsou důležité – ale ne jednotně

I když dominují vysoce autoritativní média, nejsou jedinými hráči. Pouze 15 % nejčastěji citovaných zdrojů objevují se v první desítce v různých odvětvích. To znamená, že obsah specifický pro danou oblast je odměňován. Například:

  • In Finance, zdroje jako Bankrate si NerdWallet jsou upřednostňovány.
  • In Zdravotní péče, vládní zdroje jako například CDC.gov si NIH.gov ovládat.
  • In Technika, vzdělávací platformy, jako např. Udemy, Coursera, a Střední stoupat na vrchol.

On 15 stránky, vizuální tepelná mapa ukazuje, že Claude vykazuje největší diverzitu specifickou pro danou oblast a často vybírá zdroje specifické pro dané odvětví, zatímco ChatGPT a Gemini se spíše spoléhají na obecná média.

Poznatky specifické pro dané odvětví: Co AI cituje podle odvětví

Finance a pojištění

  • Žurnalistika tvoří 37 % citací, více než v jakémkoli jiném odvětví.
  • Claudových 10 nejčastějších zdrojů je 90% jedinečný, což naznačuje hlubší průzkum specializované oblasti.

Zdravotní péče

  • Vládní a nevládní weby jsou citovány v 18 % případů., což je více než dvojnásobek průměru napříč odvětvími.
  • Gemini v tomto sektoru vede v diverzifikaci zdrojů.

Cestování/Letecká doprava

  • Překvapivě, akademické citace téměř chybí (pouze 0.7 %).
  • Zdroje jako FAA.gov si IATA.org dominují s menší závislostí na zpravodajských médiích.

Maloobchod a elektronický obchod

  • Agregátory jako Wikipedie jsou méně citovány zde než v jiných odvětvích (36 % oproti 28 %).
  • Claude cituje nejspecifičtější obsah.

Média / zábava

  • Žurnalistika opět vede s 37 %, s úzkými platformami jako TVTechnologie si Rádiový král často citováno Claudem.

Technika

  • Nejsou použity prakticky žádné encyklopedické ani akademické zdroje.
  • Platformy jako Střední, Coursera, a SproutSociální objevují se prominentně, což odráží sklon k znalosti založené na praxi.

Důsledky pro komunikační a SEO týmy

Zjištění této zprávy ukazují, že Generativní optimalizace motoru (GEO) se stává stejně důležitým jako tradiční SEO. Umělá inteligence nejen shrnuje statické databáze – je aktivně propojovat se zdroji v reálném časeA tyto odkazy jsou ovlivněny:

  • AktuálnostPravidelně aktualizujte svůj obsah.
  • Autorita doményBudujte zpětné odkazy a důvěru.
  • Specifická relevanceVytvářejte obsah přizpůsobený vašemu oboru, ne jen obecným tématům.
  • Typ obsahuZaměřte se spíše na získaná média a informativní obsah než na čistě marketingové stránky.

To mění kalkul pro obsahové marketéry, PR profesionály a vydavatele. Pokud je vaším cílem objevit se ve výsledcích generovaných umělou inteligencí, musíte vytvářet obsah, který umělá inteligence považuje za hodnotný – nejen pro uživatele nebo Google.

Závěr: Důsledky čtení (nebo ignorování) umělou inteligencí

Tato zpráva zdůrazňuje zásadní posun ve způsobu, jakým se informace zobrazují online: modely umělé inteligence nejen vyhledávají obsah – selektivně jej kurují. A tato kurace nově definuje viditelnost v digitálním věku.

Pro vydavatele, výzkumníky a značky znamená být citován umělou inteligencí být součástí vyhledávání nové generace. Díky tomu se váš obsah dostane k uživatelům, kteří váš web možná nikdy nenavštíví, ale důvěřují modelu, který na něj odkazuje. Zdroje, které jsou citovány, jsou zesíleny. Ty, které nebudou – bez ohledu na kvalitu – riskují, že budou z diskuse zcela vyloučeny.

Tato změna vytváří nové vítěze a poražené. Upřednostňují se vysoce autoritativní média a aktuální, zasloužená média. Placený obsah, lehce aktualizované blogy nebo méně zavedené hlasy mezitím často zůstávají nepřečtené – nejen lidmi, ale i systémy, které formují to, co lidé vidí.

As generativní AI I když umělá inteligence nadále hraje ústřední roli v tom, jak jsou znalosti poskytovány, klíčová otázka se stává méně zaměřenou na to, jak se umístit ve vyhledávání, a spíše na to, jak se stát součástí toho, co umělá inteligence považuje za hodné citace?

Antoine je vizionářský vůdce a zakládající partner Unite.AI, poháněný neochvějnou vášní pro utváření a prosazování budoucnosti umělé inteligence a robotiky. Je sériovým podnikatelem a věří, že umělá inteligence bude pro společnost stejně rušivá jako elektřina, a často je přistižen při blouznění o potenciálu převratných technologií a AGI.

Jako futurista, věnuje se zkoumání toho, jak tyto inovace utvářejí náš svět. Kromě toho je zakladatelem Cenné papíry.io, platforma zaměřená na investice do špičkových technologií, které nově definují budoucnost a přetvářejí celé sektory.