Raporty
Co to jest czytanie AI? Wewnętrzne mechanizmy ukryte generatywnych cytowań

Podczas gdy generatywna sztuczna inteligencja zmienia krajobraz cyfrowy, pojawia się nowe pytanie w centrum tworzenia i odkrywania treści: Co dokładnie czyta AI? Przełomowe badanie zatytułowane Co czyta AI z Generative Pulse przez Muck Rack analizowało ponad 1 milion cytowań z głównych systemów AI, w tym OpenAI’s ChatGPT (4o i 4o-mini), Google’s Gemini (Flash i Pro) oraz Anthropic’s Claude (Sonnet i Haiku), aby odkryć ukryte dynamiki za linkami, których używają te modele podczas generowania odpowiedzi.
Wyniki nie tylko są ujawniające, ale także przełomowe dla każdego w dziedzinie dziennikarstwa, komunikacji korporacyjnej, SEO lub strategii marki.
Cytowania nie są tylko dodatkami – zmieniają zachowanie AI
Jak jest oczywiste dla każdego, kto jest zanurzony w świecie AI, po prostu włączanie lub wyłączanie funkcjonalności cytowań zmienia same odpowiedzi. Gdy cytowania są wyłączone, AI opiera się bardziej na statycznych danych szkoleniowych. Ale gdy cytowania są włączone, modele generują materialnie różne dane wyjściowe, bezpośrednio ukształtowane przez źródła w czasie rzeczywistym, z których czerpią.
Kluczowy przykład: Zapytany o najgorszą drużynę baseballową, AI z wyłączonymi cytowaniami wymienił drużynę z 1962 roku Mets. Ale z włączonymi cytowaniami, odpowiedź została zaktualizowana, aby uwzględnić 2024 Chicago White Sox z rekordowym sezonem 41-121, cytując CBS Sports.
Dominacja mediów zarobionych
Ponad 95% wszystkich cytowanych źródeł pochodzi z niepłatnych mediów. Obejmuje to:
- 27% treści dziennikarskich (np. Reuters, AP, Financial Times)
- 18% stron rządowych/organizacji pozarządowych
- 13% źródeł akademickich lub badawczych
- 10% platform agregujących/encyklopedycznych, takich jak Wikipedia lub Visual Capitalist
W przeciwieństwie do tego, płatne lub reklamowe treści stanowią mniej niż 5% cytowań, co wskazuje, że modele AI są systematycznie przekrzywione przeciwko treściom marketingowym.
Sesja z uwzględnieniem nowości: Dlaczego nowe treści wygrywają
Świeżość ma znaczenie – szczególnie dla modeli OpenAI. W treściach dziennikarskich 56% cytowań wykonanych przez ChatGPT zostało opublikowanych w ciągu ostatnich 12 miesięcy, w porównaniu z 36% dla Claude. Ta tendencja, znana jako sesja z uwzględnieniem nowości, odnosi się do preferencji dla nowszych, bardziej niedawno opublikowanych źródeł nad starszymi, nawet gdy starsze źródła mogą nadal być dokładne lub istotne.
W kontekście generatywnej AI, sesja z uwzględnieniem nowości oznacza, że modele językowe – szczególnie te, które są połączone z danymi w czasie rzeczywistym, takie jak ChatGPT – są bardziej skłonne odnosić się do i ufać nowo opublikowanym materiałom, szczególnie przy odpowiedziach na zapytania dotyczące bieżących wydarzeń, nowych technologii lub zmian politycznych. Dla czasochłonnych podpowiedzi, takich jak „najnowsze postępy w leczeniu ambulatoryjnym” lub „najnowsze innowacje w nagraniach dźwiękowych”, model silnie waży treści, które zostały opublikowane w ciągu ostatnich kilku miesięcy, zakładając, że zawierają one bardziej istotne lub zaktualizowane spostrzeżenia.
Jest to krytyczne spostrzeżenie dla twórców treści i strategów marki: jeśli Wasze materiały są przestarzałe – nawet o rok – jest znacznie mniej prawdopodobne, że pojawią się one w odpowiedziach generowanych przez AI. Utrzymywanie świeżości treści nie jest tylko dobrym SEO – jest to niezbędne do widoczności w erze AI.
Różne podpowiedzi wyzwalają różne źródła
Modele AI nie cytują źródeł losowo – wybierają na podstawie rodzaju zadawanego pytania. Różne style podpowiedzi prowadzą do różnych typów cytowanych źródeł:
- Wyszukiwanie faktów i zapytania encyklopedyczne tendencję do czerpania ze statycznych stron referencyjnych, takich jak Wikipedia i Britannica, opierając się na dobrze ugruntowanej, ale często starszej informacji.
- Pytania o niedawne wydarzenia zwykle wyzwalają cytowania z głównych redakcji, takich jak AP, Reuters lub Axios, gdzie szybkość i nowość są kluczowe.
- Podpowiedzi dotyczące porad lub opinii przesuwają model w kierunku bardziej dynamicznych i konwersacyjnych źródeł, takich jak blogi, fora lub platformy, takie jak Reddit lub Medium.
- Zadania akademickie lub badawcze prowadzą AI do cytowania z czasopism, serwerów preprintowych, takich jak arXiv, lub rządowych repozytoriów, takich jak PubMed lub NCBI.
- Kreatywne żądania lub instrukcje krok po kroku często ujawniają treści generowane przez użytkowników, nieformalne instrukcje lub wątki dyskusji z platform, takich jak Quora lub niszowe fora techniczne.
To zróżnicowanie oznacza, że sposób, w jaki pytanie jest sformułowane, może mieć bezpośredni wpływ na to, które domeny są podnoszone – a które są pomijane.
Claude, na przykład, jest znacznie mniej skłonny do cytowania głównych wydawnictw, takich jak Reuters, cytując Reuters 50 razy rzadziej niż ChatGPT.
Autorytet i domena mają znaczenie – ale nie jednolicie
Podczas gdy wysoko autorytatywne wydawnictwa dominują, nie są one jedynymi graczami. Tylko 15% najczęściej cytowanych źródeł pojawia się w pierwszej dziesiątce w wielu branżach. Oznacza to, że treści specyficzne dla niszy są nagradzane. Na przykład:
- W finansach, źródła, takie jak Bankrate i NerdWallet, są faworyzowane.
- W opiece zdrowotnej, rządowe źródła, takie jak CDC.gov i NIH.gov, dominują.
- W technologii, platformy edukacyjne, takie jak Udemy, Coursera i Medium, wznoszą się na szczyt.
Na stronie 15 znajduje się mapa cieplna, która pokazuje, że Claude wykazuje największe zróżnicowanie specyficzne dla domeny, często wybierając źródła unikalne dla branży, podczas gdy ChatGPT i Gemini tendencję do polegania bardziej na ogólnych mediach.
Wgląd branżowy: Co AI cytuję według sektora
Finanse i ubezpieczenia
- Dziennikarstwo stanowi 37% cytowań, więcej niż jakakolwiek inna branża.
- Dziesięć najlepszych źródeł Claude jest 90% unikalnych, co wskazuje na głębsze eksplorowanie niszy.
Ochrona zdrowia
- Strony rządowe i organizacji pozarządowych są cytowane 18% czasu, więcej niż dwa razy więcej niż przeciętnie w całej branży.
- Gemini prowadzi w różnorodności źródeł w tej branży.
Podróże/Linie lotnicze
- Zaskakująco, cytowania akademickie są prawie nieobecne (tylko 0,7%).
- Źródła, takie jak FAA.gov i IATA.org, dominują, z mniejszym poleganiem na wydawnictwach prasowych.
Detal handlowy i e-commerce
- Agregatory, takie jak Wikipedia, są mniej cytowane tutaj niż w innych branżach (36% vs 28%).
- Claude cytuję najwięcej treści niszowych.
Media/Rozrywka
-
Dziennikarstwo ponownie prowadzi z 37%, z niszowymi platformami, takimi jak TVTechnology i Radioking, cytowanymi często przez Claude.
Technologia
- Prawie nie ma źródeł encyklopedycznych ani akademickich.
- Platformy, takie jak Medium, Coursera i SproutSocial, pojawiają się wyraźnie, odzwierciedlając tendencję ku wiedzy opartej na praktykach.
Wnioski dla zespołów komunikacji i SEO
Wyniki tego raportu ujawniają, że Optymalizacja silnika generatywnego (GEO) staje się równie ważna, jak tradycyjna optymalizacja SEO. AI nie tylko podsumowuje statyczne bazy danych – aktywnie łączy się z źródłami w czasie rzeczywistym. A te połączenia są wpływane przez:
- Nowość: Aktualizuj swoją treść regularnie.
- Autorytet domeny: Buduj odniesienia i zaufanie.
- Relewantność niszy: Twórz treści dostosowane do Twojej branży, a nie tylko ogólne tematy.
- Rodzaj treści: Skoncentruj się na zarobionych mediach i treściach informacyjnych, a nie tylko na stronach marketingowych.
To zmienia równanie dla marketerów treści, specjalistów od PR i wydawców. Jeśli Twoim celem jest pojawienie się w wynikach generowanych przez AI, musisz tworzyć treści, które AI uważa za wartościowe – nie tylko użytkowników lub Google.
Podsumowanie: Konsekwencje bycia czytanym (lub zignorowanym) przez AI
Ten raport podkreśla fundamentalną zmianę w sposobie, w jaki informacje są prezentowane online: modele AI nie tylko pobierają treści – wybiórczo je kurują. A to kuracja zmienia widoczność w erze cyfrowej.
Dla wydawców, badaczy i marek, cytowanie przez AI oznacza bycie częścią następnej generacji wyszukiwania. Umieszcza Twoją treść przed użytkownikami, którzy mogą nie odwiedzić Twojej strony, ale ufają modelowi, który ją cytuję. Źródła, które są cytowane, są wzmocnione. Te, które nie – niezależnie od jakości – ryzykują wykluczeniem z rozmowy w ogóle.
Ta zmiana tworzy nowych zwycięzców i przegranych. Wysoko autorytatywne wydawnictwa i terminowe, zarobione media są faworyzowane. Tymczasem płatne treści, słabo aktualizowane blogi lub mniej ugruntowane głosy często pozostają nieprzeczytane – nie tylko przez ludzi, ale przez systemy, które kształtują to, co ludzie widzą.
Podczas gdy generatywna AI nadal odgrywa centralną rolę w tym, jak wiedza jest dostarczana, kluczowe pytanie staje się mniej dotyczące tego, jak zająć pierwsze miejsce w wyszukiwarce, a bardziej: Jak stać się częścią tego, co AI uważa za warte cytowania?












