Raporty
Czym jest czytanie AI? Ukryte mechanizmy cytowań generatywnych

W miarę jak generatywna sztuczna inteligencja zmienia cyfrowy krajobraz, pojawia się nowe pytanie w centrum tworzenia i odkrywania treści: Czym właściwie jest czytanie przez sztuczną inteligencję? Przełomowe badanie zatytułowane Czym jest czytanie AI od Impuls generatywny przez Muck Rack przeanalizowano ponad 1 milion cytowań z głównych systemów AI — w tym ChatGPT firmy OpenAI (4o i 4o-mini), Gemini firmy Google (Flash i Pro) oraz Claude firmy Anthropic (Sonnet i Haiku) — aby odkryć ukrytą dynamikę stojącą za powiązaniami, których te modele używają podczas generowania odpowiedzi.
Wyniki badań są nie tylko odkrywcze, ale i transformacyjne dla każdego, kto zajmuje się dziennikarstwem, komunikacją korporacyjną, SEO lub strategią marki.
Cytaty to nie tylko dodatki – zmieniają zachowanie sztucznej inteligencji
Jak jest oczywiste dla każdego, kto jest zanurzony w świecie sztucznej inteligencji, samo włączenie lub wyłączenie funkcji cytowania zmienia same odpowiedziGdy cytowania są wyłączone, sztuczne inteligencje w większym stopniu opierają się na statycznych danych treningowych. Jednak po włączeniu cytowań modele generują istotnie różne wyniki, bezpośrednio kształtowane przez źródła danych w czasie rzeczywistym, z których czerpią.
Kluczowy przykładZapytana o najgorszą drużynę Major League Baseball, sztuczna inteligencja z wyłączonym systemem cytowania wymieniła Mets z 1962 roku. Jednak po włączeniu systemu cytowania zaktualizowała odpowiedź, dodając Chicago White Sox 2024 z rekordowym sezonem 41–121 — wyraźnie cytując CBS Sports.
Dominacja mediów zarobkowych
O 95% wszystkich cytowanych źródeł pochodzić z bezpłatne media. Obejmuje to:
- 27% treści dziennikarskie (np. Reuters, AP, Financial Times)
- 18% strony rządowe/organizacji pozarządowych
- 13% źródła akademickie lub badawcze
- 10% platformy agregatorskie/encyklopedyczne, takie jak Wikipedia czy Visual Capitalist
Natomiast treści płatne lub reklamowe stanowią mniej niż 5% cytowań, co jasno pokazuje, że modele sztucznej inteligencji są systematycznie stronnicze przed treści oparte na marketingu.
Błąd świeżości: dlaczego nowe treści wygrywają
Świeżość ma znaczenie – szczególnie w przypadku modeli OpenAI. W treściach dziennikarskich, 56% cytowań w serwisie ChatGPT opublikowano w ciągu ostatnich 12 miesięcy, w porównaniu do 36% dla Claude'aTa tendencja, znana jako błąd świeżości, polega na preferowaniu nowszych, niedawno opublikowanych źródeł nad starszymi, nawet jeśli starsze źródła mogą być nadal dokładne lub istotne.
W kontekście generatywnej sztucznej inteligencji, błąd świeżości oznacza, że modele językowe – zwłaszcza te, takie jak ChatGPT, które są połączone z danymi w czasie rzeczywistym – chętniej odwołują się do nowo opublikowanych materiałów i ufają im, zwłaszcza odpowiadając na pytania dotyczące bieżących wydarzeń, nowych technologii lub zmian w polityce. W przypadku pytań o charakterze czasowym, takich jak „najnowsze osiągnięcia w leczeniu ambulatoryjnym” lub „najnowsze innowacje w nagrywaniu dźwięku”, model przywiązuje dużą wagę do treści opublikowanych w ciągu ostatnich kilku miesięcy, zakładając, że zawierają one bardziej istotne lub aktualne spostrzeżenia.
To kluczowa informacja dla twórców treści i strategów marki: jeśli Twój materiał jest nieaktualny – nawet o rok – znacznie rzadziej pojawia się w odpowiedziach generowanych przez sztuczną inteligencję. Utrzymywanie świeżości treści to nie tylko dobry pomysł. SEO—jest to niezbędne dla zapewnienia widoczności w erze sztucznej inteligencji.
Różne monity wyzwalają różne źródła
Modele sztucznej inteligencji nie cytują źródeł losowo – wybierają je na podstawie rodzaju zadanego pytania. Różne style podpowiedzi prowadzą do różnych typów cytowanych źródeł:
- Wyszukiwanie faktów i zapytania encyklopedyczne mają tendencję do czerpania ze statycznych witryn referencyjnych, takich jak Wikipedia oraz Brytyjski, opierając się na powszechnie znanych, ale często starszych informacjach.
- Ostatnie pytania dotyczące wydarzeń zwykle wywołują cytowania z głównych redakcji, takich jak AP, Reuterslub Axios, gdzie szybkość i aktualność mają kluczowe znaczenie.
- Porady lub zachęty do wyrażania opinii przesunąć model w stronę bardziej dynamicznych i konwersacyjnych źródeł, takich jak blogi, fora lub platformy, takie jak Reddit or Średni.
- Zadania o charakterze akademickim lub badawczym prowadzić sztuczną inteligencję do cytowania z czasopism i serwerów preprintów, takich jak arXivlub repozytoria wspierane przez rząd, takie jak PubMed or NCBI.
- Prośby kreatywne lub instrukcje krok po kroku często prezentują treści tworzone przez użytkowników, nieformalne poradniki lub wątki dyskusji społeczności z platform takich jak Quora lub niszowych forach technologicznych.
Taka zmiana oznacza, że sposób sformułowania pytania może mieć bezpośredni wpływ na to, które dziedziny zostaną podniesione, a które pominięte.
Na przykład Claude znacznie rzadziej powołuje się na duże media, takie jak Reuters, niż na ChatGPT czy Gemini, powołując się na Reuters 50x rzadziej niż ChatGPT.
Autorytet i domena mają znaczenie, ale nie zawsze
Choć dominują media o wysokim autorytecie, nie są one jedynymi graczami. Tylko 15% najczęściej cytowanych źródeł znaleźć się w pierwszej dziesiątce w wielu branżach. Oznacza to, że treści specyficzne dla danej niszy są nagradzane. Na przykład:
- In Finanse, źródła takie jak Stopa banku oraz NerdWallet są uprzywilejowane.
- In Zdrowie, źródła rządowe, takie jak CDC.gov oraz NIH.gov zdominować.
- In Technologia , platformy edukacyjne takie jak Udemy, Coursera, Średni wznieść się na szczyt.
On strona 15wizualna mapa cieplna pokazuje, że Claude wykazuje największą różnorodność w obrębie danej dziedziny, często wybierając źródła specyficzne dla danej branży, podczas gdy ChatGPT i Gemini w większym stopniu opierają się na mediach ogólnych.
Spostrzeżenia branżowe: Co cytuje sztuczna inteligencja w poszczególnych sektorach
Finanse i ubezpieczenia
- Dziennikarstwo stanowi 37% cytowań, więcej niż jakakolwiek inna branża.
- Dziesięć najlepszych źródeł Claude'a to: 90% unikalny, co wskazuje na głębszą eksplorację niszy.
Zdrowie
- Strony rządowe i organizacji pozarządowych są cytowane w 18% przypadków, ponad dwukrotnie więcej niż średnia międzybranżowa.
- Gemini jest liderem pod względem różnorodności źródeł w tym sektorze.
Podróże/Linie lotnicze
- Zaskakująco, cytaty naukowe są prawie nieobecne (tylko 0.7%).
- Źródła jak FAA.gov oraz IATA.org dominować, w mniejszym stopniu polegając na źródłach informacji.
Handel detaliczny i elektroniczny
- Agregatory takie jak Wikipedia są rzadziej cytowane tutaj niż w innych branżach (36% w porównaniu do 28%).
- Claude wymienia najbardziej niszowe treści.
Media / rozrywka
-
Dziennikarstwo ponownie na prowadzeniu z wynikiem 37%z niszowymi platformami takimi jak Technologia telewizyjna oraz Radioking często cytowane przez Claude'a.
Technologia
- Nie korzystano praktycznie ze źródeł encyklopedycznych ani akademickich.
- Platformy takie jak Średni, Coursera, SproutSpołeczne pojawiają się w widocznym miejscu, odzwierciedlając skłonność do wiedza oparta na praktyce.
Konsekwencje dla zespołów ds. komunikacji i SEO
Wyniki tego raportu ujawniają, że Generatywna optymalizacja silnika (GEO) staje się równie ważna, co tradycyjne SEO. Sztuczna inteligencja nie ogranicza się do podsumowania statycznych baz danych, ale aktywne łączenie się ze źródłami w czasie rzeczywistym. A na te powiązania wpływają:
- Niedawność: Regularnie aktualizuj swoją treść.
- Urząd lokalny:Buduj linki zwrotne i zaufanie.
- Znaczenie niszy:Twórz treści dostosowane do Twojej branży, a nie tylko do ogólnych tematów.
- Typ zawartości:Skup się na mediach społecznościowych i treściach informacyjnych, a nie na stronach czysto marketingowych.
To zmienia sposób myślenia marketerów treści, specjalistów ds. PR i wydawców. Jeśli Twoim celem jest pojawianie się w wynikach generowanych przez sztuczną inteligencję, musisz tworzyć treści, które AI uzna za wartościowe – nie tylko dla użytkowników czy Google.
Wnioski: Konsekwencje bycia czytanym (lub ignorowanym) przez sztuczną inteligencję
Raport ten uwypukla fundamentalną zmianę w sposobie udostępniania informacji w internecie: modele sztucznej inteligencji nie tylko pobierają treści, ale także je selektywnie selekcjonują. A ta selekcja na nowo definiuje widoczność w erze cyfrowej.
Dla wydawców, badaczy i marek bycie cytowanym przez sztuczną inteligencję oznacza bycie częścią nowej generacji wyszukiwania. Prezentuje ona Twoje treści użytkownikom, którzy mogą nigdy nie odwiedzić Twojej witryny, ale ufają modelowi, który je cytuje. Źródła, które są cytowane, są wzmacniane. Te, które tego nie robią – niezależnie od jakości – ryzykują całkowite wykluczenie z dyskusji.
Ta zmiana tworzy nowych zwycięzców i przegranych. Preferowane są media o wysokim autorytecie i aktualne, zyskowne media. Tymczasem płatne treści, lekko aktualizowane blogi czy mniej znane głosy często pozostają niezauważone – nie tylko przez ludzi, ale także przez systemy kształtujące to, co ludzie widzą.
As generatywna sztuczna inteligencja nadal odgrywa kluczową rolę w sposobie przekazywania wiedzy, kluczowym pytaniem staje się nie tyle to, jak znaleźć się w rankingu wyszukiwania, ile: Jak stać się częścią tego, co sztuczna inteligencja uznaje za warte cytowania?