Звіти

Що таке читання за допомогою штучного інтелекту? Прихований механізм генеративних цитат

опублікований Липень 24, 2025

Антуан Тардіф, Генеральний директор та засновник Unite.AI

Оскільки генеративний штучний інтелект змінює цифровий ландшафт, у центрі створення та відкриття контенту виникає нове питання: що саме читає штучний інтелект? Новаторське дослідження під назвою Що таке ШІ-читання від Генеративний імпульс аналізував Muck Rack понад 1 мільйон цитат з основних систем штучного інтелекту, включаючи ChatGPT (4o та 4o-mini) від OpenAI, Gemini (Flash та Pro) від Google та Claude (Sonnet та Haiku) від Anthropic, щоб розкрити приховану динаміку зв'язків, які ці моделі використовують під час генерації відповідей.

Ці висновки є не лише показовими, а й трансформаційними для будь-кого, хто займається журналістикою, корпоративними комунікаціями, SEO чи бренд-стратегією.

Цитати — це не просто доповнення, вони змінюють поведінку штучного інтелекту

Як очевидно кожному, хто занурений у світ штучного інтелекту, просте ввімкнення або вимкнення функції цитування змінює самі відповідіКоли цитування вимкнено, штучний інтелект більше покладається на статичні навчальні дані. Але коли цитування ввімкнено, моделі генерують суттєво інші результати, безпосередньо сформовані джерелами в режимі реального часу, з яких вони отримують дані.

Ключовий прикладНа запитання про найгіршу команду Головної бейсбольної ліги штучний інтелект без цитування згадав «Метс» 1962 року. Але з увімкненим цитуванням відповідь оновив, включивши 2024 Чикаго Уайт Сокс з рекордним сезоном 41–121 — прямо посилаючись на CBS Sports.

Домінування зароблених медіа

більше 95% усіх цитованих джерел прибути з неоплачений медіа. Це включає:

27% журналістський контент (наприклад, Reuters, AP, Financial Times)
18% урядові/неурядові сайти
13% академічні або дослідницькі джерела
10% агрегаторні/енциклопедичні платформи, такі як Вікіпедія або Visual Capitalist

На відміну від, платний або рекламний контент становить менше 5% цитувань, що чітко показує, що моделі ШІ систематично упереджені проти маркетингово-орієнтований контент.

Упередженість новизни: чому перемагає новий контент

Свіжість має значення, особливо для моделей OpenAI. У журналістському контенті, 56% цитувань, зроблених ChatGPT, були опубліковані протягом останніх 12 місяців., у порівнянні з 36% для КлодаЦя тенденція, відома як упередження новизни, стосується переваги новіших, нещодавно опублікованих джерел над старішими, навіть коли старіші джерела можуть бути точними або актуальними.

У контексті генеративного штучного інтелекту упередженість новизни означає, що мовні моделі, особливо ті, що на зразок ChatGPT, що підключені до даних у режимі реального часу, з більшою ймовірністю посилатимуться на нещодавно опубліковані матеріали та довірятимуть їм, зокрема під час відповіді на запити, що стосуються поточних подій, нових технологій або змін у політиці. Для запитів, чутливих до часу, таких як «останні досягнення в амбулаторному лікуванні» або «останні інновації в звукозаписі», модель надає значну вагу контенту, опублікованому за останні кілька місяців, припускаючи, що він містить більш релевантну або оновлену інформацію.

Це критично важлива ідея для творців контенту та бренд-стратегів: якщо ваш матеріал застарів — навіть на рік — він значно менш імовірно з’явиться у відповідях, згенерованих штучним інтелектом. Підтримувати актуальність контенту — це не просто добре. SEO— це важливо для видимості в епоху штучного інтелекту.

Різні спонукання запускають різні джерела

Моделі штучного інтелекту не цитують джерела випадковим чином — вони вибирають на основі типу питання, що ставиться. Різні стилі підказок призводять до різних типів посилань на джерела:

Пошук фактів та енциклопедичні запити схильні черпати інформацію зі статичних сайтів-посилань, таких як Вікіпедія та Британіка, спираючись на добре встановлену, але часто старішу інформацію.
Запитання щодо нещодавніх подій зазвичай викликають цитування з боку великих редакцій, таких як AP, Reutersабо Axios, де швидкість та актуальність є ключовими.
Запити на пораду або звернення за думкою змістити модель у бік більш динамічних та розмовних джерел, таких як блоги, форуми чи платформи, такі як Reddit or Medium.
Академічні або дослідницькі завдання спонукати штучний інтелект цитувати матеріали з журналів, серверів препринтів, таких як ArXivабо державні репозиторії, такі як PubMed or NCBI.
Запити на творчість або покрокові інструкції часто висвітлюють контент, створений користувачами, неформальні інструкції або теми для обговорення у спільноті з таких платформ, як Quora або нішеві технологічні форуми.

Ця варіація означає, що спосіб формулювання питання може мати прямий вплив на те, які сфери підвищуються, а які залишаються позаду.

Наприклад, Клод набагато рідше цитує такі великі видання, як Reuters, ніж ChatGPT чи Gemini, посилаючись на Reuters. У 50 разів рідше, ніж ChatGPT.

Авторитет і сфера діяльності мають значення, але не однаково

Хоча домінують авторитетні ЗМІ, вони не єдині гравці. 15% найчастіше цитованих джерел з'являються в топ-10 у багатьох галузях. Це означає, що нішевий контент винагороджується. Наприклад:

In Фінансові установи, джерела, такі як Банкрат та NerdWallet надають перевагу.
In Охорона здоров'я, урядові джерела, такі як CDC.gov та NIH.gov домінувати.
In Технологія, навчальні платформи, такі як Udemy, Coursera та Medium піднятися на вершину.

On 15 сторінка, візуальна теплова карта показує, що Клод демонструє найбільшу різноманітність, специфічну для певної галузі, часто обираючи унікальні для галузі джерела, тоді як ChatGPT та Gemini схильні більше покладатися на універсальні медіа.

Галузеві аналітичні дані: що цитує ШІ за секторами

Фінанси та страхування

Журналістика становить 37% цитування, більше, ніж у будь-якій іншій галузі.
10 найкращих джерел Клода 90% унікальність, що свідчить про глибше дослідження ніші.

Охорона здоров'я

Урядові та неурядові сайти цитуються у 18% випадків, що більш ніж удвічі перевищує середній показник по галузі.
Gemini лідирує за різноманітністю джерел у цьому секторі.

Подорожі/Авіакомпанії

Дивно, академічні цитати майже відсутні (лише 0.7%).
Джерела як FAA.gov та IATA.org домінують, з меншою залежністю від новинних агентств.

Роздрібна торгівля та електронна комерція

Агрегатори, такі як Вікіпедія, цитуються рідше тут, ніж в інших галузях (36% проти 28%).
Клод цитує найнішевіший контент.

Медіа / Розваги

Журналістика знову лідирує з 37%, з нішевими платформами, такими як TVTechnology та Радіокінг часто цитується Клодом.

Технологія

Практично не використовуються енциклопедичні чи академічні джерела.
Платформи подібні Medium, Coursera та Розсада Соціальна виступають помітно, відображаючи схильність до знання, що базуються на досвіді практиків.

Наслідки для команд комунікацій та SEO

Результати цього звіту показують, що Generative Engine Optimization (GEO) стає таким же важливим, як і традиційне SEO. Штучний інтелект не просто підсумовує статичні бази даних, а активне посилання на джерела в режимі реального часуА на ці посилання впливає:

ПорядністьРегулярно оновлюйте свій контент.
Адміністрація доменуСтворюйте зворотні посилання та довіру.
Відповідність нішіСтворюйте контент, адаптований до вашої галузі, а не лише на загальні теми.
Тип вмістуЗосередьтеся на зароблених медіафайлах та інформативному контенті, а не на суто маркетингових сторінках.

Це змінює підхід контент-маркетологів, фахівців з зв’язків із громадськістю та видавців. Якщо ваша мета — з’являтися у результатах пошуку, створених штучним інтелектом, ви повинні створювати контент, який ШІ вважатиме цінним, а не лише користувачі чи Google.

Висновок: Наслідки того, що вас читає (або ігнорує) штучний інтелект

Цей звіт підкреслює фундаментальну зміну в тому, як інформація відображається в Інтернеті: моделі штучного інтелекту не просто отримують контент, а вибірково його курують. І ця курація переосмислює видимість у цифрову епоху.

Для видавців, дослідників та брендів цитування ШІ означає бути частиною наступного покоління пошуку. Це розміщує ваш контент перед користувачами, які можуть ніколи не відвідати ваш сайт, але довіряти моделі, яка на нього посилається. Джерела, які цитуються, посилюються. Ті, які цього не роблять — незалежно від якості — ризикують бути повністю виключеними з розмови.

Цей зсув створює нових переможців і переможених. Перевага надається авторитетним виданням та своєчасним, заслуженим ЗМІ. Тим часом платний контент, блоги з незначним оновленням або менш усталені голоси часто залишаються непрочитаними — не лише людьми, а й системами, які формують те, що бачать люди.

As генеративний ШІ продовжує відігравати центральну роль у тому, як доставляються знання, ключове питання стає не стільки про те, як ранжуватися в пошуку, скільки про те, як стати частиною того, що ШІ вважає вартим цитування?

Схожі теми:звіти

Вгору Далі

Коли кількість персоналу має значення: як інвестори оцінюють масштаб та історію буму штучного інтелекту

Не пропустіть

Стан стійкості кібербезпеки 2025: Як організації повинні адаптуватися до ландшафту загроз, зумовлених штучним інтелектом

Антуан Тардіф

Антуан — далекоглядний лідер і партнер-засновник Unite.AI, керований непохитною пристрастю до формування та просування майбутнього ШІ та робототехніки. Будучи серійним підприємцем, він вірить, що штучний інтелект буде таким же руйнівним для суспільства, як електрика, і його часто ловлять на захопленні потенціалом революційних технологій і AGI.

Як футурист, він присвячений дослідженню того, як ці інновації впливатимуть на наш світ. Крім того, він є засновником Securities.io, платформа, орієнтована на інвестиції в передові технології, які переосмислюють майбутнє та змінюють цілі сектори.

Об'єднуйтесь.AI