Connect with us

Що таке читання ІІ? Всередині приховані механіки генеративних цитат

Звіти

Що таке читання ІІ? Всередині приховані механіки генеративних цитат

mm

Як генеративний ІІ змінює цифровий ландшафт, виникає нове питання в центрі створення та відкриття контенту: Що саме читає ІІ? Проривне дослідження під назвою Що читає ІІ від Generative Pulse від Muck Rack проаналізувало понад 1 мільйон цитат з основних систем ІІ, включаючи OpenAI’s ChatGPT (4o і 4o-mini), Google’s Gemini (Flash і Pro) та Anthropic’s Claude (Sonnet і Haiku), щоб розкрити приховані динаміки за посиланнями, які ці моделі використовують під час генерації відповідей.

Результати не тільки відкривають, але й трансформують усе для тих, хто займається журналістикою, корпоративними комунікаціями, SEO чи брендовою стратегією.

Цитати не просто додатки – вони змінюють поведінку ІІ

Як очевидно кожному, хто занурений у світ ІІ, просте увімкнення або вимкнення функціоналу цитування змінює самі відповіді. Коли цитати вимкнені, ІІ більше залежить від статичних навчальних даних. Але коли цитати увімкнені, моделі генерують суттєво різні виходи, які безпосередньо формуються реальними джерелами, з яких вони черпають інформацію.

Ключовий приклад: Коли запитують про найгіршу команду Головної ліги бейсболу, ІІ без цитат згадує команду 1962 року Mets. Але з увімкненими цитатами воно оновлює відповідь, включаючи Чикаго Вайт Сокс 2024 року з рекордним сезоном 41–121, явно цитуючи CBS Sports.

Домінування заслужених ЗМІ

Більше 95% усіх цитованих джерел походять з безоплатних ЗМІ. Це включає:

  • 27% журналістського контенту (наприклад, Reuters, AP, Financial Times)
  • 18% урядових/НУО сайтів
  • 13% академічних чи дослідницьких джерел
  • 10% агрегаторів/енциклопедичних платформ, таких як Вікіпедія чи Visual Capitalist

Натомість, платний чи рекламний контент складає менше 5% цитат, що робить очевидним, що моделі ІІ систематично налаштовані проти маркетингового контенту.

Предвзяте ставлення до новизни: Чому новий контент перемагає

Свіжість має значення – особливо для моделей OpenAI. У журналістському контенті 56% цитат, зроблених ChatGPT, були опубліковані протягом останніх 12 місяців, порівняно з 36% для Claude. Це схильність, відома як предвзяте ставлення до новизни, відноситься до переваги нових, недавно опублікованих джерел над старими, навіть якщо старі джерела можуть все ще бути точними чи актуальними.

У контексті генеративного ІІ предвзяте ставлення до новизни означає, що мовні моделі – особливо ті, які підключені до реального часу даних – більш схильні посилатися та довіряти недавно опублікованому матеріалу, особливо при відповідях на запити, пов’язані з поточними подіями, новими технологіями чи змінами політики. Для часочутливих запитів, таких як “останні досягнення в амбулаторному лікуванні” або “недавні інновації в звукозаписі”, модель сильно вагомить контент, який був опублікований за останні кілька місяців, припускаючи, що він несе більш актуальні чи оновлені знання.

Це критичний висновок для творців контенту та брендових стратегів: якщо ваш матеріал застарів – навіть за рік – він значно менше ймовірно з’явиться в odpovědях, згенерованих ІІ. Підтримання вашого контенту свіжим не тільки добре для SEO – це життєво важливо для видимості в епоху ІІ.

Різні запити активують різні джерела

Моделі ІІ не цитують джерела випадково – вони вибирають на основі типу запиту. Різні стилі запитів ведуть до різних типів джерел, на які посилаються:

  • Пошуки фактів та енциклопедичні запити схильні черпати з статичних сайтів довідників, таких як Вікіпедія та Британніка, спираючись на добре встановлену, але часто застарілі інформацію.
  • Запити щодо недавніх подій зазвичай активують цитати з великих інформаційних агентств, таких як AP, Рейтер або Axios, де швидкість та свіжість мають ключове значення.
  • Запити на поради чи пошук думок змушують модель перейти до більш динамічних та розмовних джерел, таких як блоги, форуми чи платформи, як Reddit або Medium.
  • Академічні чи дослідницькі завдання ведуть ІІ до цитування з журналів, серверів попередніх публікацій, таких як arXiv, або урядових репозиторіїв, таких як PubMed або NCBI.
  • Креативні запити чи інструкції з кроку до кроку часто викликають контент, створений користувачами, неформальні інструкції чи дискусійні нитки з платформ, таких як Quora або спеціалізовані технічні форуми.

Ця різноманітність означає, що спосіб формулювання питання може мати прямий вплив на те, які домени піднімаються, а які залишаються позаду.

Claude, наприклад, значно менше схильна цитувати великі видання, такі як Reuters, ніж ChatGPT або Gemini, цитуючи Reuters 50 разів менше, ніж ChatGPT.

Авторитет та домен мають значення – але не однаково

Хоча джерела з високим авторитетом домінують, вони не єдині гравці. Лише 15% найцитованіших джерел з’являються у першій десятці по декількох галузях. Це означає, що нішовий контент відзначається. Наприклад:

  • У фінансах джерела, такі як Bankrate та NerdWallet, віддаються перевагу.
  • У охороні здоров’я урядові джерела, такі як CDC.gov та NIH.gov, домінують.
  • У технологіях навчальні платформи, такі як Udemy, Coursera та Medium, піднімаються на вершину.

На сторінці 15 візуальна теплова карта показує, що Claude демонструє найбільш різноманітні галузі, часто вибираючи унікальні джерела для галузі, тоді як ChatGPT та Gemini схильні більше сприймати загальні ЗМІ.

Галузеві висновки: Що цитує ІІ за сектором

Фінанси та страхування

  • Журналістика складає 37% цитат, більше, ніж будь-яка інша галузь.
  • Перші десять джерел Claude 90% унікальні, вказуючи на глибше дослідження ніш.

Охорона здоров’я

  • Урядові та НУО сайти цитуються 18% часу, що більше ніж у два рази перевищує середній показник по галузях.
  • Gemini лідирує у різноманітності джерел для цього сектора.

Подорожі/Авіалінії

  • Дивно, що академічні цитати майже відсутні (лише 0,7%).
  • Джерела, такі як FAA.gov та IATA.org, домінують, з меншою залежністю від інформаційних агентств.

Роздрібна торгівля та електронна комерція

  • Агрегатори, такі як Вікіпедія, цитуються менше тут, ніж у інших галузях (36% проти 28%).
  • Claude цитує найбільш нішевий контент.

ЗМІ/Розваги

  • Журналістика знову лідирує на 37%, з нішевими платформами, такими як TVTechnology та Radioking, часто цитованими Claude.

Технології

  • Практично жодних енциклопедичних чи академічних джерел не використовується.
  • Платформи, такі як Medium, Coursera та SproutSocial, часто з’являються, відображаючи нахил до знань практиків.

Вплив на комунікації та команди SEO

Результати цього дослідження показують, що Генеративна оптимізація двигуна (GEO) стає такою ж важливою, як і традиційна SEO. ІІ не просто підсумовує статичні бази даних – воно активно посилається на джерела в реальному часі. І ці посилання впливаються на:

  • Свіжість: Оновлюйте свій контент регулярно.
  • Авторитет домену: Будуйте зворотні посилання та довіру.
  • Нішева актуальність: Створюйте контент, адаптований до вашої галузі, а не просто загальні теми.
  • Тип контенту: Зосереджуйтеся на заслужених ЗМІ та інформативному контенті, а не просто на маркетингових сторінках.

Це змінює розрахунок для маркетологів контенту, фахівців з PR та видавців. Якщо ваша мета – з’явитися в результатах, згенерованих ІІ, вам потрібно створити контент, який ІІ вважає цінним – не тільки користувачами чи Google.

Висновок: Наслідки читання (або ігнорування) ІІ

Це звіт підкреслює фундаментальну зміну того, як інформація представляється в Інтернеті: моделі ІІ не просто отримують контент – вони вибірково курирують його. І ця курирування переозначає видимість у цифрову епоху.

Для видавців, дослідників та брендів бути цитованим ІІ означає бути частиною наступного покоління пошуку. Це ставить ваш контент перед користувачами, які можуть ніколи не відвідувати ваш сайт, але довіряють моделі, яка посилається на нього. Джерела, які цитуються, посилюються. Ті, які ні – незалежно від якості – ризикують бути виключені з розмови зовсім.

Ця зміна створює нових переможців та переможених. Джерела з високим авторитетом та своєчасні, заслужені ЗМІ віддаються перевагу. Тим часом платний контент, слабо оновлювані блоги чи менш відомі голоси часто залишаються нечитаними – не тільки людьми, але й системами, які формують те, що люди бачать.

Як генеративний ІІ продовжує відігравати центральну роль у тому, як знання передаються, ключевим питанням стає менше про те, як зайняти місце у пошуку, а більше про: Як стати частиною того, що ІІ вважає вартим цитування?

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.