Свяжитесь с нами:

Что читает ИИ? Скрытая механика генеративного цитирования

Согласно отчетам

Что читает ИИ? Скрытая механика генеративного цитирования

mm

По мере того, как генеративный ИИ меняет цифровой ландшафт, в центре создания и поиска контента возникает новый вопрос: что именно ИИ читает? Новаторское исследование под названием Что такое ИИ-чтение от Генеративный импульс Muck Rack проанализировал более 1 миллион цитирований из основных систем искусственного интеллекта, включая ChatGPT от OpenAI (4o и 4o-mini), Gemini от Google (Flash и Pro) и Claude от Anthropic (Sonnet и Haiku), чтобы раскрыть скрытую динамику связей, которые эти модели используют при генерации ответов.

Результаты исследования не только показательны, но и имеют преобразующее значение для всех, кто работает в сфере журналистики, корпоративных коммуникаций, SEO или бренд-стратегии.

Цитаты — это не просто дополнения, они меняют поведение ИИ

Как очевидно любому, кто погружен в мир ИИ, простое включение или выключение функции цитирования меняет сами ответыПри отключенном цитировании ИИ в большей степени полагаются на статические данные для обучения. Но при включении цитирования модели генерируют существенно иные результаты, напрямую зависящие от источников данных в режиме реального времени, из которых они черпают информацию.

Ключевой пример: На вопрос о худшей команде Главной лиги бейсбола искусственный интеллект с отключенной функцией напоминания упомянул «Метс» 1962 года. Но с включенной функцией напоминания он обновил ответ, включив в него 2024 Чикаго Уайт Сокс с рекордным сезоном 41–121 — явно ссылаясь CBS Sports.

Господство заработанных медиа

Более 95% всех цитируемых источников родом из неоплачиваемый СМИ. Сюда входят:

  • 27%. журналистский контент (например, Reuters, AP, Financial Times)
  • 18%. сайты правительства/НПО
  • 13%. академические или исследовательские источники
  • 10%. Агрегаторы/энциклопедические платформы, такие как Wikipedia или Visual Capitalist

С другой стороны, платный или рекламный контент составляет менее 5% цитирований, что ясно показывает, что модели ИИ систематически предвзяты против которого выступает большинство исследователей в области общественного здравоохранения. маркетингово-ориентированный контент.

Ошибка новизны: почему новый контент побеждает

Актуальность важна, особенно для моделей OpenAI. В журналистском контенте 56% ссылок ChatGPT были опубликованы в течение последних 12 месяцев., по сравнению с 36% за КлодаЭта тенденция, известная как смещение в сторону новизны, подразумевает предпочтение новых, недавно опубликованных источников старым, даже если старые источники по-прежнему могут быть точными или актуальными.

В контексте генеративного ИИ смещение новизны означает, что языковые модели, особенно такие, как ChatGPT, которые подключены к данным в режиме реального времени, с большей вероятностью будут ссылаться на недавно опубликованные материалы и доверять им, особенно при ответе на запросы, связанные с текущими событиями, новыми технологиями или изменениями в политике. Для запросов, срочных по времени, таких как «последние достижения в амбулаторном лечении» или «последние инновации в области звукозаписи», модель в значительной степени учитывает контент, опубликованный за последние несколько месяцев, предполагая, что он содержит более релевантную или актуальную информацию.

Это критически важный вывод для создателей контента и бренд-стратегов: если ваш материал устарел — даже на год, — вероятность его появления в результатах поиска, генерируемых ИИ, значительно снижается. Поддержание актуальности контента — это не просто хорошее качество. SEO— это важно для видимости в эпоху искусственного интеллекта.

Разные подсказки запускают разные источники

Модели искусственного интеллекта не цитируют источники случайным образом — они выбирают их в зависимости от типа задаваемого вопроса. Разные стили подсказок приводят к разным типам ссылок:

  • Поиск фактов и энциклопедические запросы как правило, черпают информацию из статических справочных сайтов, таких как Википедия. и Британская, опираясь на хорошо зарекомендовавшую себя, но часто устаревшую информацию.
  • Вопросы о недавних событиях обычно вызывают цитирование крупных новостных агентств, таких как AP, Reuters или Вардар, где скорость и новизна играют ключевую роль.
  • Подсказки для поиска совета или мнения переключить модель на более динамичные и разговорные источники, такие как блоги, форумы или платформы, такие как Reddit. or Средний.
  • Академические или исследовательские задачи заставлять ИИ цитировать журналы, серверы препринтов, такие как ArXivили поддерживаемые правительством репозитории, такие как PubMed or NCBI.
  • Творческие запросы или пошаговые инструкции часто выкладывают пользовательский контент, неформальные инструкции или обсуждения в сообществе с таких платформ, как Quora или специализированные технические форумы.

Такое изменение означает, что формулировка вопроса может напрямую влиять на то, какие домены будут повышены, а какие останутся позади.

Клод, например, гораздо реже ссылается на такие крупные издания, как Reuters, чем ChatGPT или Gemini, ссылаясь на Reuters В 50 раз реже, чем ChatGPT.

Власть и домен имеют значение, но не одинаково

Хотя авторитетные СМИ доминируют, они не единственные игроки. 15% самых цитируемых источников Входят в топ-10 по нескольким отраслям. Это означает, что нишевый контент вознаграждается, Например:

  • In Финансовые, источники, такие как Bankrate и NerdWallet приветствуются.
  • In Здравоохранение, правительственные источники, такие как CDC.gov и NIH.gov доминировать.
  • In Технология, обучающие платформы, такие как Udemy, Coursera и Средний подняться на вершину.

On 15 страница, визуальная тепловая карта показывает, что Клод демонстрирует наибольшее разнообразие, специфичное для конкретной области, часто выбирая уникальные для отрасли источники, тогда как ChatGPT и Gemini, как правило, больше полагаются на универсальные медиа.

Отраслевые аналитики: что ИИ цитирует по секторам

Финансы и страхование

  • На журналистику приходится 37% цитирований — больше, чем в любой другой отрасли.
  • Десять лучших источников Клода: 90% уникальный, что указывает на более глубокое исследование ниши.

Здравоохранение

  • Сайты государственных и неправительственных организаций цитируются в 18% случаев, что более чем в два раза превышает средний показатель по отрасли.
  • Gemini лидирует по разнообразию источников в этом секторе.

Путешествия/Авиакомпании

  • Как ни странно, академические цитаты практически отсутствуют (всего 0.7%).
  • Источники, такие как FAA.gov и IATA.org доминировать, с меньшей зависимостью от новостных агентств.

Розничная торговля и электронная коммерция

  • Агрегаторы, такие как Википедия, цитируются меньше здесь, чем в других отраслях (36% против 28%).
  • Клод цитирует наиболее узкоспециализированный контент.

СМИ / Развлечения

  • Журналистика снова лидирует с 37%, с такими нишевыми платформами, как Телетехнологии и Радиокинг часто цитируется Клодом.

Технология

  • Практически не используются энциклопедические и академические источники.
  • Платформы, подобные Средний, Coursera и SproutSocial появляются на видном месте, отражая склонность к практические знания.

Последствия для отделов коммуникаций и SEO

Результаты этого отчета показывают, что Генеративная оптимизация двигателя (GEO) становится таким же важным, как и традиционное SEO. ИИ не просто суммирует статические базы данных — он активное связывание с источниками в режиме реального времени. И на эти ссылки влияют:

  • новизна: Регулярно обновляйте свой контент.
  • Управление доменом: Создавайте обратные ссылки и укрепляйте доверие.
  • Актуальность ниши: Создавайте контент, соответствующий вашей отрасли, а не только общим темам.
  • Тип содержимого: сосредоточьтесь на заработанных медиа-ресурсах и информативном контенте, а не на чисто маркетинговых страницах.

Это меняет расчёты для контент-маркетологов, PR-специалистов и издателей. Если ваша цель — попасть в результаты поиска, генерируемые ИИ, вы должны создавать контент, который будет ценен именно для ИИ, а не только для пользователей или Google.

Заключение: последствия чтения (или игнорирования) ИИ

В этом отчёте подчёркивается фундаментальное изменение в том, как информация представлена в интернете: модели ИИ не просто извлекают контент, но и выборочно его курируют. И это курирование меняет представление о видимости в цифровую эпоху.

Для издателей, исследователей и брендов цитирование с помощью ИИ означает участие в поиске нового поколения. Благодаря ему ваш контент доступен пользователям, которые, возможно, никогда не посещали ваш сайт, но доверяют модели, на него ссылающейся. Источники, на которые ссылаются, усиливаются. Те же, на которые нет, независимо от качества, рискуют быть полностью исключенными из обсуждения.

Этот сдвиг порождает новых победителей и проигравших. В приоритете авторитетные СМИ и актуальные, заработанные медиа. В то же время платный контент, редко обновляемые блоги или менее известные мнения часто остаются нечитаемыми — не только людьми, но и системами, формирующими то, что видят люди.

As генеративный ИИ продолжает играть центральную роль в том, как доставляются знания, ключевым вопросом становится не столько то, как ранжироваться в поиске, сколько то, как стать частью того, что ИИ посчитает достойным цитирования?

Антуан — дальновидный лидер и партнер-основатель Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Серийный предприниматель, он считает, что ИИ будет таким же разрушительным для общества, как электричество, и его часто ловят на том, что он восторженно отзывается о потенциале разрушительных технологий и AGI.

футурист, он посвятил себя изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Ценные бумаги.io, платформа, ориентированная на инвестиции в передовые технологии, которые меняют будущее и преобразуют целые секторы.