レポート
AIが読むものは何か?生成された引用の隠されたメカニズムの中に

ジェネレーティブAIがデジタル景観を再定義する中で、コンテンツの作成と発見の中心で新しい疑問が浮上しています:AIが読むものは何でしょうか?Generative PulseのMuck Rackによる「AIが読むものは何か?」という開拓的な研究では、AIが読むものは何か?では、OpenAIのChatGPT(4oと4o-mini)、GoogleのGemini(FlashとPro)、AnthropicのClaude(SonnetとHaiku)を含む主要なAIシステムからの100万件以上の引用を分析して、モデルがレスポンスを生成する際に使用するリンクの背後にある隠れたダイナミクスを明らかにしました。
この研究の結果は、ジャーナリズム、企業コミュニケーション、SEO、ブランド戦略に関わるすべての人にとって、明らかで変革的なものです。
引用は単なる付加物ではない——AIの行動を再定義する
AIの世界に没頭している人は、引用機能を有効または無効にするだけで、回答自体が変わることを理解しています。引用が無効な場合、AIは静的なトレーニングデータに頼ります。しかし、引用が有効になると、モデルはリアルタイムのソースから取得した情報に直接影響を受けて、実質的に異なる出力を生成します。
重要な例:メジャーリーグベースボールで最も悪いチームについて尋ねられた場合、引用が無効になっているAIは1962年のメッツを回答しました。しかし、引用が有効になっている場合、モデルは回答を更新して、2024年のシカゴ・ホワイトソックスを41–121の記録的な成績で含め、CBSスポーツを明示的に引用しました。
獲得メディアの優位性
すべての引用元の95%以上が、非有料メディアから来ています。これには以下が含まれます:
- 27%のジャーナリズムコンテンツ(例:ロイター、AP、フィナンシャル・タイムズ)
- 18%の政府/NGOサイト
- 13%の学術的または研究用ソース
- 10%のアグリゲーター/百科事典プラットフォーム(ウィキペディアやビジュアルキャピタリストなど)
対照的に、有料または広告のコンテンツは、引用の5%未満を占め、AIモデルがマーケティング主導のコンテンツに反対していることを明らかにしています.
新鮮度バイアス:新しいコンテンツが勝つ理由
新鮮度は重要です——特にOpenAIのモデルでは。ジャーナリズムコンテンツでは、56%のChatGPTによる引用が、36%のClaudeよりも、過去12ヶ月以内に公開されたものでした。これは、新鮮度バイアスと呼ばれるもので、古いソースよりも新しく公開されたソースを好むことを指します。
ジェネレーティブAIの文脈では、新鮮度バイアスは、言語モデル——特にChatGPTのようなリアルタイムデータに接続されたもの——が、新しく公開された資料を参照し、信頼する可能性が高いことを意味します。特に、現在の出来事、技術の進歩、または政策変更に関する質問に対してです。
これは、コンテンツクリエイターとブランド戦略家にとって重要な洞察です:あなたの資料が古くなっていると——たとえ1年でも——AIが生成する回答に表示される可能性は大幅に低くなります。コンテンツを新鮮に保つことは、SEOにとって良いことだけではありません——AIの時代に視認性を維持するために不可欠です。
異なるプロンプトが異なるソースを呼び出す
AIモデルはソースをランダムに引用しません——質問のタイプに基づいて選択します。異なるプロンプトスタイルは異なるタイプのソースを参照することになります:
- 事実の確認と百科事典的なクエリは、ウィキペディアやブリタニカなどの静的な参照サイトから情報を引き出しますが、古い情報に頼ることが多いです。
- 最近の出来事に関する質問は、AP、ロイター、またはアクシオスなどの主要ニュースルームからの引用を引き起こします。ここではスピードと新鮮度が重要です。
- アドバイスや意見を求めるプロンプトは、モデルをよりダイナミックで会話的なソースの方向にシフトさせます。例えば、レッドやメディウムのようなブログ、フォーラム、またはプラットフォームです。
- 学術的または研究指向のタスクは、AIをジャーナル、arXivのようなプレプリントサーバー、またはPubMedやNCBIのような政府支援のリポジトリからの引用に導きます。
- 創造的なリクエストやステップバイステップの指示は、クオラやニッチなテクノロジーフォーラムからのユーザー生成コンテンツ、非公式な方法、またはコミュニティディスカッションスレッドを頻繁に表面化します。
これは、質問の言い方がどのドメインが高められ、どのドメインが見落とされるかを直接影響することを意味します。
例えば、Claudeは、ChatGPTやGeminiよりも、50倍少ない頻度でロイターを引用します。
権威とドメインの重要性——しかし、統一的にではない
高権威のアウトレットが支配的ですが、それらは唯一のプレーヤーではありません。トップ10内の複数の業界で引用されるトップソースは、15%のみです。これは、ニッチ特有のコンテンツが報われていることを意味します。例えば:
- 金融では、バンクレートやネルドウォレットのようなソースが好まれる。
- ヘルスケアでは、CDC.govやNIH.govのような政府ソースが支配的です。
- テクノロジーでは、ウデミ、コースラ、またはメディウムのような学習プラットフォームが上位に来ます。
15ページ目には、Claudeが最もドメイン固有の多様性を示し、業界固有のソースを頻繁に選択することが、ビジュアルヒートマップで示されています。一方、ChatGPTとGeminiは、より一般的なメディアに頼りがちです。
業界別の洞察:AIが引用するもの
金融と保険
- ジャーナリズムは37%の引用を占め、他の業界よりも多くなります。
- Claudeのトップ10ソースは、90%がユニークであり、より深いニッチの探索を示しています。
ヘルスケア
- 政府とNGOのサイトは18%の引用を占め、業界横断的な平均よりも2倍以上です。
- Geminiは、このセクターでソースの多様性でリードしています。
旅行と航空
- 驚くことに、学術的な引用はほとんどありません(わずか0.7%)。
- FAA.govやIATA.orgのようなソースが支配的であり、ニュースアウトレットへの依存度は低いです。
小売と電子商取引
- アグリゲーターであるウィキペディアは、他の業界よりも少なく引用されます(36% vs. 28%)。
- Claudeは、最もニッチなコンテンツを引用します。
メディアとエンターテインメント
-
ジャーナリズムは37%で再びトップであり、ClaudeはTVTechnologyやRadiokingのようなニッチプラットフォームを頻繁に引用します。
テクノロジー
- ほぼ百科事典的または学術的なソースは使用されません。
- メディウム、コースラ、またはスプローツソーシャルのようなプラットフォームが目立つのは、実践者ベースの知識に傾斜していることを反映しています。
コミュニケーションとSEOチームへの影響
この報告の結果は、ジェネレーティブエンジン最適化(GEO)が従来のSEOと同等の重要性を持つことを示しています。AIは静的なデータベースを要約するだけでなく、リアルタイムでソースにリンクしています。而且、これらのリンクは以下の要因によって影響を受けます:
- 新鮮度:コンテンツを定期的に更新します。
- ドメイン権威:バックリンクを構築し、信頼を築きます。
- ニッチの関連性:業界に特化したコンテンツを作成し、一般的なトピックだけに焦点を当てないでください。
- コンテンツの種類:純粋なマーケティングページではなく、獲得メディアや情報提供コンテンツに重点を置きます。
これは、コンテンツマーケター、PR専門家、パブリッシャーにとって、計算を変えるものです。AIが生成する結果に表示されることを目標とする場合、ユーザーやGoogleだけではなく、AIが価値があると判断するコンテンツを作成する必要があります。
結論:AIによって読まれる(または無視される)ことの結果
この報告は、オンラインで情報が提示される方法における根本的な変化を強調しています:AIモデルはコンテンツを単に取得するのではなく、選択的にキュレーションしています。而且、このキュレーションはデジタル時代の視認性を再定義しています。
パブリッシャー、研究者、ブランドにとって、AIによって引用されることは、次の世代の検索の一部になることを意味します。これにより、モデルが参照するコンテンツをユーザーの前に提示しますが、サイトを訪れることはありません。引用されるソースは拡大しますが、引用されないもの——品質に関係なく——は完全に会話から除外される危険があります。
この変化は、新しい勝者と敗者を生み出します。高権威のアウトレットやタイムリーな獲得メディアが好まれる一方で、有料コンテンツ、軽く更新されたブログ、または確立されていない声は、人々だけでなく、システムによっても読まれません。
ジェネレーティブAIが知識の提供方法で中心的な役割を果たすようになるにつれて、重要な質問は、検索結果のランキングについてではなく、AIが引用する価値があると判断するものになる方法についてです。












