Connect with us

Was liest KI? Ein Blick in die verborgenen Mechanismen generativer Zitate

Berichte

Was liest KI? Ein Blick in die verborgenen Mechanismen generativer Zitate

mm

Da generative KI das digitale Landschaftsbild umgestaltet, entsteht eine neue Frage im Zentrum der Inhaltserschaffung und -entdeckung: Was liest KI genau? Eine bahnbrechende Studie mit dem Titel Was liest KI von Generative Pulse von Muck Rack analysierte über 1 Million Zitate von großen KI-Systemen, darunter OpenAI’s ChatGPT (4o und 4o-mini), Google’s Gemini (Flash und Pro) und Anthropic’s Claude (Sonett und Haiku), um die verborgenen Dynamiken hinter den Verknüpfungen zu enthüllen, die diese Modelle bei der Generierung von Antworten verwenden.

Die Ergebnisse sind nicht nur aufschlussreich, sondern auch transformierend für alle, die in der Journalismus-, Unternehmenskommunikation, SEO oder Markenstrategie tätig sind.

Zitate sind nicht nur Add-Ons – Sie verändern das KI-Verhalten

Wie für jeden, der in der Welt der KI eingetaucht ist, offensichtlich ist, ändert sich das bloße Aktivieren oder Deaktivieren der Zitationsfunktion die Antworten selbst. Wenn Zitate deaktiviert sind, verlassen sich KIs stärker auf statische Trainingsdaten. Wenn jedoch Zitate aktiviert sind, generieren die Modelle wesentlich unterschiedliche Ausgaben, die direkt von den Echtzeitquellen geprägt sind, die sie abrufen.

Schlüsselbeispiel: Wenn nach dem schlechtesten Baseball-Team der Major League gefragt wird, erwähnt ein zitationsdeaktiviertes KI das Team der 1962er Mets. Wenn jedoch Zitate aktiviert sind, aktualisiert es die Antwort, um das Chicago White Sox von 2024 mit einer rekordbrechenden Bilanz von 41-121 aufzunehmen und explizit CBS Sports zu zitieren.

Die Dominanz von Earned Media

Über 95% aller zitierten Quellen stammen aus nicht-bezahlten Medien. Dazu gehören:

  • 27% journalistische Inhalte (z. B. Reuters, AP, Financial Times)
  • 18% Regierungs-/NGO-Websites
  • 13% akademische oder Forschungsquellen
  • 10% Aggregator-/Enzyklopädie-Plattformen wie Wikipedia oder Visual Capitalist

Im Gegensatz dazu machen bezahlte oder werbeorientierte Inhalte weniger als 5% der Zitate aus, was deutlich macht, dass KI-Modelle systematisch gegen marketinggetriebene Inhalte voreingenommen sind.

Rezidivbias: Warum neue Inhalte gewinnen

Frische zählt – insbesondere für OpenAI-Modelle. Bei journalistischen Inhalten wurden 56% der Zitate, die von ChatGPT erstellt wurden, innerhalb der letzten 12 Monate veröffentlicht, im Vergleich zu 36% für Claude. Diese Tendenz, auch Rezidivbias genannt, bezieht sich auf die Vorliebe für neuere, kürzlich veröffentlichte Quellen gegenüber älteren, auch wenn ältere Quellen immer noch genau oder relevant sein können.

Im Kontext generativer KI bedeutet Rezidivbias, dass Sprachmodelle – insbesondere solche wie ChatGPT, die mit Echtzeitdaten verbunden sind – eher auf neu veröffentlichtes Material verweisen und vertrauen, besonders wenn es um Anfragen geht, die aktuelle Ereignisse, neue Technologien oder Richtlinienänderungen betreffen. Für zeitkritische Anfragen wie “neueste Fortschritte in der ambulanten Behandlung” oder “neue Tonaufnahmeelektronik” gewichtet das Modell den Inhalt, der in den letzten Monaten veröffentlicht wurde, stark, da es annimmt, dass er relevantere oder aktualisierte Erkenntnisse enthält.

Dies ist eine kritische Erkenntnis für Inhaltserschaffer und Markenstrategen: Wenn Ihr Material veraltet ist – auch nur um ein Jahr – ist es wesentlich weniger wahrscheinlich, dass es in KI-generierten Antworten auftaucht. Die Aufrechterhaltung Ihrer Inhalte auf dem neuesten Stand ist nicht nur guter SEO – sie ist für die Sichtbarkeit im Zeitalter der KI unerlässlich.

Unterschiedliche Anfragen lösen unterschiedliche Quellen aus

KI-Modelle zitieren Quellen nicht zufällig – sie wählen basierend auf der Art der gestellten Frage. Verschiedene Anfragestile führen zu verschiedenen Quellentypen:

  • Faktüberprüfungen und enzyklopädische Anfragen neigen dazu, von statischen Referenzseiten wie Wikipedia und Britannica zu stammen, die auf etablierten, aber oft älteren Informationen basieren.
  • Aktuelle Ereignisfragen lösen in der Regel Zitate von großen Redaktionen wie AP, Reuters oder Axios aus, bei denen Geschwindigkeit und Aktualität wichtig sind.
  • Ratsuchende oder meinungsorientierte Anfragen verschieben das Modell in Richtung dynamischere und konversationellere Quellen wie Blogs, Foren oder Plattformen wie Reddit oder Medium.
  • Akademische oder forschungsorientierte Aufgaben führen KI dazu, aus Zeitschriften, Vorabdruckservern wie arXiv oder Regierungsrepositorys wie PubMed oder NCBI zu zitieren.
  • Kreative Anfragen oder Schritt-für-Schritt-Anleitungen führen häufig zu benutzererzeugten Inhalten, informellen Anleitungen oder Community-Diskussionsthreads von Plattformen wie Quora oder Nischentechnikforen.

Diese Variation bedeutet, dass die Art und Weise, wie eine Frage gestellt wird, einen direkten Einfluss darauf haben kann, welche Domänen gehoben und welche zurückgelassen werden.

Claude beispielsweise ist wesentlich weniger wahrscheinlich, große Ausgaben wie Reuters zu zitieren als ChatGPT oder Gemini, wobei Reuters 50-mal seltener zitiert wird als ChatGPT.

Autorität und Domäne zählen – aber nicht einheitlich

Während hochrangige Ausgaben dominieren, sind sie nicht die einzigen Akteure. Nur 15% der am häufigsten zitierten Quellen erscheinen in den Top 10 mehrerer Branchen. Das bedeutet, dass nischenspezifische Inhalte belohnt werden. Zum Beispiel:

  • In Finanzen werden Quellen wie Bankrate und NerdWallet bevorzugt.
  • Im Gesundheitswesen dominieren Regierungsquellen wie CDC.gov und NIH.gov.
  • In Technologie stechen Lernplattformen wie Udemy, Coursera und Medium hervor.

Auf Seite 15 zeigt eine visuelle Heatmap, dass Claude die größte branchenspezifische Vielfalt aufweist und häufig brancheneigene Quellen auswählt, während ChatGPT und Gemini stärker auf allgemeine Medien setzen.

Branchenspezifische Erkenntnisse: Was KI zitiert, nach Sektor

Finanzen & Versicherungen

  • Journalismus macht 37% der Zitate aus, mehr als jede andere Branche.
  • Claudes Top-10-Quellen sind 90% einzigartig, was auf eine tiefere Nischenexploration hinweist.

Gesundheitswesen

  • Regierungs- und NGO-Websites werden 18% der Zeit zitiert, mehr als doppelt so viel wie der Branchendurchschnitt.
  • Gemini führt in Quellenvielfalt für diesen Sektor.

Reise/Luftfahrt

  • Überraschenderweise sind akademische Zitate fast nicht vorhanden (nur 0,7%).
  • Quellen wie FAA.gov und IATA.org dominieren, mit weniger Abhängigkeit von Nachrichtenagenturen.

Einzelhandel & E-Commerce

  • Aggregatoren wie Wikipedia werden weniger zitiert hier als in anderen Branchen (36% vs. 28%).
  • Claude zitiert den meisten Nischeninhalt.

Medien/Unterhaltung

  • Journalismus führt erneut mit 37%, wobei Nischenplattformen wie TVTechnology und Radioking von Claude häufig zitiert werden.

Technologie

  • Virtuell keine enzyklopädischen oder akademischen Quellen werden verwendet.
  • Plattformen wie Medium, Coursera und SproutSocial erscheinen prominent, was auf eine Tendenz zu praktikerbasiertem Wissen hinweist.

Auswirkungen auf Kommunikations- und SEO-Teams

Die Ergebnisse dieses Berichts zeigen, dass Generative Engine Optimization (GEO) genauso wichtig wird wie traditionelles SEO. KI fasst nicht nur statische Datenbanken zusammen – sie verlinkt in Echtzeit auf Quellen. Und diese Verknüpfungen werden von:

  • Aktualität: Aktualisieren Sie Ihre Inhalte regelmäßig.
  • Domain-Autorität: Bauen Sie Backlinks und Vertrauen auf.
  • Nischenrelevanz: Erstellen Sie Inhalte, die auf Ihre Branche zugeschnitten sind, nicht nur allgemeine Themen.
  • Inhaltstyp: Konzentrieren Sie sich auf verdiente Medien und informative Inhalte anstelle von reinen Marketingseiten.

Dies ändert die Rechnung für Content-Marketer, PR-Profis und Verleger. Wenn Ihr Ziel darin besteht, in KI-generierten Ergebnissen aufzutauchen, müssen Sie Inhalte erstellen, die KI als wertvoll erachtet – nicht nur Benutzer oder Google.

Schlussfolgerung: Die Folgen davon, von KI gelesen (oder ignoriert) zu werden

Dieser Bericht hebt eine grundlegende Verschiebung hervor, wie Informationen online präsentiert werden: KI-Modelle holen nicht nur Inhalte ab – sie kuratieren sie selektiv. Und diese Kuratierung definiert Sichtbarkeit im digitalen Zeitalter neu.

Für Verleger, Forscher und Marken bedeutet es, von KI zitiert zu werden, Teil der nächsten Generation der Suche zu sein. Es bringt Ihren Inhalt den Nutzern vor Augen, die möglicherweise nie Ihre Website besuchen, aber dem Modell, das darauf verweist, vertrauen. Die zitierten Quellen werden verstärkt. Diejenigen, die nicht zitiert werden – unabhängig von der Qualität – riskieren, aus dem Gespräch ausgeschlossen zu werden.

Diese Verschiebung schafft neue Gewinner und Verlierer. Hochrangige Ausgaben und aktuelle, verdiente Medien werden bevorzugt. Gleichzeitig werden bezahlte Inhalte, leicht aktualisierte Blogs oder weniger etablierte Stimmen oft ungelesen gelassen – nicht nur von Menschen, sondern auch von den Systemen, die bestimmen, was Menschen sehen.

Da generative KI weiterhin eine zentrale Rolle bei der Wissensvermittlung spielt, wird die Schlüsselfrage weniger darin bestehen, wie man in der Suche rangiert, sondern vielmehr: Wie wird man Teil dessen, was KI als zitierwürdig erachtet?

Antoine ist ein visionärer Führer und Gründungspartner von Unite.AI, getrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Ein Serienunternehmer, glaubt er, dass KI so disruptiv für die Gesellschaft sein wird wie Elektrizität, und wird oft dabei ertappt, wie er über das Potenzial disruptiver Technologien und AGI schwärmt.

Als futurist ist er darauf fokussiert, zu erforschen, wie diese Innovationen unsere Welt formen werden. Zusätzlich ist er der Gründer von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.