Andersons Blickwinkel
Der Aufstieg der “AI-Slop”-Anschuldigungen wird zu einer neuen Form des Gatekeepings

Das Bezeichnen von etwas als “AI-Slop” ist zur neuen Hexenjagd des Internets geworden, bei der Reddit- und Hacker-News-Nutzer zunehmend andere Kommentatoren beschuldigen, Roboter zu sein, auch wenn es keine Beweise dafür gibt.
Eine neue Studie aus Norwegen und den VAE hat ergeben, dass die Anschuldigungen gegen vermeintliches “AI-Slop” von anderen Kommentatoren zwischen 2023 und 2026 auf Reddit und Hacker News stark anstiegen, auch wenn der Kommentar keine Anzeichen dafür aufwies, von einem AI-System generiert worden zu sein.
Die Ergebnisse der Analyse von 25 Millionen Kommentaren deuten darauf hin, dass solche Anschuldigungen zunehmend als eine neue Form des sozialen Gatekeepings fungieren, anstatt als Mittel zur Identifizierung von AI.
Die Forscher fanden auch heraus, dass technisch affine Gemeinschaften die “Anschuldigungskultur” früher übernahmen als andere Gruppen, wobei das Muster später auf weitere Bereiche von Reddit übertragen wurde.
Der offensichtliche Anstieg der Anschuldigungen um “AI-Slop” scheint nicht Teil einer breiteren oder allgemeineren Zunahme von Online-Feindseligkeit zu sein: ältere Schmähwörter wie ‘Shill’, ‘Sockpuppet’ und ‘Troll’ blieben während desselben Zeitraums relativ stabil, was darauf hindeutet, dass der Verdacht auf AI als eine neue Form der sozialen Grenzkontrolle entstand, anstatt eine Fortsetzung oder Erweiterung früherer Internet-Feindseligkeiten.
Die Studie besagt:
‘Wir haben 25 Millionen Kommentare von Hacker News und Reddit (2023-2026) analysiert, indem wir LLM-Urteile über 7.500 ausgewählte Anschuldigungen von AI-Nutzung kombinierten, Sentiment-Trajectorien, Sprechakt-Codierungen von 300 bestätigten Anschuldigungen von AI-Nutzung und einen Vergleichstest von angeklagten versus nicht angeklagten Elternkommentaren.
‘Wir fanden heraus, dass der Anteil der pejorativen Bezeichnungen um mehr als das Zehnfache auf beiden Plattformen anstieg, während ein Placebo-Vokabular von vor 2022 unechten Begriffen (“Shill”, “Astroturf”) nicht anstieg.
‘Diese Verschiebung spiegelte einen schnellen Trend wider, bei dem jeder verdächtigen oder scheinbar unechten Prosa als “AI-Slop” bezeichnet wurde.
‘Der “Slop”-Rahmen stellt jetzt 94 Prozent der pejorativen Erwähnungen dar, wobei die dominanten Kommentare in ihrer Tonlage von Spott zu Gatekeeping und strukturellem Protest wechselten.’
Die Studie wirft die breitere Frage auf, ob Menschen tatsächlich AI-generierte Texte erkennen können, da flüssiger Prosa – früher als Beweis für Anstrengung, Fachwissen oder echte Beteiligung behandelt – jetzt eine reichlich vorhandene und zunehmend entwertete Ware ist.
Es ist interessant zu beachten, dass die neue Arbeit sich auf Hacker News konzentriert, das streng gegen AI-generierte Kommentare überwacht wird, und auf Reddit, dessen ständiger Fluss von menschlicher Diskussion jetzt sehr geschätzt wird für AI-Entwickler und Unternehmen, sowie ein neues wichtiges Ziel für SEO-Spammer sucht, um LLM-basierte Web-Rankings durch Proxy zu infiltrieren.
Die Forscher glauben, dass ihre Ergebnisse mit dem wachsenden öffentlichen Verständnis übereinstimmen, dass frühere Quellen der Wahrheit entwertet werden könnten, wenn die Nutzung von AI verbreitet wird. Die neue Studie diskutiert reale Menschen, die fälschlicherweise als AI-Entitäten beschuldigt werden, entweder durch echten Fehler, stylistische Verwechslung oder Bosheit (d. h. der Ankläger weiß, dass sein Gegner ein Mensch ist, aber möchte ihn zum Schweigen bringen); aber prognostiziert andere Arten von Kommunikation, die ähnlich getrübt werden:
‘Unsere Ergebnisse würden vorhersagen, dass ähnliche Anschuldigungen von AI-Nutzung für Bildauthentifizierung, Sprachauthentifizierung und Code-Urheberschaft unter anderem auftreten werden, wobei die Kernabsicht der Laienanschuldigung Gatekeeping und nicht empirisch genaue Erkennung von AI-Nutzung ist.
‘Dies wird zunehmend problematisch, da AI in diesen Bereichen sogar die empirisch nachweisbaren Hinweise reduziert, die Experten finden können.
‘Dies könnte die Rolle der Experten bei der Überprüfung von AI- gegen nicht-AI-Inhalten erhöhen; oder es könnte das Vertrauen in jede Art von Medium, das plausibel durch AI generiert werden kann, stark reduzieren.’
Die neue Studie* trägt den Titel “Das ist AI-Slop, du Bot!” Studium von Anschuldigungen, Beweisen und Glaubwürdigkeit in Online-Diskursen zu LLM-generierten Kommentaren und stammt von zwei Rezensenten der Universität Oslo und der American University of Sharjah.
Methode
Die für die neue Studie entwickelte Datenbank umfasste alle öffentlichen Kommentare, die zwischen Januar 2023 und Mai 2026 auf Hacker News und 18 ausgewählten Reddit-Communities veröffentlicht wurden.
Etwa 25 Millionen Kommentare wurden gesammelt, von denen 12 Millionen von Hacker News und 13 Millionen von Reddit stammten. Die Reddit-Daten wurden aus dem Arctic-Shift-Archiv über dessen öffentliches JSON-API bezogen, während die Hacker-News-Kommentare aus dem Algolia-Hacker-News-Sucharchiv gesammelt wurden.
Um nicht auf eine bestimmte Art von Gemeinschaft zu fokussieren, wurde die Reddit-Stichprobe auf AI-fokussierte Foren wie r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMA und r/singularity aufgeteilt; kreative Gemeinschaften wie r/Art, r/writing und r/books; allgemeine Interessengemeinschaften wie r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistorians und r/science; und technologieorientierte und akademische Gemeinschaften wie r/programming und r/AskAcademia.
Die Stichprobenraten wurden über die Zeit hinweg konstant gehalten, um sicherzustellen, dass Änderungen in den Anschuldigungsraten tatsächliche Veränderungen im Gemeinschaftsverhalten widerspiegelten und nicht Änderungen in der Datenerfassung.
Fünf Ebenen von AI-Scham
Kandidatenkommentare wurden mithilfe eines 137-Muster-Suchlexikons identifiziert, das in fünf benannte Ebenen unterteilt war: Ebene 1 (‘Direkt’) erfasste explizite Anschuldigungen wie ‘ChatGPT hat dies geschrieben’, ‘Ist dies AI-generiert?’ und ‘OP ist ein Bot’.
Ebene 2 (‘Pejorativ’) umfasste Bezeichnungen wie ‘AI-Slop’, ‘GPT-Abfall’, ‘ML-Gequatsche’ und ‘Robo-Schreiben’. Ebene 3 (‘Stil’) befasste sich mit vermeintlichen stilistischen Hinweisen, einschließlich Em-Dash-Erwähnungen, dem ‘delve’-Aufruf, Tricolon-Referenzen und breitere Behauptungen über ein ‘klassisches AI-Signatur’.
Ebene 4 (‘Spott’) erfasste Parodien und Imitationen auf der Grundlage vertrauter AI-Assistenten-Phrasen wie ‘Mitmenschen’, ‘in der sich schnell entwickelnden Landschaft’ und ‘reiche Tapete’. Ebene 5 (‘Indirekt’) umfasste weniger explizite Verdächtigungen, bei denen Kommentare als etwas beschrieben wurden, das ‘nach AI riecht’, ‘wie ChatGPT liest’ oder der ‘uncanny valley of writing’ ähnelt.
Um Falschpositive zu reduzieren, wurden häufige Phrasen wie ‘Wert zu beachten’, ‘es ist wichtig zu beachten’ und ‘ist dies ein Mensch’ nur dann gezählt, wenn ein AI-bezogener Begriff in der Nähe erschien. Da diese Suchmuster nicht zuverlässig Anschuldigungen von normalen Diskussionen unterscheiden konnten, wurden zwei Validierungsprüfungen mit Claude Opus 4.7 durchgeführt.
Ein Reddit-Stichproben von 5.000 Kommentaren und ein Hacker-News-Stichproben von 2.500 Kommentaren wurden aus dem Kandidatenpool gezogen, ausgewogen über Zeitperioden und Anschuldigungskategorien.
Jeder Kommentar wurde dann in eine von fünf Ergebnisgruppen klassifiziert: Real, die echte Anschuldigungen von AI-Nutzung umfasst; Offenlegung, die Kommentare umfasst, die AI-Autorenschaft anerkennen; Neutral-Ref, die nicht-anschuldigenden Verweise auf AI umfasst; FP, die Regex-Falschpositive umfasst; und Unklar, die Fälle umfasst, bei denen der verfügbare Kontext keine zuverlässige Beurteilung zuließ.
Die Forscher untersuchten auch, wie sich die Anschuldigungen im Laufe der Zeit änderten, indem sie den Anstieg der neueren ‘AI-Slop’-Framing gegenüber älteren Beleidigungen wie ‘Abfall’, ‘Müll’, ‘Kot’, ‘Erbrochenes’, ‘Schlamm’, ‘Brei’, ‘Geschwätz’, ‘Unsinn’ und ‘Quatsch’ verfolgten.
Delimitierung der Trends
Sentiment-Trends wurden mithilfe des Valence-Aware-Dictionary-and-sEntiment-Reasoner (VADER) gemessen, während eine separate Stichprobe von 300 Reddit-Threads mit LLM-validierten Real-Anschuldigungen nach dem sozialen Rollen kodiert wurde, die durchgeführt wurden. Diese wurden als Spott (verachtender Spott); Ablehnen (direkte Ablehnung); Spott (Imitation/Parodie); Gatekeeping (‘Regel-Durchsetzung’); oder Struktureller Protest (allgemeine Missbilligung von AI) klassifiziert, um Verschiebungen in der Art der AI-Anschuldigungen im Laufe der Zeit zu verfolgen.
Ein separater ‘Placebo’-Test wurde entworfen, um zu bestimmen, ob die steigenden AI-Anschuldigungen einfach einen allgemeineren Anstieg der Verdächtigung im Internet widerspiegeln, wobei die gleiche Datenbank nach älteren vor-ChatGPT-Unechtheit-Begriffen wie ‘Shill’, ‘Astroturf’, ‘Sockpuppet’, ‘bezahlter Shill’, ‘falsches Konto’, ‘Unternehmens-Shill’, ‘Redewendungen’ und ‘Bestechungsgelder’ durchsucht wurde.
Ein letzter Satz von Tests untersuchte, ob die Merkmale, die AI-generierte Schreibweise von menschlicher Schreibweise unterscheiden, auch die Merkmale sind, die dazu führen, dass menschlich geschriebene Kommentare als AI-Anschuldigungen angesehen werden, indem sechs linguistische Marker untersucht wurden: Artikeldichte; Kontraktionsrate; formale Register-Adverbfrequenz; Präpositionsdichte; Satzlängenvarianz; und mittlere Tokenlänge. Vergleiche wurden zwischen Offenlegung und Real-Kommentaren unter Verwendung von Mann-Whitney-U-Tests durchgeführt.
Elternkommentare, die mit 800 LLM-validierten Real-Anschuldigungen von AI-Nutzung in Verbindung gebracht wurden, wurden abgerufen, wobei 421 Fälle beibehalten wurden, in denen der Elternkommentar selbst ein Kommentar und kein oberster Beitrag war. Diese wurden mit 2.048 nicht angeklagten Kommentaren verglichen, die aus dem gleichen Subreddit und Monat stammten. Logistische Regression wurde dann verwendet, um zu testen, ob die linguistischen Marker, die AI-generierte Texte von menschlichem Schreiben unterscheiden, auch vorhersagen, welche menschlich geschriebenen Kommentare AI-Anschuldigungen anziehen.
Ergebnisse
Die Studie zeichnete einen großen Anstieg von AI-Anschuldigungen auf Reddit und Hacker News zwischen 2023 und 2026 auf. Der größte Teil dieses Wachstums konzentrierte sich auf die Verwendung pejorativer Bezeichnungen:

Plattformübergreifendes Wachstum von pejorativen AI-Anschuldigungen auf Reddit und Hacker News zwischen Januar 2023 und Mai 2026. Ebene 2 (‘Pejorativ’) Anschuldigungen stiegen von niedrigen einstelligen Zahlen auf etwa ein Viertel der Kandidatenanschuldigungen auf beiden Plattformen. Drei Beschleunigungsperioden sind während 2024 und 2025 sichtbar, nach denen das Wachstum abflacht. Hacker News blieb während des größten Teils der Studienperiode über Reddit, aber beide konvergierten auf ähnliche Niveaus bis 2026. Quelle
Bis 2026 machte “AI-Slop” 94% der pejorativen AI-Anschuldigungen in der Datenbank aus, wobei frühere Begriffe wie ‘GPT-Abfall’, ‘ML-Gequatsche’ und ‘Robo-Schreiben’ ersetzt wurden. Laut der Studie stieg der Anteil pejorativer AI-Anschuldigungen um mehr als das Zehnfache auf beiden Plattformen während des Studienzeitraums:

Aufstieg des ‘AI-Slop’-Labels im Vergleich zu älteren pejorativen AI-Anschuldigungen zwischen 2023 und 2026. Während Begriffe wie ‘Abfall’, ‘Müll’, ‘Kot’, ‘Erbrochenes’, ‘Schlamm’, ‘Brei’, ‘Geschwätz’, ‘Unsinn’ und ‘Quatsch’ anfangs pejorative Anschuldigungen dominierten, sank ihr Anteil stetig, während ‘AI-Slop’ zum überwiegend bevorzugten Label wurde. Bis 2026 machte der ‘Slop’-Rahmen etwa 94% der pejorativen AI-Anschuldigungen aus, was eine Konsolidierung der Anschuldigungssprache um einen einzigen Begriff anzeigt.
Ein separater Vergleich wurde mit älteren Unechtheit-Begriffen wie ‘Shill’, ‘Astroturf’, ‘Sockpuppet’, ‘bezahlter Shill’, ‘falsches Konto’, ‘Unternehmens-Shill’, ‘Redewendungen’ und ‘Bestechungsgelder’ durchgeführt. Im Gegensatz zu AI-fokussierten Anschuldigungen zeigten diese Begriffe keinen vergleichbaren Anstieg.
Es gab auch Variationen über die Gemeinschaften hinweg, wobei früheres Wachstum in AI-fokussierten und technologieorientierten Foren auftrat – mit ähnlichen Mustern, die später in anderen Teilen von Reddit und Hacker News auftraten.
Es wurden nicht nur Änderungen in der Häufigkeit der Anschuldigungen, sondern auch in ihrer Klassifizierung beobachtet. Die Kodierung von 300 validierten Reddit-Anschuldigungen zeigte Verschiebungen in der relativen Häufigkeit von Spott, Ablehnen, Spott, Gatekeeping und Struktureller Protest. Laut der Studie wurden Gatekeeping und Struktureller Protest im Laufe der Zeit häufiger, während Spott und Spott seltener wurden.
Schlussfolgerung
Die offensichtliche Epidemie der lockeren AI-Verunglimpfung in Kommentarsektionen benötigt offensichtlich ihre eigene Version von Godwins Gesetz; basierend auf den Ereignissen und Trends in sozialen und politischen Kommentaren der letzten Jahre wäre es sinnvoll, wenn AI-Bots am wahrscheinlichsten andere Kommentatoren beschuldigen würden, Bots zu sein; jedoch könnte dies dazu führen, dass alle Kommentare zu diesem Thema unterdrückt werden.
* Bitte beachten Sie, dass diese Studie kein freundlicher Lesestoff ist und in Ton und Lexikon auf die akademischen Kollegen der Autoren abzielt.
Erstveröffentlicht am Freitag, 12. Juni 2026












