Angle d’Anderson

L’essor des accusations de “slop IA” devient une nouvelle forme de contrôle d’accès

mm
AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room.

Appeler quelque chose de “slop IA” est devenu la nouvelle chasse aux sorcières d’internet, avec les utilisateurs de Reddit et de Hacker News qui accusent de plus en plus leurs collègues commentateurs d’être des robots, même s’il n’y a aucune preuve de cela.

 

Une nouvelle étude menée en Norvège et aux Émirats arabes unis a constaté que les accusations contre les commentaires supposés “slop IA” de la part d’autres commentateurs ont augmenté de manière significative sur Reddit et Hacker News entre 2023 et 2026, même lorsque le commentaire ne montrait aucune preuve d’avoir été généré par IA.

Les résultats de l’analyse des auteurs de 25 millions de commentaires suggèrent que de telles accusations fonctionnent de plus en plus comme une forme émergente de contrôle d’accès social, plutôt que comme un moyen d’identifier l’IA.

Les chercheurs ont également constaté que les communautés techniquement orientées ont adopté la “culture de l’accusation” plus tôt que les autres groupes, avec le modèle qui s’est ensuite propagé à d’autres parties de Reddit.

Cette augmentation apparente des accusations autour du “slop IA” ne semble pas faire partie d’une augmentation plus large ou plus générale de l’hostilité en ligne : les formes de vieilles invectives telles que ‘shill’, ‘sockpuppet’ et ‘troll’ sont restées relativement stables pendant la même période, suggérant que la suspicion de l’IA est émergée comme une nouvelle forme de contrôle des frontières sociales, plutôt que comme une continuation ou une extension des anciennes querelles sur Internet.

Le document indique :

‘Nous avons analysé 25 millions de commentaires de Hacker News et Reddit (2023-2026), en combinant le jugement LLM sur 7 500 accusations échantillonnées d’utilisation d’IA, les trajectoires de sentiment, le codage des actes de parole de 300 accusations confirmées d’utilisation d’IA et un test de contrôle apparié de commentaires accusés par rapport à des commentaires non accusés.

‘Nous avons constaté que la part des accusations avec des étiquettes péjoratives a augmenté de plus de dix fois sur les deux plateformes, tandis qu’un vocabulaire de termes d’inauthenticité pré-2022 ( « shill », « astroturf ») n’a pas augmenté.

‘Ce changement reflète une tendance à la hausse rapide qui consiste à qualifier toute prose suspecte ou apparemment non authentique de “slop IA”.

‘Le cadre du “slop” constitue maintenant 94 pour cent des mentions péjoratives, les commentaires dominants changeant de ton de moquerie à contrôle d’accès et protestation structurelle.’

L’étude soulève la question plus large de savoir si les gens peuvent vraiment repérer l’écriture de l’IA, puisque la prose fluide – autrefois considérée comme preuve d’effort, d’expertise ou d’engagement réel – est maintenant une denrée abondante et de plus en plus dévaluée.

Il est intéressant de noter que le nouveau travail se concentre sur Hacker News, qui est vigilamment contrôlé contre les commentaires générés par IA, et sur Reddit, dont le flux constant de discours humain est maintenant hautement apprécié pour les développeurs et les entreprises d’IA, ainsi que pour devenir une nouvelle cible principale pour les spammeurs SEO qui cherchent à envahir les classements Web basés sur LLM par procuration.

Les chercheurs pensent que leurs résultats correspondent à la compréhension croissante du public selon laquelle les sources antérieures de vérité pourraient être dévaluées à mesure que l’utilisation de l’IA se répand. Le nouveau document discute de personnes réelles accusées d’être des entités IA, soit par erreur réelle, conflation stylistique, ou malice (c’est-à-dire que l’accusateur sait que son opposant est humain, mais souhaite le faire taire) ; mais prédit que d’autres types de communication seront similaires à ceux-ci :

‘Nos résultats ici prédiraient que des accusations similaires d’utilisation d’IA se formeront pour l’authentification d’images, l’authentification vocale et l’attribution de code parmi d’autres, avec l’intention principale de l’accusation étant le contrôle d’accès plutôt que la détection empiriquement précise de l’utilisation d’IA.

‘Cela deviendra de plus en plus problématique à mesure que l’IA dans ces domaines réduit même les indices empiriquement détectables que les experts peuvent trouver.

‘Cela pourrait avoir pour effet d’augmenter le rôle des experts dans la vérification du contenu IA par rapport au contenu non IA ; ou cela pourrait grandement réduire la confiance dans tout type de média qui peut être plausiblement généré par IA.’

Le nouveau document* est intitulé “C’est du slop IA, vous êtes un bot !” Étude des accusations, des preuves et de la crédibilité dans le discours en ligne à l’égard des commentaires générés par LLM, et provient de deux réviseurs de l’Université d’Oslo et de l’Université américaine de Sharjah.

Méthode

L’ensemble de données développé pour la nouvelle étude comprenait tous les commentaires publics publiés sur Hacker News et 18 communautés Reddit sélectionnées entre janvier 2023 et mai 2026.

Environ 25 millions de commentaires ont été collectés, dont 12 millions provenaient de Hacker News et 13 millions de Reddit. Les données Reddit ont été obtenues à partir de l’archive Arctic Shift via son API JSON publique, tandis que les commentaires Hacker News ont été collectés à partir de l’archive de recherche Algolia Hacker News.

Pour éviter de se concentrer sur un seul type de communauté, l’échantillon Reddit a été divisé entre des forums axés sur l’IA, notamment r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMA et r/singularity ; des communautés créatives comprenant r/Art, r/writing et r/books ; les forums d’intérêt général r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistorians et r/science ; et les communautés techniquement orientées et universitaires r/programming et r/AskAcademia.

Les taux d’échantillonnage ont été maintenus constants dans le temps, aidant ainsi à garantir que les changements dans les taux d’accusation reflètent les changements dans le comportement de la communauté, plutôt que les changements dans la collecte de données.

Cinq niveaux de honte de l’IA

Les commentaires candidats ont été identifiés à l’aide d’un lexique de recherche de 137 modèles organisés en cinq niveaux nommés : le niveau 1 (‘Direct’) a capturé des accusations explicites telles que ‘ChatGPT a écrit cela’, ‘Est-ce que c’est généré par IA ?’ et ‘OP est un bot’.

Le niveau 2 (‘Péjoratif’) couvrait des étiquettes telles que ‘slop IA’, ‘GPT garbage’, ‘ML drivel’ et ‘robo-writing’. Le niveau 3 (‘Style’) traitait des supposés indices stylistiques, notamment les mentions de tirets, l’appel de ‘delve’, les références tricolon et des revendications plus larges sur une ‘signature IA classique’.

Le niveau 4 (‘Mocking’) a capturé la parodie et l’imitation basées sur des phrases familières d’assistants IA telles que ‘fellow humans’, ‘dans le paysage en évolution rapide’ et ‘tapis riche’. Le niveau 5 (‘Indirect’) a présenté des soupçons moins explicites, avec des commentaires décrits comme quelque chose qui ‘sent comme IA’, ‘lit comme ChatGPT’ ou ressemble à la ‘vallée de l’incroyable de l’écriture’.

Pour réduire les faux positifs, des phrases courantes telles que ‘à noter’, ‘il est important de noter’ et ‘est-ce que c’est un humain’ n’ont été comptées que lorsque un terme lié à l’IA apparaissait à proximité. Puisque ces modèles de recherche ne pouvaient pas distinguer de manière fiable les accusations des discussions ordinaires, deux passes de validation ont été effectuées avec Claude Opus 4.7.

Un échantillon de 5 000 commentaires Reddit et un échantillon de 2 500 commentaires Hacker News ont été tirés du pool de candidats, équilibrés dans le temps et les catégories d’accusation.

Chaque commentaire a ensuite été classé dans l’un des cinq groupes de résultats : réel, couvrant les accusations réelles d’utilisation d’IA ; divulgation, couvrant les commentaires qui ont reconnu l’auteur d’IA ; neutral-ref, couvrant les références non accusatoires à l’IA ; FP, couvrant les faux positifs regex ; et ambigu, couvrant les cas où le contexte disponible n’a pas permis un jugement confiant.

Les chercheurs ont également examiné comment les accusations ont changé au fil du temps, en suivant l’augmentation de la nouvelle étiquette “slop IA” par rapport aux anciennes insultes telles que ‘drivel’, ‘garbage’, ‘trash’, ‘vomit’, ‘sludge’, ‘mush’, ‘gunk’, ‘junk’, ‘crap’, ‘word salad’ et ‘nonsense’.

Délimitation des tendances

Les tendances de sentiment ont été mesurées à l’aide du Valence Aware Dictionary et sEntiment Reasoner (VADER), tandis qu’un échantillon distinct de 300 fils de discussion Reddit contenant des accusations réelles validées par LLM a été codé selon le rôle social joué. Ceux-ci ont été classés en Sneer (moquerie réjective) ; Dismiss (rejet direct) ; Mockery (imitation/parodie) ; Gatekeep (‘application des règles’) ; ou Structural Protest (protestation générale contre l’IA), permettant ainsi de suivre les changements dans le caractère des accusations d’IA au fil du temps.

Un test de “placebo” distinct a été conçu pour déterminer si l’augmentation des accusations d’IA pourrait simplement refléter une augmentation plus large de la suspicion en ligne, dans lequel le même ensemble de données a été recherché pour des termes d’inauthenticité plus anciens tels que ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘paid shill’, ‘fake account’, ‘corporate shill’, ‘talking points’ et ‘payola’.

Une variation a également été observée entre les communautés, avec une croissance plus précoce enregistrée dans les forums axés sur l’IA et la technologie – avec des modèles similaires apparaissant plus tard dans d’autres parties de Reddit et Hacker News.

Des changements ont été observés non seulement dans la fréquence des accusations, mais également dans leur classification. Le codage de 300 accusations validées Reddit a révélé des changements dans la prévalence relative de Sneer, Dismiss, Mockery, Gatekeep et Structural Protest. Selon le document, Gatekeep et Structural Protest sont devenus plus courants au fil du temps, tandis que Sneer et Mockery sont devenus moins courants.

Résultats

L’étude a enregistré une augmentation importante des accusations d’IA sur Reddit et Hacker News entre 2023 et 2026. La plupart de cette croissance était concentrée dans l’utilisation d’étiquettes péjoratives ;

Croissance interplateforme des accusations péjoratives d'IA sur Reddit et Hacker News entre janvier 2023 et mai 2026. Les accusations de niveau 2 ('Péjoratif') sont passées de chiffres bas à environ un quart des accusations candidates sur les deux plateformes. Trois périodes d'accélération sont visibles en 2024 et 2025, après quoi la croissance se stabilise. Hacker News est resté au-dessus de Reddit pour la majeure partie de la période d'étude, mais les deux ont convergé vers des niveaux similaires d'ici 2026. Source - https://arxiv.org/pdf/2606.12073

Croissance interplateforme des accusations péjoratives d’IA sur Reddit et Hacker News entre janvier 2023 et mai 2026. Les accusations de niveau 2 (‘Péjoratif’) sont passées de chiffres bas à environ un quart des accusations candidates sur les deux plateformes. Trois périodes d’accélération sont visibles en 2024 et 2025, après quoi la croissance se stabilise. Hacker News est resté au-dessus de Reddit pour la majeure partie de la période d’étude, mais les deux ont convergé vers des niveaux similaires d’ici 2026. Source

À partir de 2026, “slop IA” a représenté 94 % des accusations péjoratives d’IA identifiées dans l’ensemble de données, remplaçant des termes plus anciens tels que ‘GPT garbage’, ‘ML drivel’ et ‘robo-writing’. Selon le document, la part des accusations péjoratives d’IA a augmenté de plus de dix fois sur les deux plateformes au cours de la période d’étude :

Montée de l'étiquette 'slop IA' par rapport aux anciennes accusations péjoratives d'IA entre 2023 et 2026. Alors que des termes tels que 'drivel', 'garbage', 'trash', 'vomit', 'sludge', 'mush', 'gunk', 'junk', 'crap', 'word salad' et 'nonsense' dominaient initialement les accusations péjoratives, leur part a diminué régulièrement à mesure que 'slop IA' est devenu l'étiquette préférée. D'ici 2026, le cadre du 'slop' représentait environ 94 % des accusations péjoratives d'IA, indiquant une consolidation du langage d'accusation autour d'un seul terme.

Montée de l’étiquette ‘slop IA’ par rapport aux anciennes accusations péjoratives d’IA entre 2023 et 2026. Alors que des termes tels que ‘drivel’, ‘garbage’, ‘trash’, ‘vomit’, ‘sludge’, ‘mush’, ‘gunk’, ‘junk’, ‘crap’, ‘word salad’ et ‘nonsense’ dominaient initialement les accusations péjoratives, leur part a diminué régulièrement à mesure que ‘slop IA’ est devenu l’étiquette préférée. D’ici 2026, le cadre du ‘slop’ représentait environ 94 % des accusations péjoratives d’IA, indiquant une consolidation du langage d’accusation autour d’un seul terme.

Une comparaison distincte a été effectuée à l’aide de termes d’inauthenticité plus anciens tels que ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘paid shill’, ‘fake account’, ‘corporate shill’, ‘talking points’ et ‘payola’. Contrairement aux accusations axées sur l’IA, ces termes n’ont pas présenté d’augmentation comparable.

Des variations ont également été observées entre les communautés, avec une croissance plus précoce enregistrée dans les forums axés sur l’IA et la technologie – avec des modèles similaires apparaissant plus tard dans d’autres parties de Reddit et Hacker News.

Des changements ont été observés non seulement dans la fréquence des accusations, mais également dans leur classification. Le codage de 300 accusations validées Reddit a révélé des changements dans la prévalence relative de Sneer, Dismiss, Mockery, Gatekeep et Structural Protest. Selon le document, Gatekeep et Structural Protest sont devenus plus courants au fil du temps, tandis que Sneer et Mockery sont devenus moins courants.

Conclusion

L’épidémie apparente de honte de l’IA dans les sections de commentaires nécessite clairement sa propre itération de la loi de Godwin ; sur la base des événements et des tendances dans les commentaires sociaux et politiques de ces dernières années, il serait logique que les bots IA deviennent les plus susceptibles d’accuser d’autres commentateurs d’être un bot ; cependant, cela pourrait tendre à étouffer tous les commentaires sur le sujet.

 

* Veuillez noter que ce document n’est pas une lecture amicale et est destiné, dans son ton et son lexique, aux pairs universitaires des auteurs.

Publié pour la première fois vendredi 12 juin 2026

Écrivain sur l'apprentissage automatique, spécialiste de domaine en synthèse d'images humaines. Ancien responsable du contenu de recherche chez Metaphysic.ai.