Взгляд Anderson

Возрождение обвинений в “AI-мусоре” становится новой формой гейткипинга

Опубликовано 12 июня 2026

Martin Anderson

AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room.

Обвинения в “AI-мусоре” стали новой охотой на ведьм в интернете, и пользователи Reddit и Hacker News все чаще обвиняют своих коллег в том, что они роботы, даже если нет никаких доказательств этого.

Новое исследование из Норвегии и ОАЭ показало, что обвинения против предполагаемого “AI-мусора” от других комментаторов резко возросли на Reddit и Hacker News между 2023 и 2026 годами, даже когда комментарий не показывал никаких признаков того, что он был сгенерирован ИИ.

Результаты анализа авторов 25 миллионов комментариев свидетельствуют о том, что такие обвинения все чаще функционируют как новая форма социального гейткипинга, а не как способ выявления ИИ.

Исследователи также обнаружили, что технически-ориентированные сообщества приняли “культуру обвинений” раньше, чем другие группы, и этот шаблон позже распространился на более широкие области Reddit.

Этот очевидный рост обвинений вокруг “AI-мусора” не кажется частью более широкого или общего увеличения онлайн-враждебности: старые формы оскорблений, такие как ‘шилл’, ‘сокпупет’ и ‘тролль’, оставались относительно стабильными в течение того же периода, что предполагает, что подозрение в ИИ возникло как новая форма социального контроля границ, а не как продолжение или расширение предыдущих интернет-соперничеств.

В статье говорится:

‘Мы проанализировали 25 миллионов комментариев с Hacker News и Reddit (2023-2026), объединив суждение LLM о 7 500 образцах обвинений в использовании ИИ, траектории настроений, кодирование речевых актов 300 подтвержденных обвинений в использовании ИИ и тест с контролем для обвиняемых и не обвиняемых родительских комментариев.

‘Мы обнаружили, что доля обвинений с уничижительными ярлыками увеличилась более чем в десять раз на обеих платформах, в то время как placebo-словарь предшествующих 2022 года неаутентичных терминов (“шилл”, “астротурф”) не изменился.

‘Этот сдвиг отражал быстро растущую тенденцию к маркировке любого подозрительного или якобы неаутентичного прозы как “AI-мусор”.’

‘Фрейм “мусор” теперь составляет 94 процента уничижительных упоминаний, и доминирующие комментарии сместились в тоне от насмешки к гейткипингу и структурному протесту.’

Исследование ставит более широкий вопрос о том, могут ли люди действительно распознавать написанное ИИ, поскольку плавный текст – ранее рассматриваемый как доказательство усилий, экспертизы или подлинного участия – теперь является обильной и все более дешевой валютой.

Интересно отметить, что новая работа сосредоточена на Hacker News, который бдительно контролируется против комментариев, сгенерированных ИИ, и на Reddit, чей постоянный поток человеческой дискуссии теперь высоко ценится для разработчиков ИИ и компаний, а также становится новой основной целью для SEO-спамеров пытаясь вторгнуться в рейтинги веб-LLM по прокси.

Исследователи считают, что их результаты соответствуют растущему общественному пониманию того, что предыдущие источники истины могут быть девальвированы с распространением ИИ. Новая статья обсуждает реальных людей, обвиняемых в том, что они сущности ИИ, либо по действительной ошибке, стилистическому слиянию, либо злонамеренно (т.е. обвинитель знает, что его оппонент является человеком, но хочет закрыть его); но предсказывает, что другие типы коммуникации будут подобным образом запятнаны:

‘Наши результаты здесь предсказывают, что подобные обвинения в использовании ИИ будут сформированы для аутентификации изображений, аутентификации голоса и авторства кода среди прочего, с основной целью обвинения, лежащей в гейткипинге, а не в эмпирически точном обнаружении использования ИИ.’

‘Это может стать все более проблематичным, поскольку ИИ в этих областях уменьшает даже эмпирически обнаруживаемые признаки, которые могут найти эксперты.’

‘Это может привести к увеличению роли экспертов в верификации контента ИИ и не-ИИ; или это может сильно уменьшить доверие к любому типу средства массовой информации, которое может быть сгенерировано ИИ.’

Новая статья называется* “Это AI-мусор, бот!” Изучение обвинений, доказательств и достоверности в онлайн-дискурсе по отношению к комментариям, сгенерированным LLM, и исходит от двух рецензентов из Университета Осло и Американского университета Шарджи.

Метод

Датасет, разработанный для нового исследования, включал все публичные комментарии, опубликованные на Hacker News и 18 выбранных сообществах Reddit между январем 2023 года и майом 2026 года.

Было собрано около 25 миллионов комментариев, из которых 12 миллионов были с Hacker News, и 13 миллионов – с Reddit. Данные Reddit были получены из архива Arctic Shift через его публичный API JSON, в то время как комментарии Hacker News были собраны из архива поиска Hacker News Algolia.

Чтобы избежать сосредоточения внимания на одном типе сообщества, выборка Reddit была разделена на AI-ориентированные форумы, включая r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMA и r/singularity; творческие сообщества, включающие r/Art, r/writing и r/books; общие форумы r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistorians и r/science; и технологически-ориентированные и академические сообщества r/programming и r/AskAcademia.

Ставки выборки были сохранены последовательными во времени, что помогло обеспечить, чтобы изменения в ставках обвинений отражали сдвиги в поведении сообщества, а не изменения в сборе данных.

Пять уровней AI-позора

Кандидатские комментарии были выявлены с помощью 137-шаблонного поискового лексикона, организованного в пять именованных уровней: Уровень 1 (‘Прямой’) захватил явные обвинения, такие как ‘ChatGPT написал это’, ‘Это сгенерировано ИИ?’ и ‘OP – бот’.

Уровень 2 (‘Уничижительный’) охватил ярлыки, такие как ‘AI-мусор’, ‘GPT-мусор’, ‘ML-чушь’ и ‘робо-письмо’. Уровень 3 (‘Стиль’) занимался предполагаемыми стилистическими признаками, включая упоминания тире, ‘вызов delve’, ссылки на триколон и более широкие утверждения о “классической подписи ИИ”.

Уровень 4 (‘Намек’) захватил пародию и имитацию на основе знакомых фраз ИИ-помощников, таких как ‘собратья-люди’, ‘в быстро меняющемся ландшафте’ и ‘богатая ткань’. Уровень 5 (‘Косвенный’) включал менее явные подозрения, с комментариями, описанными как что-то, что ‘пахнет ИИ’, ‘читается как ChatGPT’ или напоминает ‘неуютную долину письма’.

Чтобы уменьшить ложные положительные результаты, общие фразы, такие как ‘стоит отметить’, ‘важно отметить’ и ‘это человек’, учитывались только тогда, когда рядом появлялся термин, связанный с ИИ. Поскольку эти поисковые шаблоны не могли надежно различать обвинения и обычные обсуждения, были проведены два прохода проверки с Claude Opus 4.7.

Выборка из 5 000 комментариев Reddit и 2 500 комментариев Hacker News была взята из пула кандидатов, сбалансированная во времени и категориях обвинений.

Каждый комментарий был затем классифицирован в одну из пяти групп результатов: Реальный, охватывающий подлинные обвинения в использовании ИИ; Раскрытие, охватывающий комментарии, которые признали авторство ИИ; Нейтральный-реф, охватывающий не обвинительные ссылки на ИИ; Ложный положительный, охватывающий ложные положительные результаты regex; и Неоднозначный, охватывающий случаи, когда доступный контекст не позволял сделать уверенный суд.

Исследователи также изучили, как обвинения изменились во времени, отслеживая рост новой маркировки “AI-мусор” по сравнению со старыми оскорблениями, такими как ‘чушь’, ‘мусор’, ‘трэш’, ‘вomit’, ‘сладж’, ‘мус’, ‘гунк’, ‘джанк’, ‘крап’, ‘салат-слово’ и ‘чушь’.

Ограничение тенденций

Тенденции настроений измерялись с помощью Valence Aware Dictionary и sEntiment Reasoner (VADER), в то время как отдельная выборка из 300 Reddit-threads, содержащих подтвержденные LLM-обвинения, была закодирована в соответствии с социальной ролью, выполняемой в них. Эти роли были классифицированы как Презрение (презрительное высмеивание); Отказ (прямой отказ); Высмеивание (имитация/пародия); Гейткипинг (‘правоохранительная деятельность’); или Структурный протест (общее неодобрение ИИ), что позволило отслеживать сдвиги в характере обвинений в ИИ во времени.

Отдельный ‘плацебо’-тест был разработан для определения того, могут ли растущие обвинения в ИИ просто отражать более широкое увеличение подозрений в интернете, где тот же датасет был поисковым для старых пред-ChatGPT терминов неаутентичности, таких как ‘шилл’, ‘астротурф’, ‘сокпупет’, ‘платный шилл’, ‘фальшивый аккаунт’, ‘корпоративный шилл’, ‘тalking points’ и ‘payola’.

Последний набор тестов изучал, являются ли те признаки, которые отличают написанное ИИ от человеческого письма, теми же признаками, которые вызывают обвинения в использовании ИИ против человеческих комментариев, через изучение шести лингвистических маркеров: плотность статьи; степень сокращения; частота формального регистра; плотность предлогов; варьирование длины предложения; и средняя длина токена. Сравнения были сделаны между Раскрытием и Реальными комментариями с помощью теста Манна-Уитни.

Родительские комментарии, связанные с 800 LLM-подтвержденными обвинениями в Reddit, были получены, и 421 случай был сохранен, где родитель был сам комментарием, а не верхнеуровневым постом. Эти были сопоставлены с 2 048 не обвиненными комментариями, полученными из того же subreddit и месяца. Логистическая регрессия была затем использована для проверки того, являются ли лингвистические маркеры, которые отличают текст, сгенерированный ИИ, от человеческого письма, также предсказывают, какие человеческие комментарии привлекают обвинения в использовании ИИ.

Результаты

Исследование зафиксировало значительный рост обвинений в ИИ на Reddit и Hacker News между 2023 и 2026 годами. Большая часть этого роста была сконцентрирована в использовании уничижительных ярлыков;

Рост обвинений в ИИ на Reddit и Hacker News между январем 2023 года и майом 2026 года. Уровень 2 (‘Уничижительный’) обвинений увеличился с низких единиц до примерно четверти кандидатских обвинений на обеих платформах. Три ускоряющих периода видны в 2024 и 2025 годах, после чего рост замедляется. Hacker News оставался выше Reddit за большую часть периода исследования, но обе платформы сузились до схожих уровней к 2026 году. Источник

К 2026 году “AI-мусор” составил 94% уничижительных обвинений в ИИ, выявленных в датасете, заменив более ранние термины, такие как ‘GPT-мусор’, ‘ML-чушь’ и ‘робо-письмо’. Согласно статье, доля уничижительных обвинений в ИИ увеличилась более чем в десять раз на обеих платформах в течение периода исследования:

Рост ярлыка ‘AI-мусор’ по сравнению с более ранними уничижительными обвинениями в ИИ между 2023 и 2026 годами. Хотя термины, такие как ‘чушь’, ‘мусор’, ‘трэш’, ‘вomit’, ‘сладж’, ‘мус’, ‘гунк’, ‘джанк’, ‘крап’, ‘салат-слово’ и ‘чушь’, изначально доминировали в уничижительных обвинениях, их доля постоянно снижалась, поскольку ‘AI-мусор’ стал подавляющим предпочтительным ярлыком. К 2026 году ‘мусорный’ фрейм составил примерно 94% уничижительных обвинений в ИИ, что указывает на консолидацию языка обвинений вокруг одного термина.

Отдельное сравнение было проведено с использованием старых терминов неаутентичности, таких как ‘шилл’, ‘астротурф’, ‘сокпупет’, ‘платный шилл’, ‘фальшивый аккаунт’, ‘корпоративный шилл’, ‘тalking points’ и ‘payola’. В отличие от обвинений, ориентированных на ИИ, эти термины не показали подобного увеличения.

Вариация также наблюдалась в разных сообществах, с более ранним ростом, зарегистрированным в AI-ориентированных и технологически-ориентированных форумах, и подобными шаблонами, появляющимися позже в других частях Reddit и Hacker News.

Изменения были обнаружены не только в частоте обвинений, но и в их классификации. Кодирование 300 подтвержденных обвинений в Reddit показало сдвиги в относительной распространенности Презрения, Отказа, Высмеивания, Гейткипинга и Структурного протеста. Согласно статье, Гейткипинг и Структурный протест стали более распространенными со временем, в то время как Презрение и Высмеивание стали менее распространенными.

Заключение

Похоже, что эпидемия случайного AI-позора в разделах комментариев явно нуждается в своей собственной итерации закона Годвина; на основе событий и тенденций в социальном и политическом комментарии в последние годы, было бы логично, если бы ИИ-боты стали наиболее вероятными обвинителями других комментаторов в том, что они боты; однако, это может привести к подавлению всех комментариев по этому вопросу.

* Пожалуйста, обратите внимание, что эта статья не является дружественным чтением и ориентирована на академических коллег авторов по тону и лексикону.

Опубликовано впервые в пятницу, 12 июня 2026 года