Andersonův úhel

Vzestup obvinění z “AI odpadků” se stává novou formou gatekeepingu

mm
AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room.

Vyzývat něco “AI odpadky” se stalo novou honbou na čarodějnice na internetu, kdy uživatelé Redditu a Hacker News stále více obviňují své spoluříkače z toho, že jsou roboti, i když není žádný důkaz o tom.

 

Nová studie z Norska a Spojených arabských emirátů zjistila, že obvinění proti údajným “AI odpadkům” ze strany ostatních uživatelů prudce vzrostla na Redditu a Hacker News mezi lety 2023 a 2026, i když komentáře nevykazovaly žádné známky toho, že byly generovány umělou inteligencí.

Výsledky analýzy 25 milionů komentářů naznačují, že taková obvinění fungují stále více jako forma sociálního gatekeepingu, spíše než jako způsob identifikace umělých inteligencí.

Vědci také zjistili, že technicky založené komunity přijaly “kulturu obvinění” dříve než jiné skupiny, přičemž tento vzorec se později rozšířil do širších oblastí Redditu.

Zjevný nárůst obvinění kolem “AI odpadků” se nezdá být součástí širšího nebo obecnějšího nárůstu online nepřátelství: starší formy invektiv, jako ‘shill’, ‘sockpuppet’ a ‘troll’ , zůstaly relativně stabilní během stejného období, což naznačuje, že podezření z umělých inteligencí se objevilo jako nová forma sociálního hranice, spíše než jako pokračování nebo rozšíření předchozích internetových svárů.

Studie uvádí:

‘Analyzovali jsme 25 milionů komentářů z Hacker News a Redditu (2023-2026), kombinující LLM soudy na 7 500 vzorkovaných obvinění z použití AI, sentimentální trajektorie, speech-act kódování 300 potvrzených obvinění z použití AI a test srovnávacího vzorku obviněných a neobviněných rodičovských komentářů.

‘Zjistili jsme, že podíl pejorativních obvinění vzrostl více než desetinásobně na obou platformách, zatímco placebo slovník předročních termínů neautentických termínů (“shill”, “astroturf”) ne.

‘Tento posun odrážel rychlý trend označování jakékoli podezřelé nebo zdánlivě neautentické prózy jako “AI odpadky”.

‘Rámec “odpadků” nyní tvoří 94 procent pejorativních zmínek, přičemž dominantní komentáře se posunuly v tónu od posměchu směrem k gatekeepingu a strukturnímu protestu.’

Studie vyvolává širší otázku, zda lidé mohou opravdu rozpoznat psaní umělých inteligencí, protože plynulé prózy – dříve považované za důkaz úsilí, odbornosti nebo skutečného zapojení – jsou nyní hojné a stále více znehodnocené.

Je zajímavé poznamenat, že nová práce se soustředí na Hacker News, který je přísně hlídaný proti komentářům generovaným umělými inteligencemi, a na Reddit, jehož stálý tok lidské diskuse je nyní vysokou cenou pro vývojáře a společnosti AI, jakož i se stává novým hlavním cílem pro SEO spamery hledající invazovat LLM-založené webové žebříčky zprostředkováním.

Vědci se domnívají, že jejich zjištění souhlasí s rostoucím veřejným pochopením, že předchozí zdroje pravdy mohou být znehodnoceny s rostoucím používáním umělých inteligencí. Nová studie diskutuje skutečné lidi obviněné z toho, že jsou entitami AI, buď kvůli skutečné chybě, stylistické konfuzi, nebo zlomyslnosti (tj. obviněný ví, že jeho oponent je lidský, ale chce ho umlčet); ale předpovídá, že podobná obvinění z použití AI se budou tvořit pro ověření autenticity obrazů, ověření autenticity hlasu a autorství kódu mezi ostatními, s jádrem záměru laického obvinění gatekeepingu spíše než empiricky přesné detekce použití AI.

‘Naše výsledky by naznačovaly, že podobná obvinění z použití AI se budou tvořit pro ověření autenticity obrazů, ověření autenticity hlasu a autorství kódu mezi ostatními, s jádrem záměru laického obvinění gatekeepingu spíše než empiricky přesné detekce použití AI.

‘To se stane stále problematictějším, protože AI v těchto oblastech snižuje i empiricky detekovatelné tipy, které mohou najít experti.

‘To může mít za následek zvýšení role expertů při ověřování AI versus ne-AI obsahu; nebo to může výrazně snížit důvěru v jakýkoli typ média, který může být plausibilně generován umělými inteligencemi.’

Nová studie* se jmenuje “To jsou AI odpadky, ty bot!” Studium obvinění, důkazů a důvěryhodnosti v online diskusi vůči LLM-generovaným komentářům a pochází od dvou recenzentů z Univerzity v Oslu a Americké univerzity v Šarjáhu.

Metoda

Datová sada vyvinutá pro novou studii zahrnovala všechny veřejné komentáře zveřejněné na Hacker News a 18 vybraných subredditů mezi lednem 2023 a květnem 2026.

Přibližně 25 milionů komentářů bylo vybráno, z toho 12 milionů z Hacker News a 13 milionů z Redditu. Data z Redditu byla získána z Arctic Shift archivu prostřednictvím jeho veřejného JSON API, zatímco komentáře z Hacker News byly shromážděny z Algolia Hacker News search archivu.

Aby se zabránilo soustředění se na jeden typ komunity, byl vzorek z Redditu rozdělen napříč AI-zaměřenými fóry, včetně r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMA a r/singularity; kreativní komunity, jako r/Art, r/writing a r/books; obecné zájmové fórum r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistorians a r/science; a technicky orientované a akademické komunity r/programming a r/AskAcademia.

Míra vzorkování byla zachována konzistentně napříč časem, což pomohlo zajistit, že změny v míře obvinění odrážely změny v chování komunity, spíše než změny ve sběru dat.

Pět úrovní AI-hanobení

Kandidátské komentáře byly identifikovány pomocí 137-pattern vyhledávacího lexikonu organizovaného do pěti pojmenovaných úrovní: Úroveň 1 (‘Direct’) zachytila explicitní obvinění, jako ‘ChatGPT napsal toto’, ‘Je toto AI-generováno?’, a ‘OP je bot’.

Úroveň 2 (‘Pejorative’) pokrývala štítky, jako ‘AI odpadky’, ‘GPT odpadky’, ‘ML drivel’, a ‘robo-psaní’. Úroveň 3 (‘Style’) se zabývala údajnými stylistickými znaky, včetně em-dash zmínek, ‘delve’ volání, tricolon odkazy, a širší nároky na “klasický AI podpis”.

Úroveň 4 (‘Mocking’) zachytila parodii a napodobení založená na známých frázích AI-asistentů, jako ‘fellow humans’, ‘in the rapidly evolving landscape’, a ‘rich tapestry’. Úroveň 5 (‘Indirect’) obsahovala méně explicitní podezření, s komentáři popsány jako něco, co ‘smells like AI’, ‘reads like ChatGPT’, nebo připomíná ‘uncanny valley of writing’.

Aby se snížily falešné pozitivy, běžné fráze, jako ‘worth noting’, ‘it’s important to note’, a ‘is this a human’, byly počítány pouze tehdy, když se nearby objevil termín související s AI. Protože tyto vyhledávací vzory nemohly spolehlivě rozlišit obvinění od běžné diskuse, byly provedeny dvě validační průchody s Claude Opus 4.7.

Vzorek 5 000 komentářů z Redditu a 2 500 komentářů z Hacker News byl vybrán z kandidátské skupiny, vyvážený napříč časovými obdobími a kategoriemi obvinění.

Každý komentář byl poté klasifikován do jedné z pěti výsledkových skupin: Real, pokrývající skutečná obvinění z použití AI; Disclosure, pokrývající komentáře, které uznaly autorství AI; Neutral-Ref, pokrývající neobviňující odkazy na AI; FP, pokrývající regex falešné pozitivy; a Ambiguous, pokrývající případy, ve kterých dostupný kontext neumožňoval jistý soud.

Vědci také zkoumali, jak se obvinění změnily v čase, sledovali vzestup novějšího ‘AI odpadků’ rámcování proti starším urážkám, jako ‘drivel’, ‘garbage’, ‘trash’, ‘vomit’, ‘sludge’, ‘mush’, ‘gunk’, ‘junk’, ‘crap’, ‘word salad’, a ‘nonsense’.

Vymezení trendů

Sentimentální trendy byly měřeny pomocí Valence Aware Dictionary a sEntiment Reasoner (VADER), zatímco samostatný vzorek 300 Reddit vláken obsahujících LLM-validovaná Real obvinění bylo zakódováno podle sociální role, která byla prováděna. Tyto byly klasifikovány jako Sneer (odmítavá parodie); Dismiss (přímé odmítnutí); Mockery (imitace/parodie); Gatekeep (‘pravidlo-enforcement’); nebo Structural Protest (obecný nesouhlas s AI), což umožnilo sledovat změny v charakteru AI obvinění v čase.

Samostatný ‘placebo’ test byl navržen tak, aby určil, zda vzestup AI obvinění může jednoduše odrážet širší nárůst podezření online, kdy stejná datová sada byla vyhledána pro starší pre-ChatGPT neautentické termíny, jako ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘paid shill’, ‘fake account’, ‘corporate shill’, ‘talking points’, a ‘payola’.

Konečná série testů zkoumala, zda rysy, které oddělují AI-generované psaní od lidského psaní, jsou stejné rysy, které způsobují, že lidské komentáře jsou obviněny z toho, že jsou AI, prostřednictvím zkoumání šesti lingvistických markerů: článkové hustoty; kontrakční rychlosti; formální rejstříkové adverbiální frekvence; předložkové hustoty; variance délky vět; a průměrné délky tokenů. Porovnání byla provedena mezi Disclosure a Real komentáři pomocí Mann-Whitney U testů.

Rodičovské komentáře spojené s 800 LLM-validovanými Real Reddit obviněními byly získány, z nichž 421 případů bylo uchováno, kde rodičovský komentář sám byl komentář, spíše než top-level příspěvek. Tyto byly porovnány s 2 048 neobviněnými komentáři vybranými ze stejného subredditu a měsíce. Logistická regrese byla poté použita k testování, zda lingvistické markery, které odlišují AI-generované texty od lidského psaní, také předpovídají, které lidské komentáře přitahují obvinění z použití AI.

Výsledky

Studie zaznamenala velký nárůst AI obvinění napříč Redditem a Hacker News mezi lety 2023 a 2026. Většina tohoto růstu byla soustředěna do používání pejorativních štítků:

Meziplatformový růst pejorativních AI obvinění na Redditu a Hacker News mezi lednem 2023 a květnem 2026. Úroveň 2 ('Pejorative') obvinění vzrostla z nízkých jednociferných čísel na přibližně čtvrtinu kandidátských obvinění na obou platformách. Tři akcelerační období jsou viditelná během roku 2024 a 2025, po kterých růst vyrovná. Hacker News zůstal nad Redditem pro většinu studijního období, ale obě platformy se shodly na podobné úrovni do roku 2026. Zdroj - https://arxiv.org/pdf/2606.12073

Meziplatformový růst pejorativních AI obvinění na Redditu a Hacker News mezi lednem 2023 a květnem 2026. Úroveň 2 (‘Pejorative’) obvinění vzrostla z nízkých jednociferných čísel na přibližně čtvrtinu kandidátských obvinění na obou platformách. Tři akcelerační období jsou viditelná během roku 2024 a 2025, po kterých růst vyrovná. Hacker News zůstal nad Redditem pro většinu studijního období, ale obě platformy se shodly na podobné úrovni do roku 2026. Zdroj

Do roku 2026 “AI odpadky” tvořily 94 % pejorativních AI obvinění identifikovaných v datové sadě, nahrazující starší termíny, jako ‘GPT odpadky’, ‘ML drivel’, a ‘robo-psaní’. Podle studie se podíl pejorativních AI obvinění zvýšil více než desetinásobně na obou platformách během studijního období:

Růst 'AI odpadků' štítku v porovnání se staršími pejorativními AI obviněními mezi lety 2023 a 2026. Zatímco termíny, jako 'drivel', 'garbage', 'trash', 'vomit', 'sludge', 'mush', 'gunk', 'junk', 'crap', 'word salad', a 'nonsense'最初ně dominovaly pejorativním obviněním, jejich podíl klesal postupně, jak se 'AI odpadky' stalo převládajícím štítkem. Do roku 2026 'slop' rámec tvořil přibližně 94 % pejorativních AI obvinění, což naznačuje konsolidaci obvinění jazyka kolem jediného termínu.

Růst ‘AI odpadků’ štítku v porovnání se staršími pejorativními AI obviněními mezi lety 2023 a 2026. Zatímco termíny, jako ‘drivel’, ‘garbage’, ‘trash’, ‘vomit’, ‘sludge’, ‘mush’, ‘gunk’, ‘junk’, ‘crap’, ‘word salad’, a ‘nonsense’最初ně dominovaly pejorativním obviněním, jejich podíl klesal postupně, jak se ‘AI odpadky’ stalo převládajícím štítkem. Do roku 2026 ‘slop’ rámec tvořil přibližně 94 % pejorativních AI obvinění, což naznačuje konsolidaci obvinění jazyka kolem jediného termínu.

Oddělené srovnání bylo provedeno pomocí starších neautentických termínů, jako ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘paid shill’, ‘fake account’, ‘corporate shill’, ‘talking points’, a ‘payola’. Na rozdíl od AI-zaměřených obvinění, tyto termíny nevykazovaly srovnatelný nárůst.

Variace byla pozorována napříč komunitami, s dřívějším růstem zaznamenaným v AI-zaměřených a technicky orientovaných fórech – s podobnými vzory, které se později objevily v jiných částech Redditu a Hacker News.

Změny byly pozorovány nejen v četnosti obvinění, ale také v jejich klasifikaci. Kódování 300 validovaných Reddit obvinění ukázalo posuny v relativní prevalenci Sneer, Dismiss, Mockery, Gatekeep, a Structural Protest. Podle studie se Gatekeep a Structural Protest staly častějšími v čase, zatímco Sneer a Mockery se staly méně častými.

Závěr

Zjevná epidemie náhodného AI-hanobení v komentářových sekcích jasně potřebuje svou vlastní iteraci Godwinova zákona; založeno na událostech a trendech v sociálních a politických komentářích v posledních letech, bylo by smysluplné, kdyby AI boti se stali nejpravděpodobnějšími obviněními jiných komentátorů z toho, že jsou boti; nicméně, to by mohlo vést ke ztlumení všech komentářů na toto téma.

 

* Pokud si nejste vědomi, že tato studie není přátelským čtením a je zaměřena, tónem a lexikem, na akademické kolegy autorů.

Poprvé zveřejněno v pátek, 12. června 2026

Spisovatel o strojovém učení, doménový specialista na syntézu lidského obrazu. Bývalý vedoucí výzkumného obsahu ve společnosti Metaphysic.ai.
Osobní stránky: martinanderson.ai