Andersonin kulma
“AI-sotku” -syytökset muodostuvat uudeksi muodoksi portinvartijuudesta

Kutsua jotain “AI-sotkuksi” on tullut internetin uudeksi noitavainoksi, ja Redditin ja Hacker Newsin käyttäjät syyttävät yhä useammin toisia kommentoijia olemasta roboteja, vaikka näyttöä tästä ei ole.
Norjalais- ja arabiemiraattien tutkimus on osoittanut, että syytökset väitetystä “AI-sotkusta” ovat lisääntyneet voimakkaasti Redditissä ja Hacker Newsissä vuosina 2023-2026, vaikka kommentti ei osoittanut mitään merkkejä siitä, että se olisi AI:sta generoitu.
Tutkijoiden analyysi 25 miljoonasta kommentista osoittaa, että tällaiset syytökset toimivat yhä enemmän emergenttinä muotona sosiaalista portinvartijuutta, eikä niinkään keinona tunnistaa AI:ta.
Tutkijat havaitsivat myös, että teknisesti suuntautuneet yhteisöt omaksuivat “syytöskulttuurin” aikaisemmin kuin muut ryhmät, ja tämä ilmiö levisi myöhemmin laajemmin Redditissä.
Tämä näkyvä lisäys “AI-sotku”-syytöksissä ei vaikuta olevan osa laajempaa tai yleisempää lisäystä verkossa ilmenevässä vihamielisyydessä: vanhat herjauksen muodot, kuten ‘shill’, ‘sockpuppet’ ja ‘troll’ , pysyivät suhteellisen vakaana samanaikaisesti, mikä viittaa siihen, että epäily AI:sta nousi uutena muotona sosiaalisen rajanvalvontana, eikä jatkumona aiemmista internet-riidoista.
Tutkimusraportti toteaa:
‘Analysoimme 25 miljoonaa kommenttia Hacker Newsistä ja Redditistä (2023-2026), yhdistäen LLM-päätöksen 7 500 näytteestä syytöksistä AI-käytöstä, sentimentin trajektoreita, puhetekstin koodausta 300 vahvistetusta syytöksestä AI-käytöstä ja kontrollitestiin syytetyistä ja syyttämättömistä vanhemmista kommentteista.
‘Havaitsemme, että halventavan syytöksen osuus kasvoi yli kymmenkertaisesti molemmissa alustoissa, kun taas ennen vuotta 2022 olevien epäaidoista termejä (“shill”, “astroturf”) ei havaittu.
‘Tämä muutos heijasti nopeasti kasvavaa trendiä, jossa mitä tahansa epäilyttävää tai epäaidon näköistä proosaa kutsutaan “AI-sotkuksi”.
‘Sotku-kehyksessä on nyt 94 prosenttia halventavista maininnoista, ja johtavat kommentit ovat muuttuneet pilkkaamisesta portinvartijuuteen ja rakenteelliseen protestiin.’
Tutkimus herättää laajemman kysymyksen siitä, voivatko ihmiset todella tunnistaa AI-kirjoittamista, koska sujuva proosa – jota aikaisemmin pidettiin todisteena ponnistelusta, asiantuntemuksesta tai aidoista sitoutumisesta – on nyt runsas ja yhä arvoton hyödyke.
On mielenkiintoista huomata, että uusi tutkimus keskittyy Hacker Newsiin, jota valvotaan tarkasti AI-generoituja kommentteja vastaan, ja Redditiiin, jonka jatkuva virta ihmisten kirjoittamasta keskustelusta on nyt korkeasti arvostettu AI-kehittäjille ja yrityksille, sekä uusi pääkohde SEO-spammereille jotka pyrkivät valtaamaan LLM-pohjaiset verkkosijoitukset välillisesti.
Tutkijat uskovat, että heidän tuloksensa ovat yhtensäisiä kasvavan yleisen ymmärryksen kanssa, että aiemmat totuuden lähteet voivat menettää arvonsa, kun AI:n käyttö yleistyy. Uusi tutkimus kertoo todellisista ihmisistä, jotka on syytetty AI-olentoja, joko todellisen virheen, tyylin sekoittumisen tai pahantahtoisuuden kautta (ts. syyttäjä tietää, että vastustajansa on ihminen, mutta haluaa sulkea heidät pois); mutta ennustaa, että muita viestintämuotoja voidaan samalla tavalla mustamaalata:
‘Tuloksemme osoittavat, että vastaavat AI-käytön syytökset muodostuvat myös kuvien todentamiselle, äänen todentamiselle ja koodin kirjoittamiselle muun muassa, ja että syytösten ydinasiassa on portinvartijuus, eikä empirinen havaitseminen AI-käytöstä.
‘Tämä voi muodostua yhä ongelmallisemmaksi, kun AI näissä aloissa vähentää jopa asiantuntijoiden havaitsemia viitteitä.
‘Tämä voi johtaa siihen, että asiantuntijoiden rooli AI-sisällön ja ei-AI-sisällön todentamisessa kasvaa; tai se voi vähentää luottamusta mihin tahansa medioon, jota voidaan plausibelisti generoida AI:lla.’
Uusi tutkimus “That’s AI Slop, You Bot!” Tutkimus syytöksistä, todisteista ja luotettavuudesta verkossa LLM-generoituja kommentteja kohtaan on tehty kahden arvioijan toimesta Oslon yliopistosta ja Sharjahin amerikkalaisesta yliopistosta.
Menetelmä
Tutkimuksessa kehitetty aineisto koostui kaikista julkisista kommentteista, jotka oli julkaistu Hacker Newsissä ja 18 valitussa Reddit-yhteisössä tammikuun 2023 ja toukokuun 2026 välisenä aikana.
Noissa oli noin 25 miljoonaa kommenttia, joista 12 miljoonaa oli Hacker Newsistä ja 13 miljoonaa Redditistä. Redditin data hankittiin Arctic Shift -arkistosta sen julkisesta JSON-rajapinnasta, kun taas Hacker Newsin kommentit kerättiin Algolia Hacker News -haun arkistosta.
Jotta ei keskityttäisi yhteen yhteisötyyppiin, Reddit-näyte jaettiin useisiin osiin, mukaan lukien AI-keskeiset foorumit kuten r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMA ja r/singularity; luovia yhteisöjä kuten r/Art, r/writing ja r/books; yleistä mielenkiintoa koskevia foorumeja r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistorians ja r/science; sekä teknologia- ja akateemisia yhteisöjä r/programming ja r/AskAcademia.
Näytteenottotaajuudet pidettiin vakaina ajallisesti, mikä auttoi varmistamaan, että syytösten muutokset heijastivat yhteisöjen käyttäytymisen muutoksia eikä aineiston keräämisen muutoksia.
Viisi tasoa AI-nimittämistä
Ehdokas-kommentit tunnistettiin 137-mallisen hakusanaston avulla, joka jaettiin viiteen nimettyyn tasoitteeseen: Taso 1 (‘Suora’) käsitti eksplisiittiset syytökset, kuten ‘ChatGPT kirjoitti tämän’, ‘Onko tämä AI-generoitu?’ ja ‘Alkuperäinen kirjoittaja on robotti’.
Taso 2 (‘Halventava’) käsitti termejä kuten ‘AI-sotku’, ‘GPT-roska’, ‘ML-pöty’ ja ‘robotti-kirjoittaminen’. Taso 3 (‘Tyyli’) käsitti tyylinen muistuttimet, kuten em-viivat, ‘syväksi’ -huomautukset, trikoloni-viittaukset ja laajemmat väitteet “klassisesta AI-signatuurista”.
Taso 4 (‘Pilailu’) käsitti parodian ja matkinnan, joka perustui tuttuun AI-avustajien lauseisiin, kuten ‘Ihmiskollegat’, ‘nopeasti muuttuvassa maisemassa’ ja ‘rikas kuvio’. Taso 5 (‘Epäsuora’) käsitti vähemmän eksplisiittisiä epäilyjä, kuten kommentteja, jotka kuvattiin “AI-hajuna”, “lukeutuu ChatGPT:ltä” tai muistuttaa “kirjoittamisen outoa laaksoa”.
Jotta vältettäisiin virheelliset positiiviset, yleisiä termejä kuten ‘huomionarvoista’, ‘on tärkeää huomata’ ja ‘onko tämä ihminen’ otettiin huomioon vain silloin, kun AI-aiheinen termi oli lähistöllä. Koska nämä hakumallit eivät voineet luotettavasti erottaa syytöksiä tavallisesta keskustelusta, tehtiin kaksi vahvistus-kierrosta Claude Opus 4.7:n avulla.
Reddit-näyte 5 000 kommentista ja Hacker News -näyte 2 500 kommentista otettiin ehdokasjoukosta, ja ne tasapainotettiin aikajaksojen ja syytösten luokkien mukaan.
Kunkin kommentin luokittelussa käytettiin viittä tulostasoa: Tosi, joka käsitti aitoja AI-käytön syytöksiä; Ilmoitus, joka käsitti kommentteja, jotka tunnustivat AI-kirjoittamisen; Neutraali-viittaus, joka käsitti ei-syytöksellisiä viittauksia AI:hen; VP, joka käsitti regex-virheellisiä positiivisia; ja Epäselvä, joka käsitti tapaukset, joissa saatavilla oleva konteksti ei sallinut luotettavaa arviointia.
Tutkijat tutkivat myös, miten syytökset muuttuivat ajan myötä, ja seurasivat uuden “AI-sotku”-kehyksen nousua vanhempien herjauksien kuten ‘pöty’, ‘roska’, ‘jäte’, ‘oksentelu’, ‘liete’, ‘mössö’, ‘lima’, ‘roska’, ‘saasta’, ‘sana-salaatti’ ja ‘järjetön puhuminen’ vastaan.
Rajoittavat trendit
Tunteiden trendejä mitattiin Valence Aware Dictionary and sEntiment Reasoner (VADER):n avulla, ja erillinen näyte 300 Reddit-lankaa, jotka sisälsivät LLM-vahvistetut Tosi -syytökset, koodattiin sosiaalisen roolin mukaan. Nämä luokiteltiin Pilailu (hymyilevä pilkka); Hylkäys (suora hylkäys); Pilailu (matkinta); Portinvartija (‘sääntöjen valvonta’); tai Rakenteellinen protesti (yleinen AI:n vastustus), mikä mahdollisti AI-syytösten luonteen muutosten seuraamisen ajan myötä.
Erillinen “placebo”-testi suunniteltiin selvittämään, voivatko kasvavat AI-syytökset johtua laajemmasta epäilyksen lisääntymisestä verkossa, jossa etsittiin samasta aineistosta vanhoja epäaidoista termejä, kuten ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘palkattu shill’, ‘väärennetty tili’, ‘yrityksen shill’, ‘puhuva pää’ ja ‘ostettu mainos’.
Vaihtelua havaittiin myös yhteisöittäin, ja kasvua havaittiin aikaisemmin AI-keskeisissä ja teknologia-keskeisissä foorumeissa, ja samankaltaisia malleja ilmestyi myöhemmin muissa osissa Redditissä ja Hacker Newsissä.
Muutoksia havaittiin sekä syytösten tiheydessä että luokittelussa. 300 vahvistetun AI-syytöksen koodaaminen osoitti muutoksia Pilailu, Hylkäys, Pilailu, Portinvartija ja Rakenteellinen protesti -luokkien suhteellisessa esiintymisessä. Tutkimusraportin mukaan Portinvartija ja Rakenteellinen protesti yleistyivät ajan myötä, kun taas Pilailu ja Pilailu harvenivat.
Tulokset
Tutkimus osoitti suuren kasvun AI-syytöksissä Redditissä ja Hacker Newsissä vuosina 2023-2026. Suurin osa tästä kasvusta keskittyi halventavien termien käyttöön;

Molempien alustojen halventavien AI-syytösten kasvu Redditissä ja Hacker Newsissä tammikuun 2023 ja toukokuun 2026 välisenä aikana. Taso 2 (‘Halventava’) syytökset kasvoivat yhdestä prosentista noin neljään prosenttiin molemmissa alustoissa. Kolme kiihdytysvaihetta on nähtävissä vuosina 2024 ja 2025, minkä jälkeen kasvu hidastui. Hacker News oli suurimman osan tutkimusjaksoa Redditin yläpuolella, mutta molemmat alustat saavuttivat saman tason vuonna 2026. Lähde
Vuoteen 2026 mennessä “AI-sotku” käsitti 94 prosenttia havaituista halventavista AI-syytöksistä aineistossa, korvaten aiemmat termit kuten ‘GPT-roska’, ‘ML-pöty’ ja ‘robotti-kirjoittaminen’. Tutkimusraportin mukaan halventavien AI-syytösten osuus kasvoi yli kymmenkertaisesti molemmissa alustoissa tutkimusjakson aikana:

AI-syytösten ‘AI-sotku’-termin nousu vanhempien halventavien AI-syytösten suhteen vuosina 2023-2026. Vaikka termit kuten ‘pöty’, ‘roska’, ‘jäte’, ‘oksentelu’, ‘liete’, ‘mössö’, ‘lima’, ‘roska’, ‘saasta’, ‘sana-salaatti’ ja ‘järjetön puhuminen’ aluksi hallitsivat halventavia syytöksiä, niiden osuus laski jatkuvasti, kun ‘AI-sotku’ -kehyksestä tuli ylivoimaisesti suosituin termi. Vuoteen 2026 mennessä ‘sotku’-kehyksessä oli noin 94 prosenttia halventavista AI-syytöksistä, mikä osoittaa kielen konsolidoitumista yhden termin ympärille.
Erillinen vertailu tehtiin vanhempien epäaidoista termejä, kuten ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘palkattu shill’, ‘väärennetty tili’, ‘yrityksen shill’, ‘puhuva pää’ ja ‘ostettu mainos’. Toisin kuin AI-keskeiset syytökset, nämä termit eivät osoittaneet vastaavaa kasvua.
Vaihtelua havaittiin myös yhteisöittäin, ja kasvua havaittiin aikaisemmin AI-keskeisissä ja teknologia-keskeisissä foorumeissa, ja samankaltaisia malleja ilmestyi myöhemmin muissa osissa Redditissä ja Hacker Newsissä.
Muutoksia havaittiin sekä syytösten tiheydessä että luokittelussa. 300 vahvistetun AI-syytöksen koodaaminen osoitti muutoksia Pilailu, Hylkäys, Pilailu, Portinvartija ja Rakenteellinen protesti -luokkien suhteellisessa esiintymisessä. Tutkimusraportin mukaan Portinvartija ja Rakenteellinen protesti yleistyivät ajan myötä, kun taas Pilailu ja Pilailu harvenivat.
Johtopäätös
Ilmeinen AI-nimittämisen epidemiassa kommenttiosioissa vaatii oman versionsa Godwinin lakia; perustuen tapahtumiin ja trendeihin viimeaikaisissa sosiaalisissa ja poliittisissa kommentteissa, olisi järkevää, jos AI-botit tulisivat todennäköisimmiksi syyttämään toisia kommentoijia olemasta botteja; kuitenkin tämä saattaisi tukahduttaa kaiken kommentoinnin aiheesta.
* Ole tietoinen, että tämä tutkimus ei ole helppo luettava, ja se on suunnattu kirjoittajien akateemisille vastinparille, sekä sävyssä että sanastossa.
Julkaistu ensimmäisen kerran perjantaina, 12. kesäkuuta 2026












