Angolo di Anderson

L’ascesa delle accuse di “spazzatura AI” sta diventando una nuova forma di gatekeeping

mm
AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room.

Chiamare qualcosa “spazzatura AI” è diventata la nuova caccia alle streghe di internet, con gli utenti di Reddit e Hacker News che accusano sempre più spesso i loro compagni di commento di essere robot, anche quando non c’è alcuna prova di questo.

 

Uno studio recente della Norvegia e degli Emirati Arabi Uniti ha scoperto che le accuse contro presunti “spazzatura AI” da parte di altri commentatori sono aumentate drasticamente su Reddit e Hacker News tra il 2023 e il 2026, anche quando il commento non mostrava alcuna prova di essere stato generato da un’intelligenza artificiale.

I risultati dell’analisi degli autori di 25 milioni di commenti suggeriscono che tali accuse stanno funzionando sempre più come una forma emergente di gatekeeping sociale, piuttosto che come un modo per identificare l’intelligenza artificiale.

I ricercatori hanno anche scoperto che le comunità tecniche hanno adottato la “cultura dell’accusa” prima di altre comunità, con il modello che si è successivamente diffuso in altre aree di Reddit.

Questo apparente aumento delle accuse intorno alla “spazzatura AI” non sembra essere parte di un aumento più ampio o generale dell’ostilità online: le forme di invettiva più vecchie, come ‘shill’, ‘sockpuppet’ e ‘troll’, sono rimaste relativamente stabili durante lo stesso periodo, suggerendo che la sospetto di intelligenza artificiale è emersa come una nuova forma di controllo dei confini sociali, piuttosto che una continuazione o estensione di precedenti faide online.

Il documento afferma:

‘Abbiamo analizzato 25 milioni di commenti da Hacker News e Reddit (2023-2026), combinando il giudizio LLM su 7.500 accuse campionate di utilizzo di AI, traiettorie di sentimenti, codifica di atti di discorso di 300 accuse confermate di utilizzo di AI e un test di controllo abbinato di commenti genitori accusati e non accusati.

‘Abbiamo scoperto che la quota di accuse con etichetta peggiorativa è aumentata di più di dieci volte su entrambe le piattaforme, mentre un vocabolario placebo di termini di inautenticità pre-2022 (“shill”, “astroturf”) non lo ha fatto.

‘Questo cambiamento ha riflesso una tendenza in rapida crescita di etichettare come “spazzatura AI” qualsiasi prosa sospetta o apparentemente non autentica.

‘Il frame della spazzatura costituisce ora il 94 percento delle menzioni peggiorative, con i commenti dominanti che si spostano nel tono dalla derisione verso il gatekeeping e la protesta strutturale.’

Lo studio solleva la questione più ampia se le persone possano realmente riconoscere la scrittura dell’intelligenza artificiale, poiché la prosa fluente – precedentemente trattata come prova di sforzo, competenza o impegno genuino – è ora una merce abbondante e sempre più svalutata.

È interessante notare che il nuovo lavoro si concentra su Hacker News, che è strettamente vigilato contro i commenti generati da intelligenza artificiale, e su Reddit, il cui flusso costante di discorso umano è ora altamente apprezzato per gli sviluppatori e le aziende di intelligenza artificiale, nonché diventato un nuovo obiettivo principale per gli spammer di SEO che cercano di invadere i ranking web basati su LLM per procura.

I ricercatori ritengono che i loro risultati siano in linea con la crescente comprensione pubblica del fatto che le fonti di verità precedenti potrebbero essere svalutate con l’utilizzo dell’intelligenza artificiale. Il nuovo documento discute di persone reali accusate di essere entità di intelligenza artificiale, sia attraverso errori genuini, conflazione stilistica o malizia (cioè l’accusatore sa che il suo avversario è umano, ma vuole zittirlo); ma prevede che altri tipi di comunicazione saranno simili macchiati:

‘I nostri risultati prevedrebbero che simili accuse di utilizzo di intelligenza artificiale si formeranno per l’autenticazione delle immagini, l’autenticazione vocale e l’autorità del codice tra gli altri, con l’intento principale dell’accusa di gatekeeping piuttosto che la rilevazione empiricamente accurata dell’utilizzo di intelligenza artificiale.

‘Ciò potrebbe diventare sempre più problematico poiché l’intelligenza artificiale in quelle aree riduce anche gli indizi empiricamente rilevabili che gli esperti possono trovare.

‘Ciò potrebbe avere l’effetto di aumentare il ruolo degli esperti nel verificare il contenuto di intelligenza artificiale rispetto al contenuto non di intelligenza artificiale; o potrebbe ridurre notevolmente la fiducia in qualsiasi tipo di medium che possa essere plausibilmente generato da intelligenza artificiale.’

Il nuovo documento* è intitolato “That’s AI Slop, You Bot!” Studying Accusations, Evidence, and Credibility in Online Discourse Towards LLM-Generated Comments, e proviene da due revisori dell’Università di Oslo e dell’American University of Sharjah.

Metodo

Il dataset sviluppato per il nuovo studio comprendeva tutti i commenti pubblici pubblicati su Hacker News e 18 comunità di Reddit selezionate tra gennaio 2023 e maggio 2026.

Circa 25 milioni di commenti sono stati curati, con 12 milioni da Hacker News e 13 milioni da Reddit. I dati di Reddit sono stati ottenuti dall’archivio Arctic Shift attraverso la sua API JSON pubblica, mentre i commenti di Hacker News sono stati raccolti dall’archivio di ricerca Algolia Hacker News.

Per evitare di concentrarsi su un solo tipo di comunità, il campione di Reddit è stato diviso tra forum di intelligenza artificiale, compresi r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMA e r/singularity; comunità creative che comprendono r/Art, r/writing e r/books; i forum di interesse generale r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistorians e r/science; e le comunità tecnologiche e accademiche r/programming e r/AskAcademia.

I tassi di campionamento sono stati mantenuti costanti nel tempo, aiutando a garantire che i cambiamenti nei tassi di accuse riflettessero cambiamenti nel comportamento della comunità, piuttosto che cambiamenti nella raccolta dei dati.

Cinque livelli di umiliazione dell’AI

I commenti candidati sono stati identificati utilizzando un lessico di ricerca di 137 modelli organizzato in cinque livelli denominati: Livello 1 (‘Diretto’) ha catturato accuse esplicite come ‘ChatGPT ha scritto questo’, ‘È questo un contenuto generato da AI?’ e ‘OP è un robot’.

Livello 2 (‘Peggiorativo’) ha coperto etichette come ‘spazzatura AI’, ‘GPT spazzatura’, ‘ML spazzatura’ e ‘scrittura robotica’. Livello 3 (‘Stile’) ha trattato dei presunti stili, comprese le menzioni di em-dash, il ‘delve’ callout, tricolon references e altre affermazioni su un ‘classico signature AI’.

Livello 4 (‘Derisione’) ha catturato la parodia e l’imitazione basate su frasi familiari di assistenti di intelligenza artificiale come ‘esseri umani’, ‘nel paesaggio in rapida evoluzione’ e ‘tessuto ricco’. Livello 5 (‘Indiretto’) ha presentato sospetti meno espliciti, con commenti descritti come qualcosa che ‘sembra AI’, ‘legge come ChatGPT’ o somiglia alla ‘valle inquietante della scrittura’.

Per ridurre i falsi positivi, le frasi comuni come ‘vale la pena notare’, ‘è importante notare’ e ‘è questo un essere umano’ sono state conteggiate solo quando un termine di intelligenza artificiale è apparso nelle vicinanze. Poiché questi modelli di ricerca non potevano distinguere in modo affidabile le accuse dalla discussione ordinaria, due passaggi di convalida sono stati successivamente eseguiti con Claude Opus 4.7.

Un campione di 5.000 commenti di Reddit e un campione di 2.500 commenti di Hacker News sono stati tratti dal pool di candidati, bilanciati nel tempo e nelle categorie di accuse.

Ogni commento è stato quindi classificato in uno dei cinque gruppi di risultato: Reale, che copre accuse genuine di utilizzo di intelligenza artificiale; Divulgazione, che copre commenti che riconoscono l’autorità di intelligenza artificiale; Neutral-Ref, che copre riferimenti non accusatori a intelligenza artificiale; FP, che copre falsi positivi regex; e Ambiguo, che copre casi in cui il contesto disponibile non ha permesso un giudizio confidente.

I ricercatori hanno anche esaminato come le accuse sono cambiate nel tempo, tracciando la crescita del nuovo ‘spazzatura AI’ rispetto a insulti più vecchi come ‘spazzatura’, ‘immondizia’, ‘rifiuti’, ‘vomit’, ‘fango’, ‘muschio’, ‘sporcizia’, ‘immondizia’, ‘parolacce’, ‘insalata di parole’ e ‘nonsenso’.

Delimitare le tendenze

Le tendenze del sentimento sono state misurate utilizzando Valence Aware Dictionary and sEntiment Reasoner (VADER), mentre un campione separato di 300 thread di Reddit contenenti accuse di intelligenza artificiale validate da LLM è stato codificato in base al ruolo sociale svolto. Questi sono stati classificati come Sneer (derisione); Dismiss (rifiuto); Mockery (imitazione/parodia); Gatekeep (‘applicazione delle regole’); o Structural Protest (protesta generale contro l’intelligenza artificiale), consentendo di tracciare i cambiamenti nel carattere delle accuse di intelligenza artificiale nel tempo.

Un test ‘placebo’ separato è stato progettato per determinare se le accuse di intelligenza artificiale in aumento potrebbero semplicemente riflettere un aumento più ampio della sospetto online, in cui lo stesso set di dati è stato cercato per termini di inautenticità più vecchi come ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘shill pagato’, ‘account falso’, ‘shill aziendale’, ‘punti di discussione’ e ‘payola’.

Una serie finale di test ha esaminato se i tratti che distinguono la scrittura generata da intelligenza artificiale da quella umana siano gli stessi tratti che causano commenti scritti da umani ad essere accusati di essere intelligenza artificiale, attraverso l’esame di sei marcatori linguistici: densità di articoli; frequenza di contrazioni; frequenza di avverbi in registro formale; densità di preposizioni; varianza della lunghezza delle frasi; e lunghezza media del token. I confronti sono stati effettuati tra commenti Divulgazione e Reale utilizzando test U di Mann-Whitney.

I commenti genitori associati a 800 accuse di intelligenza artificiale validate da LLM su Reddit sono stati recuperati, con 421 casi mantenuti in cui il genitore era esso stesso un commento e non un post di livello superiore. Questi sono stati abbinati a 2.048 commenti non accusati tratti dallo stesso subreddit e mese. La regressione logistica è stata quindi utilizzata per testare se i marcatori linguistici che distinguono il testo generato da intelligenza artificiale da quello umano predicono anche quali commenti umani attirano accuse di utilizzo di intelligenza artificiale.

Risultati

Lo studio ha registrato un grande aumento delle accuse di intelligenza artificiale su Reddit e Hacker News tra il 2023 e il 2026. La maggior parte di questa crescita si è concentrata nell’uso di etichette peggiorative:

Crescita cross-piattaforma delle accuse di intelligenza artificiale peggiorative su Reddit e Hacker News tra gennaio 2023 e maggio 2026. Le accuse di Livello 2 ('Peggiorativo') sono passate da singole cifre a circa un quarto delle accuse candidate su entrambe le piattaforme. Tre periodi di accelerazione sono visibili durante il 2024 e il 2025, dopo di che la crescita si è stabilizzata. Hacker News è rimasto al di sopra di Reddit per la maggior parte del periodo di studio, ma entrambi hanno convergato su livelli simili nel 2026.

Crescita cross-piattaforma delle accuse di intelligenza artificiale peggiorative su Reddit e Hacker News tra gennaio 2023 e maggio 2026. Le accuse di Livello 2 (‘Peggiorativo’) sono passate da singole cifre a circa un quarto delle accuse candidate su entrambe le piattaforme. Tre periodi di accelerazione sono visibili durante il 2024 e il 2025, dopo di che la crescita si è stabilizzata. Hacker News è rimasto al di sopra di Reddit per la maggior parte del periodo di studio, ma entrambi hanno convergato su livelli simili nel 2026. Fonte

Entro il 2026, ‘spazzatura AI’ ha rappresentato il 94% delle accuse di intelligenza artificiale peggiorative identificate nel set di dati, sostituendo termini più vecchi come ‘GPT spazzatura’, ‘ML spazzatura’ e ‘scrittura robotica’. Secondo il documento, la quota di accuse di intelligenza artificiale peggiorative è aumentata di più di dieci volte su entrambe le piattaforme durante il periodo di studio:

Ascesa dell'etichetta 'spazzatura AI' rispetto ad altre accuse di intelligenza artificiale peggiorative tra il 2023 e il 2026. Mentre termini come 'spazzatura', 'immondizia', 'rifiuti', 'vomit', 'fango', 'muschio', 'sporcizia', 'immondizia', 'parolacce', 'insalata di parole' e 'nonsenso' hanno inizialmente dominato le accuse peggiorative, la loro quota è diminuita costantemente mentre 'spazzatura AI' è diventata l'etichetta preferita in modo schiacciante. Entro il 2026, il frame della spazzatura ha rappresentato circa il 94% delle accuse di intelligenza artificiale peggiorative, indicando una consolidazione del linguaggio di accusa intorno a un solo termine.

Ascesa dell’etichetta ‘spazzatura AI’ rispetto ad altre accuse di intelligenza artificiale peggiorative tra il 2023 e il 2026. Mentre termini come ‘spazzatura’, ‘immondizia’, ‘rifiuti’, ‘vomit’, ‘fango’, ‘muschio’, ‘sporcizia’, ‘immondizia’, ‘parolacce’, ‘insalata di parole’ e ‘nonsenso’ hanno inizialmente dominato le accuse peggiorative, la loro quota è diminuita costantemente mentre ‘spazzatura AI’ è diventata l’etichetta preferita in modo schiacciante. Entro il 2026, il frame della spazzatura ha rappresentato circa il 94% delle accuse di intelligenza artificiale peggiorative, indicando una consolidazione del linguaggio di accusa intorno a un solo termine.

Un confronto separato è stato effettuato utilizzando termini di inautenticità più vecchi come ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘shill pagato’, ‘account falso’, ‘shill aziendale’, ‘punti di discussione’ e ‘payola’. A differenza delle accuse di intelligenza artificiale, questi termini non hanno mostrato un aumento comparabile.

La variazione è stata osservata anche tra le comunità, con una crescita più precoce registrata nei forum di intelligenza artificiale e tecnologia, con modelli simili che sono apparsi successivamente in altre parti di Reddit e Hacker News.

Sono stati osservati cambiamenti non solo nella frequenza delle accuse, ma anche nella loro classificazione. La codifica di 300 accuse di intelligenza artificiale validate da Reddit ha rivelato cambiamenti nella prevalenza relativa di Sneer, Dismiss, Mockery, Gatekeep e Structural Protest. Secondo il documento, Gatekeep e Structural Protest sono diventati più comuni nel tempo, mentre Sneer e Mockery sono diventati meno comuni.

Conclusione

L’apparente epidemia di accuse di intelligenza artificiale casuali nei commenti sembra aver bisogno della propria iterazione della legge di Godwin; in base agli eventi e alle tendenze nel commento sociale e politico degli ultimi anni, sarebbe logico se i bot di intelligenza artificiale diventassero i più probabili ad accusare altri commentatori di essere un bot; tuttavia, ciò potrebbe tendere a soffocare tutti i commenti sulla questione.

 

* Si prega di notare che questo documento non è una lettura amichevole e si rivolge, nel tono e nel lessico, ai pari accademici degli autori.

Pubblicato per la prima volta venerdì, 12 giugno 2026

Scrittore su apprendimento automatico, specialista di dominio nella sintesi di immagini umane. Ex capo della ricerca contenuti presso Metaphysic.ai.