Ângulo de Anderson

O Surgimento das Acusações de “Lixo de IA” Está se Tornando uma Nova Forma de Controle de Acesso

Publicado em 12 de junho de 2026

Por

Martin Anderson

AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room.

Chamar algo de “lixo de IA” se tornou a nova caça às bruxas da internet, com usuários do Reddit e Hacker News cada vez mais acusando outros comentaristas de serem robôs, mesmo quando não há evidências disso.

Um novo estudo da Noruega e dos Emirados Árabes Unidos descobriu que as acusações contra supostos “lixo de IA” de outros comentaristas aumentaram abruptamente no Reddit e Hacker News entre 2023 e 2026, mesmo quando o comentário não apresentava evidências de ser gerado por IA.

Os resultados da análise dos autores de 25 milhões de comentários sugerem que tais acusações estão cada vez mais funcionando como uma forma emergente de controle de acesso social, em vez de uma forma de identificar IA.

Os pesquisadores também descobriram que as comunidades tecnicamente orientadas adotaram a “cultura de acusação” mais cedo do que outros grupos, com o padrão se espalhando posteriormente por outras áreas do Reddit.

Esse aparente aumento nas acusações em torno do “lixo de IA” não parece fazer parte de um aumento mais amplo ou geral na hostilidade online: as formas de invectiva mais antigas, como ‘vendedor’, ‘fantasma’ e ‘troll’, permaneceram relativamente estáveis durante o mesmo período, sugerindo que a suspeita de IA surgiu como uma nova forma de policiamento de fronteiras sociais, em vez de uma continuação ou extensão de antigas rivalidades na internet.

O artigo afirma:

‘Analisamos 25 milhões de comentários do Hacker News e do Reddit (2023-2026), combinando o julgamento da LLM em 7.500 acusações de uso de IA, trajetórias de sentimento, codificação de atos de fala de 300 acusações de uso de IA confirmadas e um teste de controle de acusados versus não acusados de comentários pai.

‘Descobrimos que a participação de acusações com rótulos pejorativos aumentou mais de dez vezes em ambas as plataformas, enquanto um vocabulário de palavras de inautenticidade pré-2022 (“vendedor”, “astroturf”) não aumentou.

‘Essa mudança refletiu uma tendência de rápido crescimento de rotular qualquer prosa suspeita ou aparentemente inautêntica como “lixo de IA”.

‘O quadro de “lixo” agora constitui 94 por cento das menções pejorativas, com os comentários dominantes mudando de tom de zombaria para controle de acesso e protesto estrutural.’

O estudo levanta a questão mais ampla de saber se as pessoas podem realmente identificar a escrita de IA, uma vez que a prosa fluente – anteriormente tratada como evidência de esforço, expertise ou engajamento genuíno – agora é uma commodity abundante e cada vez mais desvalorizada.

É interessante notar que o novo trabalho se concentra no Hacker News, que é vigilantemente policiado contra comentários gerados por IA, e no Reddit, cujo fluxo constante de discurso baseado em humanos agora é altamente valorizado para desenvolvedores e empresas de IA, bem como se tornando um novo alvo principal para spammers de SEO buscando invadir classificações web baseadas em LLM por procuração.

Os pesquisadores acreditam que suas descobertas estão de acordo com o crescente entendimento público de que fontes anteriores de verdade podem ser desvalorizadas à medida que o uso de IA se espalha. O novo artigo discute pessoas reais acusadas de serem entidades de IA, seja por erro genuíno, conflito estilístico, ou maldade (ou seja, o acusador sabe que seu oponente é humano, mas deseja silenciá-lo); mas prevê que outros tipos de comunicação sejam igualmente manchados:

‘Nossos resultados aqui prediriam que acusações semelhantes de uso de IA se formarão para autenticação de imagem, autenticação de voz e autoria de código, entre outros, com a intenção central da acusação leiga sendo o controle de acesso, e não a detecção empírica precisa do uso de IA.

‘Isso se tornará cada vez mais problemático à medida que a IA nesses áreas reduz mesmo as dicas empiricamente detectáveis que os especialistas podem encontrar.

‘Isso pode ter o efeito de aumentar o papel dos especialistas na verificação de conteúdo de IA versus não-IA; ou pode reduzir significativamente a confiança em qualquer tipo de meio que possa ser plausivelmente gerado por IA.’

O novo artigo* é intitulado “Isso é Lixo de IA, Você é um Robô!” Estudando Acusações, Evidências e Credibilidade no Discurso Online em Direção a Comentários Gerados por LLM, e vem de dois revisores da Universidade de Oslo e da Universidade Americana de Sharjah.

Método

O conjunto de dados desenvolvido para o novo estudo consistiu em todos os comentários públicos postados no Hacker News e em 18 comunidades selecionadas do Reddit entre janeiro de 2023 e maio de 2026.

Cerca de 25 milhões de comentários foram curados, com 12 milhões do Hacker News e 13 milhões do Reddit. Os dados do Reddit foram obtidos do arquivo Arctic Shift por meio de sua API JSON pública, enquanto os comentários do Hacker News foram coletados do arquivo de busca do Hacker News da Algolia.

Para evitar se concentrar em um único tipo de comunidade, a amostra do Reddit foi dividida em fóruns de IA, incluindo r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMA e r/singularity; comunidades criativas que incluem r/Art, r/writing e r/books; fóruns de interesse geral r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistorians e r/science; e comunidades tecnológicas e acadêmicas r/programming e r/AskAcademia.

As taxas de amostragem foram mantidas consistentes ao longo do tempo, ajudando a garantir que as mudanças nas taxas de acusação refletissem mudanças no comportamento da comunidade, em vez de mudanças na coleta de dados.

Cinco Níveis de Vergonha de IA

Comentários candidatos foram identificados usando um léxico de busca de 137 padrões organizados em cinco níveis nomeados: Nível 1 (‘Direto’) capturou acusações explícitas, como ‘ChatGPT escreveu isso’, ‘Isso é gerado por IA?’ e ‘OP é um robô’.

Nível 2 (‘Pejorativo’) cobriu rótulos como ‘Lixo de IA’, ‘Lixo de GPT’, ‘Bobagem de ML’ e ‘escrita de robô’. Nível 3 (‘Estilo’) lidou com supostos estilos, incluindo menções de traço, o ‘chamado de delve’, referências de tricolon e alegações mais amplas sobre um ‘assinatura clássica de IA’.

Nível 4 (‘Zombaria’) capturou paródia e imitação com base em frases familiares de assistentes de IA, como ‘seres humanos’, ‘no paisagem em rápida evolução’ e ‘tapeçaria rica’. Nível 5 (‘Indireto’) apresentou suspeitas menos explícitas, com comentários descritos como algo que ‘cheira a IA’, ‘lê como ChatGPT’ ou se assemelha ao ‘vale da incerteza da escrita’.

Para reduzir falsos positivos, frases comuns, como ‘vale notar’, ‘é importante notar’ e ‘isso é um humano’, foram contadas apenas quando um termo relacionado à IA aparecia nas proximidades. Porque esses padrões de busca não podiam distinguir acusações de discussão comum de forma confiável, duas passagens de validação foram realizadas posteriormente com Claude Opus 4.7.

Uma amostra de 5.000 comentários do Reddit e uma amostra de 2.500 comentários do Hacker News foram extraídas do pool de candidatos, equilibradas ao longo dos períodos de tempo e categorias de acusação.

Cada comentário foi então classificado em um dos cinco grupos de resultados: Real, que abrange acusações genuínas de uso de IA; Divulgação, que abrange comentários que reconhecem a autoria de IA; Referência Neutra, que abrange referências não acusatórias à IA; FP, que abrange falsos positivos de regex; e Ambíguo, que abrange casos em que o contexto disponível não permitia um julgamento confiante.

Os pesquisadores também examinaram como as acusações mudaram ao longo do tempo, rastreando o aumento do novo rótulo de ‘Lixo de IA’ contra insultos mais antigos, como ‘bobagem’, ‘lixo’, ‘lixo’, ‘vômito’, ‘lodo’, ‘musgo’, ‘lama’, ‘lixo’, ‘palhaçada’ e ‘nonsense’.

Delimitando as Tendências

Tendências de sentimento foram medidas usando Valence Aware Dictionary e sEntiment Reasoner (VADER), enquanto uma amostra separada de 300 threads do Reddit contendo acusações de IA validadas por LLM foi codificada de acordo com o papel social sendo realizado. Esses foram classificados como Zombaria (zombaria rejeitadora); Rejeitar (rejeição direta); Zombaria (imitação/paródia); Controle de Acesso (‘enforcement de regras’); ou Protesto Estrutural (desaprovação geral de IA), permitindo que as mudanças no caráter das acusações de IA sejam rastreadas ao longo do tempo.

Um teste de “placebo” separado foi projetado para determinar se as acusações de IA em ascensão podem simplesmente refletir um aumento mais amplo na desconfiança online, no qual o mesmo conjunto de dados foi pesquisado por termos de inautenticidade mais antigos, como ‘vendedor’, ‘astroturf’, ‘fantasma’, ‘vendedor pago’, ‘conta falsa’, ‘vendedor corporativo’, ‘pontos de conversa’ e ‘payola’.

Um conjunto final de testes examinou se os traços que separam a escrita gerada por IA da escrita humana são os mesmos traços que causam comentários escritos por humanos a serem acusados de serem IA, por meio do exame de seis marcadores linguísticos: densidade de artigo; taxa de contração; frequência de advérbios de registro formal; densidade de preposição; variação de comprimento de sentença; e comprimento médio de token. Comparações foram feitas entre Divulgação e Real comentários usando testes U de Mann-Whitney.

Comentários pai associados a 800 acusações de IA validadas por LLM do Reddit foram recuperados, com 421 casos retidos onde o pai era um comentário em vez de uma postagem de nível superior. Esses foram combinados com 2.048 comentários não acusados extraídos do mesmo subreddit e mês. Regressão logística foi então usada para testar se os marcadores linguísticos que distinguem texto gerado por IA da escrita humana também preveem quais comentários escritos por humanos atraem acusações de uso de IA.

Resultados

O estudo registrou um grande aumento nas acusações de IA em todo o Reddit e Hacker News entre 2023 e 2026. A maior parte desse crescimento foi concentrada no uso de rótulos pejorativos;

Crescimento transplataforma de acusações pejorativas de IA no Reddit e Hacker News entre janeiro de 2023 e maio de 2026. Acusações do Nível 2 (‘Pejorativo’) subiram de dígitos simples para cerca de um quarto das acusações de candidato em ambas as plataformas. Três períodos de aceleração são visíveis durante 2024 e 2025, após os quais o crescimento se estabiliza. O Hacker News permaneceu acima do Reddit por grande parte do período de estudo, mas ambos convergiram para níveis semelhantes em 2026. Fonte

Em 2026, ‘Lixo de IA’ representou 94% das acusações pejorativas de IA identificadas no conjunto de dados, substituindo termos anteriores, como ‘Lixo de GPT’, ‘Bobagem de ML’ e ‘Escrita de robô’. De acordo com o artigo, a participação de acusações pejorativas de IA aumentou mais de dez vezes em ambas as plataformas durante o período de estudo:

Ascensão do rótulo ‘Lixo de IA’ em relação a acusações pejorativas de IA mais antigas entre 2023 e 2026. Enquanto termos como ‘bobagem’, ‘lixo’, ‘lixo’, ‘vômito’, ‘lodo’, ‘musgo’, ‘lama’, ‘lixo’, ‘palhaçada’ e ‘nonsense’ inicialmente dominaram as acusações pejorativas, sua participação declinou constantemente à medida que ‘Lixo de IA’ se tornou o rótulo preferido esmagadoramente. Em 2026, o quadro de ‘lixo’ representou cerca de 94% das acusações pejorativas de IA, indicando uma consolidação da linguagem de acusação em torno de um único termo.

Uma comparação separada foi realizada usando termos de inautenticidade mais antigos, que consistem em ‘vendedor’, ‘astroturf’, ‘fantasma’, ‘vendedor pago’, ‘conta falsa’, ‘vendedor corporativo’, ‘pontos de conversa’ e ‘payola’. Ao contrário das acusações de IA, esses termos não exibiram um aumento comparável.

Variações também foram observadas em comunidades, com crescimento mais antigo registrado em fóruns de IA e tecnologia – com padrões semelhantes aparecendo posteriormente em outras partes do Reddit e Hacker News.

Mudanças foram observadas não apenas na frequência das acusações, mas também em sua classificação. A codificação de 300 acusações de IA validadas do Reddit encontrou mudanças na prevalência relativa de Zombaria, Rejeitar, Zombaria, Controle de Acesso e Protesto Estrutural. De acordo com o artigo, Controle de Acesso e Protesto Estrutural se tornaram mais comuns ao longo do tempo, enquanto Zombaria e Zombaria se tornaram menos comuns.

Conclusão

A aparente epidemia de acusações casuais de IA nos comentários claramente precisa de sua própria iteração da Lei de Godwin; com base nos eventos e tendências nos comentários sociais e políticos dos últimos anos, faria sentido se os bots de IA se tornassem os mais propensos a acusar outros comentaristas de serem um robô; no entanto, isso pode tender a sufocar todos os comentários sobre o assunto.

* Por favor, esteja ciente de que este artigo não é uma leitura amigável e é direcionado, em tom e léxico, aos pares acadêmicos dos autores.

Publicado pela primeira vez na sexta-feira, 12 de junho de 2026