Góc nhìn Anderson

Sự trỗi dậy của các cáo buộc ‘AI Slop!’ đang trở thành một hình thức kiểm soát mới

mm
AI-generated article illustration (GPT-2): Politicians seated around a round conference table point at one another while shouting, with an industrial humanoid robot sitting motionless at the center of the room.

Việc gọi một thứ gì đó là ‘AI slop’ đã trở thành cuộc săn phù thủy của internet, với người dùng Reddit và Hacker News ngày càng cáo buộc những người bình luận khác là robot, ngay cả khi không có bằng chứng về việc này.

 

Một nghiên cứu mới từ Na Uy và UAE đã phát hiện ra rằng các cáo buộc chống lại những gì được cho là ‘AI slop’ từ những người bình luận khác đã tăng mạnh trên Reddit và Hacker News giữa năm 2023 và 2026, ngay cả khi bình luận không显示 bất kỳ dấu hiệu nào của việc được tạo ra bởi AI.

Kết quả từ phân tích của các tác giả về 25 triệu bình luận cho thấy rằng những cáo buộc như vậy ngày càng hoạt động như một hình thức kiểm soát xã hội mới nổi, chứ không phải là một cách để xác định AI.

Các nhà nghiên cứu cũng phát hiện ra rằng các cộng đồng có kỹ thuật đã áp dụng ‘văn hóa cáo buộc’ sớm hơn các nhóm khác, với mẫu này sau đó lan rộng trên các khu vực rộng lớn hơn của Reddit.

Sự gia tăng rõ ràng trong các cáo buộc xung quanh ‘AI slop’ dường như không phải là một phần của sự gia tăng chung hoặc rộng hơn về sự thù địch trực tuyến: các hình thức lạm dụng cũ hơn như ‘shill’, ‘sockpuppet’, và ‘troll’ vẫn còn tương đối ổn định trong cùng thời kỳ, cho thấy rằng sự nghi ngờ về AI đã xuất hiện như một hình thức kiểm soát ranh giới xã hội mới, chứ không phải là sự tiếp tục hoặc mở rộng của các cuộc tranh cãi internet trước đó.

Bài báo cho biết:

‘Chúng tôi đã phân tích 25 triệu bình luận từ Hacker News và Reddit (2023-2026), kết hợp phán quyết của LLM về 7.500 cáo buộc sử dụng AI, đường dẫn cảm xúc, mã hóa hành động ngôn ngữ của 300 cáo buộc sử dụng AI được xác nhận, và một thử nghiệm kiểm soát phù hợp của các bình luận bị cáo buộc so với các bình luận không bị cáo buộc.

‘Chúng tôi đã tìm thấy rằng tỷ lệ cáo buộc mang tính miệt thị tăng hơn mười lần trên cả hai nền tảng trong khi từ vựng giả của các thuật ngữ không chính xác trước năm 2022 (“shill”, “astroturf”) không tăng.

‘Sự thay đổi này phản ánh một xu hướng phát triển nhanh chóng của việc gắn nhãn cho bất kỳ văn bản nào đáng ngờ hoặc không chính xác là “AI slop”.

‘Khung slop hiện chiếm 94% các đề cập mang tính miệt thị, với các bình luận thống trị thay đổi về giọng điệu từ việc chế giễu đến việc kiểm soát và phản đối cấu trúc.’

Nghiên cứu đặt ra câu hỏi rộng hơn về việc liệu người ta có thể thực sự phát hiện ra văn bản được viết bởi AI, vì văn bản trôi chảy – trước đây được coi là bằng chứng của nỗ lực, chuyên môn, hoặc tham gia thực sự – bây giờ là một hàng hóa dồi dào và ngày càng bị đánh giá thấp.

Điều thú vị là công việc mới tập trung vào Hacker News, được giám sát chặt chẽ chống lại các bình luận được tạo ra bởi AI, và trên Reddit, dòng chảy liên tục của các cuộc thảo luận dựa trên con người bây giờ được đánh giá cao cho các nhà phát triển và công ty AI, cũng như trở thành mục tiêu mới cho các nhà làm SEO xâm nhập vào các bảng xếp hạng web dựa trên LLM thông qua proxy.

Các nhà nghiên cứu tin rằng những phát hiện của họ phù hợp với sự hiểu biết ngày càng tăng của công chúng rằng các nguồn thông tin trước đây có thể bị đánh giá thấp khi sử dụng AI trở nên phổ biến. Bài báo mới thảo luận về những người thực sự bị cáo buộc là thực thể AI, либо thông qua lỗi thực sự, sự kết hợp về phong cách, hoặc ác ý (tức là người cáo buộc biết rằng đối thủ của họ là con người, nhưng muốn làm im lặng họ); nhưng dự đoán các loại hình giao tiếp khác sẽ bị ảnh hưởng tương tự:

‘Kết quả của chúng tôi ở đây sẽ dự đoán rằng các cáo buộc sử dụng AI sẽ hình thành cho việc xác thực hình ảnh, xác thực giọng nói, và quyền tác giả mã trong số các trường hợp khác, với ý định cốt lõi của cáo buộc là kiểm soát xã hội chứ không phải là phát hiện chính xác việc sử dụng AI.

‘Điều này sẽ trở nên ngày càng vấn đề khi AI trong những lĩnh vực đó giảm thậm chí các dấu hiệu có thể phát hiện được mà các chuyên gia có thể tìm thấy.

‘Điều này có thể dẫn đến việc tăng vai trò của các chuyên gia trong việc xác minh nội dung AI so với nội dung không phải AI; hoặc nó có thể làm giảm đáng kể niềm tin vào bất kỳ loại phương tiện nào có thể được tạo ra bởi AI.’

Bài báo mới mới* có tiêu đề “That’s AI Slop, You Bot!” Studying Accusations, Evidence, and Credibility in Online Discourse Towards LLM-Generated Comments, và đến từ hai người đánh giá trên Đại học Oslo và Đại học Sharjah của Mỹ.

Phương pháp

Bộ dữ liệu được phát triển cho nghiên cứu mới bao gồm tất cả các bình luận công khai được đăng trên Hacker News và 18 cộng đồng Reddit được chọn giữa tháng 1 năm 2023 và tháng 5 năm 2026.

Vào khoảng 25 triệu bình luận đã được thu thập, với 12 triệu từ Hacker News và 13 triệu từ Reddit. Dữ liệu Reddit được thu thập từ lưu trữ Arctic Shift thông qua API JSON công khai của nó, trong khi các bình luận Hacker News được thu thập từ lưu trữ tìm kiếm Hacker News của Algolia.

Để tránh tập trung vào một loại cộng đồng duy nhất, mẫu Reddit đã được chia thành các diễn đàn tập trung vào AI, bao gồm r/aiwars, r/ArtistHate, r/ChatGPT, r/OpenAI, r/MachineLearning, r/LocalLLaMAr/singularity; cộng đồng sáng tạo bao gồm r/Art, r/writingr/books; các diễn đàn quan tâm chung r/AskReddit, r/news, r/changemyview, r/explainlikeimfive, r/AskHistoriansr/science; và các cộng đồng công nghệ và học thuật r/programmingr/AskAcademia.

Tỷ lệ lấy mẫu được giữ nguyên trong suốt thời gian, giúp đảm bảo rằng các thay đổi trong tỷ lệ cáo buộc phản ánh sự thay đổi trong hành vi của cộng đồng, chứ không phải là sự thay đổi trong việc thu thập dữ liệu.

Năm mức độ của việc xấu hổ AI

Các bình luận ứng viên được xác định bằng cách sử dụng một từ vựng tìm kiếm 137 mẫu được tổ chức thành năm cấp độ có tên: Cấp độ 1 (‘Trực tiếp’) đã bắt được các cáo buộc rõ ràng như ‘ChatGPT đã viết điều này’, ‘Có phải đây là AI được tạo ra?’, và ‘OP là một bot’.

Cấp độ 2 (‘Miệt thị’) bao gồm các nhãn như ‘AI slop’, ‘GPT garbage’, ‘ML drivel’, và ‘robo-writing’. Cấp độ 3 (‘Phong cách’) liên quan đến các dấu hiệu phong cách được cho là, bao gồm tham khảo dấu gạch chéo, gọi ‘delve’, tham khảo tricolon, và các tuyên bố rộng hơn về một ‘chữ ký AI cổ điển’.

Cấp độ 4 (‘Mocking’) đã bắt được sự chế giễu và bắt chước dựa trên các cụm từ trợ lý AI quen thuộc như ‘fellow humans’, ‘trong cảnh quan đang phát triển nhanh chóng’, và ‘tấm thảm phong phú’. Cấp độ 5 (‘Indirect’) đã có các nghi ngờ không rõ ràng, với các bình luận được mô tả là thứ gì đó ‘hơi như AI’, ‘đọc như ChatGPT’, hoặc giống như ‘thung lũng không thể vượt qua của việc viết’.

Để giảm thiểu các kết quả dương tính giả, các cụm từ chung như ‘đáng chú ý’, ‘điều quan trọng cần lưu ý’, và ‘liệu đây có phải là một con người’ chỉ được tính khi một thuật ngữ liên quan đến AI xuất hiện gần đó. Vì các mẫu tìm kiếm này không thể phân biệt đáng tin cậy giữa các cáo buộc và thảo luận thông thường, hai lượt xác thực sau đó đã được thực hiện với Claude Opus 4.7.

Một mẫu Reddit gồm 5.000 bình luận và một mẫu Hacker News gồm 2.500 bình luận đã được rút ra từ nhóm ứng viên, cân bằng trên các khoảng thời gian và các loại cáo buộc.

Mỗi bình luận sau đó được phân loại vào một trong năm nhóm kết quả: Thực, bao gồm các cáo buộc thực sự về việc sử dụng AI; Định hướng, bao gồm các bình luận thừa nhận việc sử dụng AI; Trung lập-Tham chiếu, bao gồm các tham chiếu không cáo buộc đến AI; FP, bao gồm các kết quả dương tính giả của regex; và Ambiguous, bao gồm các trường hợp mà bối cảnh có sẵn không cho phép một phán quyết tự tin.

Các nhà nghiên cứu cũng đã kiểm tra cách các cáo buộc thay đổi theo thời gian, theo dõi sự gia tăng của các cáo buộc ‘AI slop’ mới hơn so với các lời lạm dụng cũ hơn như ‘drivel’, ‘garbage’, ‘trash’, ‘vomit’, ‘sludge’, ‘mush’, ‘gunk’, ‘junk’, ‘crap’, ‘word salad’, và ‘nonsense’.

Định hình các xu hướng

Các xu hướng cảm xúc được đo lường bằng cách sử dụng Từ điển và bộ lý lẽ cảm xúc Valence Aware (VADER), trong khi một mẫu riêng của 300 luồng thảo luận Reddit chứa các cáo buộc thực sự được xác nhận bởi LLM được mã hóa theo vai trò xã hội được thực hiện. Những vai trò này được phân loại thành Sneer (chế giễu); Dismiss (từ chối thẳng); Mockery (nhái lại/đùa giỡn); Gatekeep (‘thực thi quy tắc’); hoặc Structural Protest (phản đối chung về AI), cho phép theo dõi các thay đổi trong tính cách của các cáo buộc AI theo thời gian.

Một thử nghiệm ‘giả’ riêng biệt đã được thiết kế để xác định xem việc tăng cáo buộc AI có thể đơn giản phản ánh sự gia tăng chung về sự nghi ngờ trực tuyến, trong đó cùng một tập dữ liệu được tìm kiếm các thuật ngữ không chính xác cũ trước ChatGPT như ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘paid shill’, ‘fake account’, ‘corporate shill’, ‘talking points’, và ‘payola’.

Một bộ thử nghiệm cuối cùng đã kiểm tra xem các đặc điểm phân biệt văn bản được tạo ra bởi AI với văn bản được viết bởi con người có phải là các đặc điểm khiến các bình luận được viết bởi con người bị cáo buộc là AI hay không, thông qua việc kiểm tra sáu dấu hiệu ngôn ngữ: độ dày của bài viết; tỷ lệ rút gọn; tần suất trạng từ chính thức; độ dày của giới từ; độ biến thiên của độ dài câu; và độ dài trung bình của token. So sánh được thực hiện giữa Định hướngThực bình luận bằng cách sử dụng thử nghiệm Mann-Whitney U.

Các bình luận cha mẹ liên quan đến 800 cáo buộc thực sự được xác nhận bởi LLM trên Reddit đã được thu thập, với 421 trường hợp được giữ lại khi cha mẹ là một bình luận chứ không phải là một bài đăng cấp cao nhất. Những bình luận này đã được so sánh với 2.048 bình luận không bị cáo buộc được rút ra từ cùng một subreddit và tháng. Hồi quy logistic sau đó đã được sử dụng để kiểm tra xem các dấu hiệu ngôn ngữ phân biệt văn bản được tạo ra bởi AI với văn bản được viết bởi con người cũng có dự đoán được những bình luận được viết bởi con người nào sẽ bị cáo buộc là sử dụng AI hay không.

Kết quả

Nghiên cứu đã ghi nhận một sự gia tăng lớn trong các cáo buộc AI trên Reddit và Hacker News giữa năm 2023 và 2026. Hầu hết sự tăng trưởng này tập trung vào việc sử dụng các nhãn miệt thị:

Tăng trưởng trên nhiều nền tảng về các cáo buộc AI miệt thị trên Reddit và Hacker News giữa tháng 1 năm 2023 và tháng 5 năm 2026. Các cáo buộc cấp 2 ('Miệt thị') đã tăng từ một con số nhỏ lên khoảng một phần tư của các cáo buộc ứng viên trên cả hai nền tảng. Ba giai đoạn tăng tốc được nhìn thấy trong năm 2024 và 2025, sau đó sự tăng trưởng đã giảm dần. Hacker News vẫn ở trên Reddit trong hầu hết thời gian nghiên cứu, nhưng cả hai đã hội tụ về các mức tương tự vào năm 2026. Nguồn - https://arxiv.org/pdf/2606.12073

Tăng trưởng trên nhiều nền tảng về các cáo buộc AI miệt thị trên Reddit và Hacker News giữa tháng 1 năm 2023 và tháng 5 năm 2026. Các cáo buộc cấp 2 (‘Miệt thị’) đã tăng từ một con số nhỏ lên khoảng một phần tư của các cáo buộc ứng viên trên cả hai nền tảng. Ba giai đoạn tăng tốc được nhìn thấy trong năm 2024 và 2025, sau đó sự tăng trưởng đã giảm dần. Hacker News vẫn ở trên Reddit trong hầu hết thời gian nghiên cứu, nhưng cả hai đã hội tụ về các mức tương tự vào năm 2026. Nguồn

Vào năm 2026, ‘AI slop’ đã chiếm 94% các cáo buộc AI miệt thị được xác định trong tập dữ liệu, thay thế các thuật ngữ cũ hơn như ‘GPT garbage’, ‘ML drivel’, và ‘robo-writing’. Theo bài báo, tỷ lệ cáo buộc AI miệt thị đã tăng hơn mười lần trên cả hai nền tảng trong thời gian nghiên cứu:

Sự trỗi dậy của nhãn 'AI slop' so với các cáo buộc AI miệt thị cũ hơn giữa năm 2023 và 2026. Trong khi các thuật ngữ như 'drivel', 'garbage', 'trash', 'vomit', 'sludge', 'mush', 'gunk', 'junk', 'crap', 'word salad', và 'nonsense' ban đầu chiếm ưu thế trong các cáo buộc miệt thị, tỷ trọng của chúng đã giảm dần khi 'AI slop' trở thành nhãn được ưa chuộng áp đảo. Vào năm 2026, khung 'slop' chiếm khoảng 94% các cáo buộc AI miệt thị, cho thấy sự hợp nhất của ngôn ngữ cáo buộc xung quanh một thuật ngữ duy nhất.

Sự trỗi dậy của nhãn ‘AI slop’ so với các cáo buộc AI miệt thị cũ hơn giữa năm 2023 và 2026. Trong khi các thuật ngữ như ‘drivel’, ‘garbage’, ‘trash’, ‘vomit’, ‘sludge’, ‘mush’, ‘gunk’, ‘junk’, ‘crap’, ‘word salad’, và ‘nonsense’ ban đầu chiếm ưu thế trong các cáo buộc miệt thị, tỷ trọng của chúng đã giảm dần khi ‘AI slop’ trở thành nhãn được ưa chuộng áp đảo. Vào năm 2026, khung ‘slop’ chiếm khoảng 94% các cáo buộc AI miệt thị, cho thấy sự hợp nhất của ngôn ngữ cáo buộc xung quanh một thuật ngữ duy nhất.

Một so sánh riêng biệt đã được thực hiện bằng cách sử dụng các thuật ngữ không chính xác cũ hơn bao gồm ‘shill’, ‘astroturf’, ‘sockpuppet’, ‘paid shill’, ‘fake account’, ‘corporate shill’, ‘talking points’, và ‘payola’. Không giống như các cáo buộc tập trung vào AI, những thuật ngữ này không cho thấy sự tăng trưởng tương tự.

Sự khác biệt cũng được quan sát thấy trên các cộng đồng, với sự tăng trưởng sớm hơn được ghi nhận trong các diễn đàn tập trung vào AI và công nghệ – với các mẫu tương tự sau đó xuất hiện ở các phần khác của Reddit và Hacker News.

Các thay đổi đã được quan sát không chỉ trong tần suất của các cáo buộc mà còn trong việc phân loại chúng. Việc mã hóa 300 cáo buộc AI được xác nhận trên Reddit đã tìm thấy sự thay đổi trong sự phổ biến tương đối của Sneer, Dismiss, Mockery, Gatekeep, và Structural Protest. Theo bài báo, GatekeepStructural Protest đã trở nên phổ biến hơn theo thời gian, trong khi SneerMockery đã trở nên ít phổ biến hơn.

Kết luận

Dịch bệnh rõ ràng của việc xấu hổ AI một cách tùy tiện trong các phần bình luận rõ ràng cần có một phiên bản riêng của định luật Godwin; dựa trên các sự kiện và xu hướng trong bình luận xã hội và chính trị trong những năm gần đây, nó sẽ hợp lý nếu các bot AI trở thành những người có khả năng cao nhất để cáo buộc những người bình luận khác là bot; tuy nhiên, điều này có thể dẫn đến việc im lặng tất cả các bình luận về vấn đề này.

 

* Vui lòng lưu ý rằng bài báo này không phải là một bản đọc thân thiện, và được nhắm vào, về giọng điệu và từ vựng, đối với các đồng nghiệp học thuật của các tác giả.

Được xuất bản lần đầu vào thứ Sáu, ngày 12 tháng 6 năm 2026

Nhà văn về học máy, chuyên gia lĩnh vực tổng hợp hình ảnh con người. Cựu trưởng nhóm nội dung nghiên cứu tại Metaphysic.ai.
Trang cá nhân: martinanderson.ai
Liên hệ: [email protected]