Connect with us

Tấn công ‘DDoS’ vào Nghiên cứu Khoa học bằng Giấy khảo sát được tạo bởi Trí tuệ nhân tạo

Góc nhìn Anderson

Tấn công ‘DDoS’ vào Nghiên cứu Khoa học bằng Giấy khảo sát được tạo bởi Trí tuệ nhân tạo

mm
An Oxbridge professor, a white middle-aged man, is shocked to see the entrance to his office clogged with an avalanche of books. ChatGPT-40; Firefly V3.

Các mô hình trí tuệ nhân tạo tạo sinh như ChatGPT hiện đang làm ngập các nền tảng xuất bản học thuật với các bài khảo sát được tạo bởi trí tuệ nhân tạo với mức độ mà tỷ lệ tín hiệu trên nhiễu trở nên quan trọng. Một nghiên cứu mới cho rằng lũ lụt này đang làm cho các nhà nghiên cứu bị choáng ngợp, làm sai lệch trích dẫn và xói mòn niềm tin vào hồ sơ khoa học, so sánh lũ lụt các bài viết được hỗ trợ bởi trí tuệ nhân tạo với một cuộc tấn công ‘DDoS’ vào khoa học chính nó.

 

(Phần nào) ý kiến  Tuần trước, lần đầu tiên trong bảy năm cập nhật với dòng tài liệu khoa học liên quan đến trí tuệ nhân tạo, tôi phải thừa nhận thất bại và thừa nhận rằng, ít nhất là vào thời điểm cao điểm, tôi phải chọn giữa việc cập nhật các xuất bản mới quan trọng hoặc có thời gian để viết về một số trong số chúng.

Tổng số mục trong một số danh mục hạn chế (Computer Vision, Machine Learning, Language Models, và một số phần ít đăng ký khác) đã vượt quá đáng kể một nghìn – chỉ trong một ngày.

Ở mức độ như vậy, ngay cả việc lướt qua tất cả các tiêu đề mới và chỉ thỉnh thoảng đọc một số tóm tắt sẽ khiến cho một ngày trở nên không hiệu quả.

Đây là thứ ba, ngày 7 tháng 10. Ngược lại, trong danh mục Machine Learning, thứ ba vừa qua (14 tháng 10) cung cấp một khối lượng xuất bản hơi ít hơn 400 mục cho thứ ba của tuần trước; nó có 354 mục:

354 submissions cho danh mục Machine Learning trong một ngày. Nguồn: https://arxiv.org/

354 submissions cho danh mục Machine Learning trong một ngày. Nguồn: https://arxiv.org/

Bạn sẽ phải đọc Arxiv mỗi ngày, trong nhiều năm, để nhận ra mức độ điên rồ của những con số này.

Thừa nhận rằng thứ ba là ‘giờ cao điểm’ của Arxiv cho các bản gửi, có thể vì đó là ngày làm việc đầu tiên sau cuối tuần dài mà các nhân vật có ảnh hưởng hy vọng sẽ tiếp cận; và danh mục Machine Learning một phần ‘đa năng’ với số lượng giấy ít hơn so với các danh mục khác.

Mặc dù vậy, sự gia tăng trong các bản gửi giấy là một hiện tượng được ghi nhận trong học thuật và truyền thông.

Perhaps điều đáng ngạc nhiên nhất về sự gia tăng này là cách tất cả các danh mục lân cận khác hầu như không thay đổi về tần suất trong ba năm qua, trong khi danh mục Khoa học Máy tính (xem nếu bạn có thể tìm thấy nó trong các số liệu chính thức của Arxiv dưới đây) đang trên một quỹ đạo tăng mạnh:

Sự gia tăng của các bài viết khoa học máy tính (CS) trong ba năm qua. Nguồn: https://info.arxiv.org/about/reports/submission_category_by_year.html

Sự gia tăng của các bài viết khoa học máy tính (CS) trong ba năm qua. Nguồn: https://info.arxiv.org/about/reports/submission_category_by_year.html

Just over three years ago Arxiv’s AI paper submission output was estimated to be doubling every few years; and it will be interesting to read Arxiv’s own annual digest of trends at the end of 2025.

Khối lượng ở mức 11

Hai lý do rõ ràng nhất cho việc này là a) cam kết tài chính chưa từng có đối với trí tuệ nhân tạo tạo sinh đang thu hút mức đầu tư nghiên cứu khổng lồ trong các lĩnh vực tư nhân và học thuật, thường hợp tác; và b) thực tế là các hệ thống mô hình ngôn ngữ trí tuệ nhân tạo như ChatGPT hiện làm cho việc gửi giấy nghiên cứu (bao gồm cả giấy về trí tuệ nhân tạo) trở thành một quá trình gần như công nghiệp.

Tuy nhiên, chất lượng của các bản gửi nghiên cứu không tăng cùng với khối lượng (mặc dù đầu ra có lỗi của trí tuệ nhân tạo có xu hướng làm cho nhiều tiêu đề trong lĩnh vực pháp lý hơn là trong học thuật, không chỉ vì những ảnh hưởng là rõ ràng hơn ở đó).

Chính sách không khoan nhượng là khó thực hiện trong trường hợp này, ngay cả khi nhận biết nội dung được tạo bởi trí tuệ nhân tạo dễ dàng hơn; ngoài việc trí tuệ nhân tạo tự nó là một điều kỳ diệu rõ ràng cho nghiên cứu khoa học nói chung, việc sử dụng nó trong các bản gửi giấy nghiên cứu đã cải thiện nói chung độ rõ ràng của công việc từ nhiều người gửi không nói tiếng Anh – những cá nhân và nhóm đã hoạt động ở bất lợi cho đến nay.

Tuy nhiên, vấn đề của việc giảm rào cản ngôn ngữ theo cách này là nó cũng làm tăng số lượng người gửi toàn cầu, mà không tăng mức độ giám sát của con người có thể mang lại giá trị cho công việc đó.

Nếu mức độ gửi tiếp tục tăng theo cấp số nhân, tỷ lệ tín hiệu trên nhiễu sẽ trở nên không thể kiểm soát được, và chỉ có trí tuệ nhân tạo mới có thể có khả năng điều hướng lũ lụt và nhánh mới của các bài viết trí tuệ nhân tạo; một nhiệm vụ mà nó không phù hợp hơn để thực hiện so với việc kiểm tra đầu ra của chính nó. Irony, nghiên cứu khoa học là một nỗ lực con người mãnh liệt.

Một cuộc tấn công vào Nghiên cứu

Nguyên nhân của sự suy ngẫm này là một sự hợp tác mới từ Trung Quốc có tiêu đề Dừng tấn công DDoS vào Cộng đồng Nghiên cứu với các Bài khảo sát được tạo bởi Trí tuệ nhân tạo.

Bài viết mới tập trung cụ thể vào khảo sát gửi – những bản tóm tắt cao cấp của các chủ đề nghiên cứu cụ thể, đã truyền thống liệt kê và ngữ cảnh hóa, diễn giải xu hướng và đưa ra dự đoán thông minh:

Một phần nhỏ của cơ thể khảo sát khổng lồ và không ngừng tăng trưởng trong các phần liên quan đến học máy và trí tuệ nhân tạo, tại arxiv.org

Một phần nhỏ của cơ thể khảo sát khổng lồ và không ngừng tăng trưởng trong các phần liên quan đến học máy và trí tuệ nhân tạo, tại arxiv.org

Kể từ khi các khảo sát tóm tắt chứ không tạo ra, chúng đặc biệt dễ dàng tự động hóa với trí tuệ nhân tạo; và các tác giả của bài viết mới mô tả sự phổ biến của các khảo sát thấp công sức trong các điều khoản của mối đe dọa bảo mật đối với lĩnh vực nghiên cứu:

‘[Sự] xuất hiện gần đây của các khảo sát được tạo bởi trí tuệ nhân tạo, đặc biệt là được kích hoạt bởi các mô hình ngôn ngữ lớn (LLM), đã biến thể loại truyền thống này thành một đầu ra có khối lượng cao. Mặc dù tự động hóa này làm giảm rào cản gia nhập, nhưng nó cũng giới thiệu một mối đe dọa quan trọng: hiện tượng chúng tôi gọi là “cuộc tấn công DDoS của bài khảo sát” vào cộng đồng nghiên cứu.

‘Điều này đề cập đến sự lan rộng không kiểm soát của các bản thảo khảo sát toàn diện nhưng thường thiếu chất lượng, hoặc thậm chí là ảo, lũ lụt các nền tảng tiền xuất bản, làm cho các nhà nghiên cứu bị choáng ngợp và xói mòn niềm tin vào hồ sơ khoa học.

‘[Chúng tôi] cho rằng chúng ta phải dừng việc tải lên số lượng lớn các bài khảo sát được tạo bởi trí tuệ nhân tạo (tức là, cuộc tấn công DDoS của bài khảo sát) vào cộng đồng nghiên cứu, bằng cách thiết lập các tiêu chuẩn mạnh mẽ cho việc viết bài được hỗ trợ bởi trí tuệ nhân tạo.’

Các tác giả khẳng định rằng sự gia tốc không bị cản trở này của sản xuất khảo sát đe dọa đến việc làm ngập hệ thống nghiên cứu bằng các báo cáo được đánh bóng mà thiếu chiều sâu quan trọng, và có khả năng sẽ truyền bá lỗi thực tế và/hoặc ảo giác trích dẫn.

Bài viết cảnh báo rằng nếu không có quy tắc hoặc giám sát tốt hơn, các khảo sát được tạo bởi trí tuệ nhân tạo có thể biến thành bản sao nông, che giấu phân tích có ý nghĩa và làm cho các đánh giá văn học ít đáng tin cậy hơn:

‘Các tác động đối với chất lượng nghiên cứu và niềm tin là sâu sắc. Đầu tiên, những tiến bộ thực sự có nguy cơ bị che khuất bởi các bản sao được tạo bởi thuật toán của công việc hiện có.

‘Những người mới tham gia và các học giả liên ngành có thể gặp khó khăn trong việc tìm kiếm các bản xem xét đáng tin cậy giữa sự ồn ào. Hơn nữa, các lỗi hoặc thiên vị được giới thiệu bởi việc soạn thảo tự động có thể lan truyền không kiểm soát, gieo các giả định sai vào nghiên cứu tiếp theo.

‘Tóm lại, lũ lụt các khảo sát được tạo bởi trí tuệ nhân tạo không được đánh giá ngang hàng đang đe dọa đến cả sự nghiêm ngặt của các đánh giá văn học và uy tín của hồ sơ khoa học.’

‘Tác giả bất thường’

Các nhà nghiên cứu của bài viết mới cung cấp một số phân tích thú vị về sự tiến hóa của các bản gửi khảo sát:

Trái: số lượng hàng năm của các bài khảo sát khoa học máy tính từ 2020 đến 2024. Giữa: điểm số tạo bởi trí tuệ nhân tạo trung bình cho các bài viết đó trong cùng kỳ. Phải: số lượng tác giả được đánh dấu là 'bất thường' (những người có sản lượng khảo sát cao bất thường, đa dạng cộng tác viên hạn chế và mẫu tổ chức lặp lại) mỗi năm. Cả ba xu hướng đều cho thấy sự gia tăng mạnh mẽ bắt đầu từ 2023, trùng với việc phát hành ChatGPT và các mô hình ngôn ngữ lớn khác.

Trái: số lượng hàng năm của các bài khảo sát khoa học máy tính từ 2020 đến 2024. Giữa: điểm số tạo bởi trí tuệ nhân tạo trung bình cho các bài viết đó trong cùng kỳ. Phải: số lượng tác giả được đánh dấu là ‘bất thường’ (những người có sản lượng khảo sát cao bất thường, đa dạng cộng tác viên hạn chế và mẫu tổ chức lặp lại) mỗi năm. Cả ba xu hướng đều cho thấy sự gia tăng mạnh mẽ bắt đầu từ 2023, trùng với việc phát hành ChatGPT và các mô hình ngôn ngữ lớn khác.

Trong cột đầu tiên, chúng ta thấy các xu hướng tăng trưởng: đường cong bắt đầu dốc lên vào khoảng 2022, ngay khi ChatGPT xuất hiện và các mô hình ngôn ngữ lớn bắt đầu trở nên phổ biến, và các mô hình tiếp theo như Claude, PaLM, và Gemini sẽ duy trì đà đó trong suốt 2023.

Đồ thị giữa cho thấy sự gia tăng mạnh mẽ trong các bản gửi sau 2022, trùng với việc ra mắt ChatGPT. Một nhóm nghiên cứu phát hiện rằng vào năm 2024, hơn 10% các tóm tắt khoa học đã được chạy qua một mô hình ngôn ngữ lớn. Một báo cáo riêng từ một công ty phát hiện trí tuệ nhân tạo cho thấy sự nhảy vọt sau ChatGPT ở mức 72% đối với các bài viết trên arXiv có thể được viết với sự giúp đỡ của trí tuệ nhân tạo. Số lượng bài viết có điểm số tạo bởi trí tuệ nhân tạo cao cũng tăng gấp đôi trong một năm, từ 3,6% lên 6,2%.

Đồ thị bên phải cho thấy sự gia tăng ổn định trong số lượng ‘tác giả bất thường’ (những người gửi ba hoặc nhiều khảo sát trong một tháng trong khi làm việc với ít hơn hai cộng tác viên), với sự gia tăng mạnh mẽ hơn bắt đầu từ 2022.

Các tác giả khẳng định rằng nhiều trong số các bài khảo sát này có thể đã được soạn thảo bởi trí tuệ nhân tạo, vì nhiều lý do; một số được viết bởi các tác giả solo hoặc các nhóm nhỏ gửi nhiều khảo sát trong một thời gian ngắn; nhiều bài viết về các chủ đề không liên quan; và trong một số trường hợp, các tác giả không có hồ sơ trước đó trong các lĩnh vực họ đang tóm tắt.

Ngoài ra, một số được xuất bản dưới các tập thể ẩn danh với không có mối quan hệ tổ chức rõ ràng – các mẫu cho thấy sự lũ lụt có chủ ý của lĩnh vực với các khảo sát nhanh, có thể để tăng trích dẫn hoặc cải thiện hồ sơ học thuật, chứ không phải để đóng góp thực sự vào văn học.

Vấn đề

Mặc dù chúng ta không thể đề cập đến tất cả các luận điểm của bài viết mới, nhưng chúng ta nên xem xét một số quan sát đáng chú ý nhất, cũng như xem xét các giải pháp đề xuất của các tác giả cho những vấn đề này.

Chất lượng và Sự độc đáo

Vấn đề không chỉ là khối lượng: nhiều khảo sát được viết bởi trí tuệ nhân tạo bỏ qua những gì làm cho một khảo sát hữu ích: cấu trúc rõ ràng, phân tích sâu, tín dụng chính xác và cẩn thận, và sự hiểu biết thực sự. Thay vào đó, bài viết cho rằng các khảo sát được tạo bởi trí tuệ nhân tạo thường đọc như tóm tắt được khâu lại, không có sự chăm sóc hoặc giám sát cần thiết.

Các tác giả quan sát thêm rằng các khảo sát được viết bởi trí tuệ nhân tạo thường thiếu cấu trúc, nhưng thay vào đó chỉ liệt kê các bài viết mà không có hướng rõ ràng, bỏ qua các phần chính, và không tạo ra ngữ cảnh. Ngược lại, các khảo sát được viết bởi con người có xu hướng thiết lập các danh mục thích hợp và kể một câu chuyện mạch lạc hơn.

Ngoài ra, nhiều khảo sát có thể được hỗ trợ bởi trí tuệ nhân tạo dường như chỉ sao chép các phân loại chủ đề hiện có, đôi khi trực tiếp từ Wikipedia. Ví dụ, bài viết lưu ý rằng nhiều khảo sát về Vision Transformers chứa các tiêu đề phần và cấu trúc chung, tiết lộ đầu ra của trí tuệ nhân tạo dựa trên mẫu:

‘Ngược lại, một khảo sát được viết bởi con người có thể giới thiệu một phân loại mới, chẳng hạn như phân loại ViT theo các chiến lược hiệu quả. Sự thiếu cấu trúc ban đầu trong nhiều bản thảo khảo sát gần đây làm dấy lên lo ngại rằng chúng có thể được tạo bởi trí tuệ nhân tạo với sự giám sát của con người hạn chế.’

Đừng trích dẫn tôi về điều đó

Có lẽ điều đáng ngạc nhiên nhất, các khảo sát được viết bởi trí tuệ nhân tạo thường trích dẫn sai, bỏ qua các bài viết quan trọng, bao gồm các bài viết không liên quan, và đôi khi thậm chí liệt kê không tồn tại các bài viết – những lỗi cho thấy các tham chiếu đến từ việc khớp mẫu bề mặt, chứ không phải chuyên môn thực sự.

Các tác giả cũng chỉ ra rằng một số khảo sát gần đây, thường từ các nhóm hoàn toàn khác nhau, chia sẻ tới 70% danh sách trích dẫn – mức độ trùng lặp cao đến mức, họ lập luận, cho thấy sự phụ thuộc chung vào các mô hình ngôn ngữ lớn, những mô hình này rút ra từ cùng một nhóm tài liệu nguồn hạn chế.

Thực tế, những người dùng thông thường của ChatGPT sẽ biết rằng, đối với các chủ đề ít được biết đến, số lượng nguồn đa dạng mà mô hình có thể khái quát hóa là rất ít; rất thường, việc tìm kiếm các nguồn hạn chế của mô hình trên web là hữu ích hơn việc tương tác với thông tin đó thông qua một mô hình trí tuệ nhân tạo không có đủ dữ liệu trong một lĩnh vực cụ thể.

Phong cách ‘Đồng nhất’ đang xuất hiện

Các tác giả cũng lưu ý rằng nhiều khảo sát được viết bởi trí tuệ nhân tạo về cùng một chủ đề trông và nghe gần như giống hệt, vì các mô hình ngôn ngữ lớn tái sử dụng cụm từ và cấu trúc, đặc biệt là đối với các chủ đề phổ biến, dẫn đến một lượng lớn các bài viết gần như giống hệt nhau, thêm rất ít giá trị và cũng thêm nhiễu đáng kể cho các nhà nghiên cứu tìm kiếm câu trả lời trong lĩnh vực:

‘Khi nhiều tác giả yêu cầu một mô hình ngôn ngữ lớn “viết một đánh giá văn học về X,” mô hình thường tạo ra các phản hồi rất tương似, đặc biệt là đối với các định nghĩa chung hoặc các sự kiện được biết đến rộng rãi. Nghiên cứu gần đây đã chỉ ra sự gia tăng mạnh mẽ trong việc sử dụng các mẫu viết liên quan đến các mô hình ngôn ngữ lớn, cho thấy nhiều bài viết hiện chia sẻ cùng một phong cách.’

Trí tuệ nhân tạo ChatGPT của bạn đang hiển thị

Bài viết nhận xét rằng một cách nhanh chóng để phát hiện các khảo sát được viết bởi trí tuệ nhân tạo là thông qua sự hiện diện của các cụm từ như ‘như một mô hình ngôn ngữ trí tuệ nhân tạo’ hoặc ‘điểm cắt kiến thức của tôi’, cho thấy sự giám sát tối thiểu hoặc thậm chí không có sự giám sát của đầu ra từ các mô hình ngôn ngữ trước khi gửi các bài viết (mặc dù tìm kiếm có mục tiêu tại thời điểm viết không tiết lộ bất kỳ dấu hiệu nào được lập chỉ mục trong Tìm kiếm của Google).

Bài viết lưu ý rằng nhiều ‘khảo sát đáng ngờ’ cho thấy sự đa dạng từ thấp và lặp lại cụm từ, ví dụ, bằng cách bắt đầu nhiều đoạn với Ngoài ra. Loại mẫu này, các tác giả đề xuất, là điển hình của phong cách viết GPT, và có thể là một lá cờ hữu ích để phát hiện văn bản được tạo tự động.

(Ý kiến cá nhân của tôi về điều này là rằng các hạn chế của báo chí trực tuyến thường yêu cầu một nhà văn liệt kê nhiều mục trong một hình thức dựa trên văn bản, không được định dạng. Do đó, ChatGPT và các đồng nghiệp của nó có thể đã học được thói quen xấu này từ các nhà văn con người, những người phải đối mặt với số lượng lựa chọn từ vựng hạn chế. Ngoài ra, suy đoán của các tác giả cho thấy họ đang dabble trong các nguyên tắc của việc phát hiện nội dung trí tuệ nhân tạo, một lĩnh vực phức tạp và đang phát triển, với rất ít hằng số lâu dài như những gì các tác giả đề xuất)

Mặc dù các nhà nghiên cứu tiếp tục phát triển một cuộc thảo luận hấp dẫn về tác động tiêu cực của các khảo sát trí tuệ nhân tạo đối với văn hóa nghiên cứu và niềm tin, nhưng chúng ta phải chuyển hướng người đọc đến bài viết nguồn để có thêm chiều sâu về chủ đề này.

Giải pháp?

Giải pháp của bài viết là fascin, radical, và đồng thời kỳ lạ không nguyên bản: rằng sự hữu ích của các bài khảo sát nên được thay thế bằng một Khảo sát Trực tiếp Động – theo cách hiểu, một loại kết hợp giữa Wiki và trang GitHub, liên tục được cung cấp bởi các hệ thống trí tuệ nhân tạo và các mô hình ngôn ngữ lớn khác, nhưng với các bản commit chỉ được thực hiện bởi con người, để trí tuệ nhân tạo không thể ‘tự động xuất bản’ các bản cập nhật.

Hệ thống được đề xuất sẽ chia sẻ phiên bản và phân nhánh của GitHub, về cơ bản biến một nguồn thông tin thành một danh sách liên tục cập nhật tương tự như ‘awesome’ dòng danh sách được quản lý tại GitHub:

‘Theo khuôn khổ này, một thành viên cộng đồng đầu tiên thiết lập một chủ đề wiki khảo sát bằng cách chỉ định phạm vi, các câu hỏi nghiên cứu chính và các tài liệu tham khảo then chốt, điều này thiết lập một ranh giới chủ đề rõ ràng và cấu trúc ban đầu.

‘Sau đó, một đại lý tiêu thụ dựa trên mô hình ngôn ngữ lớn liên tục theo dõi các kho lưu trữ tiền xuất bản, các kỷ yếu hội nghị và các bảng xếp hạngbenchmark. Nó tự động trích xuất các tóm tắt, hình ảnh và các chỉ số hiệu suất chính; tổng hợp các tóm tắt ngắn gọn của các kết quả mới; cập nhật đồ thị trích dẫn để phản ánh mối quan hệ giữa các bài viết; và đánh dấu các xu hướng nghiên cứu mới nổi để xem xét thêm.

‘Theo thiết kế, các bản cập nhật tự động này xảy ra trong vài giờ sau khi xuất bản, đảm bảo rằng kho lưu trữ vẫn ở tiền tuyến.’

‘Sau đó, các cộng tác viên con người bước vào để cung cấp độ sâu diễn giải mà máy móc alone không thể cung cấp. Họ tinh chỉnh các phân loại đang phát triển để nắm bắt các sự khác biệt phương pháp tinh tế, phối hợp các cách giải thích mâu thuẫn của các đổi mới thuật toán trên các phân nhánh khác nhau, và cung cấp so sánh sâu sắc hơn cho tài liệu.’

Quyển Sách của Sự Thay đổi

Các tác giả triển khai đề xuất này một cách hào hứng và chi tiết, và về cơ bản biện minh cho nó với điều gì đó rất đúng: các khảo sát được viết bởi con người với công sức cao về các chủ đề dễ thay đổi xung quanh trí tuệ nhân tạo lão hóa rất nhanh mà chúng hầu như không đáng viết; và bài viết lưu ý rằng một vòng quay ba tháng trên một bài khảo sát mới sẽ có khả năng bị lỗi thời (hoặc thậm chí rất lỗi thời) vào thời điểm ngày xuất bản được lên lịch:

‘Năm này qua năm khác, các cộng đồng bị ngập lụt bởi các bản tóm tắt lặp lại hoặc bề mặt, nhanh chóng mất liên quan, khiến cả những người hành nghề và những người mới tham gia đều khó phân biệt tín hiệu từ nhiễu. Chu kỳ xuất bản truyền thống (tức là, soạn thảo, gửi, xem xét và xuất bản) có thể kéo dài vài tháng, vào thời điểm đó các đột phá quan trọng có thể đã thay đổi cảnh quan.

‘Hơn nữa, khối lượng ngày càng tăng của các khảo sát tĩnh thêm vào tình trạng quá tải nhận thức, vì người đọc phải sàng lọc qua nhiều tài liệu trùng lặp để tìm ra những hiểu biết thực sự.’

Thật không may, giải pháp của bài viết chia sẻ nhiều phẩm chất tồi tệ nhất và bị chỉ trích nhiều nhất của Discord: đặc biệt là nó sẽ là một nguồn tài nguyên luôn thay đổi và thay đổi.

Because bất kỳ phần nào của Khảo sát Trực tiếp Động đều có thể biến mất hoặc được sửa đổi tại bất kỳ thời điểm nào, nó sẽ không thể sử dụng được như một nguồn có thể trích dẫn, ổn định; ngoại trừ, có thể, bằng cách liên kết đến một ‘bản commit trước’, theo cách tương tự như archive.is và Wayback Machine, trong số các trang lưu trữ khác, cung cấp các liên kết có thể trích dẫn đến nội dung của trang web, được đóng băng tại một thời điểm nhất định. Nhưng những tài nguyên nào sẽ một bản commit như vậy cần, và liệu nó có thể được tin cậy để tồn tại theo thời gian?

Thêm vào đó, một nền tảng/Wiki với các định nghĩa và nội dung luôn thay đổi sẽ là một thách thức để lập chỉ mục, cả bởi các công cụ tìm kiếm truyền thống và các mô hình ngôn ngữ lớn.

Có lẽ phần yếu nhất của hệ thống được đề xuất là ý tưởng rằng con người thực nên giám sát các bản commit từ các đại lý trí tuệ nhân tạo; như mọi khi, con người thực là tốn kém. Những gì đang được đề xuất là một thứ gì đó giữa một bảo tàng và một thư viện – cả hai đều sẽ cần có sự cung cấp ‘thịt’ tương ứng với số lượng dữ liệu và số lượng chủ đề được bao phủ.

Nếu ‘sử dụng con người thực‘ là câu trả lời duy nhất cho một vấn đề phát triển trí tuệ nhân tạo, thì vấn đề vẫn còn mở và chưa được giải quyết.

Kết luận

Hiện tại, thời hạn sử dụng ngắn của các bài khảo sát về trí tuệ nhân tạo là khó chịu; nếu xu hướng hiện tại đối với việc viết tự động và gửi với quy mô lớn tiếp tục, như được hình dung trong bài viết mới, tỷ lệ tín hiệu trên nhiễu sẽ trở nên mãn tính, và văn học sẽ không thể kiểm soát được.

Trong một tình huống như vậy, nó sẽ còn khó khăn hơn cho các tiếng nói nhỏ, không phải FAANG để được lắng nghe trong cơn bão của các bản gửi, và các nhà lãnh đạo thị trường lớn có khả năng sẽ đạt được sự nổi bật thậm chí còn lớn hơn.

Bên cạnh các khảo sát trực tiếp, bài viết mới đề xuất rằng các tác giả không chỉ bị hạn chế tự khai báo khi trí tuệ nhân tạo được sử dụng trong bất kỳ phần nào của bản gửi, mà còn rằng các phần được hỗ trợ bởi trí tuệ nhân tạo nên được dán nhãn rõ ràng trong một bài viết (có thể với một tệp JSON đi kèm…?).

Because đây là một triển vọng khó khăn, bài viết thay vào đó đề xuất những gì tôi chỉ có thể mô tả là một ‘ghetto trí tuệ nhân tạo’ – một phần riêng biệt trong bản gửi được dành riêng cho các đóng góp trí tuệ nhân tạo.

Tóm lại, công việc mới đã thực hiện một dịch vụ hữu ích trong việc phác thảo các thách thức phía trước, mặc dù nó không có giải pháp thực tế nào để cung cấp.

 

Bài viết Dừng tấn công DDoS vào Cộng đồng Nghiên cứu với các Bài khảo sát được tạo bởi Trí tuệ nhân tạo có thể được tìm thấy tại https://arxiv.org/abs/2510.09686, và được viết bởi sáu tác giả trên các bộ phận tại Đại học Shanghai Jiao Tong.

___________________________________

* Không phải tất cả mọi người đều cảm thấy như vậy.

Nhấn mạnh của tác giả, không phải của tôi. Ngoài ra, nơi适 dụng, việc chuyển đổi trích dẫn nội tuyến của tác giả thành siêu liên kết của tôi.

Được xuất bản lần đầu vào thứ Sáu, ngày 17 tháng 10 năm 2025

Nhà văn về học máy, chuyên gia lĩnh vực tổng hợp hình ảnh con người. Cựu trưởng nhóm nội dung nghiên cứu tại Metaphysic.ai.
Trang cá nhân: martinanderson.ai
Liên hệ: [email protected]