Connect with us

Trí tuệ nhân tạo

Hướng tới Viết bài Khoa học Tự động

mm

Sáng nay, khi lướt qua các phần Khoa học Máy tính của Arxiv, như tôi thường làm vào hầu hết các buổi sáng, tôi đã gặp một bài báo gần đây từ Đại học Liên bang Ceara ở Brazil, cung cấp một khuôn khổ Xử lý Ngôn ngữ Tự nhiên mới để tự động hóa việc tóm tắt và trích xuất dữ liệu cốt lõi từ các bài báo khoa học.

Vì đây基本 là những gì tôi làm mỗi ngày, nên bài báo này đã gợi nhớ cho tôi một nhận xét trên một luồng thảo luận của các nhà văn trên Reddit đầu năm nay – một lời tiên đoán về việc viết bài khoa học sẽ là một trong những công việc báo chí đầu tiên bị máy học chiếm lĩnh.

Hãy để tôi làm rõ – tôi hoàn toàn tin rằng nhà văn khoa học tự động đang đến, và tất cả các thách thức mà tôi nêu ra trong bài viết này đều có thể giải quyết được, hoặc sẽ được giải quyết. Ở những nơi có thể, tôi cung cấp ví dụ cho điều này. Ngoài ra, tôi không đề cập đến việc liệu các trí tuệ nhân tạo viết bài khoa học hiện tại hoặc trong tương lai gần có thể viết một cách mạch lạc; dựa trên mức độ quan tâm hiện tại trong lĩnh vực này của Xử lý Ngôn ngữ Tự nhiên, tôi giả định rằng thách thức này sẽ được giải quyết.

Thay vào đó, tôi đang hỏi liệu một trí tuệ nhân tạo viết bài khoa học có thể xác định các câu chuyện khoa học liên quan theo các kết quả mong muốn (rất đa dạng) của các nhà xuất bản.

Tôi không nghĩ nó sắp xảy ra; dựa trên việc lướt qua các tiêu đề và / hoặc bản sao của khoảng 2000 bài báo khoa học mới về học máy mỗi tuần, tôi có một quan điểm hoài nghi hơn về mức độ mà các bài báo học thuật có thể được phân tích thuật toán, cả cho mục đích lập chỉ mục học thuật và cho báo chí khoa học. Như thường lệ, đó là những người đáng thương đang cản trở công việc.

Yêu cầu cho Nhà văn Khoa học Tự động

Hãy xem xét thách thức của việc tự động hóa báo cáo khoa học về nghiên cứu học thuật mới nhất. Để giữ công bằng, chúng ta sẽ hạn chế nó chủ yếu trong các danh mục CS của miền Arxiv rất phổ biến và không phải trả phí, từ Đại học Cornell, điều này至少 có một số tính năng được hệ thống hóa và có thể được cắm vào một đường ống trích xuất dữ liệu.

Hãy giả sử cũng rằng nhiệm vụ tại tay, như với bài báo mới từ Brazil, là lặp lại các tiêu đề, tóm tắt, siêu dữ liệu và (nếu được chứng minh) nội dung cơ thể của các bài báo khoa học mới để tìm các hằng số, tham số đáng tin cậy, token và thông tin lĩnh vực có thể giảm và có thể thực hiện được.

Đây là, sau tất cả, nguyên tắc mà các khuôn khổ mới rất thành công đang giành được vị trí trong các lĩnh vực như báo cáo động đất, viết thể thao, báo chí tài chính và phạm vi sức khỏe, và một điểm khởi đầu hợp lý cho nhà báo khoa học được hỗ trợ bởi trí tuệ nhân tạo.

… (còn tiếp)

Nhà văn về học máy, chuyên gia lĩnh vực tổng hợp hình ảnh con người. Cựu trưởng nhóm nội dung nghiên cứu tại Metaphysic.ai.
Trang cá nhân: martinanderson.ai
Liên hệ: [email protected]