Trí tuệ nhân tạo

Trí tuệ nhân tạo có thể giúp các nhà nghiên cứu xác định哪些 bài báo có thể được sao chép, nhằm giải quyết khủng hoảng tái sản xuất

mm

Trong những năm gần đây, ngày càng nhiều sự chú ý được dành cho những gì các học giả và nhà nghiên cứu gọi là khủng hoảng tái sản xuất / tái tạo. Nhiều nghiên cứu đơn giản là không thể đưa ra cùng một kết quả đáng kể khi cố gắng sao chép nghiên cứu, và do đó, cộng đồng khoa học lo ngại rằng các phát hiện thường được nhấn mạnh quá mức. Vấn đề này ảnh hưởng đến các lĩnh vực đa dạng như tâm lý học và trí tuệ nhân tạo. Khi nói đến lĩnh vực trí tuệ nhân tạo, nhiều bài báo không được đánh giá ngang hàng được xuất bản với những kết quả ấn tượng mà các nhà nghiên cứu khác không thể tái tạo. Để giải quyết vấn đề này và giảm số lượng nghiên cứu không thể tái tạo, các nhà nghiên cứu đã thiết kế một mô hình trí tuệ nhân tạo nhằm xác định哪些 bài báo có thể được sao chép.

Theo báo cáo của Fortune, một bài báo mới được xuất bản bởi một nhóm nhà nghiên cứu từ Trường Quản lý Kellog và Viện Hệ thống Phức tạp tại Đại học Northwestern trình bày một mô hình học sâu có thể потенti xác định哪些 nghiên cứu có thể được tái tạo và哪些 không. Nếu hệ thống trí tuệ nhân tạo có thể phân biệt đáng tin cậy giữa các nghiên cứu có thể tái tạo và không tái tạo, nó có thể giúp các trường đại học, viện nghiên cứu, công ty và các tổ chức khác lọc qua hàng nghìn bài báo nghiên cứu để xác định哪些 bài báo có thể được sử dụng và đáng tin cậy.

Hệ thống trí tuệ nhân tạo được phát triển bởi nhóm Northwestern không sử dụng loại bằng chứng thực nghiệm / thống kê mà các nhà nghiên cứu thường sử dụng để xác định tính hợp lệ của các nghiên cứu. Thay vào đó, mô hình sử dụng các kỹ thuật xử lý ngôn ngữ tự nhiên để cố gắng lượng hóa độ tin cậy của một bài báo. Hệ thống trích xuất các mẫu trong ngôn ngữ được sử dụng bởi các tác giả của một bài báo, cho thấy rằng một số mẫu từ ngữ cho thấy độ tin cậy cao hơn các mẫu khác.

Đội nghiên cứu đã dựa trên nghiên cứu tâm lý học từ những năm 1960, cho thấy rằng con người thường truyền đạt mức độ tự tin mà họ có trong ý tưởng của mình thông qua từ ngữ mà họ sử dụng. Phát triển ý tưởng này, các nhà nghiên cứu nghĩ rằng các tác giả của một bài báo có thể vô tình gửi tín hiệu về sự tự tin trong kết quả nghiên cứu của họ khi viết bài báo của họ. Các nhà nghiên cứu đã thực hiện hai vòng đào tạo, sử dụng các tập dữ liệu khác nhau. Ban đầu, mô hình được đào tạo trên khoảng hai triệu tóm tắt từ các bài báo khoa học, trong khi lần thứ hai mô hình được đào tạo trên các bài báo đầy đủ từ một dự án nhằm xác định哪些 bài báo tâm lý học có thể tái tạo – Dự án Tái tạo: Tâm lý học.

Sau khi thử nghiệm, các nhà nghiên cứu đã triển khai mô hình trên một bộ sưu tập gồm hàng trăm bài báo khác, được lấy từ các lĩnh vực như tâm lý học và kinh tế. Các nhà nghiên cứu đã tìm thấy rằng mô hình của họ đưa ra dự đoán đáng tin cậy hơn về khả năng tái tạo của một bài báo so với các kỹ thuật thống kê thường được sử dụng để xác định liệu kết quả của một bài báo có thể được tái tạo hay không.

Nhà nghiên cứu và Giáo sư Trường Quản lý Kellog Brian Uzzi đã giải thích với Fortune rằng mặc dù ông hy vọng rằng mô hình trí tuệ nhân tạo có thể được sử dụng để giúp các nhà nghiên cứu xác định khả năng tái tạo của kết quả, nhưng đội nghiên cứu không chắc chắn về các mẫu và chi tiết mà mô hình của họ đã học. Việc các mô hình học máy thường là những hộp đen là một vấn đề phổ biến trong nghiên cứu trí tuệ nhân tạo, nhưng điều này có thể khiến các nhà khoa học khác do dự khi sử dụng mô hình.

Uzzi giải thích rằng đội nghiên cứu hy vọng rằng mô hình có thể được sử dụng để giải quyết khủng hoảng coronavirus, giúp các nhà khoa học hiểu nhanh hơn về virus và xác định哪些 kết quả nghiên cứu là hứa hẹn. Như Uzzi nói với Fortune:

“Chúng tôi muốn bắt đầu áp dụng điều này vào vấn đề COVID – một vấn đề hiện tại nơi nhiều thứ đang trở nên lỏng lẻo, và chúng tôi cần xây dựng trên một nền tảng vững chắc của công việc trước đó. Không rõ công việc trước đó nào sẽ được tái tạo hay không và chúng tôi không có thời gian cho việc tái tạo.”

Uzzi và các nhà nghiên cứu khác hy vọng sẽ cải thiện mô hình bằng cách sử dụng thêm các kỹ thuật xử lý ngôn ngữ tự nhiên, bao gồm cả các kỹ thuật mà đội đã tạo ra để phân tích bản ghi cuộc gọi về thu nhập doanh nghiệp. Đội nghiên cứu đã xây dựng một cơ sở dữ liệu gồm khoảng 30.000 bản ghi cuộc gọi mà họ sẽ phân tích để tìm kiếm manh mối. Nếu đội có thể xây dựng một mô hình thành công, họ có thể thuyết phục các nhà phân tích và nhà đầu tư sử dụng công cụ này, điều này có thể mở đường cho các ứng dụng sáng tạo khác cho mô hình và các kỹ thuật của nó.

Blogger và lập trình viên với chuyên môn về Machine Learning Deep Learning topics. Daniel hy vọng giúp đỡ người khác sử dụng sức mạnh của AI cho lợi ích xã hội.