Trí tuệ nhân tạo

Bộ Dữ Liệu Mở về Covid-19 Được Phát Hành cho Học Máy

Published March 17, 2020

Updated April 28, 2026

Alex McFarland

Văn phòng Chính sách Khoa học và Công nghệ của Nhà Trắng đang yêu cầu các nhà nghiên cứu phân tích hàng nghìn bài viết học thuật bằng công nghệ trí tuệ nhân tạo (AI). Tất cả các bài viết, với số lượng khoảng 29.000, có thể cung cấp câu trả lời cho các câu hỏi về coronavirus. Khoảng 13.000 bài viết trong cơ sở dữ liệu là toàn bộ và có thể đọc được bằng máy. Đối với 16.000 bài viết còn lại, cơ sở dữ liệu có văn bản một phần và tóm tắt.

Trong những ngày gần đây, các quan chức chính phủ Mỹ đã làm việc với các công ty công nghệ và cơ sở nghiên cứu của Mỹ để bảo đảm sự cho phép pháp lý để đưa các bài viết về coronavirus lên mạng.

Bộ dữ liệu mở này được gọi là Bộ Dữ Liệu Nghiên Cứu Mở Covid-19, hoặc CORD-19. Nó sẽ liên tục thêm thông tin mới vào một trung tâm tập trung, cung cấp cho các nhà nghiên cứu và những người khác một nơi duy nhất để truy cập.

Quan hệ đối tác được Nhà Trắng công bố bao gồm Sáng kiến Chan Zuckerberg, Nghiên cứu Microsoft, Viện Trí tuệ Nhân tạo Allen, Thư viện Y học Quốc gia của Viện Y tế Quốc gia, Trung tâm An ninh và Công nghệ Nổi bật của Đại học Georgetown, Phòng thí nghiệm Cold Spring Harbor và nền tảng AI Kaggle, thuộc sở hữu của Google.

Theo CTO Mỹ Michael Kratsios, bộ dữ liệu CORD-19 là “tập hợp lớn nhất về văn học coronavirus có thể đọc được bằng máy tính cho đến nay”.

Học viện Khoa học, Kỹ thuật và Y học Quốc gia đã làm việc với Tổ chức Y tế Thế giới (WHO) để phát triển các câu hỏi “ưu tiên cao”. Những câu hỏi này xoay quanh mối quan hệ giữa coronavirus và di truyền, ủ bệnh, điều trị, triệu chứng và phòng ngừa.

Một số nghiên cứu hiện có trong cơ sở dữ liệu là nghiên cứu trước khi xuất bản được lấy từ các nguồn như medRxiv và bioRxiv. Đây là các kho lưu trữ truy cập mở.

Cori Bargmann là Người đứng đầu Khoa học của Sáng kiến Chan Zuckerberg.

“Chia sẻ thông tin quan trọng trên các cộng đồng khoa học và y tế là chìa khóa để tăng tốc khả năng phản ứng với đại dịch coronavirus,” Bargmann nói.

Theo Lời kêu gọi Hành động được Nhà Trắng phát hành, bộ sưu tập dữ liệu được phát triển thông qua việc sử dụng các công cụ thu thập văn học trên quy mô web của Microsoft, xác định và đưa cùng nhau các công việc khoa học khác nhau từ khắp thế giới. Sáng kiến Chan Zuckerberg cung cấp quyền truy cập vào nội dung trước khi xuất bản, Thư viện Y học Quốc gia cung cấp quyền truy cập vào nội dung văn học, và đội Allen AI định dạng nội dung để nó có thể được phân tích.

Tiến sĩ Eric Horvitz là Giám đốc Khoa học tại Microsoft.

“Đây là lúc tất cả cùng hợp tác khi chúng ta đối mặt với đại dịch COVID-19,” Horvitz nói. “Chúng ta cần hợp tác như các công ty, chính phủ và nhà khoa học, và làm việc để đưa công nghệ tốt nhất của chúng ta vào các lĩnh vực sinh học y học, dịch tễ học, AI và các khoa học khác. Tài nguyên văn học COVID-19 và thách thức sẽ kích thích các nỗ lực có thể tăng tốc con đường đến các giải pháp về COVID-19.”

Nhiều người hy vọng rằng cách tiếp cận này sẽ hoạt động và cung cấp một cách mới để sử dụng công nghệ AI và học máy trong tương lai. Một trong những người đó là Tiến sĩ Dewey Murdick, Giám đốc Khoa học Dữ liệu tại Trung tâm An ninh và Công nghệ Nổi bật của Đại học Georgetown. Tiến sĩ Murdick đã giúp phối hợp dự án.

“Tài nguyên quý giá này là kết quả của sự hợp tác vô tư và bây giờ cung cấp cơ hội để tìm ra câu trả lời cho các câu hỏi quan trọng về COVID-19,” Tiến sĩ Murdick nói. “Khi cuộc khủng hoảng đã qua, chúng tôi hy vọng dự án này sẽ truyền cảm hứng cho các cách mới để sử dụng học máy nhằm thúc đẩy nghiên cứu khoa học.”

Nếu dự án này thành công trong việc cung cấp các câu trả lời cần thiết về coronavirus, nó có thể được sử dụng như một mô hình trong tương lai. Công nghệ AI là một công cụ mạnh mẽ, và nó có thể phân tích kết quả của các chuyên gia và tổ chức trên toàn cầu nhanh hơn nhiều so với con người. Điều này có nghĩa là thời gian phản ứng nhanh hơn mỗi khi một đại dịch hoặc khủng hoảng khác xảy ra, điều này có thể cứu sống nhiều người và ngăn chặn sự hỗn loạn kinh tế.

Alex McFarland

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.

Unite.AI

Bộ Dữ Liệu Mở về Covid-19 Được Phát Hành cho Học Máy

You may like