sơ khai Bộ dữ liệu mở về Covid-19 được phát hành cho Machine Learning - Unite.AI
Kết nối với chúng tôi

Chăm sóc sức khỏe

Tập dữ liệu mở về Covid-19 được phát hành cho Machine Learning

cập nhật on

Văn phòng Chính sách Khoa học và Công nghệ của Nhà Trắng đang yêu cầu các nhà nghiên cứu phân tích hàng nghìn bài báo học thuật bằng công nghệ trí tuệ nhân tạo (AI). Tất cả các bài báo, với số lượng khoảng 29,000, có thể cung cấp câu trả lời cho các câu hỏi về coronavirus. Khoảng 13,000 bài báo trong cơ sở dữ liệu là toàn bộ và có thể đọc được bằng máy. Đối với 16,000 bài báo khác, cơ sở dữ liệu có một phần văn bản và tóm tắt. 

Trong vài ngày qua, các quan chức chính phủ Hoa Kỳ đã làm việc với các công ty công nghệ và tổ chức nghiên cứu của Mỹ để đảm bảo sự cho phép hợp pháp để cung cấp các tài liệu về coronavirus. 

Tập dữ liệu mở được gọi là Bộ dữ liệu nghiên cứu mở COVID-19, hay CORD-19. Nó sẽ liên tục thêm thông tin mới vào một trung tâm tập trung, cung cấp cho các nhà nghiên cứu và những người khác một nơi duy nhất để truy cập thông tin đó.

Sự hợp tác được Nhà Trắng công bố bao gồm Sáng kiến ​​Chan Zuckerberg, Nghiên cứu của Microsoft, Viện Trí tuệ Nhân tạo Allen, Thư viện Y khoa Quốc gia của Viện Y tế Quốc gia, Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, Phòng thí nghiệm Cold Spring Harbor và Kaggle AI nền tảng, được sở hữu bởi Google. 

Theo CTO Hoa Kỳ Michael Kratsios, bộ dữ liệu CORD-19 là “bộ sưu tập tài liệu về coronavirus có thể đọc được bằng máy nhiều nhất cho đến nay”.

Viện Hàn lâm Khoa học, Kỹ thuật và Y học Quốc gia đã làm việc với Tổ chức Y tế Thế giới (WHO) để phát triển các câu hỏi “ưu tiên cao”. Những câu hỏi này xoay quanh mối quan hệ giữa coronavirus và di truyền học, ủ bệnh, điều trị, triệu chứng và phòng ngừa. 

Một số nghiên cứu có trong cơ sở dữ liệu là nghiên cứu trước khi xuất bản được lấy từ các nguồn như medRxiv và bioRxiv. Đây là những kho lưu trữ truy cập mở. 

Cori Bargmann là Trưởng phòng Khoa học của Sáng kiến ​​Chan Zuckerberg.

Bargmann nói: “Chia sẻ thông tin quan trọng giữa các cộng đồng khoa học và y tế là chìa khóa để tăng tốc khả năng ứng phó với đại dịch coronavirus của chúng ta. 

Theo Lời kêu gọi hành động do Nhà Trắng phát hành, bộ sưu tập cơ sở dữ liệu được phát triển thông qua việc sử dụng các công cụ quản lý tài liệu quy mô web của Microsoft, công cụ này đã xác định và tập hợp các công trình khoa học khác nhau từ khắp nơi trên thế giới. Sáng kiến ​​Chan Zuckerberg cung cấp quyền truy cập vào nội dung trước khi xuất bản, Thư viện Y khoa Quốc gia cung cấp quyền truy cập vào nội dung tài liệu và nhóm Allen AI đã định dạng nội dung để có thể phân tích. 

Tiến sĩ Eric Horvitz là Giám đốc khoa học tại Microsoft. 

Horvitz nói: “Tất cả đều chung tay khi chúng ta đối mặt với đại dịch COVID-19. “Chúng ta cần phải đoàn kết với nhau với tư cách là các công ty, chính phủ và nhà khoa học và hợp tác để mang những công nghệ tốt nhất của chúng ta áp dụng vào y sinh học, dịch tễ học, AI và các ngành khoa học khác. Nguồn tài liệu và thách thức về COVID-19 sẽ kích thích những nỗ lực có thể đẩy nhanh con đường dẫn đến các giải pháp về COVID-19.”

Nhiều người đang hy vọng rằng phương pháp này hiệu quả và cung cấp một cách mới để sử dụng công nghệ AI và học máy trong tương lai. Một trong những người đó là Tiến sĩ Dewey Murdick, Giám đốc Khoa học Dữ liệu tại Trung tâm An ninh và Công nghệ mới nổi của Đại học Georgetown. Tiến sĩ Murdick đã giúp điều phối dự án.

Tiến sĩ Murdick cho biết: “Nguồn tài nguyên mới có giá trị này là thành quả của sự hợp tác không ích kỷ và hiện mang đến cơ hội tìm ra câu trả lời cho những câu hỏi quan trọng về COVID-19. “Sau khi cuộc khủng hoảng qua đi, chúng tôi hy vọng dự án này sẽ truyền cảm hứng cho những cách mới để sử dụng máy học để thúc đẩy nghiên cứu khoa học.”

Nếu dự án này thành công trong việc chứng minh những câu trả lời rất cần thiết về virus corona, thì nó có thể được sử dụng như một mô hình trong tương lai. Công nghệ AI là một công cụ mạnh mẽ và nó có thể phân tích kết quả của các chuyên gia và tổ chức trên toàn cầu nhanh hơn nhiều so với con người. Điều này có nghĩa là thời gian phản ứng nhanh hơn bất cứ khi nào đại dịch hoặc khủng hoảng khác bùng phát, điều này có thể cứu sống nhiều người và ngăn chặn tình trạng hỗn loạn kinh tế.

 

Alex McFarland là một nhà báo và nhà văn về AI đang khám phá những phát triển mới nhất về trí tuệ nhân tạo. Anh ấy đã cộng tác với nhiều công ty khởi nghiệp và ấn phẩm về AI trên toàn thế giới.