Connect with us

Otwarty zestaw danych na temat Covid-19 udostępniony dla uczenia maszynowego

Sztuczna inteligencja

Otwarty zestaw danych na temat Covid-19 udostępniony dla uczenia maszynowego

mm

Biuro Polityki Nauki i Technologii Białego Domu prosi badaczy o analizowanie tysięcy artykułów naukowych przy użyciu technologii sztucznej inteligencji (AI). Wszystkie artykuły, których jest około 29 000, mogą dostarczyć odpowiedzi na pytania dotyczące koronawirusa. Około 13 000 artykułów w bazie danych jest w całości i jest czytelnych maszynowo. Co do pozostałych 16 000 artykułów, baza danych zawiera częściowy tekst i streszczenia.

W ciągu ostatnich kilku dni urzędnicy rządu USA współpracowali z amerykańskimi firmami technologicznymi i instytucjami badawczymi, aby uzyskać zezwolenie prawne na udostępnienie artykułów na temat koronawirusa.

Otwarty zestaw danych nazywa się COVID-19 Open Research Dataset, czyli CORD-19. Będzie on stale dodawał nowe informacje do jednego centralnego węzła, zapewniając badaczom i innym osobom jedną miejscówkę, w której mogą uzyskać do nich dostęp.

Partnerstwo ogłoszone przez Biały Dom obejmuje Chan Zuckerberg Initiative, Microsoft Research, Allen Institute for Artificial Intelligence, National Institute of Health’s National Library of Medicine, Georgetown University’s Center for Security and Emerging Technology, Cold Spring Harbor Laboratory oraz platformę Kaggle AI, która należy do Google.

Według U.S. CTO Michaela Kratsiosa, zestaw danych CORD-19 to „najobszerniejsza kolekcja literatury na temat koronawirusa w formacie czytelnym maszynowo, jak dotąd”.

National Academy of Sciences, Engineering, and Medicine współpracowała z Światową Organizacją Zdrowia (WHO), aby opracować „priorytetowe” pytania. Pytania te dotyczą związku między koronawirusem a genetyką, inkubacją, leczeniem, objawami i zapobieganiem.

Część badań obecnych w bazie danych to badania przedpublikacyjne pobrane z takich źródeł, jak medRxiv i bioRxiv. Są to archiwa dostępne bezpłatnie.

Cori Bargmann jest szefem nauki w Chan Zuckerberg Initiative.

„Udostępnianie istotnych informacji w społecznościach naukowych i medycznych jest kluczem do przyspieszenia naszej zdolności do reagowania na pandemię koronawirusa”, powiedział Bargmann.

Według wezwania do działania opublikowanego przez Biały Dom, kolekcja bazy danych została opracowana przy użyciu narzędzi do kuracji literatury w skali sieci Microsoft, które zidentyfikowały i połączyły różne prace naukowe z całego świata. Chan Zuckerberg Initiative udostępniła dostęp do treści przedpublikacyjnych, National Library of Medicine udostępniła dostęp do treści literackiej, a zespół Allen AI sformatował treści, aby mogły być analizowane.

Dr Eric Horvitz jest Chief Scientific Officer w Microsoft.

„To jest sytuacja, w której wszyscy muszą działać razem, gdy mamy do czynienia z pandemią COVID-19”, powiedział Horvitz. „Musimy współpracować jako firmy, rządy i naukowcy, aby wykorzystać nasze najlepsze technologie w dziedzinie biomedycyny, epidemiologii, AI i innych nauk. Zasób literatury na temat COVID-19 i wyzwanie pobudzą wysiłki, które mogą przyspieszyć drogę do rozwiązań na temat COVID-19”.

Wielu ludzi liczy na to, że ten podejście zadziała i zapewni nowy sposób wykorzystania technologii AI i uczenia maszynowego w przyszłości. Jedną z tych osób jest dr Dewey Murdick, Dyrektor Data Science w Georgetown University’s Center for Security and Emerging Technology. Dr Murdick pomagał koordynować projekt.

„Ten cenny nowy zasób jest owocem bezinteresownej współpracy i teraz oferuje możliwość znalezienia odpowiedzi na ważne pytania dotyczące COVID-19”, powiedział dr Murdick. „Gdy kryzys minie, mamy nadzieję, że ten projekt zainspiruje nowe sposoby wykorzystania uczenia maszynowego do rozwoju badań naukowych”.

Jeśli ten projekt pomoże w znalezieniu potrzebnych odpowiedzi na temat koronawirusa, może być wykorzystany jako model w przyszłości. Technologia AI jest potężnym narzędziem, które może analizować wyniki ekspertów i instytucji z całego świata znacznie szybciej niż ludzie. Oznacza to szybszy czas reakcji, gdy wystąpi pandemia lub inny kryzys, co może uratować wiele istnień ludzkich i zapobiec zamieszaniu gospodarczemu.

Alex McFarland jest dziennikarzem i pisarzem zajmującym się sztuczną inteligencją, który bada najnowsze rozwoje w dziedzinie sztucznej inteligencji. Współpracował z licznymi startupami i wydawnictwami związanymi z sztuczną inteligencją na całym świecie.