Искусственный интеллект
Открытый набор данных о Covid-19, выпущенный для машинного обучения

Офис научно-технической политики Белого дома просит исследователей проанализировать тысячи научных статей с помощью технологии искусственного интеллекта (ИИ). Все эти статьи, которые насчитывают около 29 000, могут дать ответы на вопросы о коронавирусе. Около 13 000 статей в базе данных представлены в полном объеме и являются машинно-читаемыми. Что касается остальных 16 000 статей, база данных содержит частичный текст и резюме.
В течение последних нескольких дней официальные лица правительства США работали с американскими технологическими компаниями и исследовательскими учреждениями, чтобы получить юридическое разрешение на доступ к статьям о коронавирусе.
Открытый набор данных известен как COVID-19 Open Research Dataset, или CORD-19. Он будет不断 добавлять новую информацию в один центральный хаб, предоставляя исследователям и другим единую платформу для доступа к ней.
Партнерство, объявленное Белым домом, включает в себя Chan Zuckerberg Initiative, Microsoft Research, Allen Institute for Artificial Intelligence, Национальную библиотеку медицины Национального института здравоохранения, Центр безопасности и новых технологий Джорджтаунского университета, лабораторию Cold Spring Harbor и платформу Kaggle AI, принадлежащую Google.
По словам технического директора США Майкла Кратсиоса, набор данных CORD-19 является “самым обширным собранием машинно-читаемой литературы о коронавирусе на сегодняшний день”.
Национальная академия наук, инженерии и медицины работала с Всемирной организацией здравоохранения (ВОЗ), чтобы разработать “приоритетные вопросы”. Эти вопросы связаны с взаимосвязью между коронавирусом и генетикой, инкубационным периодом, лечением, симптомами и профилактикой.
Некоторые исследования, представленные в базе данных, являются доопубликационными исследованиями, полученными из таких ресурсов, как medRxiv и bioRxiv. Это открытые архивы.
Кори Баргманн является руководителем научного отдела Chan Zuckerberg Initiative.
“Обмен важной информацией между научными и медицинскими сообществами является ключом к ускорению нашей способности реагировать на пандемию коронавируса”, – сказала Баргманн.
По заявлению Белого дома, коллекция базы данных была разработана с помощью использования инструментов Microsoft для сбора литературы в масштабе веба, которые определили и собрали различные научные работы со всего мира. Chan Zuckerberg Initiative предоставила доступ к доопубликационному контенту, Национальная библиотека медицины предоставила доступ к литературному контенту, а команда Allen AI отформатировала контент, чтобы его можно было проанализировать.
Доктор Эрик Хорвиц является главным научным сотрудником Microsoft.
“Все на борту, когда мы сталкиваемся с пандемией COVID-19”, – сказал Хорвиц. “Нам нужно объединиться как компании, правительства и ученые и работать над применением наших лучших технологий в биомедицине, эпидемиологии, ИИ и других науках. Ресурс и вызов литературы COVID-19 будут стимулировать усилия, которые могут ускорить путь к решениям по COVID-19”.
Многие надеются, что этот подход сработает и предоставит новый способ использования технологии ИИ и машинного обучения в будущем. Одним из таких людей является доктор Дьюи Мурдик, директор отдела данных науки в Центре безопасности и новых технологий Джорджтаунского университета. Доктор Мурдик помог координировать проект.
“Этот ценный новый ресурс является результатом бескорыстного сотрудничества и теперь предлагает возможность найти ответы на важные вопросы о COVID-19”, – сказал доктор Мурдик. “Когда кризис пройдет, мы надеемся, что этот проект вдохновит новые способы использования машинного обучения для продвижения научных исследований”.
Если этот проект окажется успешным в нахождении необходимых ответов о коронавирусе, он может быть использован как модель в будущем. Технология ИИ является мощным инструментом, и она может проанализировать результаты экспертов и учреждений со всего мира намного быстрее, чем люди. Это означает более быстрое время реагирования, когда возникает пандемия или другой кризис, что может спасти многие жизни и предотвратить экономический хаос.












