Свяжитесь с нами:

Открытый набор данных о Covid-19 выпущен для машинного обучения

Здравоохранение

Открытый набор данных о Covid-19 выпущен для машинного обучения

mm

Управление Белого дома по научно-технической политике просит исследователей проанализировать тысячи научных статей с помощью технологии искусственного интеллекта (ИИ).. Все статьи, которых насчитывается около 29,000 13,000, могут дать ответы на вопросы о коронавирусе. Около 16,000 XNUMX статей в базе данных полностью доступны для машинного чтения. Что касается остальных XNUMX XNUMX статей, то в базе данных есть частичный текст и резюме. 

В течение последних нескольких дней официальные лица правительства США работали с американскими технологическими компаниями и исследовательскими институтами, чтобы получить законное разрешение на предоставление документов о коронавирусе. 

Набор открытых данных известен как набор данных открытых исследований COVID-19 или CORD-19. Он будет постоянно добавлять новую информацию в один централизованный узел, предоставляя исследователям и другим пользователям единое место для доступа к ней.

Партнерство, объявленное Белым домом, включает Инициативу Чана Цукерберга, Microsoft Research, Институт искусственного интеллекта Аллена, Национальную медицинскую библиотеку Национального института здравоохранения, Центр безопасности и новых технологий Джорджтаунского университета, Лабораторию Колд-Спринг-Харбор и Kaggle AI. Платформа, принадлежащая Google. 

По словам технического директора США Майкла Крациоса, набор данных CORD-19 является «самой обширной коллекцией машиночитаемой литературы по коронавирусу на сегодняшний день».

Национальная академия наук, инженерии и медицины работала со Всемирной организацией здравоохранения (ВОЗ) над разработкой «высокоприоритетных» вопросов. Эти вопросы вращаются вокруг связи между коронавирусом и генетикой, инкубацией, лечением, симптомами и профилактикой. 

Некоторые из исследований, представленных в базе данных, являются предварительными исследованиями, взятыми из таких ресурсов, как medRxiv и bioRxiv. Это архивы открытого доступа. 

Кори Баргманн — научный руководитель Инициативы Чана Цукерберга.

«Обмен жизненно важной информацией между научными и медицинскими сообществами является ключом к ускорению нашей способности реагировать на пандемию коронавируса», — сказал Баргманн. 

Согласно Призыву к действию, опубликованному Белым домом, коллекция базы данных была разработана с использованием веб-инструментов Microsoft для сбора литературы, которые выявили и объединили различные научные работы со всего мира. Инициатива Чана Цукерберга предоставила доступ к предварительно опубликованному контенту, Национальная медицинская библиотека предоставила доступ к литературному контенту, а команда искусственного интеллекта Аллена отформатировала контент, чтобы его можно было проанализировать. 

Доктор Эрик Хорвиц — главный научный сотрудник Microsoft. 

«Все руки на палубе, поскольку мы сталкиваемся с пандемией COVID-19», — сказал Хорвиц. «Мы должны объединиться как компании, правительства и ученые и работать над тем, чтобы наши лучшие технологии применялись в биомедицине, эпидемиологии, искусственном интеллекте и других науках. Литературный ресурс и задачи по COVID-19 будут стимулировать усилия, которые могут ускорить поиск решений по COVID-19».

Многие надеются, что этот подход сработает и предоставит новый способ использования технологий искусственного интеллекта и машинного обучения в будущем. Один из этих людей — доктор Дьюи Мёрдик, директор по науке о данных Центра безопасности и новых технологий Джорджтаунского университета. Доктор Мердик помогал координировать проект.

«Этот ценный новый ресурс является плодом бескорыстного сотрудничества и теперь дает возможность найти ответы на важные вопросы о COVID-19», — сказал д-р Мердик. «После того, как кризис пройдет, мы надеемся, что этот проект вдохновит на новые способы использования машинного обучения для продвижения научных исследований».

Если этому проекту удастся найти столь необходимые ответы на вопросы о коронавирусе, его можно будет использовать в качестве модели в будущем. Технология искусственного интеллекта — это мощный инструмент, который может анализировать результаты экспертов и учреждений по всему миру намного быстрее, чем люди. Это означает более быстрое реагирование в случае возникновения пандемии или другого кризиса, что может спасти множество жизней и предотвратить экономические потрясения.

 

Алекс МакФарланд — журналист и писатель, занимающийся искусственным интеллектом. Он сотрудничал с многочисленными стартапами и публикациями в области искусственного интеллекта по всему миру.