Inteligencia artificial
Conjunto de datos abiertos sobre Covid-19 lanzado para aprendizaje automático

La Oficina de Política de Ciencia y Tecnología de la Casa Blanca está pidiendo a los investigadores que analicen miles de artículos académicos con tecnología de inteligencia artificial (IA). Todos los artículos, que suman alrededor de 29.000, podrían proporcionar respuestas a preguntas sobre el coronavirus. Alrededor de 13.000 de los artículos en la base de datos están completos y son legibles por máquina. En cuanto a los otros 16.000 artículos, la base de datos tiene texto parcial y resúmenes.
En los últimos días, los funcionarios del gobierno de EE. UU. han trabajado con empresas tecnológicas estadounidenses e instituciones de investigación para obtener permiso legal para poner a disposición los documentos sobre el coronavirus.
El conjunto de datos abierto se conoce como el Conjunto de datos de investigación abierta sobre COVID-19, o CORD-19. Constantemente agregará nueva información en un centro centralizado, proporcionando a los investigadores y otros un solo lugar para acceder a ella.
La asociación anunciada por la Casa Blanca incluye la Iniciativa Chan Zuckerberg, Microsoft Research, el Instituto Allen de Inteligencia Artificial, la Biblioteca Nacional de Medicina del Instituto Nacional de Salud, el Centro de Seguridad y Tecnología Emergente de la Universidad de Georgetown, el Laboratorio Cold Spring Harbor y la plataforma de inteligencia artificial Kaggle, que es propiedad de Google.
Según el director de tecnología de EE. UU. Michael Kratsios, el conjunto de datos CORD-19 es la “colección más extensa de literatura sobre coronavirus legible por máquina hasta la fecha”.
La Academia Nacional de Ciencias, Ingeniería y Medicina trabajó con la Organización Mundial de la Salud (OMS) para desarrollar preguntas de “alta prioridad”. Estas preguntas giran en torno a la relación entre el coronavirus y la genética, el período de incubación, el tratamiento, los síntomas y la prevención.
Algunas de las investigaciones presentes en la base de datos son investigaciones de prepublicación extraídas de recursos como medRxiv y bioRxiv. Estos son archivos de acceso abierto.
Cori Bargmann es la directora de Ciencia de la Iniciativa Chan Zuckerberg.
“Compartir información vital en las comunidades científica y médica es clave para acelerar nuestra capacidad de responder a la pandemia del coronavirus”, dijo Bargmann.
Según el llamado a la acción lanzado por la Casa Blanca, la colección de la base de datos se desarrolló mediante el uso de herramientas de curación de literatura a escala web de Microsoft, que identificaron y reunieron diferentes trabajos científicos de todo el mundo. La Iniciativa Chan Zuckerberg proporcionó acceso a contenido de prepublicación, la Biblioteca Nacional de Medicina proporcionó acceso a contenido de literatura y el equipo de Allen AI formateó el contenido para que pudiera ser analizado.
El Dr. Eric Horvitz es el director científico de Microsoft.
“Es una situación de todos en cubierta mientras enfrentamos la pandemia de COVID-19”, dijo Horvitz. “Necesitamos unirnos como empresas, gobiernos y científicos y trabajar para aplicar nuestras mejores tecnologías en biomedicina, epidemiología, IA y otras ciencias. El recurso y el desafío de la literatura sobre COVID-19 estimularán los esfuerzos que pueden acelerar el camino hacia soluciones sobre COVID-19”.
Muchos esperan que este enfoque funcione y proporcione una nueva forma de utilizar la tecnología de IA y el aprendizaje automático en el futuro. Una de esas personas es el Dr. Dewey Murdick, director de Ciencia de Datos del Centro de Seguridad y Tecnología Emergente de la Universidad de Georgetown. El Dr. Murdick ayudó a coordinar el proyecto.
“Este valioso nuevo recurso es el fruto de la colaboración desinteresada y ahora ofrece la oportunidad de encontrar respuestas a preguntas importantes sobre COVID-19”, dijo el Dr. Murdick. “Una vez que haya pasado la crisis, esperamos que este proyecto inspiren nuevas formas de utilizar el aprendizaje automático para avanzar en la investigación científica”.
Si este proyecto tiene éxito en proporcionar respuestas necesarias sobre el coronavirus, podría ser utilizado como un modelo en el futuro. La tecnología de IA es una herramienta poderosa y puede analizar los resultados de expertos e instituciones de todo el mundo mucho más rápido que los humanos. Esto significa un tiempo de respuesta más rápido cada vez que se produzca una pandemia u otra crisis, lo que podría salvar muchas vidas y prevenir problemas económicos.












