Connect with us

Conjunto de Dados Abertos sobre Covid-19 Lançado para Aprendizado de Máquina

Inteligência artificial

Conjunto de Dados Abertos sobre Covid-19 Lançado para Aprendizado de Máquina

mm

A Casa Branca, por meio da Office of Science and Technology Policy, está pedindo que pesquisadores analisem milhares de artigos acadêmicos com tecnologia de inteligência artificial (IA). Todos os artigos, que somam cerca de 29.000, podem fornecer respostas a perguntas sobre o coronavírus. Aproximadamente 13.000 dos artigos no banco de dados estão em sua totalidade e são legíveis por máquina. Quanto aos outros 16.000 artigos, o banco de dados tem texto parcial e resumos. 

Nos últimos dias, funcionários do governo dos EUA trabalharam com empresas de tecnologia americanas e instituições de pesquisa para obter permissão legal para tornar os artigos sobre coronavírus disponíveis. 

O conjunto de dados aberto é conhecido como COVID-19 Open Research Dataset, ou CORD-19. Ele adicionará constantemente novas informações a um hub centralizado, fornecendo aos pesquisadores e outros um único local para acessá-las.

A parceria anunciada pela Casa Branca inclui a Chan Zuckerberg Initiative, Microsoft Research, o Allen Institute for Artificial Intelligence, a National Institute of Health’s National Library of Medicine, o Georgetown University’s Center for Security and Emerging Technology, o Cold Spring Harbor Laboratory e a plataforma de IA Kaggle, que é de propriedade do Google. 

De acordo com o CTO dos EUA, Michael Kratsios, o conjunto de dados CORD-19 é a “coletânea mais extensa de literatura sobre coronavírus legível por máquina até o momento”.

A National Academy of Sciences, Engineering, and Medicine trabalhou com a Organização Mundial da Saúde (OMS) para desenvolver perguntas de “alta prioridade”. Essas perguntas giram em torno da relação entre coronavírus e genética, incubação, tratamento, sintomas e prevenção. 

Algumas das pesquisas presentes no banco de dados são pesquisas pré-publicação retiradas de recursos como medRxiv e bioRxiv. Esses são arquivos de acesso aberto. 

Cori Bargmann é a chefe de ciência da Chan Zuckerberg Initiative.

“Compartilhar informações vitais entre as comunidades científica e médica é fundamental para acelerar nossa capacidade de responder à pandemia de coronavírus”, disse Bargmann. 

De acordo com o Chamado à Ação divulgado pela Casa Branca, a coleta de dados foi desenvolvida por meio do uso de ferramentas de curação de literatura em escala web da Microsoft, que identificaram e reuniram diferentes trabalhos científicos de todo o mundo. A Chan Zuckerberg Initiative forneceu acesso a conteúdo pré-publicação, a National Library of Medicine forneceu acesso a conteúdo de literatura e a equipe do Allen AI formatou o conteúdo para que ele pudesse ser analisado. 

Dr. Eric Horvitz é o Diretor Científico da Microsoft. 

“É tudo mãos à obra enquanto enfrentamos a pandemia de COVID-19”, disse Horvitz. “Precisamos nos unir como empresas, governos e cientistas e trabalhar para aplicar as melhores tecnologias em biomedicina, epidemiologia, IA e outras ciências. O recurso de literatura COVID-19 e o desafio estimularão esforços que podem acelerar o caminho para soluções sobre COVID-19.”

Muitos estão torcendo para que essa abordagem funcione e forneça uma nova maneira de utilizar tecnologia de IA e aprendizado de máquina no futuro. Uma dessas pessoas é o Dr. Dewey Murdick, Diretor de Ciência de Dados do Georgetown University’s Center for Security and Emerging Technology. O Dr. Murdick ajudou a coordenar o projeto.

“Esse valioso novo recurso é o fruto de uma colaboração altruísta e agora oferece a oportunidade de encontrar respostas a perguntas importantes sobre COVID-19”, disse o Dr. Murdick. “Uma vez que a crise tenha passado, esperamos que esse projeto inspire novas maneiras de usar aprendizado de máquina para avançar a pesquisa científica.”

Se esse projeto for bem-sucedido em fornecer respostas muito necessárias sobre coronavírus, ele pode ser usado como um modelo no futuro. A tecnologia de IA é uma ferramenta poderosa, e ela pode analisar os resultados de especialistas e instituições de todo o mundo muito mais rápido do que os humanos. Isso significa um tempo de resposta mais rápido sempre que uma pandemia ou outra crise surgir, o que pode salvar muitas vidas e prevenir turbulências econômicas.

Alex McFarland é um jornalista e escritor de IA que explora os últimos desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups de IA e publicações em todo o mundo.