Artificiell intelligens
Öppen datamängd för Covid-19 släppt för maskinlärande

Vita husets kontor för vetenskap och teknologi ber forskare att analysera tusentals vetenskapliga artiklar med artificiell intelligens (AI) teknik. Alla artiklarna, som uppgår till cirka 29 000, kan ge svar på frågor om coronaviruset. Ungefär 13 000 av artiklarna i databasen är i sin helhet och är maskinläsbara. När det gäller de andra 16 000 artiklarna har databasen partiell text och sammanfattningar.
Under de senaste dagarna har amerikanska myndigheter samarbetat med amerikanska teknikföretag och forskningsinstitut för att få tillstånd att göra coronavirusartiklarna tillgängliga.
Den öppna datamängden kallas COVID-19 Open Research Dataset, eller CORD-19. Den kommer att ständigt lägga till ny information i en central hub, vilket ger forskare och andra en enda plats att komma åt den.
Samarbetet som tillkännagavs av Vita huset inkluderar Chan Zuckerberg Initiative, Microsoft Research, Allen Institute for Artificial Intelligence, National Institute of Health’s National Library of Medicine, Georgetown University’s Center for Security and Emerging Technology, Cold Spring Harbor Laboratory och Kaggle AI-plattformen, som ägs av Google.
Enligt den amerikanska CTO Michael Kratsios är CORD-19-databasen den “mest omfattande samlingen av maskinläsbara coronaviruslitteratur hittills”.
National Academy of Sciences, Engineering, and Medicine samarbetade med Världshälsoorganisationen (WHO) för att utveckla “hög prioritet” frågor. Dessa frågor rör förhållandet mellan coronavirus och genetik, inkubation, behandling, symtom och förebyggande.
En del av forskningen i databasen är pre-publicerad forskning som hämtats från resurser som medRxiv och bioRxiv. Dessa är öppna tillgångsarkiv.
Cori Bargmann är chef för Chan Zuckerberg Initiative.
“Att dela viktig information över vetenskapliga och medicinska samhällen är nyckeln till att påskynda vår förmåga att svara på coronaviruspandemin”, sa Bargmann.
Enligt den call to action som släppts av Vita huset utvecklades databassamlingen med hjälp av Microsofts webb-baserade litteraturkureringverktyg, som identifierade och samlade olika vetenskapliga arbeten från hela världen. Chan Zuckerberg Initiative gav tillgång till pre-publicerat innehåll, National Library of Medicine gav tillgång till litteraturinnehåll och Allen AI-teamet formaterade innehållet så att det kunde analyseras.
Dr. Eric Horvitz är Chief Scientific Officer på Microsoft.
“Det är alla händer på däck när vi står inför COVID-19-pandemin”, sa Horvitz. “Vi måste komma samman som företag, regeringar och forskare och arbeta för att ta fram våra bästa tekniker inom biomedicin, epidemiologi, AI och andra vetenskaper. COVID-19-litteraturresursen och utmaningen kommer att stimulera insatser som kan accelerera vägen till lösningar på COVID-19.”
Många hoppas att denna metod fungerar och erbjuder ett nytt sätt att använda AI-teknik och maskinlärande i framtiden. En av dem är Dr. Dewey Murdick, Director of Data Science på Georgetown University’s Center for Security and Emerging Technology. Dr. Murdick hjälpte till att koordinera projektet.
“Denna värdefulla nya resurs är frukten av osjälviskt samarbete och erbjuder nu möjligheten att hitta svar på viktiga frågor om COVID-19”, sa Dr. Murdick. “När krisen har passerat hoppas vi att detta projekt kommer att inspirera nya sätt att använda maskinlärande för att främja vetenskaplig forskning.”
Om detta projekt lyckas med att ge de nödvändiga svaren om coronavirus, kan det användas som en modell i framtiden. AI-teknik är ett kraftfullt verktyg och kan analysera resultaten från experter och institutioner över hela världen mycket snabbare än människor. Detta innebär en snabbare reaktionstid när en pandemi eller annan kris bryter ut, vilket kan rädda många liv och förhindra ekonomiskt kaos.












