Kunstig intelligens
Åben Data-Sæt om Covid-19 Udgivet til Maskinlæring

Det Hvide Hus’ Kontor for Videnskab og Teknologi beder forskere om at analysere tusindvis af videnskabelige artikler med kunstig intelligens (AI)-teknologi. Alle artiklerne, som er omkring 29.000, kan give svar på spørgsmål om coronavirus. Omkring 13.000 af artiklerne i databasen er i deres helhed og er maskinlæsbare. For de andre 16.000 artikler har databasen delvis tekst og sammenfattelser.
Over de sidste par dage har amerikanske regeringsmedarbejdere arbejdet med amerikanske tech-virksomheder og forskningsinstitutioner for at sikre juridisk tilladelse til at gøre coronavirus-papirerne tilgængelige.
Det åbne data-sæt kaldes COVID-19 Open Research Dataset, eller CORD-19. Det vil konstant tilføje ny information til et centraliseret hub, hvilket giver forskere og andre en enkelt placering, hvor de kan få adgang til det.
Partnerskabet, der er annonceret af Det Hvide Hus, omfatter Chan Zuckerberg Initiative, Microsoft Research, Allen Institute for Artificial Intelligence, National Institute of Health’s National Library of Medicine, Georgetown University’s Center for Security and Emerging Technology, Cold Spring Harbor Laboratory og Kaggle AI-platformen, som ejes af Google.
Ifølge U.S. CTO Michael Kratsios er CORD-19-datasættet “den mest omfattende samling af maskinlæsbare coronavirus-litteratur til dato.”
National Academy of Sciences, Engineering, and Medicine arbejdede med Verdenssundhedsorganisationen (WHO) for at udvikle “høj prioritets” spørgsmål. Disse spørgsmål drejer sig om forholdet mellem coronavirus og genetik, inkubation, behandling, symptomer og forebyggelse.
Nogle af de forskningsresultater, der er til stede i databasen, er pre-publication forskning trukket fra ressourcer som medRxiv og bioRxiv. Disse er åbne adgangsarkiver.
Cori Bargmann er Chan Zuckerberg Initiative Head of Science.
“At dele vital information på tværs af videnskabelige og medicinske fællesskaber er nøgle til at accelerere vores evne til at reagere på coronavirus-pandemien,” sagde Bargmann.
Ifølge opfordringen, der er udgivet af Det Hvide Hus, blev database-samlingen udviklet gennem brug af Microsofts web-skala litteratur-curation-værktøjer, som identificerede og samlede forskellige videnskabelige arbejder fra hele verden. Chan Zuckerberg Initiative gav adgang til pre-publication-indhold, National Library of Medicine gav adgang til litteratur-indhold, og Allen AI-holdet formaterede indholdet, så det kunne analyseres.
Dr. Eric Horvitz er Chief Scientific Officer hos Microsoft.
“Det er alle hænder på dækket, mens vi står over for COVID-19-pandemien,” sagde Horvitz. “Vi skal samarbejde som virksomheder, regeringer og videnskabsmænd og arbejde på at bringe vores bedste teknologier til at bære på tværs af biomedicin, epidemiologi, AI og andre videnskaber. COVID-19-litteratur-resursen og udfordringen vil stimulere bestræbelser, der kan accelerere vejen til løsninger på COVID-19.”
Mange håber, at denne tilgang virker og giver en ny måde at anvende AI-teknologi og maskinlæring i fremtiden. En af disse personer er Dr. Dewey Murdick, Director of Data Science hos Georgetown University’s Center for Security and Emerging Technology. Dr. Murdick hjalp med at koordinere projektet.
“Denne værdifulde nye ressource er frugten af uselvisk samarbejde og tilbyder nu muligheden for at finde svar på vigtige spørgsmål om COVID-19,” sagde Dr. Murdick. “Når krisen er ovre, håber vi, at dette projekt vil inspirere nye måder at anvende maskinlæring til at fremme videnskabelig forskning.”
Hvis dette projekt lykkes i at give de nødvendige svar om coronavirus, kan det bruges som en model i fremtiden. AI-teknologi er et kraftfuldt værktøj, og det kan analysere resultaterne fra eksperter og institutioner over hele verden meget hurtigere end mennesker. Dette betyder en hurtigere reaktionstid, når en pandemi eller en anden krise bryder ud, hvilket kan redde mange liv og forhindre økonomisk uro.












