Connect with us

Offenes Datenset zu Covid-19 für Machine Learning veröffentlicht

Künstliche Intelligenz

Offenes Datenset zu Covid-19 für Machine Learning veröffentlicht

mm

Das Office of Science and Technology Policy des Weißen Hauses bittet Forscher, tausende wissenschaftliche Artikel mit künstlicher Intelligenz (KI)-Technologie zu analysieren. Alle Artikel, von denen es etwa 29.000 gibt, könnten Antworten auf Fragen zum Coronavirus liefern. Etwa 13.000 der Artikel in der Datenbank sind vollständig und maschinenlesbar. Was die anderen 16.000 Artikel betrifft, enthält die Datenbank teilweise Texte und Zusammenfassungen. 

In den letzten Tagen haben US-Regierungsbeamte mit amerikanischen Technologieunternehmen und Forschungseinrichtungen zusammengearbeitet, um die rechtliche Genehmigung zu erhalten, die Coronavirus-Papiere verfügbar zu machen. 

Das offene Datenset wird als COVID-19 Open Research Dataset oder CORD-19 bezeichnet. Es wird ständig neue Informationen in einem zentralen Hub hinzufügen und Forschern und anderen eine einzige Plattform bieten, um darauf zuzugreifen.

Die vom Weißen Haus angekündigte Partnerschaft umfasst die Chan Zuckerberg Initiative, Microsoft Research, das Allen Institute for Artificial Intelligence, die National Library of Medicine des National Institute of Health, das Center for Security and Emerging Technology der Georgetown University, das Cold Spring Harbor Laboratory und die Kaggle-AI-Plattform, die von Google gehört wird. 

Laut dem US-CTO Michael Kratsios ist das CORD-19-Datenset die “umfassendste Sammlung maschinenlesbarer Coronavirus-Literatur bis heute”.

Die National Academy of Sciences, Engineering, and Medicine hat mit der Weltgesundheitsorganisation (WHO) “hochprioritäre” Fragen entwickelt. Diese Fragen drehen sich um die Beziehung zwischen Coronavirus und Genetik, Inkubationszeit, Behandlung, Symptomen und Prävention. 

Ein Teil der in der Datenbank vorhandenen Forschung ist vorpublizierte Forschung, die aus Quellen wie medRxiv und bioRxiv stammt. Dies sind Open-Access-Archive. 

Cori Bargmann ist die Leiterin der Abteilung Wissenschaft bei der Chan Zuckerberg Initiative.

“Das Teilen von wichtigen Informationen innerhalb der wissenschaftlichen und medizinischen Gemeinschaft ist der Schlüssel, um unsere Fähigkeit, auf die Coronavirus-Pandemie zu reagieren, zu beschleunigen”, sagte Bargmann. 

Laut dem Aufruf zur Aktion, der vom Weißen Haus veröffentlicht wurde, wurde die Datensammlung durch den Einsatz von Microsofts webbasierten Literaturkurierungs-Tools entwickelt, die wissenschaftliche Arbeiten aus der ganzen Welt identifizierten und zusammenführten. Die Chan Zuckerberg Initiative ermöglichte den Zugriff auf vorpublizierte Inhalte, die National Library of Medicine ermöglichte den Zugriff auf Literaturinhalte und das Allen-AI-Team formattierte den Inhalt, damit er analysiert werden konnte. 

Dr. Eric Horvitz ist Chief Scientific Officer bei Microsoft. 

“Es ist ein Notfall, als wir der COVID-19-Pandemie gegenüberstehen”, sagte Horvitz. “Wir müssen zusammenarbeiten, als Unternehmen, Regierungen und Wissenschaftler, und unsere besten Technologien einsetzen, um Lösungen für COVID-19 zu finden. Die COVID-19-Literatur-Ressource und die Herausforderung werden Bemühungen anregen, die den Weg zu Lösungen für COVID-19 beschleunigen können.” 

Viele hoffen, dass dieser Ansatz funktioniert und eine neue Möglichkeit bietet, künstliche Intelligenz-Technologie und Machine Learning in der Zukunft zu nutzen. Eine dieser Personen ist Dr. Dewey Murdick, Direktor des Data Science bei der Georgetown University’s Center for Security and Emerging Technology. Dr. Murdick half bei der Koordinierung des Projekts.

“Diese wertvolle neue Ressource ist das Ergebnis einer selbstlosen Zusammenarbeit und bietet nun die Möglichkeit, Antworten auf wichtige Fragen zu COVID-19 zu finden”, sagte Dr. Murdick. “Sobald die Krise vorbei ist, hoffen wir, dass dieses Projekt neue Wege inspiriert, Machine Learning zur Förderung wissenschaftlicher Forschung zu nutzen.” 

Wenn dieses Projekt erfolgreich ist und die benötigten Antworten zu Coronavirus liefert, könnte es als Modell für die Zukunft dienen. KI-Technologie ist ein mächtiges Werkzeug, das die Ergebnisse von Experten und Institutionen auf der ganzen Welt viel schneller analysieren kann als Menschen. Dies bedeutet eine schnellere Reaktionszeit, wenn eine Pandemie oder eine andere Krise ausbricht, was viele Leben retten und wirtschaftliche Turbulenzen verhindern könnte.

Alex McFarland ist ein KI-Journalist und Schriftsteller, der die neuesten Entwicklungen im Bereich der künstlichen Intelligenz erforscht. Er hat mit zahlreichen KI-Startups und Veröffentlichungen weltweit zusammengearbeitet.