Künstliche Intelligenz
Deep Learning zur Suche nach krankheitsbezogenen Genen

A neue Studie unter der Leitung von Forschern der Universität Linköping zeigt, wie ein künstliches neuronales Netzwerk (ANN) große Mengen an Genexpressionsdaten offenlegen und zur Entdeckung von Gruppen krankheitsbezogener Gene führen kann. Die Studie wurde veröffentlicht in Nature Communications veröffentlicht , und die Wissenschaftler wollen, dass die Methode in der Präzisionsmedizin und der individualisierten Behandlung Anwendung findet.
Wissenschaftler entwickeln derzeit Karten biologischer Netzwerke, die darauf basieren, wie verschiedene Proteine oder Gene miteinander interagieren. In der neuen Studie wird künstliche Intelligenz (KI) eingesetzt, um herauszufinden, ob biologische Netzwerke mithilfe von Deep Learning entdeckt werden können. Künstliche neuronale Netze, die im Rahmen des Deep Learning durch experimentelle Daten trainiert werden, sind in der Lage, Muster in riesigen Mengen komplexer Daten zu finden. Aus diesem Grund werden sie häufig in Anwendungen wie der Bilderkennung eingesetzt. Trotz ihres scheinbar enormen Potenzials ist der Einsatz dieser Methode des maschinellen Lernens in der biologischen Forschung bisher begrenzt.
Sanjiv Dwivedi ist Postdoc am Fachbereich Physik, Chemie und Biologie (IFM) der Universität Linköping.
„Wir haben zum ersten Mal Deep Learning eingesetzt, um krankheitsrelevante Gene zu finden. Dies ist eine sehr leistungsfähige Methode für die Analyse riesiger Mengen biologischer Informationen, auch Big Data genannt“, sagt Dwivedi.
Die Wissenschaftler stützten sich auf eine große Datenbank mit Informationen über die Expressionsmuster von 20,000 Genen bei einer großen Anzahl von Menschen. Dem künstlichen neuronalen Netzwerk wurde nicht mitgeteilt, welche Genexpressionsmuster von Menschen mit Krankheiten oder welche von gesunden Personen stammten. Anschließend wurde das KI-Modell darauf trainiert, Muster der Genexpression zu finden.
Eines der Rätsel rund um maschinelles Lernen besteht darin, dass es derzeit nicht möglich ist, zu erkennen, wie ein künstliches neuronales Netzwerk zu seinem Endergebnis gelangt. Es ist nur möglich, die eingehenden und produzierten Informationen zu sehen, aber alles, was dazwischen passiert, besteht aus mehreren Schichten mathematisch verarbeiteter Informationen. Dieses Innenleben eines künstlichen neuronalen Netzwerks lässt sich noch nicht entschlüsseln. Die Wissenschaftler wollten wissen, ob es Ähnlichkeiten zwischen den Designs des neuronalen Netzwerks und den bekannten biologischen Netzwerken gibt.
Mike Gustafsson ist Dozent am IFM und leitet die Studie.
„Bei der Analyse unseres neuronalen Netzwerks stellte sich heraus, dass die erste verborgene Schicht größtenteils Interaktionen zwischen verschiedenen Proteinen darstellt. Tiefer im Modell, auf der dritten Ebene, fanden wir dagegen Gruppen verschiedener Zelltypen. Es ist äußerst interessant, dass diese Art biologisch relevanter Gruppierung automatisch entsteht, da unser Netzwerk von unklassifizierten Genexpressionsdaten ausgeht“, sagt Gustafsson.
Anschließend wollten die Wissenschaftler wissen, ob sich mit ihrem Modell der Genexpression bestimmen lässt, welche Genexpressionsmuster mit Krankheiten verbunden sind und welche normal sind. Sie konnten bestätigen, dass das Modell relative Muster entdecken kann, die mit biologischen Mechanismen im Körper übereinstimmen. Eine weitere Entdeckung war, dass das künstliche neuronale Netzwerk möglicherweise völlig neue Muster entdecken könnte, da es mit nicht klassifizierten Daten trainiert wurde. Die Forscher werden nun bisher unbekannte Muster untersuchen und untersuchen, ob sie innerhalb der Biologie relevant sind.
„Wir glauben, dass der Schlüssel zum Fortschritt auf diesem Gebiet im Verständnis des neuronalen Netzwerks liegt. Dadurch können wir Neues über biologische Zusammenhänge lernen, etwa über Krankheiten, bei denen viele Faktoren zusammenwirken. Und wir glauben, dass unsere Methode Modelle liefert, die leichter zu verallgemeinern sind und für viele verschiedene Arten biologischer Informationen verwendet werden können“, sagt Gustafsson.
Durch die Zusammenarbeit mit medizinischen Forschern hofft Gustafsson, die Methode in der Präzisionsmedizin anzuwenden. Dies könnte dabei helfen, zu bestimmen, welche spezifischen Arten von Medikamenten Patienten erhalten sollten.
Die Studie wurde von der schwedischen Stiftung für strategische Forschung (SSF) und dem schwedischen Forschungsrat finanziell unterstützt.