Vernetzen Sie sich mit uns

KĂĽnstliche Intelligenz

KI-Forscher entwickeln ein erklärbares neuronales Netzwerk, um genomische Regeln zu entdecken

mm

Ein Forscherteam hat kürzlich ein erklärbares neuronales Netzwerk erstellt soll Biologen dabei helfen, die mysteriösen Regeln aufzudecken, die den Code des menschlichen Genoms bestimmen. Das Forschungsteam trainierte ein neuronales Netzwerk auf Karten von Protein-DNA-Interaktionen und ermöglichte es der KI so herauszufinden, wie bestimmte DNA-Sequenzen bestimmte Gene regulieren. Die Forscher machten das Modell auch erklärbar, sodass sie die Schlussfolgerungen des Modells analysieren und bestimmen konnten, wie Motive sequenziert werden, die Gene regulieren.

Eines der großen Geheimnisse der Biologie ist der Regulierungscode des Genoms. Es ist bekannt, dass DNA aus vier Nukleotidbasen besteht – Adenin, Guanin, Thymin und Cytosin –, aber es ist nicht bekannt, wie diese Basenpaare zur Regulierung der Aktivität verwendet werden. Die vier Nukleotidbasen kodieren die Anweisungen zum Aufbau von Proteinen, steuern aber auch, wo und wie Gene exprimiert werden (wie sie Proteine ​​in einem Organismus herstellen). Bestimmte Kombinationen und Anordnungen der Basen erzeugen Abschnitte des Regulierungscodes, die an DNA-Segmente binden, und es ist unbekannt, um welche Kombinationen es sich genau handelt.

Ein interdisziplinäres Team aus Informatikern und Biologen machte sich daran, dieses Rätsel zu lösen, indem es ein erklärbares neuronales Netzwerk schuf. Das Forschungsteam schuf ein neuronales Netzwerk, das es „Base Pair Network“ oder „BPNet“ nannte. Das von BPNet zur Generierung von Vorhersagen verwendete Modell kann zur Identifizierung regulatorischer Codes interpretiert werden. Dies wurde erreicht, indem vorhergesagt wurde, wie Proteine, sogenannte Transkriptionsfaktoren, an DNA-Sequenzen binden.

Die Forscher führten eine Vielzahl von Experimenten durch und erstellten umfassende Computermodelle, um zu bestimmen, wie Transkriptionsfaktoren und DNA miteinander verbunden waren, und entwickelten eine detaillierte Karte bis auf die Ebene einzelner Nukleotidbasen. Die detaillierten Transkriptionsfaktor-DNA-Darstellungen ermöglichten es den Forschern, Werkzeuge zu entwickeln, die sowohl kritische DNA-Sequenzmuster als auch die Regeln, die als Regulierungscode fungieren, interpretieren können.

Julia Zeitlinger, promovierte Biologin und Computerforscherin an der Stanford University, erklärte, dass die aus dem erklärbaren neuronalen Netzwerk gewonnenen Ergebnisse mit bestehenden experimentellen Ergebnissen übereinstimmten, aber auch überraschende Einblicke in den regulatorischen Code des Genoms enthielten. Das KI-Modell ermöglichte es dem Forschungsteam beispielsweise, eine Regel zu entdecken, die die Funktionsweise eines Transkriptionsfaktors namens Nanog beeinflusst. Wenn mehrere Instanzen des Nanog-Motivs auf derselben Seite einer DNA-Doppelhelix vorhanden sind, binden sie kooperativ an die DNA. Wie Zeitlinger erklärte über ScienceDaily:

„Es gibt eine lange Reihe experimenteller Beweise dafür, dass es im Regulierungskodex manchmal eine solche Motivperiodizität gibt. Die genauen Umstände waren jedoch unklar und Nanog war kein Verdächtiger gewesen. Die Entdeckung, dass Nanog ein solches Muster aufweist, und zusätzliche Details seiner Wechselwirkungen zu sehen, war überraschend, da wir nicht speziell nach diesem Muster gesucht haben.“

Die neuestes Forschungspapier ist bei weitem nicht die erste Studie, die KI zur Analyse von DNA einsetzt, aber es ist wahrscheinlich die erste Studie, die die „Black Box“ der KI öffnet, um zu erkennen, welche DNA-Sequenzen Gene im Genom regulieren. Neuronale Netze zeichnen sich durch die Erkennung von Mustern in Daten aus, ihre Erkenntnisse lassen sich jedoch nur schwer aus den von ihnen erstellten Modellen extrahieren. Durch die Entwicklung einer Methode zur Analyse, welche Merkmale das Modell für die Vorhersage genomischer Regeln als wichtig erachtet, könnten die Forscher differenziertere Modelle trainieren, die zu neuen Entdeckungen führen.

Die Architektur von BPNet ähnelt Netzwerken, die zur Erkennung von Gesichtern in Bildern verwendet werden. Wenn Computer-Vision-Systeme Gesichter in Bildern erkennen, erkennt das Netzwerk zunächst Kanten und fügt diese Kanten dann zusammen. Der Unterschied besteht darin, dass BPNet aus DNA-Sequenzen lernt, Sequenzmotive erkennt und diese Motive zu Regeln höherer Ordnung zusammenfügt, die zur Vorhersage der Bindung von Daten bei der Basenauflösung verwendet werden können.

Nachdem das Modell eine hohe Genauigkeitsschwelle erreicht hat, werden die vom Modell gelernten Muster auf die ursprünglichen Eingabesequenzen zurückgeführt, wodurch die Sequenzmotive sichtbar werden. Schließlich wird das Modell mit systematischen DNA-Sequenzabfragen ausgestattet, die es den Forschern ermöglichen, die Regeln zu verstehen, nach denen Sequenzmotive kombiniert werden und funktionieren. Laut Zeitlinger ist das Modell in der Lage, viel mehr Sequenzen vorherzusagen, als die Forscher auf herkömmliche, experimentelle Weise testen könnten. Durch die Vorhersage des Ergebnisses experimenteller Anomalien konnten die Forscher außerdem ermitteln, welche Experimente bei der Validierung des Modells am aussagekräftigsten waren.

Blogger und Programmierer mit Spezialisierung auf Maschinelles lernen mit einem Tiefes Lernen Themen. Daniel hofft, anderen dabei zu helfen, die Macht der KI fĂĽr das soziale Wohl zu nutzen.