Künstliche Intelligenz
Forscher verwenden Algorithmen der natürlichen Sprachverarbeitung, um Proteumwandlungen zu verstehen

Forscher der University of Maryland haben kürzlich Techniken der natürlichen Sprachverarbeitung und Machine-Learning-Algorithmen angewendet, um Einblick in die Veränderung von Proteinen von einer Form in eine andere zu gewinnen. Die kürzlich veröffentlichte Studie, die im Journal Nature Communications erschienen ist, ist das erste Mal, dass ein KI-Algorithmus verwendet wurde, um die Dynamik von biomolekularen Systemen in Bezug auf die Umwandlung von Proteinen zu untersuchen.
Proteinmoleküle können verschiedene Formen annehmen, aber die Mechanismen, die eine Proteine von einer Form in eine andere verändern, sind noch immer etwas mysteriös. Die Funktion eines Proteins wird durch seine Form bestimmt, und ein besseres Verständnis der Mechanismen, die die Form/Struktur eines Proteins beeinflussen, könnte es Wissenschaftlern ermöglichen, gezielte Medikamente zu entwickeln und die Ursache von Krankheiten zu bestimmen.
Biologische Moleküle sind nicht stationär, sie bewegen sich ständig in Reaktion auf Ereignisse in ihrer Umgebung. Umweltbedingungen können Moleküle veranlassen, sich in verschiedene Formen zu verändern, oft sehr plötzlich. Ein Molekül kann sich plötzlich in eine völlig andere Struktur umfalten, in einem Prozess, der sehr ähnlich dem Entrollen einer Feder ist. Verschiedene Teile des Moleküls falten und entfalten sich, und die Forscher untersuchten die Zwischenstufen zwischen den verschiedenen molekularen Formen.
Laut Phys.org war Pratyush Tiwary der Hauptautor der Studie und ist Assistant Professor am Department of Chemistry and Biochemistry und am Institute for Physical Science and Technology der University of Maryland. Laut Tiwary kann die natürliche Sprachverarbeitung verwendet werden, um zu modellieren, wie Moleküle sich verändern und anpassen. Tiwary bemerkt, dass Moleküle eine bestimmte “Sprache” sprechen, mit den Bewegungen, die Moleküle machen, können in eine abstrakte Sprache übersetzt werden. Wenn dieser Prozess der Zuordnung von Molekül-Bewegungen zu Sprachmustern durchgeführt wird, können Techniken der natürlichen Sprachverarbeitung und KI-Algorithmen verwendet werden, um “biologisch wahre Geschichten aus den resultierenden abstrakten Wörtern zu generieren”.
Wenn ein Molekül von einer Form in eine andere Form übergeht, geschieht dies extrem schnell. Der Übergang kann nur so lange dauern wie eine Billionstel Sekunde. Die enorme Geschwindigkeit des Übergangs macht es schwierig für Wissenschaftler, mit Methoden wie Spektroskopie oder sogar hochleistungsfähigen Mikroskopen zu bestimmen, welche Parameter den Entfaltungsprozess beeinflussen. Um zu bestimmen, welche Parameter die Entfaltung von Proteinen beeinflussen, erstellten Tiwary und das restliche Forschungsteam physikalische Modelle, die Proteine simulierten. Komplexe statistische Modelle wurden verwendet, um Protein-Simulationen zu erstellen, die die Form, Traektorie und Bewegung der Moleküle emulierten. Die Modelle wurden dann einem Machine-Learning-Algorithmus basierend auf Techniken der natürlichen Sprachverarbeitung zur Verfügung gestellt.
Die Modelle der natürlichen Sprachverarbeitung, die verwendet wurden, um das Machine-Learning-System zu trainieren, waren sehr ähnlich den Algorithmen, die in den predictiven Textsystemen von Gmail verwendet werden. Die simulierten Proteine wurden als eine Sprache behandelt, bei der die Bewegungen der Moleküle in “Buchstaben” übersetzt wurden. Die Buchstaben wurden dann zu Wörtern und Sätzen verknüpft. Die Machine-Learning-Algorithmen konnten die grammatischen und syntaktischen Regeln hinter den Protein-Strukturen lernen und bestimmen, welche Formen/Bewegungen anderen Formen/Bewegungen folgten. Die Algorithmen konnten dann verwendet werden, um vorherzusagen, wie bestimmte Proteine sich entfalten und welche Formen sie annehmen würden.
Die Forscher verwendeten ein Long-Short-Term-Memory-Netzwerk (LSTM), um die proteinbasierten Sätze zu analysieren. Das Forschungsteam überwachte auch die Mathematik, auf der das Netzwerk basierte, und überwachte die Parameter, während das Netzwerk die Dynamik der molekularen Umwandlung lernte. Laut den Ergebnissen der Studie verwendete das Netzwerk eine Logik, die sehr ähnlich einem statischen physikalischen Konzept namens Pfad-Entropie war. Wenn diese Entdeckung konstant bleibt, könnte sie möglicherweise zu Verbesserungen in LSTM-Netzwerken führen. Tiwary erklärte, dass die Entdeckung einen Teil der Black-Box-Natur eines LSTM zurückklappt und es Forschern ermöglicht, besser zu verstehen, welche Parameter für eine optimale Leistung eingestellt werden können.
Als Testfall für ihren Algorithmus analysierten die Forscher ein Biomolekül namens Riboswitch. Riboswitch war bereits mit Spektroskopie analysiert worden, und als Riboswitch mit dem Machine-Learning-System analysiert wurde, entsprachen die vorhergesagten Riboswitch-Formen denen, die durch Spektroskopie entdeckt worden waren.
Tiwary hofft, dass ihre Erkenntnisse es Forschern ermöglichen werden, gezielte Medikamente mit weniger Nebenwirkungen zu entwickeln. Wie Tiwary über Phys.org erklärte:
“Man möchte wirksame Medikamente haben, die sehr stark binden, aber nur an das, was man binden möchte. Wir können das erreichen, wenn wir die verschiedenen Formen verstehen, die ein bestimmtes Biomolekül annehmen kann, da wir Medikamente entwickeln können, die nur an eine dieser spezifischen Formen binden, zum richtigen Zeitpunkt und nur so lange, wie wir es wollen.”












