Stummel DeepMind ist bereit, die Biowissenschaften durch die Lösung des Proteinfaltungsproblems zu verändern – Unite.AI
Vernetzen Sie sich mit uns

Artificial Intelligence

DeepMind ist bereit, die Biowissenschaften durch die Lösung des Proteinfaltungsproblems zu verändern

mm
Aktualisiert on

Googles KI-Abteilung DeepMind hat kürzlich machte erhebliche Fortschritte zur Lösung einer der ältesten Herausforderungen der Biologie, Berechnung der Form eines Proteins aus einer Aminosäuresequenz. Laut Nature hat der Durchbruch das Potenzial, die Bereiche Biologie und Chemie zu verändern und es Wissenschaftlern zu ermöglichen, die Funktion vieler Proteine ​​zu bestimmen, die derzeit noch rätselhaft sind.

Die Form eines Proteins definiert seine Funktion und die meisten biologischen Funktionen hängen von Proteinen ab. „Proteinfaltung“ ist die Bezeichnung für den Prozess, der Aminosäureketten in die dreidimensionalen Strukturen umwandelt, die Protionen zur Erfüllung ihrer Funktionen benötigen. Wenn Wissenschaftler die Beziehung zwischen Aminosäuresequenzen und der Form der von ihnen erzeugten Proteine ​​bestimmen können, können sie bestimmen, welche Proteine ​​verschiedene biologische Prozesse beeinflussen.

Wissenschaftler gehen davon aus, dass es im menschlichen Proteom mindestens 80,000 Proteine ​​gibt, aber nur ein kleiner Teil dieser Proteine ​​weist bekannte Strukturen auf. Die traditionelle Methode zur Bestimmung der Form eines Proteins kann jahrelange Laborexperimente erfordern und nutzt sogar die Leistungsfähigkeit von Informatikalgorithmen und -modellen. Die von DeepMind geleistete Arbeit kann den Prozess der Entdeckung von Proteinstrukturen erheblich beschleunigen und die Struktur von Proteinen in einem Bruchteil der normalen Zeit zuverlässig bestimmen.

Die Forscher von DeepMind trainierten ihre Algorithmen anhand einer Datenbank, die aus etwa 170,0000 Proteinsequenzen und den diesen Sequenzen entsprechenden Formen bestand. Die von den Forschern entwickelten Algorithmen wurden auf 100 bis 200 GPUs trainiert, und der Trainingsprozess dauerte einige Wochen. Das von den Forschern entwickelte Modell erhielt den Namen „AlphaFold“.

AlphaFold arbeitet mit einem „Spannungsalgorithmus“, der zunächst kleine Teile des Proteins miteinander verbindet und sich dann vergrößert, um immer größere Abschnitte zu verbinden. Zunächst wurden kleine Aminosäurecluster miteinander verknüpft, und dann suchte der Algorithmus nach Möglichkeiten, diese Cluster zu verknüpfen.

AlphaFold-Forscher versuchten zunächst, mithilfe herkömmlicher Deep-Learning-Algorithmen genetische und strukturelle Daten zu verwenden, um die Beziehung zwischen Aminosäuren und Proteinen vorherzusagen. AlphaFold erstellte dann Konsensmodelle für den Stil der Proteine. Als sich herausstellte, dass diese Technik zu viele Einschränkungen aufwies, versuchten die Forscher eine neue Strategie. Das AlphaFold-Forschungsteam erstellte Modelle, die auf weitere Merkmale trainiert wurden, und dieses Mal lieferten die Modelle Vorhersagen für die endgültige Struktur der Proteinsequenzen.

Das Ingenieursteam testete AlphaFold, indem es an einem Wettbewerb teilnahm, bei dem Computeralgorithmen gegeneinander antreten, um die Struktur eines Proteins anhand von Aminosäuresequenzen zu ermitteln. Der Wettbewerb war das „Critical Assessment of Protein Structure Prediction“ oder CASP. Den Teilnehmern des Wettbewerbs werden 100 Aminosäuresequenzen zur Verfügung gestellt und ihre Modelle müssen die Struktur der Proteine ​​erarbeiten. AlphaFold übertraf nicht nur die anderen Computermodelle in puncto Genauigkeit, sondern zeigte auch eine vergleichbare Leistung wie herkömmliche, laborbasierte Modellierungstechniken. Der endgültige mittlere Wert von AlphaFold lag bei etwa 92 von 100, wobei laborbasierten experimentellen Methoden ein Wert von 90 zugewiesen wurde. Der mittlere Wert von AlphaFold fiel bei den schwierigsten Proteinen auf 87 Prozent.

Laut Demis Hassabis, CEO und Mitbegründer von DeepMindDas Unternehmen plant bereits, Forschern den Zugang zu AlphaFold zu ermöglichen. Wissenschaftler des Max-Planck-Instituts für Entwicklungsbiologie nutzen das Modell bereits, um Proteinstrukturen zu entdecken, an denen sie seit über einem Jahrzehnt arbeiten.

Janet Thornton, emeritierte Direktorin des European Bioinformatics Institute, wurde über ScienceMag zitiert mit den Worten, dass die Errungenschaften von DeepMind „die Zukunft der Strukturbiologie und Proteinforschung verändern werden“. Inzwischen ist Biologe an der University of Maryland, Shady Grove, John Moult sagt dass er nie gedacht hätte, dass das Problem der Proteinfaltung in diesem Leben nie gelöst werden würde.

Während es höchst unwahrscheinlich ist, dass AlphaFold traditionelle, experimentelle Methoden zur Entdeckung von Proteinstrukturen vollständig ersetzen wird, könnte es die Geschwindigkeit, mit der Proteinstrukturen entdeckt werden, drastisch erhöhen. Forscher benötigen möglicherweise weniger hochwertige experimentelle Daten, um eine Proteinstruktur zu bestimmen, und Forscher haben bereits Zugriff auf eine große Menge genomischer Daten, die mit den Lösungen von AlphaFold in Strukturen übersetzt werden könnten.