Vernetzen Sie sich mit uns

Gesundheitswesen

Google DeepMind stellt AlphaGenome vor, um die Funktionen des menschlichen Genoms zu entschlĂĽsseln

mm

Google DeepMind veröffentlichte am 28. Januar AlphaGenome, ein KI-Modell, das vorhersagt, wie DNA-Sequenzen in biologische Funktionen übersetzt werden. Es verarbeitet bis zu einer Million Basenpaare gleichzeitig und übertrifft bestehende Modelle in 25 von 26 Benchmarks zur Vorhersage von Varianteneffekten.

Das Modell, veröffentlicht in der Natur und detailliert beschrieben auf DeepMind-BlogAlphaGenome stellt einen bedeutenden Fortschritt in der computergestützten Genomik dar. Während frühere Modelle separate Systeme für verschiedene Vorhersageaufgaben benötigten, deckt AlphaGenome alles von der Genexpression bis zur Chromatinzugänglichkeit in einer einzigen einheitlichen Architektur ab.

„AlphaGenome kann lange DNA-Abschnitte analysieren und vorhersagen, wo sich die kritischen regulatorischen Elemente befinden und welche Auswirkungen diese auf die Genexpression haben“, schrieb das DeepMind-Team in seiner Ankündigung. Das Kontextfenster des Modells, das Millionen von Token umfasst, ermöglicht es, Wechselwirkungen zwischen weit entfernten DNA-Regionen zu erfassen, die die Aktivierung und Deaktivierung von Genen beeinflussen.

Funktionsweise

AlphaGenome kombiniert zwei neuronale Netzwerkarchitekturen: ein eindimensionales Faltungsnetzwerk nach Borzoi zur Verarbeitung roher DNA-Sequenzen und eine aus der Bildsegmentierung adaptierte U-Net-Architektur. Dieser hybride Ansatz ermöglicht es dem Modell, sowohl die sequentielle Struktur der DNA als auch die komplexen räumlichen Beziehungen zwischen regulatorischen Elementen zu verarbeiten.

Die Trainingsdaten umfassen etwa 7,000 Genomsequenzen der ENCODE- und FANTOM-Konsortien – umfangreiche Kooperationsprojekte zur Katalogisierung funktioneller Elemente im gesamten menschlichen Genom. Das Modell lernt, Signale aus experimentellen Analysen vorherzusagen, die Genexpression, DNA-Zugänglichkeit, Proteinbindung und Chromatinmodifikationen messen.

Für Forscher liegt der praktische Nutzen in der Vorhersage der Auswirkungen von Genvarianten. Wenn das Genom eines Patienten eine Mutation aufweist, müssen Kliniker wissen, ob diese Variante relevant ist. AlphaGenome kann vorhersagen, wie sich eine einzelne Nukleotidveränderung auf die gesamte regulatorische Landschaft auswirkt und so potenziell krankheitsverursachende Varianten aufdecken, die mit aktuellen Methoden übersehen werden.

Das Modell erzielte hervorragende Ergebnisse bei Benchmark-Tests, die seine Fähigkeit zur Vorhersage des Einflusses genetischer Varianten auf die Genexpression und die Aktivität regulatorischer Elemente prüften. Bei Expression Quantitative Trait Loci (eQTLs) – Varianten, die bekanntermaßen die Genexpressionsniveaus beeinflussen – erreichte AlphaGenome die Leistung spezialisierter, speziell für diese Aufgaben trainierter Modelle oder übertraf diese sogar.

Open-Source-VerfĂĽgbarkeit

DeepMind hat AlphaGenome veröffentlicht Quellcode auf GitHub Für nichtkommerzielle Zwecke wird diese Ressource bereitgestellt, womit die Tradition des Labors, grundlegende Werkzeuge der Biologie öffentlich zugänglich zu machen, fortgesetzt wird. Das Repository enthält Modellgewichte, Inferenzcode und Dokumentation zur Durchführung von Vorhersagen für benutzerdefinierte Sequenzen.

Die öffentliche Veröffentlichung folgt dem Modell von AlphaFold, dem Proteinstrukturvorhersage-Tool von DeepMind, das seit seiner Veröffentlichung im Jahr 2021 von über 3 Millionen Forschern genutzt wird. AlphaGenome adressiert ein komplementäres Problem: Während AlphaFold vorhersagt, wie Proteine ​​aussehen, prognostiziert AlphaGenome, wann und wo Gene diese Proteine ​​produzieren.

Demis Hassabis, CEO von Google DeepMind, hat die Biologie als primäres Anwendungsgebiet für die KI-Fähigkeiten des Labors positioniert. Die Genomik-Forschung erweitert DeepMinds Ambitionen über die dialogbasierte KI und Sprachmodelle hinaus, die Produkte wie Gemini antreiben, und wendet ähnliche architektonische Innovationen auf wissenschaftliche Fragestellungen an.

Warum dies wichtig ist

Das menschliche Genom umfasst etwa 3 Milliarden Basenpaare, aber nur etwa 1.5 % davon codieren direkt für Proteine. Die restlichen 98.5 % – lange als „Junk-DNA“ abgetan – enthalten regulatorische Elemente, die steuern, wann, wo und in welchem ​​Ausmaß Gene exprimiert werden. Mutationen in diesen nicht-codierenden Bereichen verursachen Krankheiten, doch die Identifizierung der relevanten Varianten erwies sich als außerordentlich schwierig.

Herkömmliche Methoden erfordern aufwändige und zeitintensive Experimente zur Untersuchung einzelner Varianten. Modelle des maschinellen Lernens wie AlphaGenome können Tausende von Varianten computergestützt screenen und priorisieren, welche experimentell weiter untersucht werden sollten. Bei der Diagnose seltener Erkrankungen, bei denen Patienten häufig neuartige Varianten mit unbekannten Auswirkungen tragen, könnte diese Fähigkeit den Weg von der Sequenzierung zur Diagnose beschleunigen.

Die Fähigkeit des Modells, Millionen von Basenpaarkontexten zu verarbeiten, ist besonders bedeutsam. Genregulatorische Elemente können Hunderttausende von Basenpaaren von den von ihnen kontrollierten Genen entfernt liegen und kommunizieren über die komplexe dreidimensionale Faltung der DNA. Frühere Modelle mit kürzeren Kontextfenstern konnten diese weitreichenden Abhängigkeiten nicht erfassen.

AlphaGenome reiht sich in ein wachsendes Ökosystem von KI-Werkzeugen ein, die die biologische Forschung revolutionieren. Proteinstrukturvorhersage, Wirkstoffentwicklung und nun auch Genregulation sind zunehmend gut handhabbare Probleme des maschinellen Lernens. Für die genetische Forschungsgemeinschaft demokratisiert die offene Verfügbarkeit dieser Modelle den Zugang zu Rechenkapazitäten, die zuvor gut finanzierten Laboren vorbehalten waren.

Die Grenzen des Modells werden in der Präsentation von DeepMind ebenfalls deutlich. AlphaGenome liefert zwar hervorragende Vorhersagen experimenteller Messwerte, doch die Übertragung dieser Vorhersagen auf klinische Ergebnisse bedarf weiterer Validierung. Die Diskrepanz zwischen der Vorhersage der Chromatinzugänglichkeit und der Vorhersage des Krankheitsrisikos bleibt beträchtlich.

AlphaGenome dient derzeit als Forschungsinstrument – ​​eines, das das Verständnis der Funktionsweise des Genoms beschleunigen könnte, auch wenn klinische Anwendungen noch Jahre entfernt sind. Die 3,000 Wissenschaftler in 160 Ländern, die das Modell bereits nutzen, deuten darauf hin, dass die Forschungsgemeinschaft den unmittelbaren Nutzen der Entwicklung von DeepMind erkennt.

Alex McFarland ist ein KI-Journalist und Autor, der sich mit den neuesten Entwicklungen in der künstlichen Intelligenz beschäftigt. Er hat mit zahlreichen KI-Startups und Publikationen weltweit zusammengearbeitet.