Υγεία

Η Google DeepMind Παρουσιάζει το AlphaGenome για την Αποκωδικοποίηση της Λειτουργίας του Ανθρώπινου Γονιδιώματος

mm

Η Google DeepMind κυκλοφόρησε το AlphaGenome στις 28 Ιανουαρίου, ένα μοντέλο AI που προβλέπει πώς οι ακολουθίες DNA μετατρέπονται σε βιολογικές λειτουργίες, επεξεργαζόμενη έως και ένα εκατομμύριο ζευγάρια βάσεων同時 και υπερβαίνοντας τα υπάρχοντα μοντέλα σε 25 από 26 διαγωνισμούς πρόβλεψης επίδρασης παραλλαγών.

Το μοντέλο, δημοσιευμένο στο Nature και λεπτομερώς στο μπλογκ της DeepMind, αντιπροσωπεύει một σημαντική πρόοδο στις υπολογιστικές γενετικές. Όπου τα προηγούμενα μοντέλα απαιτούσαν ξεχωριστά συστήματα για διαφορετικές εργασίες πρόβλεψης, το AlphaGenome χειρίζεται όλα, από την έκφραση γονιδίων έως τη διαθεσιμότητα χρωματίνης, σε μια ενιαία αρχιτεκτονική.

“Το AlphaGenome μπορεί να κοιτάξει σε μια μακρά ακολουθία DNA και να προβλέψει πού βρίσκονται τα κρίσιμα ρυθμιστικά στοιχεία και οι επιπτώσεις τους στην έκφραση γονιδίων”, έγραψε η ομάδα της DeepMind στην ανακοίνωσή τους. Το παράθυρο контекστού ενός εκατομμυρίου token του μοντέλου του επιτρέπει να καταγράψει μακροπρόθεσμες αλληλεπιδράσεις μεταξύ απομακρυσμένων περιοχών DNA που επηρεάζουν πώς τα γονίδια ενεργοποιούνται και απενεργοποιούνται.

Πώς Λειτουργεί

Το AlphaGenome συνδυάζει δύο αρχιτεκτονικές νευρωνικών δικτύων: ένα Borzoi-στυλ 1D συνβολικό δίκτυο για την επεξεργασία των ακατέργαστων ακολουθιών DNA και μια αρχιτεκτονική U-Net που προσαρμόζεται από την τομική εικόνα. Αυτή η υβριδική προσέγγιση επιτρέπει στο μοντέλο να χειρίζεται τόσο την ακολουθιακή φύση του DNA όσο και τις σύνθετες χωρικές σχέσεις μεταξύ ρυθμιστικών στοιχείων.

Τα δεδομένα εκπαίδευσης καλύπτουν περίπου 7.000 γονιδιακές πίστες από τα консόρτσια ENCODE και FANTOM—μεγάλες συνεργατικές προσπάθειες που έχουν καταλογραφήσει λειτουργικά στοιχεία σε όλο το ανθρώπινο γονίδιο. Το μοντέλο μαθαίνει να προβλέψει σήματα από πειραματικές μετρήσεις που μετρούν την έκφραση γονιδίων, τη διαθεσιμότητα DNA, τη δέσμευση πρωτεϊνών και τις τροποποιήσεις χρωματίνης.

Για τους ερευνητές, η πρακτική αξία βρίσκεται στην πρόβλεψη της επίδρασης παραλλαγών. Όταν το γονίδιο ενός ασθενούς περιέχει μια μετάλλαξη, οι κλινικοί γιατροί πρέπει να γνωρίζουν αν αυτή η παραλλαγή έχει σημασία. Το AlphaGenome μπορεί να προβλέψει πώς μια αλλαγή σε ένα μόνο νουκλεοτίδιο επηρεάζει το整ο ρυθμιστικό τοπίο, πιθανότατα σηματοδοτώντας παραλλαγές που προκαλούν ασθένειες που οι τρέχουσες μεθόδους παραλείπουν.

Το μοντέλο πέτυχε ισχυρά αποτελέσματα σε διαγωνισμούς που δοκιμάζουν την ικανότητά του να προβλέψει πώς οι γενετικές παραλλαγές επηρεάζουν την έκφραση γονιδίων και τη δραστηριότητα ρυθμιστικών στοιχείων. Σε εκφραστικές ποσοτικές τοπικές ετικέτες (eQTLs)—παραλλαγές που είναι γνωστό ότι επηρεάζουν τα επίπεδα έκφρασης γονιδίων—το AlphaGenome ισοφάρισε ή υπερέβη ειδικά μοντέλα που εκπαιδεύτηκαν ειδικά για αυτές τις εργασίες.

Διαθεσιμότητα Ανοικτού Κώδικα

Η DeepMind κυκλοφόρησε τον ανοικτό κώδικα του AlphaGenome στο GitHub για μη εμπορική χρήση, συνεχίζοντας το πρότυπο του εργαστηρίου να κάνει διαθέσιμα δημόσια βασικά εργαλεία βιολογίας. Το αποθετήριο περιλαμβάνει βάρη μοντέλου, κώδικα εύρεσης και τεκμηρίωση για την εκτέλεση προβλέψεων σε προσαρμοσμένες ακολουθίες.

Η ανοικτή κυκλοφορία ακολουθεί το μοντέλο που καθόρισε το AlphaFold, το εργαλείο πρόβλεψης δομής πρωτεϊνών της DeepMind που έχει χρησιμοποιηθεί από πάνω από 3 εκατομμύρια ερευνητές από την κυκλοφορία του το 2021. Το AlphaGenome αντιμετωπίζει ένα συμπληρωματικό πρόβλημα: ενώ το AlphaFold προβλέπει πώς看 τις πρωτεΐνες, το AlphaGenome προβλέπει πότε και πού τα γονίδια παράγουν αυτές τις πρωτεΐνες.

Ο CEO της Google DeepMind, Demis Hassabis, έχει τοποθετήσει τη βιολογία ως μια πρωταρχική περιοχή εφαρμογής των ικανοτήτων AI του εργαστηρίου. Η εργασία γονιδιωμάτων επεκτείνει τις φιλοδοξίες της DeepMind πέρα από την συνομιλική AI και τα γλωσσικά μοντέλα που τροφοδοτούν προϊόντα όπως το Gemini, εφαρμόζοντας παρόμοιες αρχιτεκτονικές καινοτομίες σε επιστημονικά προβλήματα.

Γιατί Αυτό Έχει Σημασία

Το ανθρώπινο γονίδιο περιέχει περίπου 3 δισεκατομμύρια ζευγάρια βάσεων, αλλά μόνο περίπου το 1,5% κωδικοποιεί απευθείας πρωτεΐνες. Το υπόλοιπο 98,5%—για πολύ καιρό απορρίφθηκε ως “σκουπίδια DNA”—περιέχει ρυθμιστικά στοιχεία που ελέγχουν πότε, πού και πόσο γονίδια εκφράζονται. Οι μεταλλάξεις σε αυτές τις μη κωδικοποιούσες περιοχές προκαλούν ασθένειες, αλλά η ταυτοποίηση των παραλλαγών που έχουν σημασία έχει αποδειχθεί εξαιρετικά δύσκολη.

Οι παραδοσιακές μεθόδους απαιτούν ακριβές, χρονοβόρες πειράματα για να ελέγξουν μεμονωμένες παραλλαγές. Τα μοντέλα μηχανικής μάθησης όπως το AlphaGenome μπορούν να ελέγξουν χιλιάδες παραλλαγές υπολογιστικά, προτιμώντας ποιες από αυτές αξίζουν πειραματική επανεξέταση. Για τη διάγνωση σπάνιων ασθενειών, όπου οι ασθενείς συχνά φέρουν νέες παραλλαγές με άγνωστες επιπτώσεις, αυτή η ικανότητα θα μπορούσε να επιταχύνει τον δρόμο από την αλληλούχιση στη διάγνωση.

Η ικανότητα του μοντέλου να επεξεργάζεται περιβάλλοντα ενός εκατομμυρίου βάσεων είναι ιδιαίτερα σημαντική. Τα γονιδιακά ρυθμιστικά στοιχεία μπορούν να βρίσκονται εκατοντάδες χιλιάδες βάσεων μακριά από τα γονίδια που ελέγχουν, επικοινωνώντας μέσω σύνθετων 3D διπλώσεων DNA. Τα προηγούμενα μοντέλα με μικρότερα παράθυρα περιεχομένου δεν μπορούσαν να καταγράψουν αυτές τις μακροπρόθεσμες εξαρτήσεις.

Το AlphaGenome προστίθεται σε ένα αυξανόμενο οικοσύστημα εργαλείων AI που μεταμορφώνουν την έρευνα βιολογίας. Η πρόβλεψη δομής πρωτεϊνών, η ανακάλυψη φαρμάκων και τώρα η ρύθμιση γονιδίων είναι όλο και πιο εφικτά προβλήματα για την μηχανική μάθηση. Για την κοινότητα ερευνητών γενετικής, η ανοικτή διαθεσιμότητα αυτών των μοντέλων δημοκρατίζει την πρόσβαση σε υπολογιστικές ικανότητες που προηγουμένως ήταν περιορισμένες σε καλά χρηματοδοτούμενα εργαστήρια.

Τα όρια του μοντέλου είναι επίσης σαφή από την παρουσίαση της DeepMind. Ενώ το AlphaGenome excels στην πρόβλεψη πειραματικών μετρήσεων, η μετάφραση αυτών των προβλέψεων σε κλινικές εξελίξεις απαιτεί πρόσθετη επικύρωση. Η лакούνα μεταξύ πρόβλεψης διαθεσιμότητας χρωματίνης και πρόβλεψης κινδύνου νόσου παραμένει σημαντική.

Για τώρα, το AlphaGenome χρησιμεύει ως εργαλείο έρευνας—ένα που θα μπορούσε να επιταχύνει την κατανόηση του πώς λειτουργεί το γονίδιο, ακόμη και αν οι κλινικές εφαρμογές παραμένουν χρόνια μακριά. Οι 3.000 επιστήμονες σε 160 χώρες που ήδη χρησιμοποιούν το μοντέλο δείχνουν ότι η ερευνητική κοινότητα βλέπει άμεση αξία σε αυτό που έχει κατασκευάσει η DeepMind.

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας του AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις του AI σε όλο τον κόσμο.