στέλεχος Η DeepMind είναι έτοιμη να μεταμορφώσει τις βιολογικές επιστήμες λύνοντας το πρόβλημα αναδίπλωσης πρωτεϊνών - Unite.AI
Συνδεθείτε μαζί μας

Τεχνητή νοημοσύνη

Η DeepMind είναι έτοιμη να μεταμορφώσει τις βιολογικές επιστήμες λύνοντας το πρόβλημα της αναδίπλωσης πρωτεΐνης

mm
Ενημερώθηκε on

Το τμήμα τεχνητής νοημοσύνης της Google DeepMind πρόσφατα σημείωσε σημαντική πρόοδο για την επίλυση μιας από τις παλαιότερες προκλήσεις στη βιολογία, υπολογισμός του σχήματος μιας πρωτεΐνης από μια αλληλουχία αμινοξέων. Σύμφωνα με το Nature, η ανακάλυψη έχει τη δυνατότητα να μεταμορφώσει τα πεδία της βιολογίας και της χημείας, επιτρέποντας στους επιστήμονες να προσδιορίσουν τη λειτουργία πολλών πρωτεϊνών που είναι επί του παρόντος μυστηριώδεις.

Το σχήμα μιας πρωτεΐνης καθορίζει τη λειτουργία της και οι περισσότερες βιολογικές λειτουργίες εξαρτώνται από τις πρωτεΐνες. “Δίπλωμα πρωτεΐνης” είναι το όνομα που δίνεται στη διαδικασία που μετατρέπει τις αλυσίδες αμινοξέων στις τρισδιάστατες δομές που απαιτούν τα protiones για να εκτελέσουν τις λειτουργίες τους. Εάν οι επιστήμονες μπορούν να προσδιορίσουν τη σχέση μεταξύ των αλληλουχιών αμινοξέων και του σχήματος των πρωτεϊνών που δημιουργούν, μπορούν να προσδιορίσουν ποιες πρωτεΐνες επηρεάζουν διαφορετικές βιολογικές διεργασίες.

Οι επιστήμονες υποθέτουν ότι υπάρχουν τουλάχιστον 80,000 πρωτεΐνες εντός του ανθρώπινου πρωτεώματος, αλλά μόνο ένα μικρό κλάσμα αυτών των πρωτεϊνών έχει γνωστές δομές. Η παραδοσιακή μέθοδος προσδιορισμού του σχήματος μιας πρωτεΐνης μπορεί να πάρει χρόνια εργαστηριακών πειραμάτων, ακόμη και αξιοποιώντας τη δύναμη των αλγορίθμων και των μοντέλων της επιστήμης των υπολογιστών. Το έργο του DeepMind μπορεί να επιταχύνει δραματικά τη διαδικασία ανακάλυψης πρωτεϊνικών δομών, προσδιορίζοντας αξιόπιστα τη δομή των πρωτεϊνών σε ένα κλάσμα του κανονικού χρόνου.

Οι ερευνητές στο DeepMind εκπαίδευσαν τους αλγόριθμους τους σε βάση δεδομένων που αποτελούνταν από περίπου 170,0000 αλληλουχίες πρωτεϊνών και τα σχήματα που αντιστοιχούν σε αυτές τις αλληλουχίες. Οι αλγόριθμοι που αναπτύχθηκαν από τους ερευνητές εκπαιδεύτηκαν σε 100 έως 200 GPU και η διαδικασία εκπαίδευσης χρειάστηκε μερικές εβδομάδες για να ολοκληρωθεί. Το μοντέλο που ανέπτυξαν οι ερευνητές ονομάστηκε "AlphaFold".

Το AlphaFold λειτουργεί μέσω ενός «αλγόριθμου τάσης», που ξεκινά συνδέοντας μικρά κομμάτια της πρωτεΐνης μεταξύ τους και στη συνέχεια κλιμακώνεται για να συνδέσει όλο και μεγαλύτερα τμήματα. Μικρές ομάδες αμινοξέων συνδέθηκαν μεταξύ τους στην αρχή και στη συνέχεια ο αλγόριθμος αναζήτησε τρόπους σύνδεσης αυτών των συστάδων.

Οι ερευνητές του AlphaFold αρχικά προσπάθησαν να χρησιμοποιήσουν συμβατικούς αλγόριθμους βαθιάς μάθησης σε γενετικά και δομικά δεδομένα για να προβλέψουν τη σχέση μεταξύ αμινοξέων και πρωτεϊνών. Στη συνέχεια, η AlphaFold δημιούργησε συναινετικά μοντέλα για το στυλ των πρωτεϊνών. Όταν αυτή η τεχνική αποδείχθηκε ότι είχε πάρα πολλούς περιορισμούς, οι ερευνητές δοκίμασαν μια νέα στρατηγική. Η ερευνητική ομάδα του AlphaFold δημιούργησε μοντέλα εκπαιδευμένα σε περισσότερα χαρακτηριστικά και αυτή τη φορά είχε το μοντέλο να επιστρέψει προβλέψεις για την τελική δομή των πρωτεϊνικών αλληλουχιών.

Η ομάδα μηχανικών εξέτασε το AlphaFold συμμετέχοντάς το σε έναν διαγωνισμό όπου αλγόριθμοι υπολογιστών ανταγωνίζονται για να αξιολογήσουν τη δομή μιας πρωτεΐνης από αλληλουχίες αμινοξέων. Ο διαγωνισμός ήταν η «Κριτική Αξιολόγηση Πρόβλεψης Δομής Πρωτεϊνών» ή CASP. Στους συμμετέχοντες στο διαγωνισμό παρέχονται 100 αλληλουχίες αμινοξέων και τα μοντέλα τους πρέπει να επεξεργαστούν τη δομή των πρωτεϊνών. Το AlphaFold όχι μόνο ξεπέρασε τα άλλα μοντέλα υπολογιστών όσον αφορά την ακρίβεια, αλλά απέδωσε επίσης συγκρίσιμες με τις παραδοσιακές τεχνικές μοντελοποίησης που βασίζονται στο εργαστήριο. Η τελική, διάμεση βαθμολογία του AlphaFold ήταν περίπου 92 στα 100, με τις πειραματικές μεθόδους που βασίζονται στο εργαστήριο να λαμβάνουν βαθμολογία 90. Η διάμεση βαθμολογία του AlphaFold έπεσε στο 87 τοις εκατό στις πιο δύσκολες πρωτεΐνες.

Σύμφωνα με τον Chief Executive και συνιδρυτή της DeepMind Demis Hassabis, η εταιρεία ήδη σχεδιάζει να δώσει στους ερευνητές πρόσβαση στο AlphaFold, με επιστήμονες από το Max Planck Institute for Development Biology να χρησιμοποιούν ήδη το μοντέλο για να ανακαλύψουν δομές πρωτεΐνης στις οποίες εργάζονταν για πάνω από μια δεκαετία.

Janet Thornton, επίτιμη διευθύντρια του Ευρωπαϊκού Ινστιτούτου Βιοπληροφορικής, αναφέρθηκε μέσω του ScienceMag λέγοντας ότι τα επιτεύγματα του DeepMind «θα αλλάξουν το μέλλον της δομικής βιολογίας και της έρευνας πρωτεϊνών». Εν τω μεταξύ, βιολόγος στο Πανεπιστήμιο του Μέριλαντ, Shady Grove, λέει ο John Moult ότι ποτέ δεν πίστευε ότι το πρόβλημα της αναδίπλωσης των πρωτεϊνών δεν θα λυνόταν ποτέ σε αυτή τη ζωή.

Ενώ το AlphaFold είναι πολύ απίθανο να αντικαταστήσει πλήρως τις παραδοσιακές, πειραματικές μεθόδους ανακάλυψης πρωτεϊνικών δομών, θα μπορούσε να αυξήσει δραματικά την ταχύτητα με την οποία ανακαλύπτονται οι δομές πρωτεΐνης. Οι ερευνητές μπορεί να απαιτούν λιγότερα πειραματικά δεδομένα υψηλής ποιότητας για να προσδιορίσουν μια δομή πρωτεΐνης και οι ερευνητές έχουν ήδη πρόσβαση σε μεγάλο όγκο γονιδιωματικών δεδομένων που θα μπορούσαν να μεταφραστούν σε δομές χρησιμοποιώντας τις λύσεις του AlphaFold.