Connect with us

Ερευνητές Χρησιμοποιούν Αλγόριθμους Επεξεργασίας Φυσικής Γλώσσας για να Κατανοήσουν τη Μεταμόρφωση Πρωτεϊνών

Τεχνητή νοημοσύνη

Ερευνητές Χρησιμοποιούν Αλγόριθμους Επεξεργασίας Φυσικής Γλώσσας για να Κατανοήσουν τη Μεταμόρφωση Πρωτεϊνών

mm

Ερευνητές από το Πανεπιστήμιο του Μέριλαντ applied natural language processing τεχνικές και αλγόριθμους μηχανικής μάθησης για να αποκτήσουν εικόνα για το πώς μοριακά πρωτεΐνες μετατρέπονται από μια μορφή σε μια άλλη. Η πρόσφατη μελέτη, που δημοσιεύθηκε στο περιοδικό Nature Communications, είναι η πρώτη φορά που ένας αλγόριθμος AI έχει χρησιμοποιηθεί για τη μελέτη της δυναμικής των βιομοριακών συστημάτων σε σχέση με τη μεταμόρφωση των πρωτεϊνών.

Οι μοριακές πρωτεΐνες μπορούν να λάβουν διάφορες μορφές, αλλά οι μηχανισμοί που προκαλούν μια πρωτεΐνη να μετατρέπεται από μια μορφή σε μια άλλη παραμένουν κάπως μυστηριώδεις. Η λειτουργία μιας μοριακής πρωτεΐνης ορίζεται από το σχήμα της, και η απόκτηση μιας καλύτερης κατανόησης των μηχανισμών που επηρεάζουν το σχήμα/δομή μιας πρωτεΐνης θα μπορούσε να επιτρέψει στους επιστήμονες να σχεδιάσουν στοχευμένες θεραπείες και να καθορίσουν την αιτία των ασθενειών.

Τα βιολογικά μόρια δεν είναι στατικά, αλλά κινούνται συνεχώς ως απάντηση σε γεγονότα στο περιβάλλον τους. Οι περιβαλλοντικές πιέσεις μπορούν να κάνουν τα μόρια να μετατρέπονται σε διαφορετικές μορφές, συχνά πολύ γρήγορα. Ένα μόριο μπορεί να μετατρέπεται ξαφνικά σε μια完全 διαφορετική δομή, σε einen διαδικασία που είναι πολύ παρόμοια με την αποσύνδεση ενός ελατηρίου. Διαφορετικά τμήματα του μορίου αναπτύσσονται και πτύσσονται, και οι ερευνητές μελέτησαν τα ενδιάμεσα στάδια μεταξύ των διαφορετικών μορφών των μορίων.

Σύμφωνα με το Phys.org, ο Pratyush Tiwary ήταν ο senior author της μελέτης και είναι assistant professor στο Τμήμα Χημείας και Βιοχημείας και Ινστιτούτο Φυσικής Επιστήμης και Τεχνολογίας του Μέριλαντ. Σύμφωνα με τον Tiwary, η επεξεργασία φυσικής γλώσσας μπορεί να χρησιμοποιηθεί για να μοντελοποιηθεί πώς τα μόρια μετατρέπονται και προσαρμόζονται. Ο Tiwary σημειώνει ότι τα μόρια έχουν μια bestimmte “γλώσσα” που ομιλούν, με τις κινήσεις που κάνουν τα μόρια να μπορούν να μεταφραστούν σε μια αφηρημένη γλώσσα. Όταν αυτή η διαδικασία της αντιστοίχισης της κίνησης του μορίου σε γλώσσα γίνεται, οι τεχνικές επεξεργασίας φυσικής γλώσσας και οι αλγόριθμοι AI μπορούν να χρησιμοποιηθούν για να “δημιουργήσουν βιολογικά αληθινά ιστορίες από τα αποτέλεσματα των αφηρημένων λέξεων”.

Όταν ένα μόριο μετατρέπεται από μια μορφή σε μια άλλη, η μετάβαση συμβαίνει εξαιρετικά γρήγορα. Η μετάβαση μπορεί να διαρκέσει όσο ένα τρισεκατομμύριο του δευτερολέπτου. Η ταχύτητα της μετάβασης καθιστά δύσκολο για τους επιστήμονες να καθορίσουν ποια παραμέτρα επηρεάζουν τη διαδικασία αναδίπλωσης με μεθόδους όπως η φασματοσκοπία ή ακόμη και με ισχυρά μικροσκόπια. Για να καθορίσουν ποια παραμέτρα επηρεάζουν την αναδίπλωση των πρωτεϊνών, ο Tiwary και η υπόλοιπη ερευνητική ομάδα δημιούργησαν φυσικά μοντέλα που προσομοιώνουν τις πρωτεΐνες. Συμπλέγματα στατιστικά μοντέλα χρησιμοποιήθηκαν για να δημιουργηθούν προσομοιώσεις πρωτεϊνών που μιμούνται το σχήμα, την τροχιά και την κίνηση των μορίων. Τα μοντέλα δόθηκαν σε ένα σύστημα μηχανικής μάθησης που βασίζεται σε μεθόδους επεξεργασίας φυσικής γλώσσας.

Τα μοντέλα επεξεργασίας φυσικής γλώσσας που χρησιμοποιήθηκαν για να εκπαιδεύσουν το σύστημα μηχανικής μάθησης ήταν πολύ παρόμοια με τους αλγόριθμους που χρησιμοποιούνται στα συστήματα προβλέψιμης κειμένου του Gmail. Οι προσομοιωμένες πρωτεΐνες αντιμετωπίστηκαν ως μια γλώσσα όπου οι κινήσεις των μορίων μεταφράστηκαν σε “γράμματα”. Τα γράμματα συνδέθηκαν μεταξύ τους για να σχηματίσουν λέξεις και προτάσεις. Οι αλγόριθμοι μηχανικής μάθησης μπορούσαν να μάθουν τις γραμματικές και συντακτικές κανόνες πίσω από τις δομές των πρωτεϊνών, καθορίζοντας ποια σχήματα/κινήσεις ακολουθούν άλλες μορφές/κινήσεις. Οι αλγόριθμοι θα μπορούσαν να χρησιμοποιηθούν για να προβλέψουν πώς bestimmte πρωτεΐνες θα αναπτύσσονται και ποια σχήματα θα λάβουν.

Οι ερευνητές χρησιμοποίησαν ένα δίκτυο μνήμης μακράς και βραχύχρονης μνήμης (LSTM) για να αναλύσουν τις πρωτεϊνικές προτάσεις. Η ερευνητική ομάδα cũng διατήρησε τα μαθηματικά που το δίκτυο βασίζονταν, παρακολουθώντας τις παραμέτρους καθώς το δίκτυο έμαθε τη δυναμική της μεταμόρφωσης των μορίων. Σύμφωνα με τα αποτελέσματα της μελέτης, το δίκτυο χρησιμοποίησε λογική που ήταν παρόμοια με μια στατιστική φυσική έννοια γνωστή ως πуть εντροπίας. Αν αυτό το εύρημα παραμείνει σταθερό, θα μπορούσε να οδηγήσει σε βελτιώσεις στα δίκτυα LSTM. Ο Tiwary εξήγησε ότι η ανακάλυψη αποκαλύπτει κάποια από τη μαύρη κουτί φύση ενός LSTM, επιτρέποντας στους ερευνητές να κατανοήσουν καλύτερα ποια παραμέτρα μπορούν να ρυθμιστούν για βέλτιστη απόδοση.

Ως μια περίπτωση δοκιμής για τον αλγόριθμό τους, οι ερευνητές ανέλυσαν ένα βιομόριο που ονομάζεται riboswitch. Το riboswitch είχε ήδη αναλυθεί με φασματοσκοπία, και όταν το riboswitch αναλύθηκε με το σύστημα μηχανικής μάθησης, οι προβλεπόμενες μορφές του riboswitch ταίριαξαν με αυτές που ανακαλύφθηκαν από τη φασματοσκοπία.

Ο Tiwary ελπίζει ότι τα ευρήματά τους θα επιτρέψουν στους ερευνητές να αναπτύξουν στοχευμένες θεραπείες που έχουν λιγότερες παρενέργειες. Όπως εξήγησε ο Tiwary μέσω του Phys.org:

“Θέλουμε να έχουμε ισχυρά φάρμακα που δένονται πολύ ισχυρά, αλλά μόνο στο πράγμα που θέλουμε να δέσουν. Μπορούμε να το επιτύχουμε αν μπορούμε να κατανοήσουμε τις διαφορετικές μορφές που μπορεί να λάβει ένα δεδομένο βιομόριο ενδιαφέροντος, γιατί μπορούμε να φτιάξουμε φάρμακα που δένονται μόνο σε μια από αυτές τις συγκεκριμένες μορφές στην κατάλληλη στιγμή και μόνο για όσο χρόνο θέλουμε.”

Blogger και προγραμματιστής με ειδικότητες στα Machine Learning και Deep Learning θέματα. Ο Daniel ελπίζει να βοηθήσει τους άλλους να χρησιμοποιήσουν τη δύναμη του AI για κοινωνικό καλό.