Intelligenza Artificiale
Il ricercatore utilizza algoritmi di elaborazione del linguaggio naturale per comprendere la trasformazione delle proteine

I ricercatori dell'Università del Maryland hanno recentemente fatto domanda elaborazione del linguaggio naturale tecniche e algoritmi di apprendimento automatico per ottenere informazioni dettagliate su come molecole proteiche passare da una forma all'altra. Il recente documento, pubblicato sulla rivista Nature Communications, è la prima volta che un algoritmo di intelligenza artificiale viene utilizzato per studiare la dinamica dei sistemi biomolecolari in relazione alla trasformazione delle proteine.
Le molecole proteiche possono assumere varie forme, ma i meccanismi che spingono una proteina a passare da una forma all'altra sono ancora alquanto misteriosi. La funzione di una molecola proteica è definita dalla sua forma e una migliore comprensione dei meccanismi che influenzano la forma/struttura di una proteina potrebbe consentire agli scienziati di progettare terapie farmacologiche mirate e determinare la causa delle malattie.
Le molecole biologiche non sono stazionarie, si muovono costantemente in risposta agli eventi nel loro ambiente. Le pressioni ambientali possono far cambiare le molecole in forme diverse, spesso all'improvviso. Una molecola può improvvisamente ripiegarsi in una struttura completamente diversa, in un processo molto simile allo srotolamento di una molla. Diverse porzioni della molecola si dispiegano e si ripiegano, ei ricercatori hanno studiato gli stadi intermedi tra le diverse forme molecolari.
Secondo Phys.org, Pratyush Tiwary è stato l'autore senior dell'articolo ed è professore assistente presso il Dipartimento di Chimica e Biochimica e l'Istituto di Scienze e Tecnologie Fisiche del Maryland. Secondo Tiwary, l’elaborazione del linguaggio naturale può essere utilizzata per modellare il modo in cui le molecole si trasformano e si adattano. Tiwary osserva che le molecole hanno un certo “linguaggio” che parlano, con i movimenti che le molecole compiono che possono essere tradotti in un linguaggio astratto. Quando viene eseguito questo processo di mappatura del movimento delle molecole sui modelli linguistici, le tecniche di elaborazione del linguaggio naturale e gli algoritmi di intelligenza artificiale possono essere utilizzati per “generare storie biologicamente veritiere dalle parole astratte risultanti”.
Quando una molecola passa da una forma all'altra, la transizione avviene in modo estremamente rapido. La transizione può durare solo un trilionesimo di secondo. L'assoluta velocità della transizione rende difficile per gli scienziati determinare quali parametri influenzano il processo di sviluppo utilizzando metodi come la spettroscopia o persino microscopi ad alta potenza. Per determinare quali parametri influenzano il dispiegamento delle proteine, Tiwary e il resto del team di ricerca hanno creato modelli fisici che simulano le proteine. Sono stati utilizzati complessi modelli statistici per creare simulazioni proteiche che emulassero la forma, la traiettoria e il movimento delle molecole. I modelli sono stati quindi assegnati a un algoritmo di apprendimento automatico basato su metodi di elaborazione del linguaggio naturale.
I modelli di elaborazione del linguaggio naturale utilizzati per addestrare il sistema di apprendimento automatico erano molto simili agli algoritmi utilizzati nei sistemi di scrittura predittiva utilizzati da Gmail. Le proteine simulate sono state trattate come un linguaggio in cui i movimenti delle molecole sono stati tradotti in "lettere". Le lettere sono state poi collegate tra loro per formare parole e frasi. Gli algoritmi di apprendimento automatico sono stati in grado di apprendere le regole grammaticali e sintattiche alla base delle strutture proteiche, determinando quali forme/movimenti seguivano altre forme/movimenti. Gli algoritmi potrebbero quindi essere utilizzati per prevedere come determinate proteine si districherebbero e quali forme assumerebbero.
I ricercatori hanno utilizzato a memoria lunga a breve termine (LSTM) rete per analizzare le frasi a base di proteine. Il team di ricerca ha anche tenuto traccia della matematica su cui si basava la rete, monitorando i parametri mentre la rete apprendeva le dinamiche della trasformazione molecolare. Secondo i risultati dello studio, la rete utilizzava una logica simile a un concetto di fisica statica noto come path entropy. Se questa scoperta rimane costante, potrebbe potenzialmente portare a miglioramenti nelle reti LSTM. Tiwary ha spiegato che la scoperta rimuove parte della natura della scatola nera di un LSTM, consentendo ai ricercatori di capire meglio quali parametri possono essere regolati per prestazioni ottimali.
Come banco di prova per il loro algoritmo, i ricercatori hanno analizzato una biomolecola chiamata riboswitch. Riboswitch era già stato analizzato utilizzando la spettroscopia e quando il riboswitch è stato analizzato con il sistema di apprendimento automatico, le forme di riboswitch previste corrispondevano a quelle scoperte dalla spettroscopia.
Tiwary spera che le loro scoperte consentano ai ricercatori di sviluppare farmaci mirati che abbiano meno effetti collaterali. Come ha spiegato Tiwary tramite Phys.org:
“Vuoi avere potenti farmaci che si legano molto fortemente, ma solo alla cosa a cui vuoi che si leghino. Possiamo raggiungere questo obiettivo se riusciamo a comprendere le diverse forme che può assumere una data biomolecola di interesse, perché possiamo produrre farmaci che si legano solo a una di quelle forme specifiche al momento opportuno e solo per il tempo che vogliamo».