Povežite se s nama

Umjetna inteligencija

Istraživač koristi algoritme za obradu prirodnog jezika za razumijevanje transformacije proteina

mm

Nedavno su se prijavili istraživači sa Sveučilišta Maryland obrada prirodnog jezika tehnike i algoritme strojnog učenja kako bi se dobio uvid u to kako proteinske molekule prelaziti iz jednog oblika u drugi oblik. Nedavni rad, objavljen u časopisu Nature Communications, prvi je put da je algoritam umjetne inteligencije korišten za proučavanje dinamike biomolekularnih sustava s obzirom na transformaciju proteina.

Molekule proteina mogu poprimiti različite oblike, ali mehanizmi koji potiču proteine ​​da prijeđu iz jednog oblika u drugi još uvijek su pomalo misteriozni. Funkcija proteinske molekule definirana je njezinim oblikom, a bolje razumijevanje mehanizama koji utječu na oblik/strukturu proteina moglo bi omogućiti znanstvenicima osmišljavanje ciljanih terapija lijekovima i utvrđivanje uzroka bolesti.

Biološke molekule nisu stacionarne, one se stalno kreću kao odgovor na događaje u svojoj okolini. Pritisci okoliša mogu natjerati molekule u različite oblike, često sasvim iznenada. Molekula se iznenada može ponovno smotati u potpuno drugačiju strukturu, u procesu koji je vrlo sličan odmotavanju opruge. Različiti dijelovi molekule razvijaju se i presavijaju, a istraživači su proučavali međustupnjeve između različitih molekularnih oblika.

Prema Phys.org, Pratyush Tiwary bio je stariji autor rada i docent je na Odsjeku za kemiju i biokemiju u Marylandu i Institutu za fizikalnu znanost i tehnologiju. Prema Tiwaryju, obrada prirodnog jezika može se koristiti za modeliranje transformacije i prilagodbe molekula. Tiwary primjećuje da molekule imaju određeni "jezik" kojim govore, s pokretima koje čine molekule koji se mogu prevesti na apstraktni jezik. Kada se provede ovaj proces mapiranja kretanja molekula u jezične obrasce, tehnike obrade prirodnog jezika i algoritmi umjetne inteligencije mogu se koristiti za "generiranje biološki istinitih priča iz rezultirajućih apstraktnih riječi".

Kada molekula prijeđe iz jednog oblika u drugi, prijelaz se događa iznimno brzo. Prijelaz može trajati samo trilijunti dio sekunde. Sama brzina prijelaza otežava znanstvenicima određivanje koji parametri utječu na proces odvijanja pomoću metoda poput spektroskopije ili čak mikroskopa velike snage. Kako bi odredili koji parametri utječu na odvijanje proteina, Tiwary i ostatak istraživačkog tima stvorili su fizičke modele koji simuliraju proteine. Složeni statistički modeli korišteni su za stvaranje simulacija proteina koje su oponašale oblik, putanju i kretanje molekula. Modeli su zatim dani algoritmu strojnog učenja koji se temelji na metodama obrade prirodnog jezika.

Modeli obrade prirodnog jezika korišteni za obuku sustava strojnog učenja bili su vrlo slični algoritmima korištenim u sustavima za predviđanje teksta koje koristi Gmail. Simulirani proteini tretirani su kao jezik u kojem su kretanja molekula prevedena u "slova". Slova su zatim povezana u riječi i rečenice. Algoritmi strojnog učenja uspjeli su naučiti gramatička i sintaktička pravila koja stoje iza proteinskih struktura, određujući koji oblici/pokreti slijede druge oblike/pokrete. Algoritmi bi se tada mogli koristiti za predviđanje kako će se određeni proteini raspetljati i koje će oblike poprimiti.

Istraživači su koristili a dugo kratkoročno pamćenje (LSTM) mreže kako bi se analizirale rečenice temeljene na proteinima. Istraživački tim također je pratio matematiku na kojoj se mreža temeljila, prateći parametre dok je mreža učila dinamiku molekularne transformacije. Prema rezultatima studije, mreža je koristila logiku koja je bila slična konceptu statičke fizike poznatom kao entropija puta. Ako ovo otkriće ostane konstantno, potencijalno bi moglo dovesti do poboljšanja u LSTM mrežama. Tiwary je objasnio da ovo otkriće uklanja neke od prirode crne kutije LSTM-a, dopuštajući istraživačima da bolje razumiju koji se parametri mogu podesiti za optimalnu izvedbu.

Kao testni slučaj za njihov algoritam, istraživači su analizirali biomolekulu nazvanu riboswitch. Riboswitch je već bio analiziran spektroskopijom, a kada je riboswitch analiziran sustavom strojnog učenja, predviđeni oblici riboswitcha podudarali su se s onima otkrivenima spektroskopijom.

Tiwary se nada da će njihova otkrića omogućiti istraživačima da razviju ciljane lijekove koji imaju manje nuspojava. Kao što je Tiwary objasnio putem Phys.org:

“Želite imati snažne lijekove koji se vrlo snažno vežu, ali samo na ono za što želite da se vežu. To možemo postići ako možemo razumjeti različite oblike koje određena biomolekula od interesa može poprimiti, jer možemo napraviti lijekove koji se vežu samo na jedan od tih specifičnih oblika u odgovarajuće vrijeme i samo onoliko dugo koliko mi želimo.”