Kunstig intelligens

Forskere bruker naturlig språkbehandling-algoritmer for å forstå proteintransformasjon

Published October 11, 2020

Updated April 28, 2026

Daniel Nelson

Forskere fra University of Maryland har nylig brukt naturlig språkbehandling-teknikker og maskinlæringsalgoritmer for å få innsikt i hvordan proteinmolekyler skifter fra en form til en annen form. Den nylige artikkelen, som er publisert i tidsskriftet Nature Communications, er første gangen en AI-algoritme er blitt brukt til å studere dynamikken til biomolekylære systemer med hensyn til proteintransformasjon.

Proteinmolekyler kan ta på seg forskjellige former, men mekanismene som utløser en protein til å skifte fra en form til en annen er fortsatt noe mysteriøse. Funksjonen til en proteinmolekyl er definert av dens form, og å få en bedre forståelse av mekanismene som påvirker formen/strukturen til en protein kan enable forskere til å designe målrettede legemidler og bestemme årsaken til sykdommer.

Biologiske molekyler er ikke stasjonære, de er konstant i bevegelse som respons på hendelser i deres miljø. Miljømessige press kan gjøre molekyler skifte til forskjellige former, ofte ganske plutselig. En molekyl kan plutselig omfoldes til en helt annen struktur, i en prosess som er svært lik avspoling av en fjær. Forskjellige deler av molekylet foldes og ufoldes, og forskerne studerte de mellomliggende stadiene mellom de forskjellige molekylformene.

Ifølge Phys.org, var Pratyush Tiwary hovedforfatteren av artikkelen og er en assistentprofessor ved Marylands avdeling for kjemi og biokjemi og Institutt for fysisk vitenskap og teknologi. Ifølge Tiwary kan naturlig språkbehandling brukes til å modellere hvordan molekyler transformerer og tilpasser seg. Tiwary påpeker at molekyler har et visst “språk” som de snakker, med bevegelsene som molekyler gjør kan oversettes til et abstrakt språk. Når denne prosessen med å kartlegge molekylbevegelse til språkmønster utføres, kan naturlig språkbehandlingsteknikker og AI-algoritmer brukes til å “generere biologisk sanne historier ut av de resulterende abstrakte ordene”.

Når en molekyl skifter fra en form til en annen form, skjer overgangen ekstremt raskt. Overgangen kan bare vare like lenge som en trilliondel av et sekund. Den rene hastigheten til overgangen gjør det vanskelig for forskere å bestemme hvilke parametre som påvirker ufoldingprosessen ved hjelp av metoder som spektroskopi eller selv kraftige mikroskoper. For å bestemme hvilke parametre som påvirker ufoldingen av proteiner, skapte Tiwary og resten av forskningsteamet fysikkmodeller som simulerte proteiner. Komplekse statistiske modeller ble brukt til å skape proteinsimuleringer som emulerte formen, banen og bevegelsen til molekylene. Modellene ble deretter gitt til en maskinlæringsalgoritme basert på naturlig språkbehandling.

De naturlige språkbehandlingsmodellene som ble brukt til å trene maskinlæringsystemet var svært lik de algoritmene som brukes i prediktive tekstsystemer som Gmail bruker. De simulerte proteinene ble behandlet som et språk hvor molekylbevegelsene ble oversatt til “bokstaver”. Bokstavene ble deretter koblet sammen for å danne ord og setninger. Maskinlæringsalgoritmene kunne lære de grammatikalske og syntaktiske reglene bak proteinstrukturene, og bestemme hvilke former/bevegelser fulgte andre former/bevegelser. Algoritmene kunne deretter brukes til å forutsi hvordan bestemte proteiner ville utvikle seg og hvilke former de ville ta.

Forskerne brukte en lang korttidshukommelse (LSTM)-netverk for å analysere proteinbaserte setninger. Forskingsteamet holdt også øye med matematikken som nettverket var basert på, og overvåket parameterne mens nettverket lærte dynamikken til molekyltransformasjon. Ifølge resultater fra studien, brukte nettverket logikk som var svært lik et statisk fysikkonsept kjent som sti-entropi. Hvis denne oppdagelsen holder seg konstant, kan det potensielt føre til forbedringer i LSTM-nettverk. Tiwary forklarte at oppdagelsen fjerner noe av den sorte boksen til en LSTM, og lar forskere bedre forstå hvilke parametre som kan justeres for optimal ytelse.

Som en testfall for deres algoritme, analyserte forskerne en biomolekyl kalt riboswitch. Riboswitch hadde allerede blitt analysert ved hjelp av spektroskopi, og når riboswitch ble analysert med maskinlæringsystemet, matchet de predikerte riboswitch-formene de som ble funnet ved hjelp av spektroskopi.

Tiwary håper at deres funn vil la forskere utvikle målrettede legemidler som har færre bivirkninger. Som Tiwary forklarte via Phys.org:

“Du ønsker å ha potente legemidler som binder svært sterkt, men bare til det du ønsker at de skal binde til. Vi kan oppnå dette hvis vi kan forstå de forskjellige formene som en gitt biomolekyl av interesse kan ta, fordi vi kan lage legemidler som binder bare til en av disse spesifikke formene på riktig tid og bare så lenge vi ønsker.”

Daniel Nelson

Blogger og programmerer med spesialområder i Machine Learning og Deep Learning emner. Daniel håper å hjelpe andre med å bruke kraften av AI for sosialt godt.

Unite.AI

Forskere bruker naturlig språkbehandling-algoritmer for å forstå proteintransformasjon

You may like