Følg os

Kunstig intelligens

Forsker bruger naturlige sprogbehandlingsalgoritmer til at forstĂĄ proteintransformation

mm

Forskere fra University of Maryland søgte for nylig naturlig sprogbehandling teknikker og maskinlæringsalgoritmer for at få indsigt i hvordan protein molekyler skifte fra en form til en anden form. Den seneste avis, offentliggjort i tidsskriftet Nature Communications, er første gang, at en AI-algoritme er blevet brugt til at studere dynamikken i biomolekylære systemer med hensyn til transformation af proteiner.

Proteinmolekyler kan antage forskellige former, men de mekanismer, der får et protein til at skifte fra en form til en anden, er stadig noget mystiske. Funktionen af ​​et proteinmolekyle er defineret af dets form, og opnåelse af en bedre forståelse af de mekanismer, der påvirker formen/strukturen af ​​et protein, kunne gøre det muligt for forskere at designe målrettede lægemiddelterapier og bestemme årsagen til sygdomme.

Biologiske molekyler er ikke stationære, de bevæger sig konstant som reaktion på begivenheder i deres miljø. Miljøbelastninger kan få molekyler til at skifte til forskellige former, ofte ganske pludseligt. Et molekyle kan pludselig omfolde sig til en helt anden struktur, i en proces, der minder meget om udrulningen af ​​en fjeder. Forskellige dele af molekylet folder sig ud og folder, og forskerne studerede de mellemliggende stadier mellem de forskellige molekylære former.

Ifølge Phys.org, Pratyush Tiwary var seniorforfatter af papiret og er assisterende professor ved Marylands Department of Chemistry and Biochemistry og Institute for Physical Science and Technology. Ifølge Tiwary kan naturlig sprogbehandling bruges til at modellere, hvordan molekyler transformerer og tilpasser sig. Tiwary bemærker, at molekyler har et bestemt "sprog", som de taler, med de bevægelser, som molekyler laver, i stand til at blive oversat til et abstrakt sprog. Når denne proces med at kortlægge molekylebevægelser til sprogmønstre udføres, kan naturlige sprogbehandlingsteknikker og AI-algoritmer bruges til at "generere biologisk sandfærdige historier ud af de resulterende abstrakte ord."

Når et molekyle går fra en form til en anden form, sker overgangen ekstremt hurtigt. Overgangen kan kun tage så lang tid som en billiontedel af et sekund. Overgangens hastighed gør det vanskeligt for forskere at bestemme, hvilke parametre der påvirker udfoldningsprocessen ved hjælp af metoder som spektroskopi eller endda højeffektmikroskoper. For at bestemme, hvilke parametre der påvirker udfoldelsen af ​​proteiner, skabte Tiwary og resten af ​​forskerholdet fysikmodeller, der simulerede proteiner. Komplekse statistiske modeller blev brugt til at skabe proteinsimuleringer, der emulerede molekylernes form, bane og bevægelse. Modellerne blev derefter givet til en maskinlæringsalgoritme baseret på naturlige sprogbehandlingsmetoder.

De naturlige sprogbehandlingsmodeller, der blev brugt til at træne maskinlæringssystemet, lignede meget de algoritmer, der blev brugt i de forudsigelige tekstsystemer, Gmail anvender. De simulerede proteiner blev behandlet som et sprog, hvor molekylernes bevægelser blev oversat til "bogstaver". Bogstaverne blev derefter knyttet sammen for at lave ord og sætninger. Maskinlæringsalgoritmerne var i stand til at lære de grammatiske og syntaktiske regler bag proteinstrukturerne, og bestemme hvilke former/bevægelser, der fulgte andre former/bevægelser. Algoritmerne kunne derefter bruges til at forudsige, hvordan visse proteiner ville løse sig, og hvilke former de ville tage.

Forskerne brugte en langtidshukommelse (LSTM) netværk for at analysere de proteinbaserede sætninger. Forskerholdet holdt også styr på den matematik, som netværket var baseret på, og overvågede parametrene, efterhånden som netværket lærte dynamikken i molekylær transformation. Ifølge resultaterne af undersøgelsen brugte netværket logik, der lignede et statisk fysikkoncept kendt som sti-entropi. Hvis dette fund holder konstant, kan det potentielt føre til forbedringer i LSTM-netværk. Tiwary forklarede, at opdagelsen skræller noget af sort-boks-karakteren af ​​en LSTM tilbage, hvilket lader forskerne bedre forstå, hvilke parametre der kan indstilles til optimal ydeevne.

Som et testcase for deres algoritme analyserede forskerne et biomolekyle kaldet riboswitch. Riboswitch var allerede blevet analyseret ved hjælp af spektroskopi, og da riboswitch blev analyseret med maskinlæringssystemet, matchede de forudsagte riboswitch-former dem, der blev opdaget ved spektroskopi.

Tiwary håber, at deres resultater vil lade forskere udvikle målrettede lægemidler, der har færre bivirkninger. Som Tiwary forklarede via Phys.org:

"Du vil have potente stoffer, der binder meget stærkt, men kun til den ting, du vil have dem til at binde sig til. Det kan vi opnå, hvis vi kan forstå de forskellige former, som et givet biomolekyle af interesse kan antage, fordi vi kan lave lægemidler, der kun binder til en af ​​disse specifikke former på det passende tidspunkt og kun så længe, ​​vi ønsker."