Umělá inteligence

Výzkumníci používají algoritmy zpracování přirozeného jazyka k pochopení transformace proteinů

Published October 11, 2020

Updated April 28, 2026

Daniel Nelson

Výzkumníci z University of Maryland nedávno použili techniky zpracování přirozeného jazyka a algoritmy strojového učení k získání přehledu o tom, jak molekuly proteinů přecházejí z jedné podoby do druhé. Tato nedávná studie, publikovaná v časopise Nature Communications, je prvním případem, kdy byl algoritmus umělé inteligence použit ke studiu dynamiky biomolekulárních systémů v souvislosti s transformací proteinů.

Molekuly proteinů mohou mít různé formy, ale mechanismy, které vyvolávají přechod proteinu z jedné formy do druhé, jsou stále somewhat záhadné. Funkce molekuly proteinu je definována její strukturou a získání lepšího pochopení mechanismů, které ovlivňují tvar/strukturu proteinu, by mohlo umožnit vědcům navrhnout cílené léky a určit příčinu onemocnění.

Biomolekuly nejsou statické, neustále se pohybují v reakci na události ve svém prostředí. Environmentální tlaky mohou způsobit, že molekuly přecházejí do různých forem, často velmi náhle. Molekula se může náhle přestavit do zcela jiné struktury, v procesu, který je velmi podobný odvinutí pružiny. Různé části molekuly se složí a rozloží, a výzkumníci studovali mezistupně mezi různými molekulárními formami.

Podle Phys.org, Pratyush Tiwary byl hlavním autorem studie a je asistentem profesora na katedře chemie a biochemie a Institutu pro fyzikální vědy a technologie Marylandu. Podle Tiwaryho lze zpracování přirozeného jazyka použít k modelování, jak molekuly přecházejí a adaptují. Tiwary poznamenává, že molekuly mají určitý “jazyk”, který hovoří, s pohyby, které molekuly dělají, schopnými být přeloženy do abstraktního jazyka. Když je proveden proces mapování pohybu molekuly na jazykové vzory, techniky zpracování přirozeného jazyka a algoritmy umělé inteligence lze použít k “vytvoření biologicky pravdivých příběhů z výsledných abstraktních slov”.

Když molekula přechází z jedné formy do druhé, přechod nastane extrémně rychle. Přechod může trvat pouze jednu triliontinu sekundy. Rychlost přechodu činí obtížným pro vědce určit, které parametry ovlivňují proces rozvinutí pomocí metod, jako je spektroskopie nebo dokonce mikroskopy s vysokým výkonem. Za účelem určení, které parametry ovlivňují rozvinutí proteinů, Tiwary a zbytek výzkumného týmu vytvořili fyzikální modely, které simulovaly proteiny. Složité statistické modely byly použity k vytvoření simulací proteinů, které emulovaly tvar, trajektorii a pohyb molekul. Modely byly poté předány algoritmu strojového učení založenému na technikách zpracování přirozeného jazyka.

Modely zpracování přirozeného jazyka použité k trénování systému strojového učení byly podobné algoritmům používaným v prediktivních textových systémech Gmail. Simulované proteiny byly považovány za jazyk, ve kterém pohyby molekul byly přeloženy do “písmen”. Písmena byla poté spojena do slov a vět. Algoritmy strojového učení byly schopny naučit se gramatické a syntaktické pravidla za proteinovými strukturami, určující, které tvary/pohyby následují jiné tvary/pohyby. Algoritmy mohly být poté použity k předpovědi, jak bestimmé proteiny se rozvinou a které tvary budou mít.

Výzkumníci využili long short-term memory (LSTM) síť k analýze proteinových vět. Výzkumný tým také sledoval matematiku, na které byla síť založena, monitoroval parametry, jak síť učila dynamiku molekulární transformace. Podle výsledků studie síť používala logiku podobnou statickému fyzikálnímu konceptu známému jako path entropy. Pokud toto zjištění zůstane konstantní, mohlo by potenciálně vést ke zlepšení sítí LSTM. Tiwary vysvětlil, že toto zjištění odhaluje část černé skříňky LSTM, umožňující výzkumníkům lépe pochopit, které parametry lze optimalizovat pro optimální výkon.

Jako testovací případ pro svůj algoritmus analyzovali výzkumníci biomolekulu zvanou riboswitch. Riboswitch již byl analyzován pomocí spektroskopie a když byl riboswitch analyzován systémem strojového učení, předpovězené formy riboswitch odpovídaly těm, které byly objeveny spektroskopií.

Tiwary doufá, že jejich zjištění umožní výzkumníkům vyvinout cílené léky s menšími vedlejšími účinky. Jak Tiwary vysvětlil prostřednictvím Phys.org:

“Chcete mít silné léky, které se velmi silně váží, ale pouze k tomu, co chcete, aby se vázaly. Toho můžeme dosáhnout, pokud pochopíme různé formy, které může mít určitá biomolekula, protože můžeme vyvinout léky, které se váží pouze k jedné z těchto konkrétních forem v příslušném čase a pouze po dobu, kterou chceme.”

Daniel Nelson

Blogger a programátor se specializací na Machine Learning a Deep Learning témata. Daniel doufá, že pomůže ostatním využít sílu AI pro sociální dobro.

Unite.AI

Výzkumníci používají algoritmy zpracování přirozeného jazyka k pochopení transformace proteinů

You may like