Umělá inteligence
Výzkumník používá algoritmy zpracování přirozeného jazyka k pochopení transformace proteinů

Nedávno se přihlásili vědci z University of Maryland zpracování přirozeného jazyka techniky a algoritmy strojového učení, abyste získali přehled o tom, jak proteinové molekuly přechod z jednoho tvaru do druhého. Nedávný papír, publikované v časopise Nature Communications, je poprvé, kdy byl algoritmus AI použit ke studiu dynamiky biomolekulárních systémů s ohledem na transformaci proteinů.
Molekuly proteinů mohou nabývat různých forem, ale mechanismy, které vedou protein k přechodu z jedné formy do druhé, jsou stále poněkud záhadné. Funkce molekuly proteinu je definována jejím tvarem a získání lepšího pochopení mechanismů, které ovlivňují tvar/strukturu proteinu, by mohlo vědcům umožnit navrhnout cílené lékové terapie a určit příčinu onemocnění.
Biologické molekuly nejsou stacionární, neustále se pohybují v reakci na události ve svém prostředí. Tlaky prostředí mohou způsobit, že se molekuly posunou do různých forem, často zcela náhle. Molekula se může náhle přestavět do úplně jiné struktury, procesem, který je velmi podobný odvíjení pružiny. Různé části molekuly se rozvinou a složí a vědci studovali přechodná stádia mezi různými molekulárními formami.
Podle Phys.org Pratyush Tiwary byl hlavním autorem článku a je odborným asistentem na katedře chemie a biochemie v Marylandu a Institutu fyzikální vědy a technologie. Podle Tiwaryho lze zpracování přirozeného jazyka použít k modelování toho, jak se molekuly transformují a přizpůsobují. Tiwary poznamenává, že molekuly mají určitý „jazyk“, kterým mluví, přičemž pohyby, které molekuly dělají, mohou být převedeny do abstraktního jazyka. Když se provádí tento proces mapování pohybu molekul na jazykové vzorce, lze techniky zpracování přirozeného jazyka a algoritmy umělé inteligence použít k „generování biologicky pravdivých příběhů z výsledných abstraktních slov“.
Když molekula přechází z jedné formy do druhé, dochází k přechodu extrémně rychle. Přechod může trvat jen biliontinu sekundy. Naprostá rychlost přechodu ztěžuje vědcům určit, jaké parametry ovlivňují proces rozvíjení pomocí metod, jako je spektroskopie nebo dokonce vysoce výkonné mikroskopy. Aby bylo možné určit, které parametry ovlivňují rozvinutí proteinů, Tiwary a zbytek výzkumného týmu vytvořili fyzikální modely, které simulovaly proteiny. Komplexní statistické modely byly použity k vytvoření proteinových simulací, které napodobovaly tvar, trajektorii a pohyb molekul. Modely byly poté předány algoritmu strojového učení založeného na metodách zpracování přirozeného jazyka.
Modely zpracování přirozeného jazyka používané k trénování systému strojového učení byly velmi podobné algoritmům používaným v prediktivních textových systémech, které Gmail používá. Se simulovanými proteiny bylo zacházeno jako s jazykem, kde byly pohyby molekul překládány na „písmena“. Písmena pak byla spojena dohromady, aby vytvořila slova a věty. Algoritmy strojového učení se dokázaly naučit gramatická a syntaktická pravidla za proteinovými strukturami a určit, které tvary/pohyby následují po jiných tvarech/pohybech. Algoritmy by pak mohly být použity k předpovědi, jak se určité proteiny rozmotají a jaké tvary získají.
Výzkumníci využili a dlouhodobá krátkodobá paměť (LSTM) sítě, aby bylo možné analyzovat věty založené na proteinech. Výzkumný tým také sledoval matematiku, na které byla síť založena, a sledoval parametry, jak se síť učila dynamice molekulární transformace. Podle výsledků studie síť používala logiku, která byla podobná konceptu statické fyziky známému jako entropie dráhy. Pokud bude toto zjištění konstantní, mohlo by to potenciálně vést ke zlepšení sítí LSTM. Tiwary vysvětlil, že objev odlupuje část černé skříňky LSTM a umožňuje výzkumníkům lépe pochopit, které parametry lze vyladit pro optimální výkon.
Jako testovací případ pro svůj algoritmus výzkumníci analyzovali biomolekulu zvanou riboswitch. Riboswitch již byl analyzován pomocí spektroskopie, a když byl riboswitch analyzován systémem strojového učení, předpokládané formy riboswitchů odpovídaly těm, které byly objeveny spektroskopií.
Tiwary doufá, že jejich zjištění umožní výzkumníkům vyvinout cílené léky, které mají méně vedlejších účinků. Jak Tiwary vysvětlil prostřednictvím Phys.org:
"Chcete mít silné léky, které se vážou velmi silně, ale pouze na věc, na kterou chcete, aby se navázaly." Můžeme toho dosáhnout, pokud dokážeme porozumět různým formám, které může mít daná biomolekula, protože můžeme vyrábět léky, které se vážou pouze na jednu z těchto specifických forem ve vhodnou dobu a jen tak dlouho, jak chceme.“