Inteligencia Artificial
Investigador utiliza algoritmos de procesamiento de lenguaje natural para comprender la transformación de proteínas

Investigadores de la Universidad de Maryland aplicaron recientemente procesamiento natural del lenguaje técnicas y algoritmos de aprendizaje automático para obtener información sobre cómo moléculas de proteína cambiar de una forma a otra forma. El papel reciente, publicado en la revista Nature Communications, es la primera vez que se utiliza un algoritmo de IA para estudiar la dinámica de los sistemas biomoleculares con respecto a la transformación de proteínas.
Las moléculas de proteínas pueden adoptar varias formas, pero los mecanismos que hacen que una proteína cambie de una forma a otra siguen siendo un tanto misteriosos. La función de una molécula de proteína se define por su forma, y obtener una mejor comprensión de los mecanismos que influyen en la forma/estructura de una proteína podría permitir a los científicos diseñar terapias farmacológicas dirigidas y determinar la causa de las enfermedades.
Las moléculas biológicas no son estacionarias, se mueven constantemente en respuesta a eventos en su entorno. Las presiones ambientales pueden hacer que las moléculas cambien a diferentes formas, a menudo de forma bastante repentina. Una molécula puede replegarse repentinamente en una estructura completamente diferente, en un proceso que es muy similar al desenrollado de un resorte. Diferentes porciones de la molécula se despliegan y se pliegan, y los investigadores estudiaron las etapas intermedias entre las diferentes formas moleculares.
Según Phys.org, Pratyush Tiwary fue el autor principal del artículo y profesor asistente en el Departamento de Química y Bioquímica y en el Instituto de Ciencia y Tecnología Físicas de Maryland. Según Tiwary, el procesamiento del lenguaje natural se puede utilizar para modelar cómo se transforman y adaptan las moléculas. Tiwary señala que las moléculas tienen un cierto “lenguaje” que hablan, y los movimientos que realizan las moléculas pueden traducirse a un lenguaje abstracto. Cuando se lleva a cabo este proceso de mapear el movimiento de las moléculas con los patrones del lenguaje, se pueden utilizar técnicas de procesamiento del lenguaje natural y algoritmos de inteligencia artificial para “generar historias biológicamente veraces a partir de las palabras abstractas resultantes”.
Cuando una molécula pasa de una forma a otra, la transición ocurre extremadamente rápido. La transición solo puede durar una billonésima de segundo. La gran velocidad de la transición dificulta que los científicos determinen qué parámetros afectan el proceso de desarrollo utilizando métodos como la espectroscopia o incluso microscopios de alta potencia. Para determinar qué parámetros afectan el desarrollo de las proteínas, Tiwary y el resto del equipo de investigación crearon modelos físicos que simulaban proteínas. Se utilizaron modelos estadísticos complejos para crear simulaciones de proteínas que emulaban la forma, la trayectoria y el movimiento de las moléculas. Luego, los modelos se entregaron a un algoritmo de aprendizaje automático basado en métodos de procesamiento de lenguaje natural.
Los modelos de procesamiento de lenguaje natural utilizados para entrenar el sistema de aprendizaje automático eran muy parecidos a los algoritmos utilizados en los sistemas de texto predictivo que emplea Gmail. Las proteínas simuladas fueron tratadas como un lenguaje donde los movimientos de las moléculas se traducían a “letras”. Luego, las letras se unían para formar palabras y oraciones. Los algoritmos de aprendizaje automático pudieron aprender las reglas gramaticales y sintácticas detrás de las estructuras de proteínas, determinando qué formas/movimientos siguieron a otras formas/movimientos. Luego, los algoritmos podrían usarse para predecir cómo se desenredarían ciertas proteínas y qué formas tomarían.
Los investigadores utilizaron un memoria a largo plazo (LSTM) red para analizar las oraciones basadas en proteínas. El equipo de investigación también realizó un seguimiento de las matemáticas en las que se basaba la red, monitoreando los parámetros a medida que la red aprendía la dinámica de la transformación molecular. Según los resultados del estudio, la red utilizó una lógica similar a un concepto de física estática conocido como entropía de trayectoria. Si este hallazgo se mantiene constante, podría generar mejoras en las redes LSTM. Tiwary explicó que el descubrimiento elimina parte de la naturaleza de caja negra de un LSTM, lo que permite a los investigadores comprender mejor qué parámetros se pueden ajustar para un rendimiento óptimo.
Como caso de prueba para su algoritmo, los investigadores analizaron una biomolécula llamada riboswitch. Riboswitch ya se había analizado mediante espectroscopia, y cuando se analizó riboswitch con el sistema de aprendizaje automático, las formas predichas de riboswitch coincidieron con las descubiertas por espectroscopia.
Tiwary espera que sus hallazgos permitan a los investigadores desarrollar medicamentos dirigidos que tengan menos efectos secundarios. Como explicó Tiwary a través de Phys.org:
“Quieres tener drogas potentes que se unan muy fuertemente, pero solo a lo que quieres que se unan. Podemos lograr eso si podemos entender las diferentes formas que puede tomar una determinada biomolécula de interés, porque podemos hacer medicamentos que se unan solo a una de esas formas específicas en el momento apropiado y solo durante el tiempo que queramos”.