Connect with us

Investigador Utiliza Algoritmos de Procesamiento de Lenguaje Natural Para Entender La Transformación de Proteínas

Inteligencia artificial

Investigador Utiliza Algoritmos de Procesamiento de Lenguaje Natural Para Entender La Transformación de Proteínas

mm

Investigadores de la Universidad de Maryland aplicaron recientemente técnicas de procesamiento de lenguaje natural y algoritmos de aprendizaje automático para obtener información sobre cómo las moléculas de proteínas cambian de una forma a otra. El reciente artículo, publicado en la revista Nature Communications, es la primera vez que se ha utilizado un algoritmo de inteligencia artificial para estudiar la dinámica de sistemas biomoleculares con respecto a la transformación de proteínas.

Las moléculas de proteínas pueden adoptar varias formas, pero los mecanismos que hacen que una proteína cambie de una forma a otra aún son algo misteriosos. La función de una molécula de proteína está definida por su forma, y obtener una mejor comprensión de los mecanismos que influyen en la forma/estructura de una proteína podría permitir a los científicos diseñar terapias de medicamentos dirigidos y determinar la causa de enfermedades.

Las moléculas biológicas no están estacionarias, están en constante movimiento en respuesta a eventos en su entorno. Las presiones ambientales pueden hacer que las moléculas cambien a diferentes formas, a menudo muy repentinamente. Una molécula puede refoldarse en una estructura completamente diferente, en un proceso que es muy similar al desenrollado de un resorte. Diferentes porciones de la molécula se despliegan y se pliegan, y los investigadores estudiaron las etapas intermedias entre las diferentes formas moleculares.

Según Phys.org, Pratyush Tiwary fue el autor principal del artículo y es profesor asistente en el Departamento de Química y Bioquímica y en el Instituto de Ciencia y Tecnología Física de Maryland. Según Tiwary, el procesamiento de lenguaje natural se puede utilizar para modelar cómo las moléculas se transforman y adaptan. Tiwary señala que las moléculas tienen un lenguaje “certain” que hablan, con los movimientos que hacen las moléculas capaces de ser traducidos a un lenguaje abstracto. Cuando se lleva a cabo este proceso de mapeo del movimiento de la molécula a patrones de lenguaje, las técnicas de procesamiento de lenguaje natural y los algoritmos de inteligencia artificial se pueden utilizar para “generar historias biológicamente verdaderas a partir de las palabras abstractas resultantes”.

Cuando una molécula cambia de una forma a otra forma, la transición ocurre extremadamente rápido. La transición puede durar solo una fracción de trillón de segundo. La velocidad extrema de la transición hace que sea difícil para los científicos determinar qué parámetros impactan el proceso de despliegue utilizando métodos como la espectroscopía o incluso microscopios de alta potencia. Para determinar qué parámetros impactan el despliegue de las proteínas, Tiwary y el resto del equipo de investigación crearon modelos de física que simularon proteínas. Se utilizaron modelos estadísticos complejos para crear simulaciones de proteínas que emulaban la forma, la trayectoria y el movimiento de las moléculas. Los modelos se dieron a un algoritmo de aprendizaje automático basado en métodos de procesamiento de lenguaje natural.

Los modelos de procesamiento de lenguaje natural utilizados para entrenar el sistema de aprendizaje automático fueron muy similares a los algoritmos utilizados en los sistemas de texto predictivo de Gmail. Las proteínas simuladas se trataron como un lenguaje donde los movimientos de las moléculas se tradujeron a “letras”. Las letras se vincularon entre sí para formar palabras y oraciones. Los algoritmos de aprendizaje automático pudieron aprender las reglas gramaticales y sintácticas detrás de las estructuras de proteínas, determinando qué formas/movimientos seguían a otras formas/movimientos. Los algoritmos podrían utilizarse para predecir cómo ciertas proteínas se desenredarían y qué formas adoptarían.

Los investigadores utilizaron una red de memoria a corto y largo plazo (LSTM) para analizar las oraciones basadas en proteínas. El equipo de investigación también mantuvo un registro de las matemáticas en las que se basaba la red, monitoreando los parámetros a medida que la red aprendía la dinámica de la transformación molecular. Según los resultados del estudio, la red utilizó una lógica similar a un concepto de física estadística conocido como entropía de camino. Si este hallazgo se mantiene constante, podría potencialmente conducir a mejoras en las redes LSTM. Tiwary explicó que el descubrimiento elimina parte de la naturaleza de caja negra de una LSTM, lo que permite a los investigadores comprender mejor qué parámetros se pueden ajustar para un rendimiento óptimo.

Como caso de prueba para su algoritmo, los investigadores analizaron una biomolécula llamada riboswitch. Riboswitch ya había sido analizada utilizando espectroscopía, y cuando riboswitch se analizó con el sistema de aprendizaje automático, las formas de riboswitch predichas coincidieron con las descubiertas por espectroscopía.

Tiwary espera que sus hallazgos permitan a los investigadores desarrollar medicamentos dirigidos que tengan menos efectos secundarios. Como explicó Tiwary a través de Phys.org:

“Quieres tener medicamentos potentes que se unan muy fuertemente, pero solo a lo que quieres que se unan. Podemos lograr eso si podemos entender las diferentes formas que puede adoptar una biomolécula de interés, porque podemos crear medicamentos que se unan solo a una de esas formas específicas en el momento adecuado y solo durante el tiempo que queremos”.

Bloguero y programador con especialidades en Machine Learning y Deep Learning temas. Daniel espera ayudar a otros a utilizar el poder de la IA para el bien social.