Inteligência artificial
Pesquisador Usa Algoritmos de Processamento de Linguagem Natural Para Entender Transformação de Proteínas

Pesquisadores da Universidade de Maryland aplicaram recentemente técnicas de processamento de linguagem natural e algoritmos de aprendizado de máquina para obter insights sobre como moléculas de proteínas mudam de uma forma para outra. O artigo recente, publicado na revista Nature Communications, é a primeira vez que um algoritmo de IA foi usado para estudar a dinâmica de sistemas biomoleculares com relação à transformação de proteínas.
As moléculas de proteínas podem assumir várias formas, mas os mecanismos que fazem com que uma proteína mude de uma forma para outra ainda são um pouco misteriosos. A função de uma molécula de proteína é definida por sua forma, e obter uma melhor compreensão dos mecanismos que influenciam a forma/estrutura de uma proteína pode permitir que os cientistas desenvolvam terapias de drogas direcionadas e determinem a causa de doenças.
As moléculas biológicas não estão paradas, elas estão constantemente se movendo em resposta a eventos em seu ambiente. Pressões ambientais podem fazer com que as moléculas mudem para diferentes formas, muitas vezes muito rapidamente. Uma molécula pode se refoldar em uma estrutura completamente diferente, em um processo que é muito semelhante ao desenrolar de uma mola. Diferentes partes da molécula se desdobram e se dobram, e os pesquisadores estudaram os estágios intermediários entre as diferentes formas moleculares.
De acordo com o Phys.org, Pratyush Tiwary foi o autor sênior do artigo e é professor assistente no Departamento de Química e Bioquímica e Instituto de Ciência e Tecnologia Física de Maryland. De acordo com Tiwary, o processamento de linguagem natural pode ser usado para modelar como as moléculas se transformam e se adaptam. Tiwary observa que as moléculas têm uma certa “linguagem” que elas falam, com os movimentos que as moléculas fazem capazes de ser traduzidos em uma linguagem abstrata. Quando esse processo de mapeamento do movimento da molécula para padrões de linguagem é realizado, técnicas de processamento de linguagem natural e algoritmos de IA podem ser usados para “gerar histórias biologicamente verdadeiras a partir das palavras abstratas resultantes”.
Quando uma molécula muda de uma forma para outra, a transição ocorre extremamente rápido. A transição pode levar apenas um trilhão de segundos. A velocidade da transição torna difícil para os cientistas determinar quais parâmetros afetam o processo de desdobramento usando métodos como espectroscopia ou até mesmo microscópios de alta potência. Para determinar quais parâmetros afetam o desdobramento das proteínas, Tiwary e a equipe de pesquisa criaram modelos físicos que simulam proteínas. Modelos estatísticos complexos foram usados para criar simulações de proteínas que emulam a forma, a trajetória e o movimento das moléculas. Os modelos foram então dados a um algoritmo de aprendizado de máquina baseado em métodos de processamento de linguagem natural.
Os modelos de processamento de linguagem natural usados para treinar o sistema de aprendizado de máquina foram muito semelhantes aos algoritmos usados nos sistemas de texto preditivo do Gmail. As proteínas simuladas foram tratadas como uma linguagem onde os movimentos das moléculas foram traduzidos para “letras”. As letras foram então ligadas para formar palavras e frases. Os algoritmos de aprendizado de máquina foram capazes de aprender as regras gramaticais e sintáticas por trás das estruturas de proteínas, determinando quais formas/movimentos seguiam outros. Os algoritmos podiam então ser usados para prever como certas proteínas se desenrolariam e quais formas elas assumiriam.
Os pesquisadores utilizaram uma rede de memória de longo prazo curto (LSTM) para analisar as frases baseadas em proteínas. A equipe de pesquisa também acompanhou as matemáticas em que a rede se baseava, monitorando os parâmetros à medida que a rede aprendia a dinâmica da transformação molecular. De acordo com os resultados do estudo, a rede usou lógica semelhante a um conceito físico estatístico conhecido como entropia de caminho. Se essa descoberta se mantiver constante, pode potencialmente levar a melhorias nas redes LSTM. Tiwary explicou que a descoberta remove um pouco da natureza de caixa preta de uma LSTM, permitindo que os pesquisadores entendam melhor quais parâmetros podem ser ajustados para um desempenho ótimo.
Como um caso de teste para seu algoritmo, os pesquisadores analisaram uma biomolécula chamada riboswitch. O riboswitch já havia sido analisado usando espectroscopia, e quando o riboswitch foi analisado com o sistema de aprendizado de máquina, as formas de riboswitch previstas corresponderam às descobertas por espectroscopia.
Tiwary espera que suas descobertas permitam que os pesquisadores desenvolvam drogas direcionadas que tenham menos efeitos colaterais. Como Tiwary explicou por meio do Phys.org:
“Você quer ter drogas potentes que se liguem muito fortemente, mas apenas à coisa que você quer que elas se liguem. Podemos alcançar isso se pudermos entender as diferentes formas que uma biomolécula de interesse pode assumir, porque podemos criar drogas que se liguem apenas a uma dessas formas específicas no momento apropriado e apenas por tanto tempo quanto desejamos.”












