Inteligência artificial

DeepMind Preparado para Transformar as Ciências Biológicas Resolvendo o Problema de Dobramento de Proteínas

Publicado 2 de dezembro de 2020

Atualização do 9 de dezembro de 2022

Daniel Nelson

A divisão de inteligência artificial do Google, DeepMind, recentemente fez um progresso significativo para resolver um dos desafios mais antigos da biologia, calculando a forma de uma proteína a partir de uma sequência de aminoácidos. Segundo a Nature, a descoberta tem o potencial de transformar os campos da biologia e da química, permitindo aos cientistas determinar a função de muitas proteínas que atualmente são misteriosas.

A forma de uma proteína define sua função, e a maioria das funções biológicas depende de proteínas. "Dobramento de proteínas" é o nome dado ao processo que converte cadeias de aminoácidos nas estruturas tridimensionais que os protiones requerem para realizar suas funções. Se os cientistas puderem determinar a relação entre as sequências de aminoácidos e a forma das proteínas que elas geram, eles poderão determinar quais proteínas afetam diferentes processos biológicos.

Os cientistas levantam a hipótese de que existem pelo menos 80,000 proteínas dentro do proteoma humano, mas apenas uma pequena fração dessas proteínas possui estruturas conhecidas. O método tradicional de determinar a forma de uma proteína pode levar anos de experimentos de laboratório, aproveitando até mesmo o poder dos algoritmos e modelos da ciência da computação. O trabalho feito pelo DeepMind pode acelerar drasticamente o processo de descoberta de estruturas de proteínas, determinando de forma confiável a estrutura das proteínas em uma fração do tempo normal.

Os pesquisadores da DeepMind treinaram seus algoritmos em um banco de dados composto por aproximadamente 170,0000 sequências de proteínas e as formas correspondentes a essas sequências. Os algoritmos desenvolvidos pelos pesquisadores foram treinados entre 100 e 200 GPUs, e o processo de treinamento levou algumas semanas para ser concluído. O modelo desenvolvido pelos pesquisadores foi apelidado de “AlphaFold”.

O AlphaFold opera por meio de um “algoritmo de tensão”, começando conectando pequenos pedaços da proteína e depois ampliando para conectar seções cada vez maiores. Pequenos grupos de aminoácidos foram ligados primeiro e, em seguida, o algoritmo procurou encontrar maneiras de vincular esses grupos.

Os pesquisadores do AlphaFold inicialmente tentaram usar algoritmos convencionais de aprendizado profundo em dados genéticos e estruturais para prever a relação entre aminoácidos e proteínas. AlphaFold então criou modelos de consenso para o estilo das proteínas. Quando essa técnica provou ter muitas limitações, os pesquisadores tentaram uma nova estratégia. A equipe de pesquisa do AlphaFold criou modelos treinados em mais recursos e, desta vez, tiveram as previsões de retorno do modelo para a estrutura final das sequências de proteínas.

A equipe de engenharia testou o estresse do AlphaFold ao inscrevê-lo em uma competição em que algoritmos de computador competem para avaliar a estrutura de uma proteína a partir de sequências de aminoácidos. A competição foi a “Avaliação Crítica da Previsão da Estrutura de Proteínas” ou CASP. Os participantes da competição recebem 100 sequências de aminoácidos e seus modelos devem elaborar a estrutura das proteínas. O AlphaFold não apenas superou os outros modelos de computador em termos de precisão, mas também teve um desempenho comparável às técnicas tradicionais de modelagem baseadas em laboratório. A pontuação média final do AlphaFold foi de aproximadamente 92 em 100, com métodos experimentais baseados em laboratório recebendo uma pontuação de 90. A pontuação média do AlphaFold caiu para 87 por cento nas proteínas mais difíceis.

De acordo com o CEO e co-fundador da DeepMind, Demis Hassabis, a empresa já está fazendo planos para dar aos pesquisadores acesso ao AlphaFold, com cientistas do Instituto Max Planck para Biologia do Desenvolvimento já utilizando o modelo para descobrir estruturas de proteínas nas quais trabalham há mais de uma década.

Janet Thornton, diretora emérita do Instituto Europeu de Bioinformática, foi citado via ScienceMag como dizendo que as conquistas da DeepMind “mudarão o futuro da biologia estrutural e da pesquisa de proteínas”. Enquanto isso, o biólogo da Universidade de Maryland, Shady Grove, John Moult diz que ele nunca pensou que o problema do dobramento de proteínas nunca seria resolvido nesta vida.

Embora seja altamente improvável que o AlphaFold substitua completamente os métodos tradicionais e experimentais de descoberta de estruturas de proteínas, ele pode aumentar drasticamente a velocidade com que as estruturas de proteínas são descobertas. Os pesquisadores podem exigir menos dados experimentais de alta qualidade para determinar a estrutura de uma proteína, e os pesquisadores já têm acesso a um grande volume de dados genômicos que podem ser traduzidos em estruturas usando as soluções da AlphaFold.

Tópicos relacionados:AlfaFold Biologia Química DeepMind dobramento de proteínas proteínas

Daniel Nelson

Blogueiro e programador com especialidades em Machine Learning e a Deep Learning tópicos. Daniel espera ajudar outras pessoas a usar o poder da IA para o bem social.

Unir-se.AI

DeepMind Preparado para Transformar as Ciências Biológicas Resolvendo o Problema de Dobramento de Proteínas

Você pode gostar