talón DeepMind está listo para transformar las ciencias biológicas al resolver el problema del plegamiento de proteínas - Unite.AI
Contáctanos

Inteligencia artificial

DeepMind está preparado para transformar las ciencias biológicas al resolver el problema del plegamiento de proteínas

mm
Actualizado on

La división de inteligencia artificial de Google, DeepMind, recientemente hecho un progreso significativo hacia la solución de uno de los desafíos más antiguos de la biología, calculando la forma de una proteína a partir de una secuencia de aminoácidos. Según Nature, el avance tiene el potencial de transformar los campos de la biología y la química, permitiendo a los científicos determinar la función de muchas proteínas que actualmente son misteriosas.

La forma de una proteína define su función, y la mayoría de las funciones biológicas dependen de las proteínas. “plegamiento de proteínas” es el nombre que se le da al proceso que convierte las cadenas de aminoácidos en las estructuras tridimensionales que requieren las prociones para llevar a cabo sus funciones. Si los científicos pueden determinar la relación entre las secuencias de aminoácidos y la forma de las proteínas que generan, pueden determinar qué proteínas impactan en diferentes procesos biológicos.

Los científicos plantean la hipótesis de que hay al menos 80,000 XNUMX proteínas dentro del proteoma humano, pero solo una pequeña fracción de estas proteínas tiene estructuras conocidas. El método tradicional para determinar la forma de una proteína puede llevar años de experimentos de laboratorio, incluso aprovechando el poder de los algoritmos y modelos informáticos. El trabajo realizado por DeepMind puede acelerar drásticamente el proceso de descubrimiento de estructuras de proteínas, determinando de manera confiable la estructura de las proteínas en una fracción del tiempo normal.

Los investigadores de DeepMind entrenaron sus algoritmos en una base de datos compuesta por aproximadamente 170,0000 100 secuencias de proteínas y las formas correspondientes a esas secuencias. Los algoritmos desarrollados por los investigadores se entrenaron en entre 200 y XNUMX GPU, y el proceso de entrenamiento tardó algunas semanas en completarse. El modelo desarrollado por los investigadores se denominó "AlphaFold".

AlphaFold opera a través de un "algoritmo de tensión", comenzando por conectar pequeñas piezas de la proteína y luego aumentando para conectar secciones cada vez más grandes. Al principio, se unieron pequeños grupos de aminoácidos, y luego el algoritmo buscó formas de vincular estos grupos.

Los investigadores de AlphaFold inicialmente intentaron utilizar algoritmos convencionales de aprendizaje profundo sobre datos genéticos y estructurales para predecir la relación entre los aminoácidos y las proteínas. AlphaFold luego creó modelos de consenso para el estilo de las proteínas. Cuando esta técnica demostró tener demasiadas limitaciones, los investigadores probaron una nueva estrategia. El equipo de investigación de AlphaFold creó modelos entrenados en más características y, esta vez, el modelo devolvió predicciones para la estructura final de las secuencias de proteínas.

El equipo de ingeniería probó AlphaFold al participar en una competencia en la que los algoritmos informáticos compiten para evaluar la estructura de una proteína a partir de secuencias de aminoácidos. La competencia fue la "Evaluación crítica de la predicción de la estructura de proteínas" o CASP. Los participantes en la competencia reciben 100 secuencias de aminoácidos y sus modelos deben resolver la estructura de las proteínas. AlphaFold no solo superó a los otros modelos de computadora en términos de precisión, sino que también se desempeñó de manera comparable a las técnicas de modelado tradicionales basadas en laboratorio. La puntuación media final de AlphaFold fue de aproximadamente 92 sobre 100, y a los métodos experimentales de laboratorio se les asignó una puntuación de 90. La puntuación media de AlphaFold cayó al 87 por ciento en las proteínas más difíciles.

Según el director ejecutivo y cofundador de DeepMind, Demis Hassabis, la compañía ya está haciendo planes para brindarles a los investigadores acceso a AlphaFold, y los científicos del Instituto Max Planck de Biología del Desarrollo ya utilizan el modelo para descubrir estructuras de proteínas en las que han estado trabajando durante más de una década.

Janet Thornton, directora emérita del Instituto Europeo de Bioinformática, fue citado a través de ScienceMag diciendo que los logros de DeepMind "cambiarán el futuro de la biología estructural y la investigación de proteínas". Mientras tanto, el biólogo de la Universidad de Maryland, Shady Grove, Juan Moult dice que nunca pensó que el problema del plegamiento de proteínas nunca se resolvería en esta vida.

Si bien es muy poco probable que AlphaFold reemplace por completo los métodos experimentales tradicionales para descubrir estructuras de proteínas, podría aumentar drásticamente la velocidad a la que se descubren las estructuras de proteínas. Los investigadores pueden necesitar menos datos experimentales de alta calidad para determinar la estructura de una proteína, y los investigadores ya tienen acceso a un gran volumen de datos genómicos que podrían traducirse en estructuras utilizando las soluciones de AlphaFold.