Connect with us

La IA acaba de simular 500 millones de años de evolución – Y creó una nueva proteína

Inteligencia artificial

La IA acaba de simular 500 millones de años de evolución – Y creó una nueva proteína

mm

La evolución ha estado perfeccionando la vida a nivel molecular durante miles de millones de años. Las proteínas, los bloques de construcción fundamentales de la vida, han evolucionado a través de este proceso para realizar diversas funciones biológicas, desde luchar contra infecciones hasta digerir alimentos. Estas moléculas complejas están compuestas por largas cadenas de aminoácidos dispuestas en secuencias precisas que dictan su estructura y función. Si bien la naturaleza ha producido una diversidad extraordinaria de proteínas, entender su estructura y diseñar proteínas completamente nuevas ha sido un desafío complejo para los científicos.

Los avances recientes en inteligencia artificial están transformando nuestra capacidad para abordar algunos de los desafíos más significativos de la biología. Anteriormente, la IA se utilizaba para predecir cómo una secuencia de proteínas determinada se plegaría y se comportaría – un desafío complejo debido al vasto número de configuraciones. Recientemente, la IA ha avanzado para generar proteínas completamente nuevas a una escala sin precedentes. Este hito se ha logrado con ESM3, un modelo de lenguaje generativo multimodal diseñado por EvolutionaryScale. A diferencia de los sistemas de IA convencionales diseñados para el procesamiento de texto, ESM3 ha sido entrenado para comprender secuencias de proteínas, estructuras y funciones. Lo que lo hace verdaderamente notable es su capacidad para simular 500 millones de años de evolución – un logro que ha llevado a la creación de una proteína fluorescente completamente nueva, algo que nunca antes se ha visto en la naturaleza.

Este avance es un paso significativo hacia hacer que la biología sea más programable, abriendo nuevas posibilidades para diseñar proteínas personalizadas con aplicaciones en medicina, ciencia de materiales y más allá. En este artículo, exploramos cómo funciona ESM3, qué ha logrado y por qué este avance está redefiniendo nuestra comprensión de la biología y la evolución.

Conoce a ESM3: La IA que simula la evolución

ESM3 es un modelo de lenguaje multimodal entrenado para comprender y generar proteínas analizando sus secuencias, estructuras y funciones. A diferencia de AlphaFold, que puede predecir la estructura de proteínas existentes, ESM3 es esencialmente un modelo de ingeniería de proteínas, que permite a los investigadores especificar requisitos funcionales y estructurales para diseñar proteínas completamente nuevas.

El modelo posee un conocimiento profundo de secuencias de proteínas, estructuras y funciones, junto con la capacidad de generar proteínas a través de una interacción con los usuarios. Esta capacidad permite al modelo generar proteínas que pueden no existir en la naturaleza pero que siguen siendo biológicamente viables. La creación de una proteína fluorescente verde novel (esmGFP) es una demostración impresionante de esta capacidad. Las proteínas fluorescentes, inicialmente descubiertas en medusas y corales, se utilizan ampliamente en investigación médica y biotecnología. Para desarrollar esmGFP, los investigadores proporcionaron a ESM3 con características estructurales y funcionales clave de proteínas fluorescentes conocidas. El modelo luego refinó iterativamente el diseño, aplicando un enfoque de cadena de pensamiento para optimizar la secuencia. Mientras que la evolución natural podría tomar millones de años para producir una proteína similar, ESM3 acelera este proceso para lograrlo en días o semanas.

El proceso de diseño de proteínas impulsado por IA

Aquí está cómo los investigadores han utilizado ESM3 para desarrollar esmGFP:

  1. Activar la IA – Inicialmente, ingresaron secuencias y pistas estructurales para guiar a ESM3 hacia características relacionadas con la fluorescencia.
  2. Generar proteínas novelas – ESM3 exploró un vasto espacio de secuencias potenciales para producir miles de proteínas candidatas.
  3. Filtrado y refinamiento – Los diseños más prometedores se filtraron y sintetizaron para pruebas de laboratorio.
  4. Validación en células vivas – Las proteínas diseñadas por IA seleccionadas se expresaron en bacterias para confirmar su fluorescencia y funcionalidad.

Este proceso ha dado como resultado una proteína fluorescente (esmGFP) sin precedentes.

Cómo esmGFP se compara con proteínas naturales

Lo que hace que esmGFP sea extraordinario es lo distante que está de las proteínas fluorescentes conocidas. Mientras que la mayoría de las proteínas GFP recién descubiertas tienen variaciones ligeras de las existentes, esmGFP tiene una identidad de secuencia del 58% con su pariente natural más cercano. Evolutivamente, tal diferencia corresponde a un tiempo de divergencia de más de 500 millones de años.

Para poner esto en perspectiva, la última vez que surgieron proteínas con distancias evolutivas similares, los dinosaurios aún no habían aparecido y la vida multicelular aún estaba en sus primeras etapas. Esto significa que la IA no solo ha acelerado la evolución – ha simulado una ruta evolutiva completamente nueva, produciendo proteínas que la naturaleza podría nunca haber creado.

Por qué este descubrimiento es importante

Este desarrollo es un paso significativo hacia adelante en la ingeniería de proteínas y profundiza nuestra comprensión de la evolución. Al simular millones de años de evolución en solo días, la IA está abriendo puertas a posibilidades emocionantes:

  • Descubrimiento de fármacos más rápido: Muchos medicamentos funcionan al dirigirse a proteínas específicas, pero encontrar las correctas es lento y costoso. Las proteínas diseñadas por IA podrían acelerar este proceso, ayudando a los investigadores a descubrir nuevos tratamientos de manera más eficiente.
  • Nuevas soluciones en bioingeniería: Las proteínas se utilizan en todo, desde descomponer desechos plásticos hasta detectar enfermedades. Con el diseño impulsado por IA, los científicos pueden crear proteínas personalizadas para la atención médica, la protección ambiental e incluso nuevos materiales.
  • IA como simulador de evolución: Uno de los aspectos más intrigantes de esta investigación es que posiciona a la IA como un simulador de evolución en lugar de solo una herramienta de análisis. Las simulaciones evolutivas tradicionales involucran iterar a través de mutaciones genéticas, a menudo tomando meses o años para generar candidatos viables. ESM3, sin embargo, evita estas restricciones lentas prediciendo proteínas funcionales directamente. Este cambio de enfoque significa que la IA podría no solo imitar la evolución sino explorar activamente posibilidades evolutivas más allá de la naturaleza. Dado suficiente poder computacional, la evolución impulsada por IA podría descubrir nuevas propiedades bioquímicas que nunca han existido en el mundo natural.

Consideraciones éticas y desarrollo de IA responsable

Si bien los beneficios potenciales de la ingeniería de proteínas impulsada por IA son inmensos, esta tecnología también plantea preguntas éticas y de seguridad. ¿Qué sucede cuando la IA comienza a diseñar proteínas más allá de la comprensión humana? ¿Cómo podemos asegurarnos de que estas proteínas sean seguras para su uso médico o ambiental?

Debemos centrarnos en el desarrollo de IA responsable y en pruebas exhaustivas para abordar estas preocupaciones. Las proteínas generadas por IA, como esmGFP, deben someterse a pruebas de laboratorio exhaustivas antes de considerarlas para aplicaciones en el mundo real. Además, se están desarrollando marcos éticos para la biología impulsada por IA para garantizar la transparencia, la seguridad y la confianza pública.

En resumen

El lanzamiento de ESM3 es un desarrollo vital en el campo de la biotecnología. ESM3 demuestra que la evolución no debería ser un proceso lento y de prueba y error. Comprimir 500 millones de años de evolución de proteínas en solo días abre un futuro en el que los científicos pueden diseñar proteínas completamente nuevas con una velocidad y precisión increíbles. El desarrollo de ESM3 significa que podemos no solo utilizar la IA para comprender la biología sino también para remodelarla. Este avance nos ayuda a avanzar en nuestra capacidad para programar la biología de la misma manera que programamos software, desbloqueando posibilidades que apenas estamos comenzando a imaginar.

El Dr. Tehseen Zia es un profesor asociado titular en la Universidad COMSATS de Islamabad, con un doctorado en Inteligencia Artificial de la Universidad Técnica de Viena, Austria. Especializado en Inteligencia Artificial, Aprendizaje Automático, Ciencia de Datos y Visión por Computadora, ha hecho contribuciones significativas con publicaciones en revistas científicas reputadas. El Dr. Tehseen también ha liderado varios proyectos industriales como investigador principal y ha servido como consultor de Inteligencia Artificial.