Inteligencia artificial

Evogene y Google Cloud presentan un modelo de base de diseño de moléculas generativas, pionero en una nueva era de inteligencia artificial en ciencias de la vida

mm

Evogene Ltd. ha presentado un modelo de base de inteligencia artificial generativa de primera clase para el diseño de moléculas pequeñas, lo que supone un avance en la forma en que se descubren nuevos compuestos. Anunciado el 10 de junio de 2025, en colaboración con Google Cloud, el modelo amplía la plataforma ChemPass AI de Evogene y aborda un desafío de larga data en ambos campos de los fármacos y la agricultura: encontrar moléculas nuevas que cumplan múltiples criterios complejos al mismo tiempo. Este desarrollo está en condiciones de acelerar la investigación y el desarrollo en el descubrimiento de fármacos y la protección de cultivos, permitiendo la optimización simultánea de propiedades como la eficacia, la toxicidad y la estabilidad en un solo ciclo de diseño.

De la selección secuencial al diseño simultáneo

En la investigación tradicional de fármacos y productos químicos agrícolas, los científicos suelen probar un factor a la vez, primero comprobando si un compuesto funciona y luego probando su seguridad y estabilidad. Este método paso a paso es lento, costoso y a menudo termina en fracaso, con muchos compuestos prometedores que no cumplen con los requisitos en etapas posteriores. También mantiene a los investigadores centrados en estructuras químicas conocidas, limitando la innovación y dificultando la creación de nuevos productos patentables. Este enfoque obsoleto contribuye a los altos costos, los plazos largos y una tasa de éxito baja, alrededor del 90% de los candidatos a fármacos fallan antes de llegar al mercado.

La inteligencia artificial generativa cambia este paradigma. En lugar de un filtro uno a uno, los modelos de inteligencia artificial pueden manejar múltiples requisitos al mismo tiempo, diseñando moléculas para que sean potentes y seguras y estables desde el principio. El nuevo modelo de base de Evogene se construyó explícitamente para permitir este diseño multi-parámetro simultáneo. Este enfoque tiene como objetivo reducir los riesgos en fases posteriores del desarrollo al incorporar consideraciones como el ADME y la toxicidad en el diseño inicial.

En la práctica, podría significar menos fracasos en etapas tardías, por ejemplo, menos candidatos a fármacos que muestran excelentes resultados de laboratorio solo para fallar en ensayos clínicos debido a efectos secundarios. En resumen, la inteligencia artificial generativa permite a los investigadores innovar más rápido y de manera más inteligente, optimizando simultáneamente los muchos aspectos de una molécula exitosa en lugar de abordar cada uno de manera aislada.

Dentro de ChemPass AI: Cómo los modelos generativos diseñan moléculas

En el corazón de la plataforma ChemPass AI de Evogene se encuentra un poderoso nuevo modelo de base entrenado en un enorme conjunto de datos químicos. La empresa reunió una base de datos curada de aproximadamente 40 mil millones de estructuras moleculares – que abarca compuestos conocidos y diversidad de esqueletos químicos – para enseñarle a la inteligencia artificial el “lenguaje” de las moléculas. Utilizando la infraestructura Vertex AI de Google Cloud con supercomputación GPU, el modelo aprendió patrones de esta vasta biblioteca química, dándole un conocimiento sin precedentes sobre cómo se ven las moléculas similares a los fármacos. Este régimen de entrenamiento masivo es similar al de un modelo de lenguaje grande, pero en lugar de lenguaje humano, la inteligencia artificial aprendió representaciones químicas.

El modelo generativo de Evogene se basa en la arquitectura de red neural transformer, similar a los modelos GPT que revolucionaron el procesamiento del lenguaje natural. De hecho, el sistema se refiere a ChemPass-GPT, un modelo de inteligencia artificial propietario entrenado en cadenas SMILES (una codificación de texto de estructuras moleculares). En términos simples, ChemPass-GPT trata a las moléculas como oraciones, cada cadena SMILES de una molécula es una secuencia de caracteres que describe sus átomos y enlaces. El modelo transformer ha aprendido la gramática de este lenguaje químico, permitiéndole “escribir” nuevas moléculas prediciendo un carácter a la vez, de la misma manera que GPT puede escribir oraciones letra por letra. Debido a que se entrenó con miles de millones de ejemplos, el modelo puede generar nuevas cadenas SMILES que corresponden a estructuras químicas válidas y similares a los fármacos.

Este enfoque generativo basado en secuencia aprovecha la fuerza de los transformadores para capturar patrones complejos. Al entrenar en un conjunto de datos tan grande y químicamente diverso, ChemPass AI supera los problemas que enfrentaron los modelos de inteligencia artificial anteriores, como el sesgo de pequeños conjuntos de datos o la generación de moléculas redundantes o inválidas. El rendimiento del modelo de base ya supera con creces a un modelo GPT genérico aplicado a la química: las pruebas internas mostraron alrededor de 90% de precisión en la producción de moléculas nuevas que cumplen con todos los criterios de diseño, en comparación con alrededor del 29% de precisión para un modelo basado en GPT tradicionalevogene.com. En términos prácticos, esto significa que casi todas las moléculas que sugiere ChemPass AI no solo son nuevas, sino que también cumplen con su perfil de destino, una mejora notable en comparación con las técnicas generativas básicas.

Si bien el motor generativo principal de Evogene utiliza un transformer en cadenas SMILES lineales, vale la pena destacar que la caja de herramientas de inteligencia artificial más amplia incluye otras arquitecturas como redes neuronales de grafos (GNN). Las moléculas son naturalmente grafos, con átomos como nodos y enlaces como aristas, y las GNN pueden razonar directamente sobre estas estructuras. En el diseño de fármacos moderno, las GNN se utilizan a menudo para predecir propiedades o incluso generar moléculas construyéndolas átomo por átomo. Este enfoque basado en grafos complementa los modelos de secuencia; por ejemplo, la plataforma de Evogene también incorpora herramientas como DeepDock para la criba virtual 3D, que probablemente utilicen el aprendizaje profundo para evaluar la unión de moléculas en un contexto estructural. Al combinar modelos de secuencia (grandes para la creatividad y la novedad) con modelos basados en grafos (grandes para la precisión estructural y la predicción de propiedades), ChemPass AI garantiza que los compuestos generados no solo sean nuevos en papel, sino también químicamente sólidos y efectivos en la práctica. El bucle de diseño de la inteligencia artificial podría generar estructuras de candidatos y luego evaluarlas a través de modelos predictivos, algunos posiblemente basados en GNN, para criterios como la toxicidad o la factibilidad sintética, creando un ciclo de retroalimentación que refina cada sugerencia.

Optimización multi-objetivo: Potencia, toxicidad, estabilidad todo al mismo tiempo

Una característica destacada de ChemPass AI es su capacidad integrada para la optimización multi-objetivo. El descubrimiento de fármacos clásico a menudo optimiza una propiedad a la vez, pero ChemPass se diseñó para manejar múltiples objetivos simultáneamente. Esto se logra a través de técnicas avanzadas de aprendizaje automático que guían el modelo generativo hacia la satisfacción de múltiples restricciones. En el entrenamiento, Evogene puede imponer requisitos de propiedades, como que una molécula debe activar un objetivo específico con fuerza, evitar ciertos motivos tóxicos y tener buena biodisponibilidad, y el modelo aprende a navegar el espacio químico bajo esas reglas. El sistema ChemPass-GPT incluso permite la “generación basada en restricciones”, lo que significa que se puede instruir para que solo proponga moléculas que cumplan con propiedades específicas deseables desde el principio.

¿Cómo logra la inteligencia artificial este equilibrio multi-parámetro? Un enfoque es el aprendizaje multi-tarea, donde el modelo no solo genera moléculas, sino que también predice sus propiedades utilizando predictores aprendidos, ajustando la generación en consecuencia. Otro enfoque poderoso es el aprendizaje por refuerzo (RL). En un flujo de trabajo mejorado con RL, el modelo generativo actúa como un “agente” que “juega un juego” de diseño de moléculas: propone una molécula y luego recibe una puntuación de recompensa basada en cuán bien la molécula cumple con los objetivos (potencia, falta de toxicidad, etc.). A lo largo de muchas iteraciones, el modelo ajusta su estrategia de generación para maximizar esta recompensa. Este método se ha utilizado con éxito en otros sistemas de diseño de fármacos impulsados por inteligencia artificial, los investigadores han demostrado que los algoritmos de aprendizaje por refuerzo pueden guiar a los modelos generativos para producir moléculas con propiedades deseables. En esencia, la inteligencia artificial se puede entrenar con una función de recompensa que encapsula múltiples objetivos, por ejemplo, dando puntos por eficacia predictiva y restando puntos por toxicidad predictiva. El modelo entonces optimiza sus “movimientos” (agregar o eliminar átomos, alterar grupos funcionales) para obtener la puntuación más alta, efectivamente aprendiendo los compromisos necesarios para satisfacer todos los criterios.

Evogene no ha revelado la receta propietaria exacta detrás del motor multi-objetivo de ChemPass AI, pero está claro a partir de sus resultados que tales estrategias están en juego. El hecho de que cada compuesto generado “cumpla simultáneamente con parámetros esenciales” como la eficacia, la sintetizabilidad y la seguridad. La próxima versión 2.0 de ChemPass AI se desarrollará para permitir un ajuste multi-parámetro aún más flexible, incluyendo criterios definidos por el usuario adaptados a áreas terapéuticas o requisitos de cultivos específicos. Esto sugiere que el modelo de próxima generación podría permitir a los investigadores ajustar la importancia de ciertos factores (por ejemplo, priorizar la penetración en el cerebro para un fármaco para la neurología o la biodegradabilidad ambiental para un pesticida) y la inteligencia artificial ajustaría su estrategia de diseño en consecuencia. Al integrar capacidades multi-objetivo, ChemPass AI puede diseñar moléculas que alcanzan el punto dulce en múltiples métricas de rendimiento al mismo tiempo, una hazaña prácticamente imposible con métodos tradicionales.

Un salto más allá de los métodos de I+D tradicionales

El surgimiento del modelo generativo de ChemPass AI destaca un cambio más amplio en la investigación y el desarrollo de ciencias de la vida: el paso de flujos de trabajo de prueba y error laboriosos a creatividad y precisión mejoradas con inteligencia artificial. A diferencia de los químicos humanos, que tienden a aferrarse a series químicas conocidas e iterar lentamente, una inteligencia artificial puede abarcar miles de millones de posibilidades y aventurarse en el 99,9% no explorado del espacio químico. Esto abre la puerta a encontrar compuestos eficaces que no se parezcan a nada que hayamos visto antes, crucial para tratar enfermedades con química novedosa o abordar plagas y patógenos que han desarrollado resistencia a moléculas existentes. Además, al considerar la patentabilidad desde el principio, la inteligencia artificial generativa ayuda a evitar áreas de propiedad intelectual congestionadas. Evogene apunta explícitamente a producir moléculas que creen una nueva propiedad intelectual, una ventaja competitiva importante.

Los beneficios sobre los enfoques tradicionales se pueden resumir de la siguiente manera:

  • Optimización multi-característica paralela: La inteligencia artificial evalúa muchos parámetros en paralelo, diseñando moléculas que satisfacen la potencia, la seguridad y otros criterios. Las tuberías tradicionales, en cambio, a menudo solo descubren un problema de toxicidad después de años de trabajo en un fármaco prometedor. Al filtrar previamente estos problemas, los candidatos diseñados por la inteligencia artificial tienen una mejor oportunidad de éxito en ensayos costosos posteriores.

  • Ampliación de la diversidad química: Los modelos generativos no se limitan a bibliotecas de compuestos existentes. ChemPass AI puede crear estructuras que nunca se han hecho antes, pero que se predice que serán efectivas. Esta generación impulsada por la novedad evita reinventar la rueda (o la molécula) y ayuda a crear productos diferenciados con nuevos modos de acción. Los métodos tradicionales a menudo conducen a compuestos “me-too” que ofrecen poca novedad.

  • Velocidad y escala: Lo que un equipo de químicos podría lograr a través de síntesis y pruebas en un año, una inteligencia artificial puede simular en días. La plataforma de aprendizaje profundo de ChemPass AI puede cribar virtualmente decenas de miles de millones de compuestos rápidamente y generar cientos de ideas nuevas en una sola ejecución. Esto comprime dramáticamente el cronograma de descubrimiento, centrándose en experimentos de laboratorio húmedo solo en los candidatos más prometedores identificados in silico.

  • Conocimiento integrado: Los modelos de inteligencia artificial como ChemPass incorporan vastas cantidades de conocimiento químico y biológico (por ejemplo, relaciones conocidas de estructura-actividad, alertas de toxicidad, reglas de propiedades de fármacos) en su entrenamiento. Esto significa que cada diseño de molécula se beneficia de una amplitud de datos previos que ningún experto humano podría retener en su cabeza. El diseño tradicional se basa en la experiencia de los químicos medicinales, valiosa pero limitada a la memoria y el sesgo humanos, mientras que la inteligencia artificial puede capturar patrones a través de millones de experimentos y diversas familias químicas.

En términos prácticos, para la industria farmacéutica esto podría llevar a tasas de éxito más altas en ensayos clínicos y reducir los costos de desarrollo, ya que se desperdician menos recursos en compuestos condenados. En la agricultura, significa una creación más rápida de soluciones de protección de cultivos más seguras y sostenibles, por ejemplo, un herbicida que es letal para las malezas pero benigno para organismos no objetivo y se descompone de manera inofensiva en el medio ambiente. Al optimizar la eficacia y la seguridad ambiental juntas, la inteligencia artificial puede ayudar a entregar “efectivos, sostenibles y propietarios” productos químicos para la agricultura, abordando desafíos regulatorios y de resistencia de una sola vez.

Parte de una caja de herramientas de inteligencia artificial más amplia en Evogene

Mientras que ChemPass AI roba el protagonismo para el diseño de moléculas pequeñas, es parte de los tres “motores de tecnología” impulsados por inteligencia artificial de Evogene, adaptados a diferentes dominios. La empresa tiene MicroBoost AI centrado en microbios, ChemPass AI en química y GeneRator AI en elementos genéticos. Cada motor aplica análisis de grandes datos y aprendizaje automático a su campo respectivo.

Esta ecología integrada de motores de inteligencia artificial subraya la estrategia de Evogene como una empresa de ciencias de la vida “primero en inteligencia artificial”. Apuntan a revolucionar el descubrimiento de productos en todo el tablero, ya sea formulando un fármaco, un bioestimulante o un cultivo resistente a la sequía, aprovechando la computación para navegar la complejidad biológica. Los motores comparten una filosofía común: utilizar el aprendizaje automático de vanguardia para aumentar la probabilidad de éxito en la investigación y el desarrollo y reducir el tiempo y el costo.

Perspectiva: El descubrimiento impulsado por inteligencia artificial madura

La inteligencia artificial generativa está transformando el descubrimiento de moléculas, cambiando el papel de la inteligencia artificial de asistente a colaborador creativo. En lugar de probar una idea a la vez, los científicos pueden usar la inteligencia artificial para diseñar moléculas completamente nuevas que cumplan con múltiples objetivos, potencia, seguridad, estabilidad y más, en un solo paso.

Este futuro ya se está desarrollando. Un equipo farmacéutico podría solicitar una molécula que apunte a una proteína específica, evite el cerebro y sea oralmente disponible, la inteligencia artificial puede entregar candidatos a pedido. En la agricultura, los investigadores podrían generar controles de plagas ecológicos adaptados a restricciones regulatorias y ambientales.

El modelo de base reciente de Evogene, desarrollado con Google Cloud, es un ejemplo de este cambio. Permite el diseño multi-parámetro y abre nuevas áreas del espacio químico. A medida que las versiones futuras permiten una personalización aún mayor, estos modelos se convertirán en herramientas esenciales en todo el ámbito de las ciencias de la vida.

Crucialmente, el impacto depende de la validación en el mundo real. A medida que las moléculas generadas por la inteligencia artificial se prueban y se refinan, los modelos mejoran, creando un poderoso bucle de retroalimentación entre la computación y el experimento.

Este enfoque generativo no se limita a fármacos o pesticidas. Pronto podría impulsar avances en materiales, alimentos y sostenibilidad, ofreciendo un descubrimiento más rápido y más inteligente en industrias que antes estaban limitadas por la prueba y el error.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.