Intelligence artificielle
Evogene et Google Cloud dévoilent un modèle de base pour la conception générative de molécules, ouvrant une nouvelle ère dans l’IA pour les sciences de la vie

Evogene Ltd. a dévoilé un modèle de base d’IA générative de première classe pour la conception de petites molécules, marquant une avancée dans la découverte de nouveaux composés. Annoncé le 10 juin 2025, en collaboration avec Google Cloud, le modèle étend la plate-forme ChemPass AI d’Evogene et résout un défi de longue date dans les domaines pharmaceutique et agricole : trouver de nouvelles molécules qui répondent à plusieurs critères complexes simultanément. Ce développement est sur le point d’accélérer la R&D dans la découverte de médicaments et la protection des cultures en permettant l’optimisation simultanée de propriétés telles que l’efficacité, la toxicité et la stabilité dans un seul cycle de conception.
De la sélection séquentielle à la conception simultanée
Dans la recherche traditionnelle sur les médicaments et les produits chimiques agricoles, les scientifiques testent généralement un facteur à la fois – d’abord en vérifiant si un composé fonctionne, puis en testant plus tard sa sécurité et sa stabilité. Cette méthode étape par étape est lente, coûteuse et se termine souvent par un échec, de nombreux composés prometteurs ne répondant pas aux attentes dans les étapes ultérieures. Elle maintient également les chercheurs concentrés sur des structures chimiques familières, limitant l’innovation et rendant plus difficile la création de nouveaux produits brevetables. Cette approche obsolète contribue à des coûts élevés, à des délais longs et à un faible taux de réussite – environ 90% des candidats-médicaments échouent avant d’arriver sur le marché.
L’IA générative change ce paradigme. Au lieu d’un filtrage un par un, les modèles d’IA peuvent gérer plusieurs exigences à la fois, concevant des molécules pour être puissantes et sûres et stables dès le départ. Le nouveau modèle de base d’Evogene a été explicitement conçu pour permettre cette conception multi-paramètres simultanée. Cette approche vise à réduire les risques dans les phases ultérieures du développement en intégrant des considérations telles que l’ADME et la toxicité dans la conception initiale.
Dans la pratique, cela pourrait signifier moins d’échecs en fin de parcours – par exemple, moins de candidats-médicaments qui montrent de bons résultats en laboratoire mais échouent dans les essais cliniques en raison d’effets secondaires. En résumé, l’IA générative permet aux chercheurs d’innover plus rapidement et plus intelligemment, en optimisant simultanément les nombreux aspects d’une molécule réussie plutôt que de les traiter isolément.
À l’intérieur de ChemPass AI : Comment les modèles génératifs conçoivent des molécules
Au cœur de la plate-forme ChemPass AI d’Evogene se trouve un puissant nouveau modèle de base formé sur un énorme ensemble de données chimiques. La société a assemblé une base de données curatoriale d’environ 40 milliards de structures moléculaires – englobant des composés médicamenteux connus et des échafaudages chimiques divers – pour enseigner à l’IA le “langage” des molécules. En utilisant l’infrastructure Vertex AI de Google Cloud avec un supercalculateur GPU, le modèle a appris des modèles à partir de cette vaste bibliothèque chimique, lui donnant une connaissance sans précédent sur ce que ressemblent les molécules médicamenteuses. Cette formation massive est similaire à la formation d’un grand modèle de langage, mais au lieu de la langue humaine, l’IA a appris les représentations chimiques.
Le modèle génératif d’Evogene est basé sur l’architecture de réseau neuronal de transformateur, similaire aux modèles GPT qui ont révolutionné le traitement du langage naturel. En fait, le système est appelé ChemPass-GPT, un modèle d’IA propriétaire formé sur des chaînes SMILES (un codage texte des structures moléculaires). En termes simples, ChemPass-GPT traite les molécules comme des phrases – chaque chaîne SMILES d’une molécule est une séquence de caractères décrivant ses atomes et ses liaisons. Le modèle de transformateur a appris la grammaire de ce langage chimique, lui permettant de “récrire” de nouvelles molécules en prédisant un caractère à la fois, de la même manière que GPT peut écrire des phrases lettre par lettre. Puisqu’il a été formé sur des milliards d’exemples, le modèle peut générer de nouvelles chaînes SMILES correspondant à des structures chimiquement valides et médicamenteuses.
Cette approche générative basée sur les séquences tire parti de la force des transformateurs pour capturer des modèles complexes. En se formant sur un tel ensemble de données énorme et chimiquement diversifié, ChemPass AI surmonte les problèmes que les modèles d’IA précédents ont rencontrés, comme les biais provenant de petits ensembles de données ou la génération de molécules redondantes ou invalides. Les performances du modèle de base dépassent déjà celles d’un modèle GPT générique appliqué à la chimie : les tests internes ont montré une précision d’environ 90% dans la production de nouvelles molécules répondant à tous les critères de conception, contre environ 29% de précision pour un modèle basé sur GPT traditionnelevogene.com. En termes pratiques, cela signifie que presque toutes les molécules suggérées par ChemPass AI ne sont pas seulement nouvelles, mais répondent également à leur profil cible, une amélioration frappante par rapport aux techniques génératives de base.
Alors que le moteur génératif principal d’Evogene utilise un transformateur sur des SMILES linéaires, il convient de noter que l’ensemble plus large d’outils d’IA inclut d’autres architectures comme les réseaux de neurones de graphes (GNN). Les molécules sont naturellement des graphes – avec des atomes comme nœuds et des liaisons comme arêtes – et les GNN peuvent raisonner directement sur ces structures. Dans la conception de médicaments moderne, les GNN sont souvent utilisés pour prédire les propriétés ou même générer des molécules en les construisant atome par atome. Cette approche basée sur les graphes complète les modèles de séquence ; par exemple, la plate-forme d’Evogene intègre également des outils comme DeepDock pour la sélection virtuelle 3D, qui utilise probablement l’apprentissage profond pour évaluer la liaison moléculaire dans un contexte basé sur la structure. En combinant des modèles de séquence (excellents pour la créativité et la nouveauté) avec des modèles basés sur les graphes (excellents pour la précision structurelle et la prédiction des propriétés), ChemPass AI garantit que les composés générés sont non seulement nouveaux sur le papier, mais également chimiquement solides et efficaces dans la pratique. La boucle de conception de l’IA pourrait générer des structures de candidats et les évaluer via des modèles prédictifs – certains possiblement basés sur les GNN – pour des critères tels que la toxicité ou la faisabilité synthétique, créant un cycle de rétroaction qui affine chaque suggestion.
Optimisation multi-objectifs : Puissance, toxicité, stabilité Tout à la fois
Une caractéristique de premier plan de ChemPass AI est sa capacité intégrée à l’optimisation multi-objectifs. La découverte de médicaments classique optimise généralement une propriété à la fois, mais ChemPass a été conçu pour gérer plusieurs objectifs simultanément. Cela est réalisé grâce à des techniques d’apprentissage automatique avancées qui guident le modèle génératif pour satisfaire plusieurs contraintes. Lors de la formation, Evogene peut imposer des exigences de propriété – telles qu’une molécule doit activer une cible spécifique avec force, éviter certains motifs toxiques et avoir une bonne biodisponibilité – et le modèle apprend à naviguer dans l’espace chimique sous ces règles. Le système ChemPass-GPT permet même une “génération basée sur les contraintes”, ce qui signifie qu’il peut être instruit pour ne proposer que des molécules qui répondent à des propriétés spécifiques souhaitées dès le départ.
Comment l’IA accomplit-elle cet équilibre multi-paramètres ? Une approche consiste à l’apprentissage multi-tâches, où le modèle génère non seulement des molécules mais prédit également leurs propriétés en utilisant des prédicteurs appris, ajustant la génération en conséquence. Une autre approche puissante est l’apprentissage par renforcement (RL). Dans un flux de travail amélioré par le RL, le modèle génératif agit comme un “agent” jouant un “jeu” de conception moléculaire : il propose une molécule et reçoit ensuite un score de récompense basé sur la manière dont cette molécule répond aux objectifs (puissance, absence de toxicité, etc.). Au fil de nombreuses itérations, le modèle affine sa stratégie de génération pour maximiser cette récompense. Cette méthode a été utilisée avec succès dans d’autres systèmes de conception de médicaments basés sur l’IA – les chercheurs ont montré que les algorithmes d’apprentissage par renforcement peuvent guider les modèles génératifs pour produire des molécules avec des propriétés souhaitables. En essence, l’IA peut être formée avec une fonction de récompense qui encapsule plusieurs objectifs, par exemple en attribuant des points pour l’efficacité prédite et en soustrayant des points pour la toxicité prédite. Le modèle optimise alors ses “coups” (ajout ou suppression d’atomes, modification de groupes fonctionnels) pour obtenir le score le plus élevé, apprenant ainsi les compromis nécessaires pour satisfaire tous les critères.
Evogene n’a pas divulgué la “sauce secrète” exacte derrière le moteur multi-objectif de ChemPass AI, mais il est clair à partir de leurs résultats que de telles stratégies sont à l’œuvre. Le fait que chaque composé généré “réponde simultanément à des paramètres essentiels” tels que l’efficacité, la synthétisabilité et la sécurité. La prochaine version de ChemPass AI 2.0 poussera cela plus loin – elle est en cours de développement pour permettre une mise à l’échelle multi-paramètres encore plus flexible, y compris des critères définis par l’utilisateur adaptés à des domaines thérapeutiques ou à des exigences de culture spécifiques. Cela suggère que le modèle de prochaine génération pourrait permettre aux chercheurs de régler l’importance de certains facteurs (par exemple, en donnant la priorité à la pénétration cérébrale pour un médicament neurologique ou à la biodégradabilité environnementale pour un pesticide) et que l’IA ajustera sa stratégie de conception en conséquence. En intégrant de telles capacités multi-objectifs, ChemPass AI peut concevoir des molécules qui atteignent le point optimal sur de nombreux indicateurs de performance à la fois, une prouesse pratiquement impossible avec les méthodes traditionnelles.
Un bond en avant des méthodes de R&D traditionnelles
L’avènement du modèle génératif de ChemPass AI met en évidence un changement plus large dans la R&D des sciences de la vie : le passage des flux de travail fastidieux de trial and error à la créativité et à la précision augmentées par l’IA. Contrairement aux chimistes humains, qui ont tendance à s’en tenir à des séries chimiques connues et à itérer lentement, un IA peut concevoir des milliards de possibilités et s’aventurer dans les 99,9% inexplorés de l’espace chimique. Cela ouvre la porte à la découverte de composés efficaces qui ne ressemblent à rien de ce que nous avons vu auparavant – crucial pour traiter des maladies avec une chimie nouvelle ou pour lutter contre des pests et des agents pathogènes qui ont développé une résistance aux molécules existantes. De plus, en considérant la brevetabilité dès le départ, l’IA générative aide à éviter les domaines de propriété intellectuelle encombrés. Evogene vise explicitement à produire des molécules qui créent de nouveaux brevets, un avantage concurrentiel important.
Les avantages par rapport aux approches traditionnelles peuvent être résumés comme suit :
-
Optimisation multi-caractéristiques parallèle : L’IA évalue de nombreux paramètres en parallèle, concevant des molécules qui satisfont à la puissance, à la sécurité et à d’autres critères. Les pipelines traditionnels, en revanche, ne découvrent souvent qu’un problème de toxicité après des années de travail sur un médicament prometteur. En filtrant ces problèmes à l’avance, les candidats conçus par l’IA ont plus de chances de réussir dans les essais coûteux ultérieurs.
-
Expansion de la diversité chimique : Les modèles génératifs ne sont pas limités aux bibliothèques de composés existants. ChemPass AI peut concevoir des structures qui n’ont jamais été créées auparavant, mais qui sont prédites pour être efficaces. Cette génération basée sur la nouveauté évite de réinventer la roue (ou la molécule) et aide à créer des produits différenciés avec de nouveaux modes d’action. Les méthodes traditionnelles conduisent souvent à des composés “me too” qui offrent peu de nouveauté.
-
Vitesse et échelle : Ce que pourrait accomplir une équipe de chimistes via la synthèse et les tests en un an, un IA peut le simuler en quelques jours. La plate-forme d’apprentissage profond de ChemPass AI peut simuler rapidement des dizaines de milliards de composés et générer des centaines de nouvelles idées en une seule passe. Cela réduit considérablement le délai de découverte, en se concentrant sur les expériences de laboratoire humide uniquement sur les candidats les plus prometteurs identifiés in silico.
-
Connaissance intégrée : Les modèles d’IA comme ChemPass intègrent d’énormes quantités de connaissances chimiques et biologiques (par exemple, des relations structure-activité connues, des alertes de toxicité, des règles de propriété médicamenteuse) dans leur formation. Cela signifie que chaque conception de molécule bénéficie d’une largeur de données antérieures que aucun expert humain ne pourrait retenir. La conception traditionnelle repose sur l’expérience des chimistes médicinaux – précieuse mais limitée à la mémoire et aux préjugés humains – tandis que l’IA peut capturer des modèles à travers des millions d’expériences et des familles chimiques diverses.
Dans les faits, pour les produits pharmaceutiques, cela pourrait conduire à des taux de réussite plus élevés dans les essais cliniques et à une réduction des coûts de développement, car moins de ressources sont gaspillées sur des composés condamnés. Dans l’agriculture, cela signifie une création plus rapide de solutions de protection des cultures plus sûres et plus durables – par exemple, un herbicide qui est mortel pour les mauvaises herbes mais inoffensif pour les organismes non ciblés et se décompose sans danger dans l’environnement. En optimisant à la fois l’efficacité et la sécurité environnementale, l’IA peut aider à livrer des “produits efficaces, durables et brevetables” – répondant ainsi aux défis de réglementation et de résistance en une seule fois.
Partie d’un ensemble plus large d’outils d’IA chez Evogene
Alors que ChemPass AI attire l’attention pour la conception de petites molécules, il fait partie des trois “moteurs techniques” d’Evogene alimentés par l’IA, adaptés à différents domaines. La société a MicroBoost AI axé sur les micro-organismes, ChemPass AI sur la chimie et GeneRator AI sur les éléments génétiques. Chaque moteur applique l’analyse de grandes données et l’apprentissage automatique à son domaine respectif.
Cet écosystème intégré de moteurs d’IA souligne la stratégie d’Evogene en tant que société de sciences de la vie “IA d’abord”. Ils visent à révolutionner la découverte de produits à travers le board – que ce soit la formulation d’un médicament, d’un biostimulant ou d’une culture résistante à la sécheresse – en harnachant la computation pour naviguer la complexité biologique. Les moteurs partagent une philosophie commune : utiliser l’apprentissage automatique de pointe pour augmenter la probabilité de réussite de la R&D et réduire le temps et le coût.
Perspectives : La découverte basée sur l’IA atteint sa maturité
L’IA générative transforme la découverte de molécules, faisant passer le rôle de l’IA de l’assistant au collaborateur créatif. Au lieu de tester une idée à la fois, les scientifiques peuvent maintenant utiliser l’IA pour concevoir entièrement de nouvelles molécules qui répondent à plusieurs objectifs – puissance, sécurité, stabilité et plus – en une seule étape.
Cet avenir se déroule déjà. Une équipe pharmaceutique pourrait demander une molécule qui cible une protéine spécifique, évite le cerveau et est administrée par voie orale – l’IA peut livrer des candidats sur demande. Dans l’agriculture, les chercheurs pourraient générer des méthodes de lutte contre les pests respectueuses de l’environnement adaptées aux contraintes réglementaires et environnementales.
Le modèle de base récent d’Evogene, développé avec Google Cloud, est un exemple de ce changement. Il permet la conception multi-paramètres et ouvre de nouveaux domaines de l’espace chimique. À mesure que les versions futures permettront une personnalisation encore plus poussée, ces modèles deviendront des outils essentiels dans les sciences de la vie.
De manière cruciale, l’impact dépend de la validation dans le monde réel. À mesure que les molécules générées par l’IA sont testées et affinées, les modèles s’améliorent – créant une boucle de rétroaction puissante entre la computation et l’expérimentation.
Cette approche générative n’est pas limitée aux médicaments ou aux pesticides. Elle pourrait bientôt conduire à des avancées dans les matériaux, les aliments et la durabilité – offrant une découverte plus rapide et plus intelligente à travers les industries autrefois limitées par la méthode de trial and error.












