Connect with us

L’IA simule 500 millions d’années d’évolution – et crée une nouvelle protéine !

Intelligence artificielle

L’IA simule 500 millions d’années d’évolution – et crée une nouvelle protéine !

mm

L’évolution a affiné la vie au niveau moléculaire pendant des milliards d’années. Les protéines, les briques fondamentales de la vie, ont évolué à travers ce processus pour effectuer diverses fonctions biologiques, de la lutte contre les infections à la digestion des aliments. Ces molécules complexes sont composées de longues chaînes d’acides aminés disposés dans des séquences précises qui dictent leur structure et leur fonction. Alors que la nature a produit une diversité extraordinaire de protéines, la compréhension de leur structure et la conception de nouvelles protéines entièrement nouvelles ont longtemps été un défi complexe pour les scientifiques.

Les progrès récents de l’intelligence artificielle transforment notre capacité à relever certains des défis les plus importants de la biologie. Auparavant, l’IA était utilisée pour prédire comment une séquence de protéine donnée se plierait et se comporterait – un défi complexe en raison du nombre considérable de configurations. Récemment, l’IA a progressé pour générer entièrement de nouvelles protéines à une échelle sans précédent. Ce jalon a été atteint avec ESM3, un modèle de langage génératif multimodal conçu par EvolutionaryScale. Contrairement aux systèmes d’IA conventionnels conçus pour le traitement de texte, ESM3 a été formé pour comprendre les séquences de protéines, les structures et les fonctions. Ce qui le rend vraiment remarquable, c’est sa capacité à simuler 500 millions d’années d’évolution – une prouesse qui a conduit à la création d’une protéine fluorescente complètement nouvelle, quelque chose qui n’a jamais été vu dans la nature.

Cette avancée est un pas important vers la programmation de la biologie, ouvrant de nouvelles possibilités pour la conception de protéines personnalisées avec des applications en médecine, en science des matériaux et au-delà. Dans cet article, nous explorons comment ESM3 fonctionne, ce qu’il a réalisé et pourquoi cette avancée est en train de redéfinir notre compréhension de la biologie et de l’évolution.

Rencontrez ESM3 : L’IA qui simule l’évolution

ESM3 est un modèle de langage multimodal formé pour comprendre et générer des protéines en analysant leurs séquences, structures et fonctions. Contrairement à AlphaFold, qui peut prédire la structure de protéines existantes, ESM3 est essentiellement un modèle d’ingénierie de protéines, permettant aux chercheurs de spécifier des exigences fonctionnelles et structurelles pour concevoir entièrement de nouvelles protéines.

Le modèle possède une connaissance approfondie des séquences de protéines, des structures et des fonctions, ainsi que la capacité de générer des protéines par interaction avec les utilisateurs. Cette capacité permet au modèle de générer des protéines qui n’existent peut-être pas dans la nature mais qui restent biologiquement viables. La création d’une protéine fluorescente verte nouvelle (esmGFP) est une démonstration frappante de cette capacité. Les protéines fluorescentes, initialement découvertes chez les méduses et les coraux, sont largement utilisées dans la recherche médicale et la biotechnologie. Pour développer esmGFP, les chercheurs ont fourni à ESM3 les caractéristiques structurelles et fonctionnelles clés des protéines fluorescentes connues. Le modèle a ensuite affiné le design de manière itérative, en appliquant une approche de raisonnement en chaîne pour optimiser la séquence. Alors que l’évolution naturelle pourrait prendre des millions d’années pour produire une protéine similaire, ESM3 accélère ce processus pour l’obtenir en quelques jours ou semaines.

Le processus de conception de protéine dirigé par l’IA

Voici comment les chercheurs ont utilisé ESM3 pour développer esmGFP :

  1. Déclencher l’IA – Initialement, ils ont saisi des indices de séquence et de structure pour guider ESM3 vers des caractéristiques liées à la fluorescence.
  2. Générer de nouvelles protéines – ESM3 a exploré un vaste espace de séquences potentielles pour produire des milliers de protéines candidates.
  3. Filtrer et affiner – Les conceptions les plus prometteuses ont été filtrées et synthétisées pour des tests de laboratoire.
  4. Validation dans des cellules vivantes – Les protéines conçues par l’IA sélectionnées ont été exprimées dans des bactéries pour confirmer leur fluorescence et leur fonctionnalité.

Ce processus a abouti à une protéine fluorescente (esmGFP) sans équivalent dans la nature.

Comment esmGFP se compare aux protéines naturelles

Ce qui rend esmGFP extraordinaire, c’est à quel point il est éloigné des protéines fluorescentes connues. Alors que la plupart des nouvelles protéines fluorescentes découvertes ont des variations légères par rapport aux existantes, esmGFP a une identité de séquence de seulement 58 % avec son parent naturel le plus proche. Évolutionnairement, une telle différence correspond à un temps de divergence de plus de 500 millions d’années.

Pour mettre cela en perspective, la dernière fois que des protéines avec des distances évolutives similaires sont apparues, les dinosaures n’existaient pas encore et la vie multicellulaire était encore à ses débuts. Cela signifie que l’IA n’a pas seulement accéléré l’évolution – elle a simulé une voie évolutionnaire entièrement nouvelle, produisant des protéines que la nature n’aurait peut-être jamais créées.

Pourquoi cette découverte est importante

Ce développement est un pas important en avant dans l’ingénierie des protéines et approfondit notre compréhension de l’évolution. En simulant des millions d’années d’évolution en quelques jours, l’IA ouvre des portes à des possibilités excitantes :

  • Découverte de médicaments plus rapide : De nombreux médicaments fonctionnent en ciblant des protéines spécifiques, mais trouver les bonnes est lent et coûteux. Les protéines conçues par l’IA pourraient accélérer ce processus, aidant les chercheurs à découvrir de nouveaux traitements plus efficacement.
  • Nouvelles solutions en bioingénierie : Les protéines sont utilisées dans tout, de la décomposition des déchets en plastique à la détection des maladies. Avec la conception dirigée par l’IA, les scientifiques peuvent créer des protéines personnalisées pour les soins de santé, la protection de l’environnement et même de nouveaux matériaux.
  • IA en tant que simulateur d’évolution : L’un des aspects les plus intrigants de cette recherche est qu’il positionne l’IA comme un simulateur d’évolution plutôt que comme un outil d’analyse. Les simulations d’évolution traditionnelles impliquent d’itérer à travers des mutations génétiques, souvent prenant des mois ou des années pour générer des candidats viables. ESM3, cependant, contourne ces contraintes lentes en prédissant directement des protéines fonctionnelles. Ce changement d’approche signifie que l’IA pourrait non seulement imiter l’évolution mais également explorer activement les possibilités évolutives au-delà de la nature. Étant donné suffisamment de puissance de calcul, l’évolution dirigée par l’IA pourrait découvrir de nouvelles propriétés biochimiques qui n’ont jamais existé dans le monde naturel.

Considérations éthiques et développement responsable de l’IA

Alors que les avantages potentiels de l’ingénierie de protéines dirigée par l’IA sont immenses, cette technologie soulève également des questions éthiques et de sécurité. Que se passe-t-il lorsque l’IA commence à concevoir des protéines au-delà de la compréhension humaine ? Comment nous assurer que ces protéines sont sûres pour une utilisation médicale ou environnementale ?

Nous devons nous concentrer sur le développement responsable de l’IA et sur des tests approfondis pour répondre à ces préoccupations. Les protéines générées par l’IA, comme esmGFP, devraient subir des tests de laboratoire exhaustifs avant d’être considérées pour des applications dans le monde réel. De plus, des cadres éthiques pour la biologie dirigée par l’IA sont en cours de développement pour assurer la transparence, la sécurité et la confiance du public.

En résumé

Le lancement d’ESM3 est un développement crucial dans le domaine de la biotechnologie. ESM3 démontre que l’évolution ne devrait pas être un processus lent et d’essais et d’erreurs. Compresser 500 millions d’années d’évolution de protéines en quelques jours ouvre un avenir où les scientifiques peuvent concevoir de nouvelles protéines avec une vitesse et une précision incroyables. Le développement d’ESM3 signifie que nous pouvons non seulement utiliser l’IA pour comprendre la biologie mais également la redéfinir. Cette avancée nous aide à améliorer notre capacité à programmer la biologie de la même manière que nous programmons le logiciel, déverrouillant des possibilités que nous commençons à peine à imaginer.

Dr. Tehseen Zia est un professeur associé titulaire à l'Université COMSATS d'Islamabad, titulaire d'un doctorat en intelligence artificielle de l'Université technique de Vienne, en Autriche. Spécialisé en intelligence artificielle, apprentissage automatique, science des données et vision par ordinateur, il a apporté des contributions significatives avec des publications dans des revues scientifiques réputées. Dr. Tehseen a également dirigé divers projets industriels en tant que chercheur principal et a servi en tant que consultant en intelligence artificielle.