Santé
Les algorithmes utilisés par des entreprises comme Netflix pourraient déchiffrer le langage biologique des maladies neurodégénératives

Les algorithmes puissants utilisés par des entreprises comme Netflix, Facebook et Amazon pourraient avoir des implications majeures dans le domaine de la santé. Ils ont démontré leur capacité à prédire le langage biologique du cancer et d’autres maladies neurodégénératives telles que la maladie d’Alzheimer.
Cette initiative a été entreprise par des universitaires du St. John’s College, Université de Cambridge, qui ont alimenté des données massives produites au fil des décennies dans un modèle de langage informatique. L’objectif était de voir si l’intelligence artificielle (IA) pouvait faire des découvertes plus avancées que les humains, et ils ont constaté que c’était le cas avec la capacité de la technologie à déchiffrer le langage biologique.
L’étude a été publiée dans la revue scientifique PNAS, intitulée « Apprendre la grammaire moléculaire des condensats de protéines à partir de déterminants de séquence et d’incrustations ». Selon les experts, elle pourrait être utilisée pour « corriger les erreurs grammaticales à l’intérieur des cellules qui causent la maladie ».
Le professeur Tuomas Knowles est l’auteur principal de l’article et un membre du St. John’s College.
« L’introduction de la technologie d’apprentissage automatique dans la recherche sur les maladies neurodégénératives et le cancer est un véritable changement de jeu. En fin de compte, l’objectif sera d’utiliser l’intelligence artificielle pour développer des médicaments ciblés qui atténueraient considérablement les symptômes ou empêcheraient la démence de survenir du tout ».
Algorithmes puissants
Les algorithmes d’apprentissage automatique utilisés par des entreprises comme Netflix et Facebook font des prédictions très éduquées sur les consommateurs et sur ce qu’ils feront ensuite. C’est ce qui se passe lorsque Netflix recommande un nouveau film ou que Facebook recommande un nouvel ami. Les assistants vocaux tels qu’Alexa et Siri peuvent reconnaître les individus immédiatement et répondre.
Le Dr Kadi Liis Saar est l’auteur principal de l’article et un chercheur au St. John’s College. Elle a utilisé une technologie similaire pour entraîner un modèle de langage à grande échelle, qui visait à identifier ce qui se passe aux protéines pendant la maladie.
« Le corps humain abrite des milliers et des milliers de protéines et les scientifiques ne connaissent pas encore la fonction de la plupart d’entre elles. Nous avons demandé à un modèle de langage basé sur un réseau de neurones d’apprendre le langage des protéines », a-t-elle déclaré.
« Nous avons spécifiquement demandé au programme d’apprendre le langage des condensats biomoléculaires métamorphiques – des gouttes de protéines trouvées dans les cellules – que les scientifiques ont vraiment besoin de comprendre pour percer le langage de la fonction et de la dysfonction biologiques qui causent le cancer et les maladies neurodégénératives comme la maladie d’Alzheimer. Nous avons constaté qu’il pouvait apprendre, sans qu’on le lui ait explicitement dit, ce que les scientifiques ont déjà découvert sur le langage des protéines au fil des décennies de recherche ».
Les scientifiques croient qu’il existe plusieurs centaines de maladies neurodégénératives, les plus courantes étant la maladie d’Alzheimer, la maladie de Parkinson et la maladie de Huntington. La maladie d’Alzheimer affecte 50 millions de personnes dans le monde, et au cours de la maladie, les protéines forment des grumeaux et tuent les cellules nerveuses saines.
Condensats de protéines et technologie de traitement du langage naturel
Avec un cerveau sain, ces masses de protéines peuvent être éliminées efficacement. Selon des découvertes plus récentes, les scientifiques croient maintenant que certaines protéines désordonnées forment des condensats, qui sont des gouttes liquides de protéines. Ceux-ci n’ont pas de membrane et se mélangent librement les uns avec les autres, et ils peuvent se former et se reformer.
« Les condensats de protéines ont récemment attiré beaucoup d’attention dans le monde scientifique car ils contrôlent des événements clés dans la cellule tels que l’expression des gènes – la façon dont notre ADN est converti en protéines – et la synthèse des protéines – la façon dont les cellules fabriquent des protéines », a déclaré le professeur Knowles.
« Tout défaut lié à ces gouttes de protéines peut entraîner des maladies telles que le cancer. C’est pourquoi l’introduction de la technologie de traitement du langage naturel dans la recherche sur les origines moléculaires de la dysfonction des protéines est vitale si nous voulons être en mesure de corriger les erreurs grammaticales à l’intérieur des cellules qui causent la maladie », a-t-il poursuivi.
« Nous avons alimenté l’algorithme avec toutes les données connues sur les protéines afin qu’il puisse apprendre et prédire le langage des protéines de la même manière que ces modèles apprennent le langage humain et que WhatsApp sait suggérer des mots à utiliser », a déclaré le Dr Saar.
« Ensuite, nous avons pu lui demander sur la grammaire spécifique qui amène uniquement certaines protéines à former des condensats à l’intérieur des cellules. C’est un problème très difficile et débloquer cela nous aidera à apprendre les règles du langage de la maladie », a-t-elle poursuivi.
Les principaux moteurs de cette avancée technologique sont une quantité croissante de données disponibles, une puissance de calcul plus élevée et des avancées techniques. L’apprentissage automatique a le potentiel de transformer de manière spectaculaire la recherche dans ces domaines, permettant des découvertes qui n’auraient jamais pu être prédites.
Selon le Dr Saar, « L’apprentissage automatique peut être libre des limites de ce que les chercheurs pensent être les cibles de l’exploration scientifique et cela signifiera que de nouvelles connexions seront trouvées que nous n’avons même pas encore conçues. C’est vraiment très excitant ».
Le nouveau réseau est disponible aux chercheurs du monde entier, et un nombre croissant de scientifiques s’impliquent.












