Santé
Comment l’IA est utilisée dans la lutte contre le coronavirus de Wuhan

L’intelligence artificielle est utilisée dans la lutte contre le coronavirus de Wuhan. L’intelligence artificielle est employée par les chercheurs pour suivre la propagation de la maladie et pour rechercher des traitements potentiels pour le virus.
Le coronavirus de Wuhan est apparu en Chine en décembre, et au cours des deux mois qui ont suivi, il s’est propagé à travers la Chine et dans d’autres parties du globe. Il est encore inconnu à quel point le virus est contagieux et à quelle vitesse il peut se propager, bien qu’il y ait actuellement plus de 40 000 cas confirmés en Chine. Afin de mieux comprendre comment le virus pourrait se propager et à quelle vitesse il peut se propager, les chercheurs utilisent des algorithmes d’apprentissage automatique axés sur les données tirées des sites de médias sociaux et d’autres parties du web.
Au cours de la semaine écoulée, le taux d’infection semble avoir diminué légèrement, mais il est incertain si la maladie est en train de être maîtrisée ou si les nouveaux cas deviennent plus difficiles à détecter. Alors que d’autres pays du monde n’ont vu que quelques cas de coronavirus, en comparaison avec la Chine, la communauté mondiale de la santé reste préoccupée par la capacité du virus à se propager. Les chercheurs tentent de devancer la propagation du virus en utilisant l’apprentissage automatique et les grandes données collectées sur Internet.
Comme le rapporte Wired, une équipe internationale de chercheurs a extrait des données de diverses parties d’Internet, notamment des publications de médecins et de groupes médicaux, des canaux de santé publique, des publications sur les médias sociaux et des rapports d’actualité, en compilant une base de données de texte qui pourrait être liée au coronavirus. Les chercheurs analysent ensuite les données à la recherche de signes que le virus pourrait se propager en dehors des frontières chinoises, en utilisant des techniques d’apprentissage automatique pour trouver des modèles pertinents dans les données qui pourraient indiquer comment le virus se comporte.
Les chercheurs passent au crible les publications sur les médias sociaux à la recherche de symptômes potentiels de coronavirus, en se concentrant sur les régions où les médecins pensent que des cas pourraient se manifester. Les publications sur les médias sociaux sont traitées à l’aide de techniques de traitement du langage naturel, qui peuvent distinguer entre les publications où une personne mentionne ses propres symptômes et celles où quelqu’un utilise des mots liés aux symptômes dans un autre contexte (comme lorsqu’il discute des actualités sur le coronavirus).
Selon Alessandro Vespignani, comme le rapporte Wired, professeur à l’Université Northeastern et expert en analyse de la contagion, même avec des techniques d’apprentissage automatique avancées, il est souvent difficile de suivre la propagation du virus parce que les caractéristiques du virus sont encore en partie inconnues, et que la plupart des publications sur les médias sociaux proviennent de sociétés de médias et concernent actuellement l’épidémie en Chine. Cependant, Vesignani croit que si le virus devait prendre pied aux États-Unis, il serait plus facile à suivre grâce à davantage de publications concernant le virus.
Malgré les défis pour obtenir des informations pertinentes sur le comportement potentiel du coronavirus, le modèle créé par les chercheurs semble être raisonnablement efficace pour trouver des indices dans un grand nombre de publications sur les médias sociaux. Le modèle utilisé par les chercheurs a pu trouver des preuves d’une épidémie virale le 30 décembre, bien qu’il ait fallu du temps pour déterminer à quel point la situation était grave. Les informations collectées par crowdsourcing pourraient améliorer encore l’efficacité des modèles de suivi des maladies, car elles permettent une collecte plus efficace de données pertinentes sur le virus. Par exemple, une analyse des données collectées par des médecins chinois suggère que les personnes âgées de moins de 15 ans sont plus résistantes au virus.
L’intelligence artificielle peut également être combinée avec des données collectées à partir d’appareils mobiles pour construire des modèles qui peuvent potentiellement prédire la direction dans laquelle un virus se propage ainsi que le taux de propagation. Par exemple, des chercheurs de l’Université de Southampton ont utilisé des données mobiles pour déterminer le chemin que le virus a pu prendre lorsqu’il est sorti de Wuhan dans les jours qui ont suivi son apparition. D’autres chercheurs ont analysé des données collectées par Tencent, un développeur d’applications mobiles chinois, et ont constaté que les restrictions imposées par le gouvernement chinois pourraient potentiellement réduire la propagation du virus, achetant un temps précieux pour élaborer un plan d’attaque.
Comme le rapporte Fortune, la startup Insilico Medicine a utilisé l’intelligence artificielle pour identifier des molécules qui pourraient potentiellement traiter le coronavirus. L’IA d’Insilico a identifié des milliers de molécules de médicaments possibles au cours de quatre jours. Insilico a expliqué que les 100 candidats les plus prometteurs seraient synthétisés et que toutes ses recherches sur les structures moléculaires seraient publiées pour que d’autres chercheurs puissent en tirer parti. Les chercheurs médicaux et les sociétés sont en train d’accélérer le développement et les tests de traitements, la société de biotechnologie américaine Gilead prévoyant de commencer les tests immédiats d’un nouveau médicament antiviral dans la région de Wuhan.
Après que Insilico ait décidé de commencer à rechercher des traitements, il s’est concentré sur une enzyme appelée 3C-like protéase. Le coronavirus dépend de cette enzyme pour se reproduire et se propager. Selon Insilico, il a choisi cette enzyme en particulier parce qu’elle est très similaire à d’autres protéases virales dont les structures ont déjà été documentées, et parce que l’Université de technologie de Shanghai a développé un modèle de la 3C-like protéase 2019-nCoV. En l’espace de quatre jours, Insilico a pu générer des centaines de milliers de molécules candidates et n’en a sélectionné que les 100 les plus susceptibles d’être utiles. Les résultats de la recherche ont été récemment publiés dans le référentiel bioRxiv et sur le site Web d’Insilico.












