AI 101
Les développeurs créent un logiciel open source pour aider les chercheurs en IA à réduire leur empreinte carbone

Un groupe de chercheurs internationaux en intelligence artificielle et de data scientists ont collaboré pour concevoir un logiciel capable d'estimer l'empreinte carbone des opérations informatiques. Le progiciel open source, appelé CodeCarbo, a été conçu par un consortium de sociétés d'IA et de science des données. L'espoir est que le logiciel permettra et incitera les programmeurs à rendre leur code plus efficace et à réduire la quantité de CO2 générée par l'utilisation des ressources informatiques.
Réduire l'empreinte carbone
Selon l'ITP, le nouveau progiciel CodeCarbon a été développé par une équipe de groupes de recherche sur l'IA dirigée par la société de recherche sur l'IA Mila, avec Comet.ml, Haverford College en Pennsylvanie et GAMMA. Non seulement le logiciel estime la quantité de CO2 produite par l'utilisation des ressources informatiques, mais il fournit également aux développeurs des conseils pour réduire leur empreinte énergétique carbone.
Former des modĂšles d'IA peut nĂ©cessiter beaucoup d'Ă©nergie. Comme expliquĂ© par ArsTechnica, des chercheurs de l'UniversitĂ© du Massachusetts Ă Amherst ont estimĂ© le coĂ»t total de la crĂ©ation et de la formation de certains modĂšles d'IA, et l'Ă©quipe a dĂ©couvert que la formation du rĂ©seau de langage naturel BERT gĂ©nĂ©rait autrefois environ autant de carbone qu'un vol aller-retour entre San Francisco et New York. Pendant ce temps, entraĂźner le modĂšle plusieurs fois jusqu'Ă ce qu'il soit optimisĂ© pourrait gĂ©nĂ©rer autant de CO2 que 315 passagers diffĂ©rents prenant le mĂȘme vol.
Pourquoi exactement les modĂšles d'IA consomment-ils autant d'Ă©nergie et gĂ©nĂšrent-ils autant de CO2 comme sous-produit ? Une partie de la rĂ©ponse rĂ©side dans la façon dont les modĂšles d'IA sont entraĂźnĂ©s et optimisĂ©s. Pour obtenir mĂȘme de petites amĂ©liorations par rapport aux algorithmes de pointe existants, les chercheurs en IA peuvent entraĂźner leur modĂšle des milliers de fois, en apportant de lĂ©gĂšres modifications au modĂšle Ă chaque fois jusqu'Ă ce qu'une architecture de modĂšle optimale soit dĂ©couverte.
Les modÚles d'IA augmentent également en taille tout le temps, devenant plus complexes chaque année.
Les algorithmes et modÚles d'apprentissage automatique les plus puissants, tels que GPT-3, BERT et VGG, comportent des millions de paramÚtres et sont entraßnés pendant des semaines, ce qui représente des centaines ou des milliers d'heures de formation. GPT-2 comptait environ 1.5 milliard de paramÚtres au sein du réseau, tandis que GPT-3 comptait environ 175 milliards de poids. Cela finit par utiliser des centaines de kilogrammes de CO2.
CodeCarbone
CodeCarbon dispose d'un module de mécanisme de suivi qui enregistre la quantité d'énergie utilisée par les fournisseurs de cloud et les centres de données. Le systÚme utilise ensuite des données extraites de sources accessibles au public pour estimer le volume de CO2 généré, en vérifiant les statistiques du réseau électrique auquel le matériel est connecté. Le tracker estime le CO2 produit pour chaque expérience à l'aide d'un module d'IA particulier, stockant les données d'émissions pour les deux projets et l'ensemble de l'organisation.
Le fondateur de Mila, Yohua Bengio, a expliquĂ© que si l'IA est un outil incroyablement puissant qui peut rĂ©soudre de nombreux problĂšmes, elle nĂ©cessite souvent une puissance informatique importante. Sylvian Duranton, directeur gĂ©nĂ©ral du Boston Consulting Group, a fait valoir que l'informatique et l'IA continueront de croĂźtre Ă des rythmes exponentiels dans le monde. L'idĂ©e est que CodeCarbon aidera les entreprises d'IA et d'informatique Ă limiter leur empreinte carbone Ă mesure qu'elles continuent de croĂźtre. CodeCarbon gĂ©nĂ©rera un tableau de bord qui permettra aux entreprises de voir facilement la quantitĂ© d'Ă©missions gĂ©nĂ©rĂ©es par la formation de leurs modĂšles d'apprentissage automatique. Il reprĂ©sentera Ă©galement les Ă©missions dans des mesures que les dĂ©veloppeurs peuvent facilement comprendre, telles que les kilomĂštres parcourus en voiture, les heures de tĂ©lĂ©vision regardĂ©es et la consommation d'Ă©nergie typique d'un mĂ©nage aux Ătats-Unis.
Les développeurs de CodeCarbon s'attendent à ce que le logiciel encourage non seulement les chercheurs en IA à essayer de réduire leur propre empreinte carbone, mais qu'il encourage une plus grande transparence concernant les émissions globales. Les développeurs pourront quantifier et rendre compte des émissions générées par une gamme de différentes expériences d'IA et d'informatique. L'équipe responsable de la création de CodeCarbon espÚre que d'autres développeurs prendront leur outil open source et l'amélioreront avec de nouvelles fonctionnalités qui aideront les ingénieurs et les chercheurs en IA à réduire encore plus leur impact environnemental.










