Annonces

Le laboratoire national d’Argonne lance un service d’inférence IA à grande échelle pour la science ouverte

mm

La course pour construire des modèles d’IA plus grands a dominé les actualités pendant des années, mais l’un des plus grands défis de l’informatique scientifique est resté en grande partie sans solution : comment les chercheurs peuvent-ils utiliser des systèmes d’IA avancés à grande échelle sans construire leur propre infrastructure coûteuse.

C’est le problème que le Laboratoire national d’Argonne cherche à résoudre avec le lancement de ce qu’il décrit comme le premier service d’inférence IA à grande échelle conçu spécifiquement pour la science ouverte.

Le nouveau service, développé par le Argonne Leadership Computing Facility (ALCF), offre aux chercheurs un accès en mode cloud à des modèles de langage à grande échelle, des modèles de fondation scientifique et des systèmes de vision par ordinateur qui fonctionnent directement sur l’infrastructure de calcul haute performance d’Argonne. Au lieu de former leurs propres modèles ou de gérer des grappes de matériel spécialisé, les scientifiques peuvent utiliser une plate-forme d’inférence partagée optimisée pour les flux de travail de recherche à grande échelle.

Pourquoi l’inférence IA est importante pour la science

Une grande partie de la conversation sur l’IA a porté sur la formation de modèles, mais l’inférence est là où les systèmes d’IA deviennent pratiquement utiles. L’inférence IA est la phase où les modèles formés analysent les données, génèrent des prédictions, interprètent les résultats ou aident à la prise de décision en temps réel.

Pour la recherche scientifique, l’inférence peut accélérer considérablement le rythme de l’expérimentation. Les énormes ensembles de données provenant d’accélérateurs de particules, de télescopes, d’expériences de fusion, de projets de génomique et de simulations moléculaires peuvent submerger les pipelines d’analyse traditionnels. Les systèmes d’inférence IA peuvent interpréter rapidement ces ensembles de données, aidant les chercheurs à identifier des modèles ou des anomalies qui auraient autrement pris des semaines ou des mois à découvrir.

Le nouveau service d’Argonne est destiné à éliminer un goulet d’étranglement majeur en rendant les capacités d’inférence avancées accessibles en tant que ressource centralisée plutôt que d’exiger que chaque établissement déploie sa propre pile d’IA.

Michael Papka, directeur de l’ALCF, a décrit l’initiative comme un changement de cap, passant de l’offre de puissance de calcul brute à la fourniture de services scientifiques dotés d’IA.

Une infrastructure d’IA nationale pour la recherche

Le service d’inférence est étroitement lié à la mission Genesis du département américain de l’Énergie, une initiative nationale visant à accélérer la découverte scientifique grâce à des infrastructures alimentées par l’IA. La mission vise à relier les supercalculateurs, les instruments scientifiques et les grands ensembles de données dans un écosystème d’IA unifié capable de soutenir la recherche de nouvelle génération.

Le système d’Argonne soutient déjà des chercheurs de plusieurs laboratoires du DOE, notamment le Brookhaven National Laboratory, le Lawrence Berkeley National Laboratory, le Oak Ridge National Laboratory et le Los Alamos National Laboratory. La vision plus large est de créer une plate-forme de recherche nationale interconnectée où les outils d’IA, les données expérimentales et les ressources de calcul haute performance peuvent fonctionner ensemble de manière transparente.

Ceci est particulièrement important dans la mesure où les charges de travail d’IA scientifique impliquent de plus en plus des flux de travail agents, où les modèles interagissent à plusieurs reprises avec des systèmes de simulation, des bases de données et des outils d’analyse. Ces flux de travail peuvent générer une consommation de jetons et des coûts de calcul énormes lorsqu’ils sont exécutés sur des plateformes d’IA commerciales. L’infrastructure d’Argonne est conçue pour prendre en charge ces flux de travail à l’interne pour les applications scientifiques.

La technologie derrière la plate-forme

Le service offre un accès à plusieurs familles de modèles, notamment les modèles Gemma de Google, la famille LLaMA de Meta et les systèmes GPT-OSS d’OpenAI, ainsi que des modèles de fondation scientifique spécifiques au domaine et des systèmes développés en interne tels qu’AuroraGPT.

AuroraGPT est particulièrement notable car il représente l’ambition plus large d’Argonne de construire des systèmes d’IA formés spécifiquement sur la littérature scientifique, les ensembles de données et les entrées de recherche multimodales. Le projet a exploré des architectures à très grande échelle optimisées pour le raisonnement scientifique et les environnements de calcul haute performance.

L’infrastructure elle-même s’exécute sur des systèmes ALCF dédiés, notamment Sophia et Metis, avec une expansion future prévue sur des systèmes alimentés par NVIDIA nommés Tara et Minerva.

Au-delà des chatbots : des applications scientifiques réelles

Alors que la discussion publique sur l’IA tourne souvent autour des assistants de conversation, l’accent d’Argonne est fermement mis sur l’accélération de la recherche.

Dans la recherche sur l’énergie de fusion, les modèles d’inférence peuvent surveiller le comportement du plasma en temps réel et potentiellement prédire les perturbations avant qu’elles n’apparaissent. En astronomie et en physique des particules, les systèmes d’IA peuvent analyser d’énormes flux de données de télescopes ou de collisionneurs pour identifier des événements rares de manière plus efficace. En chimie et en science des matériaux, les systèmes d’inférence peuvent coordonner des simulations moléculaires complexes et automatiser des flux de travail de calcul à grande échelle.

Un exemple mis en avant par Argonne est ChemGraph, un cadre alimenté par l’IA conçu pour simplifier les flux de travail de simulation moléculaire. Le système utilise des interactions d’appel d’outils d’IA répétées pour coordonner les simulations, l’analyse des données et l’expérimentation itérative dans un flux de travail plus connecté.

L’implication plus large est que l’informatique scientifique évolue des travaux de supercalcul isolés vers des environnements de recherche interactifs et assistés par l’IA de manière continue.

Le rôle croissant d’Argonne dans l’infrastructure d’IA

Fondé en 1946, le Laboratoire national d’Argonne a longtemps été l’une des institutions de recherche scientifique les plus importantes des États-Unis, en particulier dans le calcul haute performance, les systèmes énergétiques, la science des matériaux et la recherche nucléaire. Le laboratoire fonctionne sous la direction du département américain de l’Énergie et a joué un rôle central dans plusieurs générations d’initiatives américaines de supercalcul.

Ces dernières années, Argonne est devenu de plus en plus influent dans le développement de l’IA pour la science grâce à des projets liés au calcul à l’échelle exaflopie et aux grands modèles de fondation scientifique. L’ALCF lui-même abrite certains des systèmes de calcul les plus avancés du pays, notamment Aurora, l’un des supercalculateurs les plus rapides du monde.

Le lancement du service d’inférence reflète une transition plus large qui se produit à la fois dans le monde universitaire et dans l’informatique d’entreprise : passer des modèles d’IA autonomes à des plateformes d’infrastructure d’IA intégrées capables de prendre en charge des charges de travail de raisonnement à grande échelle et continues.

Pour la recherche scientifique, cette transition pourrait considérablement compresser le délai entre la génération de données brutes et la découverte significative.

Antoine est un leader visionnaire et associé fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et on le surprend souvent en train de vanter le potentiel des technologies perturbatrices et de l'AGI.

En tant que futuriste, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.