Intelligence artificielle
Laboratoire d’agents : Une équipe de recherche virtuelle par AMD et Johns Hopkins

Alors que tout le monde parle d’agents IA et d’automatisation, AMD et l’Université Johns Hopkins ont travaillé à l’amélioration de la collaboration entre les humains et l’IA dans la recherche. Leur nouveau cadre open-source, Laboratoire d’agents, est une réinvention complète de la façon dont la recherche scientifique peut être accélérée grâce à la collaboration entre humains et IA.
Après avoir examiné de nombreux cadres de recherche IA, le Laboratoire d’agents se distingue par son approche pratique. Au lieu d’essayer de remplacer les chercheurs humains (comme le font de nombreuses solutions existantes), il se concentre sur le renforcement de leurs capacités en gérant les aspects chronophages de la recherche tout en gardant les humains aux commandes.
L’innovation clé ici est simple mais puissante : Plutôt que de poursuivre une recherche entièrement autonome (ce qui conduit souvent à des résultats discutables), le Laboratoire d’agents crée un laboratoire virtuel où plusieurs agents IA spécialisés travaillent ensemble, chacun gérant différents aspects du processus de recherche tout en restant ancrés dans les conseils humains.
Décortiquer le laboratoire virtuel
Pensez au Laboratoire d’agents comme à une équipe de recherche bien orchestrée, mais avec des agents IA jouant des rôles spécialisés. Tout comme un véritable laboratoire de recherche, chaque agent a des responsabilités et une expertise spécifiques :
- Un agent PhD traite les revues de littérature et la planification de la recherche
- Les agents postdoctoraux aident à affiner les approches expérimentales
- Les agents ingénieurs ML gèrent la mise en œuvre technique
- Les agents professeurs évaluent et notent les résultats de la recherche
Ce qui rend ce système particulièrement intéressant, c’est son flux de travail. Contrairement aux outils IA traditionnels qui fonctionnent en isolement, le Laboratoire d’agents crée un environnement de collaboration où ces agents interagissent et s’appuient sur le travail les uns des autres.
Le processus suit une progression de recherche naturelle :
- Revues de littérature : L’agent PhD fouille les articles universitaires à l’aide de l’API arXiv, en rassemblant et en organisant les recherches pertinentes
- Formulation du plan : Les agents PhD et postdoctoraux travaillent ensemble pour créer des plans de recherche détaillés
- Mise en œuvre : Les agents ingénieurs ML écrivent et testent le code
- Analyse et documentation : L’équipe travaille ensemble pour interpréter les résultats et générer des rapports complets
Mais c’est là que cela devient vraiment pratique : Le cadre est flexible en termes de calcul, ce qui signifie que les chercheurs peuvent allouer des ressources en fonction de leur accès à la puissance de calcul et des contraintes budgétaires. Cela en fait un outil conçu pour les environnements de recherche réels.

Schmidgall et al.
Le facteur humain : Là où l’IA rencontre l’expertise
Alors que le Laboratoire d’agents possède des capacités d’automatisation impressionnantes, la véritable magie se produit dans ce qu’ils appellent le « mode copilote ». Dans cette configuration, les chercheurs peuvent fournir des commentaires à chaque étape du processus, créant une véritable collaboration entre l’expertise humaine et l’assistance IA.
Les données de commentaires du mode copilote révèlent des informations intéressantes. En mode autonome, les articles générés par le Laboratoire d’agents ont obtenu une note moyenne de 3,8/10 dans les évaluations humaines. Mais lorsque les chercheurs ont participé au mode copilote, ces notes ont augmenté à 4,38/10. Ce qui est particulièrement intéressant, c’est où ces améliorations se sont produites – les articles ont obtenu des notes nettement plus élevées en termes de clarté (+0,23) et de présentation (+0,33).
Mais voici la réalité : même avec la participation humaine, ces articles ont obtenu des notes inférieures d’environ 1,45 point par rapport à la note moyenne des articles acceptés par NeurIPS (qui se situe à 5,85). Ce n’est pas un échec, mais c’est une leçon cruciale sur la façon dont l’expertise humaine et les capacités IA doivent se compléter.
L’évaluation a révélé quelque chose d’autre de fascinant : les évaluateurs IA ont systématiquement noté les articles environ 2,3 points plus haut que les évaluateurs humains. Cet écart met en évidence pourquoi la supervision humaine reste cruciale dans l’évaluation de la recherche.

Schmidgall et al.
Décortiquer les chiffres
Ce qui compte vraiment dans un environnement de recherche ? Le coût et la performance. L’approche du Laboratoire d’agents pour la comparaison des modèles révèle des gains d’efficacité surprenants à cet égard.
GPT-4o est apparu comme le champion de vitesse, complétant l’ensemble du flux de travail en seulement 1 165,4 secondes – soit 3,2 fois plus vite que o1-mini et 5,3 fois plus vite que o1-preview. Mais ce qui est encore plus important, c’est qu’il ne coûte que 2,33 $ par article. Par rapport aux méthodes de recherche autonomes précédentes qui coûtent environ 15 $, nous parlons d’une réduction de coûts de 84 %.
En regardant les performances du modèle :
- o1-preview a obtenu la note la plus élevée en termes d’utilité et de clarté
- o1-mini a obtenu les meilleures notes de qualité expérimentale
- GPT-4o a accusé un retard dans les métriques, mais a pris les devants en termes d’efficacité coûts
Les implications réelles sont importantes.
Les chercheurs peuvent maintenant choisir leur approche en fonction de leurs besoins spécifiques :
- Besoin de prototypage rapide ? GPT-4o offre de la vitesse et de l’efficacité coûts
- Priorisation de la qualité expérimentale ? o1-mini pourrait être votre meilleur choix
- Recherche de sortie la plus polie ? o1-preview montre des promesses
Cette flexibilité signifie que les équipes de recherche peuvent adapter le cadre à leurs ressources et à leurs exigences, plutôt que d’être verrouillées dans une solution universelle.
Un nouveau chapitre dans la recherche
Après avoir examiné les capacités et les résultats du Laboratoire d’agents, je suis convaincu que nous sommes en train de regarder un changement important dans la façon dont la recherche sera menée. Mais ce n’est pas le récit de remplacement qui domine souvent les manchettes – c’est quelque chose de beaucoup plus nuancé et puissant.
Alors que les articles du Laboratoire d’agents ne répondent pas encore aux normes des meilleures conférences, ils créent un nouveau paradigme pour l’accélération de la recherche. Pensez-y comme avoir une équipe d’assistants de recherche IA qui ne dorment jamais, chacun spécialisé dans différents aspects du processus scientifique.
Les implications pour les chercheurs sont profondes :
- Le temps passé sur les revues de littérature et le codage de base pourrait être redirigé vers l’idéation créative
- Les idées de recherche qui auraient pu être mises de côté en raison de contraintes de ressources deviennent viables
- La capacité à prototyper et à tester rapidement les hypothèses pourrait conduire à des avancées plus rapides
Les limites actuelles, comme l’écart entre les notes de revue IA et humaines, sont des opportunités. Chaque itération de ces systèmes nous rapproche d’une collaboration de recherche plus sophistiquée entre humains et IA.
En regardant vers l’avenir, je vois trois développements clés qui pourraient remodeler la découverte scientifique :
- Des modèles de collaboration humaine-IA plus sophistiqués émergeront à mesure que les chercheurs apprendront à utiliser efficacement ces outils
- Les économies de coûts et de temps pourraient démocratiser la recherche, permettant aux petits laboratoires et aux institutions de poursuivre des projets plus ambitieux
- Les capacités de prototypage rapide pourraient conduire à des approches expérimentales plus nombreuses dans la recherche
La clé pour maximiser ce potentiel ? Comprendre que le Laboratoire d’agents et des cadres similaires sont des outils d’amplification, et non d’automatisation. L’avenir de la recherche n’est pas de choisir entre l’expertise humaine et les capacités IA – c’est de trouver des moyens innovants de les combiner.












