Leaders d’opinion
Non, l’IA ne stagne pas. Vous regardez le mauvais tableau de bord

Les dirigeants commencent à remettre en question leurs feuilles de route pour l’IA. Après l’essor initial des outils génératifs en 2023, il est naturel de se demander si l’élan s’est ralenti. Mais cette question mal interprète le tableau de bord. Les progrès de l’IA n’ont pas stagné. Ils se sont déplacés.
Ce qui ressemblait autrefois à un changement exponentiel en surface, une écriture fluide, des résumés polis, se produit maintenant dans des domaines plus profonds et plus conséquents : la raisonnement, le code, l’orchestration des flux de travail et la compréhension multimodale. Ces progrès sont moins spectaculaires, mais beaucoup plus impactants. Si vous mesurez toujours l’IA par sa capacité à écrire un meilleur paragraphe, vous manquez la transformation réelle.
Les véritables gains se produisent là où le travail est effectué
Les progrès s’accélèrent là où ils comptent le plus. Sur de nouvelles normes rigoureuses comme GPQA, qui évalue la raisonnement scientifique de niveau universitaire, les performances des modèles ont bondi de près de 49% points d’une année sur l’autre. Sur MMMU, qui teste les tâches cross-domaine et multimodales, les scores ont augmenté de près de 19 points. SWE-bench, une norme qui nécessite de corriger des bases de code GitHub réelles et de passer des tests automatisés, est passée de 4,4% à plus de 71% en un an.
Ces améliorations ne sont pas marginales. Elles montrent que les grands modèles de langage maîtrisent les tâches qui exigent de la précision, de la raisonnement et une intégration à travers des systèmes complexes. SWE-bench, en particulier, va au-delà des problèmes de jouets pour démontrer si les modèles peuvent participer à un développement de logiciels réel, un seuil qui semblait être à des années de distance.
Dans le même temps, les entreprises évoluent dans leurs attentes. Il n’est plus suffisant que les modèles soient « généralement intelligents », ils doivent être spécifiquement utiles. Le passage vers des modèles adaptés au domaine, des systèmes connectés à des outils et des cadres de travail multi-agents reflète la demande croissante de performances qui sont opérationnelles, auditable et intégrées dans les flux de travail du monde réel.
Le récit ne correspond pas à la réalité
Alors, pourquoi est-ce que cela ressemble à une ralentie ? Il y a deux raisons. Premièrement, les normes qui ont initialement attiré l’attention, la synthèse de texte, la génération d’e-mails et les tâches de conversation simples, ont atteint des plafonds naturels. Une fois qu’un modèle performe de manière cohérente à 90% de précision sur ces tâches, les gains paraissent minimaux. C’est un effet de plafond, et non un plateau dans les progrès.
Les améliorations d’aujourd’hui impliquent une mémoire à long terme, une intégration d’outils, une raisonnement à l’exécution et une précision spécifique au domaine. Ces capacités ne produisent pas de démos virales, mais elles améliorent considérablement ce que les modèles peuvent faire dans les flux de travail réels. Alors que les normes de langage traditionnelles sont en plateau, les normes opérationnelles liées à la raisonnement du monde réel, à l’utilisation d’outils et à la fiabilité des entreprises s’améliorent plus vite que jamais. C’est cette différence qui explique la déconnexion : les observateurs occasionnels voient une stagnation parce que la surface n’a pas changé, mais les praticiens voient une transformation qui se produit juste en dessous.
Des démos au déploiement
L’IA n’est plus limitée à des démos spectaculaires ou à des prototypes étroits. Elle franchit le seuil du déploiement mainstream, en particulier dans les environnements d’entreprise où la fiabilité, la précision et la livraison de résultats comptent. Le passage vers des systèmes structurés et spécifiques aux tâches est déjà en cours.
D’ici 2026, 40% des applications d’entreprise comporteront des agents IA intégrés, un bond massif par rapport aux 5% de 2025. Ces agents sont conçus non seulement pour répondre à des invites, mais pour exécuter des tâches, orchestrer des flux de travail et livrer des résultats tangibles dans des domaines comme la finance, la cybersécurité et les opérations client.
Cette évolution reflète un déplacement technique plus profond. Les principaux développeurs d’IA, y compris OpenAI, passent d’une mise à l’échelle brute à une raisonnement à l’exécution, permettant aux modèles de réfléchir aux problèmes, de valider les sorties et d’interagir avec des outils externes de manière dynamique. Ce qui ressemblait autrefois à une automatisation étroite devient quelque chose de beaucoup plus capable : des agents qui planifient, s’adaptent et exécutent de manière fiable. Ce n’est pas une IA plus grande, c’est une IA plus intelligente, conçue pour un travail réel.
Et ce travail réel est mesuré, et non simplement imaginé. Les entreprises passent des cycles de preuve de concept à des déploiements prêts pour la production avec des indicateurs de performance clés et des objectifs commerciaux liés aux résultats. Cette phase de maturation est moins axée sur la nouveauté et plus sur la fiabilité.
L’erreur que les dirigeants sont sur le point de commettre
Le véritable risque auquel sont confrontés les dirigeants d’entreprise aujourd’hui n’est pas que les progrès de l’IA se sont ralentis. C’est qu’ils croiront qu’ils se sont ralentis et qu’ils suspendront les investissements exactement au moment où les capacités s’accélèrent en dessous de la surface.
Les organisations qui prennent les devants ne attendent pas la prochaine révélation de style GPT. Elles intègrent l’IA d’aujourd’hui dans des flux de travail à haute valeur et transversaux, et livrent un impact commercial mesurable. Plus des deux tiers des organisations qui utilisent l’IA signalent des réductions de coûts ou une croissance des revenus significatives directement liées à ces déploiements. Les adoptants les plus réussis étaient ceux qui ont intégré l’IA à travers plusieurs fonctions commerciales et automatisé des chaînes de processus entières.
Pourtant, de nombreux groupes de direction restent coincés en utilisant des cadres d’évaluation obsolètes. Ils s’appuient sur des normes académiques qui ne reflètent plus la complexité des tâches réelles de l’entreprise. Ils optimisent trop pour l’efficacité des jetons tout en ignorant la valeur opérationnelle de la précision, de la récupérabilité et de l’intégration.
Ce n’est pas seulement un retard technique, c’est un retard stratégique. L’écart entre les entreprises qui ont recalibré leur approche de l’IA et celles qui ne l’ont pas s’élargit. Et bientôt, il ne sera pas mesuré en termes de modèles déployés, mais en parts de marché capturées et en temps de réalisation de la valeur.
Comment revoir l’évaluation de l’IA
Il est temps de mettre à jour le tableau de bord. Les organisations doivent suivre la complétion de tâches complètes, l’orchestration d’outils et les flux de travail cross-modaux. Les modèles doivent être évalués non seulement pour savoir s’ils « répondent à une question », mais pour savoir s’ils complètent une tâche mult étape, se remettent d’une défaillance et produisent une sortie qui s’intègre dans les systèmes existants.
Des normes comme GPQA, MMMU et SWE-bench sont un début. Mais des normes internes construites autour du domaine spécifique de l’entreprise et de ses flux de travail sont encore plus importantes.
L’IA moderne est capable de livrer des résultats à haute valeur, mais seulement si vous testez les résultats qui comptent.
Ce qui définit la prochaine vague de succès ne sera pas les modèles avec le plus de paramètres, ce seront les systèmes qui performe de manière fiable dans un contexte commercial spécifique. La précision, l’auditabilité, le support de la chaîne d’outils et la récupération en cas d’erreur seront plus importants que la fluidité ou le ton.
La frontière a changé
L’IA ne stagne pas. Elle se déplace dans les couches où le travail se fait réellement, où les systèmes doivent raisonner, valider et interagir à travers des domaines. Elle quitte la phase de la nouveauté et entre dans la phase de l’infrastructure.
Les entreprises qui comprennent ce déplacement sont déjà en train de construire un avantage. Elles ne poursuivent pas la prochaine démo virale. Elles capturent une productivité réelle, améliorent le temps de résolution et mettent à l’échelle des processus avec précision et rapidité.
Si vous regardez toujours l’ancien tableau de bord, vous manquez les points qui sont marqués ailleurs. Les prochains leaders ne seront pas ceux qui ont attendu les feux d’artifice. Ce seront ceux qui ont vu à travers le bruit et agi sur le signal réel.












