Connect with us

Leaders d’opinion

Pourquoi le “Meilleur LLM pour le Marketing” n’Existe Pas

mm

Chaque nouvelle version de modèle de langage à grande échelle arrive avec les mêmes promesses : des fenêtres de contexte plus grandes, une raisonnement plus solide et de meilleures performances de référence. Ensuite, avant longtemps, les marketeurs avertis ressentent une anxiété maintenant familière qui commence à se faufile. Le modèle qu’ils utilisent pour tout est-il déjà en train de tomber en arrière ? Vaut-il la peine de passer à un autre et de réentraîner tout depuis le début ? Que se passe-t-il s’ils ne font rien et se retrouvent distancés ?

Cette anxiété est compréhensible. Elle est également mal placée.

En tant que personne responsable de la construction des systèmes sur lesquels les marketeurs comptent chaque jour, je vois ce schéma se reproduire dans les équipes et les flux de travail longtemps avant qu’il n’apparaisse dans les titres.

D’un point de vue produit et plateforme, quelque chose est devenu de plus en plus clair au cours des dernières années : il n’y a pas de modèle unique qui performe constamment le mieux sur toutes les tâches de marketing. Ayant un siège au premier rang pour des centaines d’équipes de marketing qui lancent des campagnes mondiales à mesure que le rythme de l’innovation des modèles s’accélère, il est clair que les exigences du travail de marketing dans le monde réel sont trop nuancées pour qu’une stratégie à modèle unique tienne sur le long terme.

Choisir le “bon” modèle n’a pas d’importance parce qu’aucun modèle unique n’est adapté à chaque tâche. Ce qui compte, c’est concevoir des systèmes qui peuvent continuellement évaluer les modèles et les faire correspondre au travail spécifique que les marketeurs tentent de faire. Ce n’est pas quelque chose que les marketeurs individuels devraient avoir à gérer, mais quelque chose que leurs outils devraient gérer pour eux. La conclusion pratique est simple : arrêtez de demander quel modèle est le “meilleur” et commencez à demander si vos outils peuvent s’adapter à mesure que les modèles changent.

Pourquoi la Pensée “Meilleur Modèle” se Décompose dans le Marketing

La plupart des discussions publiques sur les LLM tournent autour de références générales : des problèmes mathématiques, des défis de raisonnement, des examens standardisés. Ces références sont des signaux utiles pour les progrès de la recherche, mais ils sont de mauvais prédicteurs de la performance des tâches dans le monde réel.

Le contenu marketing, en particulier, a des caractéristiques que les références génériques capturent rarement :

  • Il s’agit toujours d’un produit ou d’un service spécifique
  • Il est toujours écrit pour un public défini
  • Il doit constamment refléter la voix, le ton et les normes de la marque

Par exemple, nous voyons constamment que différents modèles excellent dans différents types de travail de marketing. Certains sont meilleurs pour créer des copies dans la voix de votre marque à partir de zéro, tandis que d’autres performent mieux pour comprendre des documents techniques complexes et les condenser en billets de blog. Nous apprenons cela grâce à des tests rigoureux, car de nouvelles capacités ne créent de la valeur que lorsqu’elles sont évaluées rapidement et de manière réaliste. Ainsi, par exemple, lorsque Gemini 3 Pro a été lancé à la fin de nov 2025, notre équipe l’a intégré et testé dans les 24 heures, puis l’a mis à la disposition de clients sélectionnés pour évaluer son adaptation aux flux de travail de marketing réels plutôt qu’aux références abstraites.

Ce schéma n’est pas anecdotique. La recherche montre de plus en plus que la performance des LLM est fortement dépendante de la tâche, avec des modèles exhibant une variance significative sur les tâches d’écriture, de résumé, de raisonnement et de suivi d’instructions. Un modèle qui performe bien sur des tests de raisonnement généraux peut encore avoir du mal avec la génération de contenu sensible à la marque et contraint.

Encore plus important, nous voyons ces changements sur une base mensuelle. Le leadership des modèles change à mesure que les fournisseurs optimisent pour différentes capacités, structures de coûts et approches de formation. L’idée qu’un fournisseur restera le “meilleur” sur tous les cas d’utilisation du marketing est déjà obsolète.

Les Coûts Cachés de la Chasse aux Versions

Lorsque les équipes tentent de suivre manuellement les versions de modèles et de basculer vers de nouveaux outils de manière réactive, les coûts opérationnels s’accumulent. Les marketeurs éprouvent :

  • Une perturbation des flux de travail parce que les invites, les modèles et les processus nécessitent une ajustement constant
  • Une qualité de sortie incohérente parce que les différents modèles se comportent différemment sur les tâches
  • Une fatigue de décision parce que le temps d’évaluation remplace le travail productif

J’ai vu des équipes de marketing passer des trimestres entiers à migrer d’un fournisseur à un autre, pour finalement constater que leurs invites soigneusement réglées ne fonctionnent plus comme prévu. Le contenu qui était censé être conforme à la marque est maintenant lu différemment. Les membres de l’équipe qui venaient de se familiariser avec un flux de travail sont maintenant confrontés à une nouvelle courbe d’apprentissage. Les gains de performance promis se matérialisent rarement de manière à justifier la perturbation.

Les recherches de l’industrie montrent constamment que la plupart de la valeur de l’IA est perdue non pas au niveau du modèle, mais dans l’intégration et la gestion du changement. D’un point de vue produit, le plus grand risque est de coupler les flux de travail trop étroitement à un seul modèle. Cela crée simplement un verrouillage technique, ce qui rend les améliorations plus difficiles avec le temps.

Une Approche Plus Durable : Les Systèmes Optimisés pour les LLM

Une approche plus résiliente consiste à supposer la volatilité. Et puis concevoir pour cela.

Dans un système optimisé pour les LLM, les modèles sont traités comme des composants interchangeables plutôt que comme des dépendances fixes. Les performances sont évaluées en continu à l’aide de flux de travail réels, et non de références abstraites. Les différents modèles peuvent être acheminés vers différentes tâches en fonction des résultats observés plutôt que des capacités théoriques.

Cela peut signifier acheminer la génération de légendes pour les médias sociaux vers un modèle qui excelle dans la brièveté et la force de frappe, tandis que la direction du contenu de blog long vers un autre qui maintient la cohérence sur des milliers de mots. L’agent qui aide à élaborer la stratégie peut utiliser un troisième modèle qui est meilleur pour la raison. Le système prend ces décisions d’acheminement de manière automatique en fonction du modèle qui a testé le mieux pour chaque type de tâche spécifique.

Du point de vue de l’utilisateur, ce processus devrait être invisible. Une analogie que j’aime utiliser ici : Dans la cuisine française, chaque composant – sauce, réduction, assaisonnement – a une technique derrière lui. Le dîneur n’a pas besoin de savoir d’où vient chaque ingrédient. Il n’expérimente qu’un meilleur repas.

Pour les marketeurs, le même principe s’applique. Le moteur sous-jacent peut changer tandis que les flux de travail restent stables. Les améliorations apparaissent progressivement sous la forme d’une meilleure alignement de la marque, d’une plus grande satisfaction du contenu et de résultats plus cohérents, sans forcer les équipes à réapprendre les outils toutes les quelques mois. Dans la pratique, cela signifie que les marketeurs obtiennent des résultats plus cohérents et moins de perturbations de flux de travail, même si les modèles changent sous le capot.

Pourquoi la Mesure est Plus Importante que les Références

Les décisions de modèle n’ont d’importance que si elles produisent des améliorations mesurables dans les flux de travail réels. Les références publiques fournissent une perspective directionnelle, mais elles ne répondent pas aux questions opérationnelles spécifiques au marketing comme :

  • Est-ce que ce modèle applique la voix de la marque de manière plus fiable ?
  • Est-ce qu’il intègre les connaissances sur les produits avec moins d’erreurs ?
  • Est-ce qu’il réduit le temps d’édition ou les goulets d’étranglement de gouvernance ?

Les recherches récentes mettent l’accent sur l’importance de l’évaluation humaine dans la boucle et des tests spécifiques aux tâches pour les systèmes LLM appliqués. À grande échelle, ces signaux sont beaucoup plus prédictifs de la valeur que les classements des tableaux de bord.

Le Changement Agentique Augmente les Enjeux

Alors que les systèmes d’IA deviennent plus agents, planifient, rédigent, itèrent et exécutent avec moins de surveillance directe, l’importance de la sélection du modèle sous-jacent augmente. En même temps, il devient moins réalisable pour les humains de superviser chaque décision.

Cela reflète les recherches actuelles sur les systèmes agents, qui mettent en évidence que le choix de l’outil et du modèle a un impact significatif sur la fiabilité et la sécurité. Dans cet environnement, la sélection du modèle devient une décision d’infrastructure, et non une préférence utilisateur. Le système lui-même doit s’assurer que chaque composant d’un flux de travail est alimenté par le modèle le plus adapté à ce moment, en fonction des performances observées plutôt que de l’habitude.

Absorber le Changement au Lieu de Réagir

Les titres vont continuer à paraître, de nouveaux modèles vont continuer à être lancés, et le leadership dans les performances des LLM va continuer à changer.

Le succès réside dans la construction de systèmes qui peuvent absorber la volatilité des modèles plutôt que de réagir à chaque version aussi rapidement que possible. C’est ainsi que les marketeurs peuvent mettre à l’échelle leur travail rapidement, maintenir la qualité et la cohérence de la marque, et rester concentrés sur le travail qui a vraiment un impact.

Je crois vraiment que l’avenir de l’IA dans le marketing est de rendre le changement de modèle sans importance pour les personnes qui font le travail. Après tout, les marketeurs ont beaucoup plus d’importance à faire que de réentraîner les modèles tous les six mois.

Bryan Tsao est directeur principal des produits chez Jasper, la plateforme d'agents de marketing, où il dirige les équipes Produit, Ingénierie, Croissance et Données. Avant Jasper, il a occupé des postes de direction supérieure, notamment vice-président de la croissance et des données chez Dropbox, vice-président du produit et de la conception chez Namely, et vice-président du produit, de la conception et des données chez Mattermark. Il détient un master en systèmes de gestion de l'information de l'Université de Californie, Berkeley, et un baccalauréat en sciences cognitives de l'UC San Diego.