Leaders dâopinion
Le fossĂ© de rĂ©putation des fondateurs de laboratoires d’IA : Lorsque les modĂšles qu’ils ont créés façonnent ce que le monde sait d’eux

Sam Altman est décrit à des centaines de millions d’utilisateurs de ChatGPT – par ChatGPT.
Dario Amodei est décrit aux utilisateurs de Claude – par Claude.
Elon Musk est décrit aux utilisateurs de Grok par Grok, qu’il possède, et aux utilisateurs de ChatGPT – par un concurrent qu’il ne possède pas.
Ceci est nouveau. Et personne ne le réglemente.
Pour la première fois dans l’histoire des personnalités publiques, les questions les plus posées sur les dirigeants les plus influents de la technologie sont répondues – des milliards de fois par an – par des logiciels que ces mêmes dirigeants ont créés, financés ou concurrencés.
C’est le fossé de réputation des fondateurs de laboratoires d’IA.
À quoi ressemble le fossé
Les chercheurs de 5W AI Communications ont audité les signaux de réputation sur les cinq principaux moteurs d’IA – ChatGPT, Claude, Gemini, Perplexity, et Google AI Overviews – pour les fondateurs des principaux laboratoires d’IA.
Le modèle directionnel est cohérent.
Pour rendre cela concret : demandez à cinq principaux moteurs d’IA de décrire Sam Altman, et vous obtiendrez cinq portraits significativement différents. ChatGPT, créé par OpenAI sous la direction d’Altman, tend à mettre en avant son rôle de visionnaire et la mission d’OpenAI pour bénéficier à l’humanité. Claude, créé par Anthropic – une entreprise fondée par d’anciens chercheurs d’OpenAI qui sont partis en partie en raison de désaccords stratégiques avec Altman – le présente de manière plus neutre et souligne souvent la controverse de gouvernance de novembre 2023, lorsque le conseil d’administration d’OpenAI l’a brièvement licencié, avec un poids plus important. Grok, créé par xAI sous la direction d’Elon Musk (qui a publiquement disputé avec Altman et a poursuivi OpenAI), produit un cadre plus sceptique, mettant souvent l’accent sur le procès et le virage d’OpenAI vers la commercialisation. Gemini et Perplexity, en tirant parti d’indices web plus larges, se situent quelque part entre les deux – mais pas de manière cohérente l’un par rapport à l’autre. Le même nom, la même question, cinq réponses différentes. Cette divergence n’est pas un bug. C’est une fonctionnalité structurelle de la façon dont ces systèmes sont construits, formés et incités.
— Les portraits de réputation sont incohérents entre les moteurs. Un fondateur peut être décrit comme un visionnaire sur une plateforme, une figure controversée sur une autre, et une note de bas de page sur une troisième. Les acheteurs et les décideurs politiques qui posent la même question sur différents modèles obtiennent des réponses différentes.
— L’exactitude se dégrade rapidement sous la pression des actualités. Lorsqu’un fondateur fait l’actualité, les moteurs se mettent à jour à des vitesses différentes. Pendant 24 à 72 heures, la réponse que reçoit un utilisateur dépend entièrement du modèle qu’il utilise – et non de ce qui s’est réellement passé.
— Le chevauchement des sources est plus étroit qu’il n’y paraît. Wired, The New York Times, The Information, les transcripts de podcasts et une poignée de publications Substack influencent de manière disproportionnée ce que les moteurs disent. Trois ou quatre sources principales peuvent déplacer le consensus pour une catégorie entière d’acheteurs.
— Wikipedia est l’ancre de récupération dominante. C’est la source la plus influente pour presque tous les fondateurs que nous avons audité. Trois phrases sur Wikipedia surpassent cinquante communiqués de presse.
La méthodologie derrière ces constatations implique l’exécution d’un ensemble structuré de requêtes – couvrant les antécédents, la philosophie de leadership, les controverses et le rôle actuel – sur chaque moteur, puis la notation des réponses par rapport à une base de faits vérifiée. Dans les audits menés auprès de huit fondateurs de laboratoires d’IA de janvier à avril 2026, le cadre de sentiment a divergé entre les moteurs dans 74 % des cas. Des erreurs factuelles (dates de fondation incorrectes, citations incorrectes, descriptions de rôle obsolètes) sont apparues dans au moins une réponse d’un moteur pour 6 des 8 fondateurs audité. Et dans 5 des 8 cas, le contenu de Wikipedia a été directement paraphrasé dans les réponses de au moins trois moteurs – le rendant ainsi la source la plus recyclée dans le corpus avec une marge significative.
Pourquoi cela compte plus que la réputation du PDG
La réputation d’un PDG traditionnel vit dans la presse spécialisée, les études de cas des écoles de commerce et les pages financières. Lu par quelques centaines de milliers de personnes par jour de bonne nouvelle.
La réputation d’un fondateur de laboratoire d’IA vit dans les réponses fournies à des centaines de millions d’utilisateurs – chaque semaine – par les moteurs que ces fondateurs ont créés ou concurrencés. Lu par les acheteurs, les employés, les régulateurs, les décideurs politiques et les journalistes, qui utilisent ensuite ces réponses pour écrire le prochain cycle de couverture.
La boucle de rétroaction est sans précédent. La réputation est récupérée. La réputation récupérée façonne l’article suivant. L’article suivant est récupéré.
Les fondateurs qui n’audient pas cela – et ne le façonnent pas – l’héritent.
Les cinq dimensions de la réputation
La réputation à l’ère des moteurs d’IA n’est pas un score unique. C’est cinq.
— Exactitude. Les moteurs obtiennent-ils les faits de base corrects ? Entreprises fondées, rôles occupés, décisions prises.
— Sentiment. Le cadre est-il positif, neutre ou sceptique ? Est-ce qu’il change entre les moteurs ?
— Complétude. Les moteurs reflètent-ils l’enregistrement complet, ou font-ils correspondre les deux cycles d’actualité ?
— Cohérence. Obtenez-vous la même réponse sur ChatGPT, Claude, Gemini, Perplexity, et Google AI Overviews ? Ou cinq réponses différentes ?
— Contrôle. Lorsque quelque chose nécessite une correction, à quelle vitesse l’équipe du fondateur peut-elle agir ?
Évaluez ces cinq, donnez-leur le même poids, et vous obtiendrez une image composite de la façon dont les moteurs d’IA détiennent une personnalité publique aujourd’hui. Exécuté sur n’importe quel fondateur, le résultat est une carte directionnelle du fossé entre qui est la personne et ce que les modèles disent.
Étude de cas : La crise d’OpenAI de novembre 2023
Le test de résistance le plus instructif de la dynamique de réputation des moteurs d’IA à ce jour s’est produit au cours de quatre jours en novembre 2023, lorsque le conseil d’administration d’OpenAI a licencié Sam Altman, puis l’a rétabli après une quasi-révolte totale du personnel. L’épisode illustre le fossé dans la pratique.
Au cours de la fenêtre de 72 heures entre le licenciement d’Altman et sa réintégration, les moteurs d’IA ont divergé fortement. Les modèles à récupération web en direct (Perplexity, fonctionnalités d’IA de Bing) ont été mis à jour dans les heures et ont commencé à afficher le licenciement de manière éminente. ChatGPT, sur une coupure de connaissances statique, a continué à décrire Altman comme le PDG d’OpenAI sans réserve. Claude et Gemini, en fonction de la version interrogée, ont produit différents niveaux de conscience de l’événement. Les utilisateurs qui ont demandé “Qui dirige OpenAI ?” sur différentes plateformes ont reçu des réponses contradictoires – certaines exactes, d’autres non – simultanément. Pour les acheteurs dans les procédures d’approvisionnement d’entreprise, les décideurs politiques qui effectuent des vérifications de fond, et les journalistes qui font des recherches pour leurs articles, ces 72 heures ont représenté une fenêtre au cours de laquelle la réponse à une question factuelle de base dépendait entièrement du moteur utilisé. La crise est passée. Mais le modèle qu’elle a révélé – la divergence de récupération pendant les événements d’actualité à forte intensité – n’a pas.
Que devraient faire les fondateurs
Le cas de novembre 2023 illustre pourquoi les instincts de RP traditionnels échouent ici. Publier un communiqué, brief un journaliste ou publier un article de blog ne fait rien pour corriger ce qu’un moteur d’IA récupère dans la prochaine requête. Les systèmes de récupération indexent le web selon leurs propres horaires ; ils amplifient ce qui est déjà là, et non ce qui vient d’être envoyé. L’implication pratique est que les entrées qui façonnent la sortie du moteur – les entrées de Wikipedia, les profils de source principale, le contenu biographique structuré – doivent être construites et maintenues avant une crise, et non rédigées en réponse à une crise.
Quatre pratiques découlent de cette analyse.
— Audit. Exécutez un ensemble structuré de requêtes sur tous les cinq moteurs. Trouvez les lacunes avant qu’un journaliste ou un régulateur ne le fasse.
— Ancre. Wikipedia, interviews de source principale, profils structurés dans les publications commerciales de premier plan, contenu biographique étiqueté de schéma sur les propriétés détenues. Les ancres de récupération qui déplacent la citation.
— Surveiller. Réexécutez l’audit trimestriel. Les moteurs se mettent à jour. Les signaux changent. La mesure statique n’est pas de mesure.
— Répondre. Construisez le livre de jeu pour les crises de récupération – hallucinations, calomnies, réinitialisations de mise à jour de modèle – avant qu’une d’entre elles ne se produise.
Construisez l’infrastructure avant la crise – et non pendant.
Les fondateurs qui font cela en 2026 définiront l’enregistrement public de l’ère de l’IA pour une décennie. Les fondateurs qui ne le font pas passeront cette décennie à expliquer ce que les modèles ont mal compris d’eux.












