Interviews
Ben Faes, PDG de RWS – Série d’entretiens

Ben Faes est le directeur général du groupe RWS. Il apporte plus de 25 ans d’expérience dans la conduite de la transformation numérique et le développement d’entreprises axées sur la technologie, avec un solide bilan en matière de croissance rentable, de construction de modèles de commercialisation innovants et de développement d’équipes internationales de haute performance.
Avant de rejoindre RWS, Ben a occupé des postes de direction dans les secteurs de la technologie et des services commerciaux. Chez AOL, il est devenu directeur général pour la France, avant de rejoindre Alphabet en 2008, où il a été un pionnier de la monétisation de YouTube en Europe et a ensuite dirigé plusieurs entreprises Google dans la région EMEA, culminant avec le poste de directeur général de Google Cloud pour l’Europe du Sud et les marchés émergents. En 2021, il est devenu le PDG de Webhelp au Royaume-Uni, et après son acquisition par Concentrix, il a dirigé les initiatives de transformation et de technologie mondiales chez Concentrix Catalyst.
RWS est une entreprise de solutions d’intelligence artificielle et de services de contenu qui aide les organisations à créer, gérer, traduire et protéger les informations à grande échelle, en combinant la technologie avancée avec l’expertise humaine. L’entreprise se spécialise dans des domaines tels que la traduction et la localisation de langues, les services de propriété intellectuelle et les solutions de contenu et de données alimentées par l’IA, permettant aux entreprises de communiquer efficacement sur les marchés et de déployer des systèmes d’IA d’entreprise avec une précision culturelle et contextuelle. Avec une main-d’œuvre mondiale importante et des décennies d’expérience, RWS aide les grandes entreprises à transformer des données complexes en contenu clair et fiable, tout en accélérant l’innovation et en garantissant que les idées sont comprises dans le monde entier.
Vous avez dirigé des transformations majeures dans des entreprises comme Google Cloud et maintenant chez RWS. Comment votre expérience dans le développement de plateformes d’IA d’entreprise a-t-elle façonné votre approche de la construction de Language Weaver Pro comme un système de traduction critique pour la mission, plutôt qu’un outil à usage général ?
Ce que j’ai appris en développant l’IA d’entreprise, c’est que les outils à usage général atteignent rapidement leur limite dans les environnements à enjeux élevés.
Les entreprises n’ont pas seulement besoin de quelque chose qui fonctionne la plupart du temps. Elles ont besoin de quelque chose sur lequel elles peuvent compter – quelque chose qu’elles sont à l’aise de déployer dans des flux de travail critiques, de la RH à la localisation au support client.
Avec Language Weaver Pro, nous n’avons pas commencé par nous demander : « Comment pouvons-nous construire un meilleur modèle de traduction ? » Nous nous sommes demandé : « À quoi ressemblerait un système de traduction pour qu’une entreprise puisse lui faire confiance à grande échelle ? »
Cela déplace le focus. Ce n’est pas seulement une question de qualité du modèle. C’est une question de cohérence, de contrôle, de scalabilité et de sécurité – les choses qui font qu’un système est utilisable dans le monde réel.
Une des choses dont je suis le plus fier, c’est que Language Weaver Pro n’a pas eu besoin d’être adapté pour l’entreprise plus tard. Il a été conçu pour cela dès le premier jour.
Alors que d’autres se déplacent maintenant vers la spécialisation, c’est quelque chose que Language Weaver a intégré dans ses fondements depuis des années. Notre partenariat avec Cohere nous a donné des capacités d’IA de classe mondiale – et nous avons ajouté les contrôles d’entreprise et l’expertise linguistique nécessaires pour les rendre vraiment utilisables à grande échelle.
Language Weaver Pro est construit sur un modèle de plus de 100 milliards de paramètres. Quelles décisions architecturales ou de formation ont été critiques pour atteindre des performances solides au niveau du paragraphe et du document, où de nombreux systèmes de traduction ont généralement des difficultés ?
La plupart des systèmes de traduction sont optimisés pour la phrase en tant qu’unité de traduction – ce qui reflète la façon dont l’industrie de la localisation a historiquement fonctionné. Le problème est que le sens ne vit pas toujours au niveau de la phrase. L’ambiguïté, la cohérence terminologique et le ton opèrent tous au-delà des phrases. Obtenir de solides performances au niveau du paragraphe a nécessité des décisions délibérées, notamment l’option pour une fenêtre de contexte beaucoup plus grande que les systèmes de traduction typiques.
Un problème que la plupart des systèmes rencontrent ici est que la gestion de contextes plus larges est généralement accompagnée d’une augmentation des temps de traitement. C’est là que l’architecture Mixture of Experts entre en jeu. MoE permet à Language Weaver Pro d’être à la fois suffisamment grand pour gérer du contenu complexe et long, et suffisamment efficace pour le déployer à l’échelle de l’entreprise.
La plateforme s’est classée première dans 31 des 32 langues dans les benchmarks menés par des humains. Comment l’évaluation humaine diffère-t-elle des métriques automatisées, et pourquoi cette distinction est-elle importante pour les cas d’utilisation d’entreprise ?
Les métriques automatisées sont essentielles pour l’échelle. Pour évaluer de manière cohérente la qualité, vous ne pouvez pas continuellement effectuer des évaluations humaines sur 32 langues et des milliers de segments sans elles. Mais il y a des limites également. Les métriques traditionnelles comme BLEU mesurent la superposition des mots de surface, ce qui signifie qu’une traduction peut obtenir un bon score tout en manquant de nuance, ou obtenir un mauvais score tout en étant parfaitement précise. Même les métriques neuronales les plus sophistiquées sont des proxys pour le jugement humain, et non des substituts à celui-ci. Une traduction qui est techniquement exacte mais incorrecte sur le plan tonal dans un contexte culturel peut causer de réels dommages.
C’est pourquoi nous avons effectué les deux. Les évaluations humaines aveugles que nous avons menées avec nos propres traducteurs professionnels nous ont donné la sensibilité de domaine et culturelle que nos clients d’entreprise et leurs utilisateurs finals se soucient vraiment.
De nombreux systèmes de traduction par IA ont des difficultés à maintenir la cohérence sur de longs documents. Comment Language Weaver Pro préserve-t-il le sens et le contexte à travers les paragraphes, en particulier dans le contenu juridique ou réglementaire ?
La cohérence est l’un des défis les plus difficiles dans la traduction à grande échelle – et ce n’est pas quelque chose que les modèles à usage général peuvent résoudre par eux-mêmes.
C’est également un domaine où nous avons eu un véritable avantage. Des solutions comme Trados et Language Weaver ont longtemps intégré des contrôles de terminologie solides, vous permettant d’imposer un langage cohérent sur même les plus grands et les plus complexes ensembles de contenu.
Cela compte plus que jamais dans les environnements réglementés. Dans le contenu juridique ou de conformité, la cohérence n’est pas un élément facultatif – c’est critique. Une simple variation dans la façon dont un terme défini est traduit peut invalider un contrat, déformer un dépôt réglementaire ou introduire un risque réel.
Le contrôle de la terminologie élimine cette incertitude. Il garantit que la sortie finale utilise exactement le langage que les équipes juridiques et de conformité ont approuvé – de manière cohérente, à grande échelle.
Vous avez décrit cela comme un passage de la traduction à l’intelligence linguistique. Qu’est-ce que cela signifie dans la pratique, et comment cela change-t-il la façon dont les entreprises interagissent avec le contenu multilingue ?
Pendant des décennies, l’industrie a considéré la traduction comme un processus mécanique qui convertit des mots d’une langue à une autre. Et même si des processus de traduction spécialisés par des humains, tels que la transcréation, ont existé depuis un certain temps, tout cela a reposé sur un processus relativement lent axé sur les comptes de mots. « L’intelligence linguistique » change fondamentalement ce paradigme. Il s’agit d’un passage de la conversion de mots à une véritable compréhension du sens ; il s’agit de saisir le contexte, la nuance, la voix de la marque et l’intention spécifique derrière le contenu, quelle que soit la langue d’origine. Nous passons d’une tâche passive et réactive à une capacité proactive et stratégique.
Dans la pratique, lorsque nos outils d’IA sont capables de rendre les traductions plus fluides et sensibles au contexte, la couche d’intelligence culturelle humaine peut se concentrer sur la pertinence et l’impact, plutôt que de simplement éditer le contenu.
La plateforme met l’accent sur la gouvernance, le contrôle de la terminologie et la sécurité des données. Quels systèmes spécifiques sont en place pour garantir que les traductions répondent aux exigences de conformité dans des secteurs tels que la finance et les soins de santé ?
La confiance est la pierre angulaire de notre plateforme, en particulier pour les industries réglementées. Tout d’abord, nous offrons une flexibilité de déploiement que les outils publics ne peuvent pas offrir. Les clients peuvent exécuter Language Weaver sur leurs propres serveurs internes ou dans leur propre cloud privé dédié. Cela garantit que les données sensibles ne quittent jamais leur environnement sécurisé, ce qui est non négociable pour répondre aux exigences de résidence des données.
Deuxièmement, nous offrons un contrôle granulaire sur les sorties qui peuvent changer avec les exigences d’une industrie. Les clients intègrent directement leurs propres glossaires approuvés dans le modèle. Cela garantit que une clause de non-responsabilité juridique spécifique dans le domaine financier ou un terme médical approuvé dans le domaine des soins de santé est traduit correctement et de manière cohérente à chaque fois, éliminant le risque de langage non conforme.
Enfin, la gouvernance est intégrée. La plateforme s’intègre aux cadres de sécurité d’entreprise existants, offrant des pistes d’audit complètes et des contrôles d’accès, et les clients peuvent toujours acheminer le contenu vers des experts humains pour des certificats d’exactitude ou pour une révision obligatoire.
Contrairement aux modèles d’IA à usage général, Language Weaver Pro est conçu spécifiquement pour la traduction. Quels sont les compromis entre la spécialisation et la flexibilité, et pourquoi la spécialisation devient-elle plus importante pour l’IA d’entreprise ?
Un modèle à usage général est un peu comme un couteau suisse. Il est polyvalent – il peut suggérer une recette à partir de ce qui se trouve dans votre réfrigérateur, esquisser un plan paysager, écrire un poème ou même essayer de coder.
Mais lorsqu’il s’agit de travail d’entreprise critique pour la mission, « suffisamment bon » n’est pas suffisant. Vous n’utiliseriez pas un couteau suisse pour une opération chirurgicale à moins d’y être contraint. Vous voudriez un instrument de précision.
C’est la différence avec un modèle conçu à des fins spécifiques comme Language Weaver Pro. Nous n’essayons pas de faire tout. Nous nous concentrons sur faire une chose exceptionnellement bien – fournir des traductions précises et fiables à grande échelle.
Ce niveau de spécialisation devient essentiel. Les enjeux sont simplement trop élevés pour les outils généralistes. Les entreprises ont besoin de traductions sur lesquelles elles peuvent compter – du contenu qui est clair, actionnable et précis à chaque fois.
La collaboration avec Cohere rassemble l’expertise linguistique et l’infrastructure d’IA sécurisée. Comment le système est-il conçu pour équilibrer les performances, la confidentialité et la flexibilité de déploiement sur le cloud, sur site et dans les environnements hybrides ?
Cette collaboration est fondamentale pour notre stratégie car elle a été conçue autour d’un principe fondamental : l’IA de classe mondiale doit s’adapter à la posture de sécurité du client, et non l’inverse. Nous refusons de forcer les entreprises à adopter un modèle de cloud public universel.
Notre conception atteint cet équilibre en séparant le modèle d’IA de l’infrastructure sur laquelle il s’exécute. Cohere fournit le modèle de base de pointe, tout en étant un partenaire de classe mondiale pour nous, et nous fournissons l’expertise linguistique et la flexibilité de déploiement dont nous sommes déjà connus. Cela nous permet de déployer ces modèles performants et fluides partout où résident les données de nos clients. Pour une banque ou une agence de renseignement, cela signifie l’exécuter complètement isolé sur leurs machines internes. Pour un fournisseur de soins de santé, cela peut être dans leur cloud privé dédié pour répondre aux réglementations HIPAA. Et pour une entreprise technologique mondiale, un modèle hybride peut offrir des performances et une flexibilité à travers les régions, tout en maintenant la sécurité des données là où ils en ont besoin.
La clé est que le client est toujours en contrôle. Ils bénéficient de la pleine performance du modèle de traduction le plus avancé et le plus grand de l’industrie sans jamais avoir à compromettre sur leur confidentialité des données ou leurs exigences de conformité. Nous leur apportons le pouvoir à leur périmètre.
L’un des plus grands risques pour les entreprises est la traduction qui semble correcte mais contient des erreurs subtiles. Comment votre plateforme identifie-t-elle et réduit-elle ces risques, en particulier dans les scénarios à enjeux élevés ?
Ceci est une faille fondamentale de l’IA à usage général, et en tant qu’entreprise qui se spécialise dans l’intelligence linguistique, nous comprenons que ce risque est inacceptable. Un non-sens plausible est une responsabilité, et non un atout.
Nous cherchons à atténuer ce risque de plusieurs manières. Tout d’abord, nos modèles ne sont pas formés sur l’internet public non filtré. Ils sont construits sur une base de données linguistiques de haute qualité, traduites par des humains et spécifiques à des domaines, sur quatre décennies. Cela enseigne au modèle à être correct, et non simplement fluide. Il apprend la bonne façon de traduire des clauses juridiques complexes et des instructions médicales précises parce qu’il a appris à partir de données propres, et non de bavardages sur internet.
Nous donnons également à nos clients un contrôle direct sur la sortie. Grâce à la gestion de la terminologie et à la rétroaction, ils peuvent verrouiller la traduction correcte pour leurs termes les plus critiques et les plus ambigus. Cela garantit qu’une revendication de brevet spécifique ou une interaction médicamenteuse est rendue avec les traductions correctes, chaque fois.
Enfin, nous bouclons la boucle. Nos systèmes sont conçus pour intégrer l’expertise humaine pour la révision et l’affinement. Ce cycle constant de rétroaction des linguistes experts et des propres réviseurs du client crée un cycle d’amélioration continue, capturant les nuances et les erreurs subtiles que les modèles généralistes ne peuvent pas voir.
Avec une concurrence solide de la part d’outils comme DeepL et Google Gemini, voyez-vous l’avenir de la traduction par IA se déplaçant vers des modèles spécifiques à des domaines, et qu’est-ce que cela signifie pour l’écosystème plus large de l’IA ?
Permettez-moi de répondre à cela avec une anecdote. Nous avons un client, un grand nom dans l’informatique, qui travaille avec plusieurs fournisseurs de traduction. Nous travaillons avec la majorité de leur portefeuille, et l’une des principales raisons pour lesquelles ils nous choisissent est que lorsque quelque chose ne va pas, nous pouvons le corriger. La terminologie technique coréenne ne fonctionne pas tout à fait ? Nous avons une équipe pour cela. Les chiffres allemands causent des problèmes ? Nous avons des personnes qui peuvent aider.
C’est le point plus large. Nous attendons que les progrès futurs dans l’IA viennent moins des avancées purement modélisées et plus des solutions qui peuvent exploiter un contexte pertinent – linguistique, culturel et spécifique à un domaine. RWS, grâce à son vaste portefeuille de produits, à des décennies de données propriétaires et à des relations étroites avec les clients, a accès à exactement ce type de contexte. Les fournisseurs à usage général peuvent correspondre à une référence de modèle ; mais ils ne peuvent pas reproduire cela. L’avenir appartient aux fournisseurs qui combinent l’IA de pointe avec les humains et l’expertise institutionnelle pour la faire fonctionner dans le monde réel – et c’est exactement où nous nous situons.
Je vous remercie pour cette grande interview, ceux qui souhaitent en savoir plus peuvent visiter RWS.












