访谈
Ben Faes,RWS 首席执行官 – 采访系列

Ben Faes 是 RWS Group 的首席执行官。他拥有超过 25 年的数字化转型和技术驱动型业务扩张经验,具有强大的推动盈利增长、建立创新营销模式和发展高绩效国际团队的记录。
在加入 RWS 之前,Ben 在技术和商业服务领域担任过多个高级领导职位。在 AOL,他升任法国管理总监,后于 2008 年加入 Alphabet,在欧洲开创了 YouTube 的盈利模式,并后来领导了 Google 在 EMEA 地区的多个业务,最后担任 Google Cloud 南欧和新兴市场的管理总监。2021 年,他成为 Webhelp 的英国首席执行官,在 Webhelp 被 Concentrix 收购后,领导 Concentrix Catalyst 的全球转型和技术计划。
RWS 是一家全球人工智能解决方案和内容服务公司,帮助组织创建、管理、翻译和保护大规模信息,结合先进技术和人类专业知识。该公司专注于语言翻译和本地化、知识产权服务以及人工智能内容和数据解决方案等领域,帮助企业跨市场有效沟通并部署具有文化和背景准确性的企业人工智能系统。凭借庞大的全球劳动力和数十年的经验,RWS 支持大型企业将复杂数据转化为清晰可靠的内容,同时加速创新并确保全球范围内的思想传达。
您曾领导过 Google Cloud 和现在 RWS 的重大变革。您的企业人工智能平台扩张经验如何影响您在 Language Weaver Pro 中构建使命关键翻译系统而非一般用途工具的方法?
我从扩张企业人工智能中所学到的经验是:一般用途工具在高风险环境中很快就会遇到瓶颈。
企业不仅需要能够正常工作的东西,他们需要能够依赖的东西 —— 能够在关键工作流程中嵌入的东西,从人力资源到本地化再到客户支持。
我们在构建 Language Weaver Pro 时,并没有问“如何构建一个更好的翻译模型?”而是问“一个企业如何信任一个翻译系统?”
这改变了我们的关注点。它不仅仅是关于模型质量的问题,而是关于一致性、控制、可扩展性和安全性 —— 这些使系统在现实世界中可用的东西。
我最自豪的事情之一是,Language Weaver Pro 不需要在以后为企业进行适配。它从第一天就为企业而设计。
虽然其他人现在正在向专业化转变,但 Language Weaver 多年来一直将其构建到其基础中。我们的与 Cohere 的合作伙伴关系为我们提供了世界级的人工智能能力 —— 并且我们添加了企业控制和语言专业知识,使其在大规模上真正可用。
Language Weaver Pro 建立在一个 100 多亿参数模型上。为了在段落和文档级别上实现强大的性能,哪些架构或训练决策是至关重要的?
大多数翻译系统都是针对句子作为翻译单位进行优化的 —— 这反映了本地化行业的历史工作方式。问题在于,意义并不总是存在于句子级别。模糊性、术语一致性和语气都在更长的文本跨度中起作用。为了实现强大的段落级性能,需要做出有意识的决定,包括选择比典型翻译系统更大的上下文窗口。
一个大多数系统在这里遇到的问题是,处理更大的上下文通常会带来更长的处理时间。这就是 Mixture of Experts 架构发挥作用的地方。MoE 允许 Language Weaver Pro 在处理复杂、长篇内容的同时,能够在企业规模上高效地部署。
该平台在 32 种语言中排名前 31 位,采用人工评估。人工评估与自动化指标如何不同,并且为什么这种区别对于企业用例至关重要?
自动化指标对于规模至关重要。为了持续评估质量,您不能不断地在 32 种语言和数千个片段中运行人工评估。然而,也存在局限性。传统指标如 BLEU 测量表面级别的单词重叠,这意味着翻译可以得分很高,但缺乏细微差别,或者得分很低,但完全准确。甚至更复杂的神经指标也是对人类判断的代理,而不是替代品。在文化背景下语气不正确的翻译可能会造成真正的损害。
这就是为什么我们同时进行了这两项评估。我们与专业翻译人员进行的盲人评估为我们提供了企业客户和他们的最终用户真正关心的领域和文化敏感性。
许多人工智能翻译系统在维护长文档的一致性方面存在困难。Language Weaver Pro 如何在段落中保持意义和上下文,特别是在法律或监管内容中?
一致性是大规模翻译中最具挑战性的问题之一 —— 而这不是一般性模型可以单独解决的问题。
这也是我们拥有真正领先优势的领域。像 Trados 和 Language Weaver 这样的解决方案长期以来一直构建了强大的术语控制,因此您可以在最大的、最复杂的内容集中强制一致的语言。
这在监管环境中尤为重要。在法律或合规内容中,一致性不是一种很好的特性 —— 它是至关重要的。对定义术语的翻译的单一变化可能会使合同失效,扭曲监管文件或引入真正的风险。
术语控制消除了这种不确定性。它确保最终输出使用法律和合规团队已批准的语言 —— 始终如一地,在大规模上。
您将其描述为从翻译到语言智能的转变。这种转变在实践中意味着什么,并且如何改变企业与多语言内容的交互方式?
几十年来,行业一直将翻译视为一种机械过程,将单词从一种语言转换为另一种语言。虽然像转创这样的专业人工翻译过程已经存在一段时间,但这都依赖于一个相对较慢的过程,专注于单词数量。“语言智能”从根本上改变了这种范式。它是从转换单词到真正理解意义的转变 —— 它是关于理解背景、细微差别、品牌声音和内容背后的特定意图,无论原始语言是什么。我们正在从一个被动的、反应性的任务转变为一个主动的、战略性的能力。
在实践中,当我们的 AI 工具能够使翻译更加流畅和上下文感知时,文化智能人工层不仅可以编辑内容,还可以专注于相关性和影响力。
该平台强调治理、术语控制和数据安全。为了确保翻译满足金融和医疗保健等行业的合规要求,哪些具体系统已经就位?
信任是我们平台的基石,尤其是在监管行业。首先,我们提供了公用工具无法提供的部署灵活性。客户可以在本地或在自己的专用私有云中运行 Language Weaver。这确保了敏感数据永远不会离开他们的安全环境,这对于满足数据居住要求是不可协商的。
其次,我们为输出提供了细粒度的控制。客户可以直接将他们自己的批准词汇表嵌入模型中。这保证了特定的法律免责声明或医疗保健中的批准的医学术语每次都被正确且一致地翻译,消除了不合规语言的风险。
最后,治理是内置的。该平台与现有的企业安全框架集成,提供完整的审计跟踪和访问控制,客户可以始终将内容路由到 humans-in-the-loop 的专家进行准确性证书或强制审查。
与 DeepL 和 Google 的 Gemini 等工具相比,Language Weaver Pro 是为翻译而专门构建的。专用化和灵活性之间的权衡是什么,为什么专用化对企业人工智能来说越来越重要?
一个通用模型有点像瑞士军刀。它是多功能的 —— 它可以建议从您的冰箱中可以做出的食谱,绘制景观计划,写一首诗,甚至尝试一些代码。
但是,当涉及到企业的关键任务工作时,“足够好”是不够的。你不会在没有其他选择的情况下使用瑞士军刀进行手术。你会想要一个精密仪器。
这就是 Language Weaver Pro 的不同之处。我们不试图做所有事情。我们专注于做一件事做得非常好 —— 在规模上提供准确、可靠的翻译。
这种专门化正在变得至关重要。企业需要他们可以信任的翻译 —— 内容清晰、可行、每次都准确。风险太高,不能使用通用工具。
Cohere 的合作将语言专业知识和安全的人工智能基础设施结合在一起。系统如何设计以平衡性能、隐私和部署灵活性,在云端、内部和混合环境中?
这种合作对于我们的战略至关重要,因为它是围绕一个核心原则构建的:世界级的人工智能必须适应客户的安全姿势,而不是相反。
我们的设计通过将人工智能模型与其运行的基础设施分离来实现这一平衡。Cohere 提供了最先进的基础模型,同时成为我们的世界级合作伙伴,我们提供语言专业知识和已知的部署灵活性。这使我们能够在客户的数据所在的任何地方部署这些高性能、流畅的模型。对于银行或情报机构来说,这意味着在他们的本地机器上完全隔离运行。对于医疗保健提供者来说,这可以在他们的专用私有云中满足 HIPAA 法规。对于全球科技公司来说,混合模型可以在各个地区提供性能和灵活性,同时在需要时保持数据安全。
关键是客户始终控制着一切。他们获得了业界最大的、最先进的翻译模型的全部性能,而无需在数据隐私或合规性方面做出任何妥协。我们将力量交给他们的边界。
对于企业来说,翻译看似正确但包含微妙错误的风险是最大的。您的平台如何识别和减轻这些风险,特别是在高风险场景中?
这是通用人工智能的一个根本缺陷,作为一家专门从事语言智能的公司,我们理解这是一种不可接受的风险。听起来很合理的无意义内容是一个负担,而不是一种资产。
我们通过以下几种方式来减轻这种风险。首先,我们的模型不是在未经筛选的公共互联网上训练的。它们是建立在四十年高质量的人工翻译和领域特定语言数据的基础上。这教会模型做正确的事情,而不仅仅是流畅。它学习正确翻译复杂法律条款和精确的医疗指示,因为它从干净的数据中学习,而不是互联网聊天。
我们还为客户提供直接的输出控制。通过术语管理和反馈,他们可以锁定对其最关键和模糊的术语的正确翻译。这确保特定的专利声明或药物相互作用短语每次都被正确且一致地翻译。
最后,我们闭合了循环。我们的系统旨在与 humans-in-the-loop 的专家集成,用于审查和改进。这一来自语言学家和客户自己的审查者的持续反馈循环捕捉到了那些通用模型无法察觉的细微差别和微妙错误。
随着 DeepL 和 Google 的 Gemini 等工具的强烈竞争,您是否认为人工智能翻译的未来将向领域特定模型转变,这对更广泛的人工智能生态系统意味着什么?
让我用一个轶事来回答这个问题。我们有一个客户,是一家计算机行业的知名公司,他们与多个翻译供应商合作。我们与他们的大部分产品线合作,其中一个主要原因是,当事情出错时,我们可以解决它。韩语技术术语没有完全命中?我们有一个团队可以处理这个问题。德国数字造成问题?我们有可以帮助的人。
这是一个更广泛的观点。我们预计人工智能的未来进步将更多地来自于利用相关上下文的解决方案 —— 语言、文化和领域特定 —— 而不是纯粹的模型进步。RWS 通过其广泛的产品组合、数十年的专有数据和与客户的深厚关系,拥有这种背景的访问权。一般用途的提供商可以匹配模型基准;但他们无法复制这一点。未来属于那些将前沿人工智能与使其在现实世界中发挥作用的人类和机构专业知识相结合的提供商 —— 而这正是我们所处的位置。
感谢您接受这次精彩的采访,任何希望了解更多信息的人都可以访问 RWS。
