访谈
雅雷克·库托夫斯基,DeepL 的创始人和 CEO – 采访系列

雅雷克·库托夫斯基 是 DeepL 的创始人和 CEO,DeepL 是一款先进的 AI 驱动的翻译工具,以其令人印象深刻的准确性和自然听起来的翻译而闻名。
DeepL 致力于为各地的企业打破语言障碍。超过 100,000 家企业和政府以及 228 个全球市场中的数百万个人都信任 DeepL 的语言 AI 平台,以实现类似人类的翻译和更好的写作。DeepL 的 AI 解决方案专门针对语言进行了调整,旨在帮助企业转变业务沟通、扩大市场并提高生产力。DeepL 于 2017 年成立,如今拥有超过 1,000 名热情的员工,并得到了 Benchmark、IVP 和 Index Ventures 等世界知名投资者的支持。
您能否带我们了解 DeepL 早期的愿景,以及公司的目标如何在成立以来不断演变?
当我在 2017 年创立公司时,我们正处于深度学习的转折点,这激发了我们公司的名称。我们一直有一个愿景,即使组织能够在全球范围内蓬勃发展和扩张,而不会受到语言障碍的阻碍,这仍然是我们的使命。因此,我们开始尝试该技术及其在语言方面的应用,并迅速看到了它的强大之处 – 很明显,神经网络和 AI 将成为翻译的下一个重大突破,我们可以通过神经网络实现的成果将远远超过传统解决方案。考虑到这一点,我们决定将我们的发现打包成一个产品并与世界分享。
最初作为一个有趣的项目,DeepL 很快演变成了更重要的东西。仅仅在 2017 年正式推出我们的首个产品 DeepL 翻译几个月后,我们就有了一些最重要的欧洲和德国公司敲开我们的门,希望部署我们的解决方案。这一认识关于我们产品的相关性和重要性激发了我们深入了解他们的问题,并投资时间真正了解我们的技术如何解决他们的问题。我们制定了一个更具体的商业策略和明确的盈利计划,首先专注于向公众发布产品,稍后再确定商业方面。快进到今天,我们已经显著增长,扩大了我们的团队、产品和客户网络。我们现在有数百万个使用我们专用 AI 翻译和写作工具的个人用户,以及全球 100,000 多家企业和政府合作伙伴,包括 50% 的财富 500 强公司和领先企业,如 Nikkei(金融时报的所有者)、Coursera、Deutsche Bahn、Zendesk 等。
您在谷歌和微软等大型玩家主导的领域创立了 DeepL。您如何在如此竞争激烈的格局中找到自己的位置?
我们从成立开始就面临着来自大型科技公司的竞争,这使我们保持敏捷、创新,并始终努力为用户提供最好的解决方案。但我挑战任何人声称他们已经解决了企业和企业使用案例中的语言挑战 – 这是 DeepL 与众不同并在语言 AI 和翻译领域真正独特的地方。
我们与一般用途的 AI 系统不同,我们的 AI 翻译和写作解决方案专门为语言使用案例设计;这种专门化使我们能够实现更高的准确性和精度,同时最小化幻觉和错误信息。翻译菜单时您可能正在度假,但大多数客户都是企业和知识工作者,对于他们来说,风险要高得多。想象一下,一位律师需要翻译高度细致、关键和机密的法律文件;或者一家主要媒体出版商依赖我们的平台每天实时翻译成千上万的故事,这些故事随后被分发给全球数百万读者。这些复杂的使用案例需要一种一般模型无法提供的准确性、定制、数据隐私和安全性。数据保护和安全也是我们产品的核心,因此我们遵守最高的隐私和安全标准,包括所有 GDPR 要求,提供最先进的数据加密等。
DeepL最近推出了其首个内部LLM。该模型与市场上的其他大型语言模型有何不同,在什么情况下被认为更优?
我们的下一代翻译模型由专门为翻译和编辑设计的专有LLM技术驱动,这使其与市场上的其他模型区别开来,并为翻译质量和性能设定了新的行业标准。与仅依赖公共互联网数据的通用模型不同,DeepL的LLM受益于七年来专门为内容创作和翻译而策划的专有数据。它还使用人类模型辅导,拥有成千上万的精心挑选的语言专家,他们接受过培训,以完善和提高模型的翻译质量。
因此,我们为DeepL被广泛认为是企业和专业人士中最可靠和最受欢迎的语言AI解决方案而感到自豪。在盲测中,专业翻译人员发现,我们的下一代LLM需要的编辑次数比其他平台少得多,谷歌和ChatGPT需要两到三倍的编辑次数才能达到相同的质量。
您能否解释DeepL的LLM的训练过程?在翻译中保持准确性和细微差别方面,需要多少人类输入,以及如何平衡这一点与AI开发的计算方面?
我们在最高质量的语言数据和成千上万名精心挑选的语言专家的专业知识的基础上训练我们的LLM。这种结合计算方面和人类反馈的两方面方法使我们能够在保持翻译质量和细微差别的同时支持我们的客户。人类输入在数据策划、质量评估和提供持续改进的反馈方面至关重要。没有这一方面,DeepL的翻译质量就不会像现在这样。
DeepL最近扩展到165个新市场,并增加了对三种新语言的支持。您在选择这些市场和语言时的战略思考是什么,扩张如何影响DeepL的用户群体?
语言是一个全球性问题,影响着几乎所有行业的企业 – 无论他们是在内部与同事还是在外部与客户和他们运营的多元化市场中面临语言障碍。作为一家研究驱动的公司,我们所做的一切都是由我们的使命,即打破语言障碍和我们从客户和企业那里收到的反馈所引导的。我们决定扩大产品的可用性 – DeepL Pro 现在在 228 个全球市场上都可用 – 并添加新的语言功能,例如最近推出的繁体中文,这是由我们的使命驱动的,受到客户反馈和市场研究的指导。
我们处于人工智能的激动人心的时刻,采用人工智能不仅是一种趋势,而且是一种必要。公司准备好接受人工智能,但他们正在寻找能够带来真正价值和投资回报率的技术,我们已经被证明能够带来显著的影响 – 2024 年的一项 Forrester 研究显示,使用 DeepL 可以为全球公司带来 345% 的投资回报率,翻译时间减少 90%,工作量减少 50%。通过扩大我们的覆盖范围和能力,我们可以为更多的市场、人和企业带来这些现实世界的好处。以繁体中文为例,它是全球 3300 万人的主要语言。因此,这真的推动了我们业务的规模,并帮助我们满足日益增长的全球需求。如今,我们拥有超过 100,000 名企业客户,并且正在迅速增长。
拥有超过 100,000 名客户,包括德国铁路和 Zendesk 等大型企业,您在扩大规模以满足企业和政府需求时遇到了哪些主要挑战和机会?
当我们与客户坐在一起时,他们很清楚我们可以为他们提供的价值和投资回报率 – 即使在美国,人们可能认为英语是唯一的语言,但大多数公司都有多语种团队,并且在全球市场中导航。DeepL 专用 AI 翻译工具和写作服务的价值和影响是明显的。因此,这不是他们是否应该实施语言 AI 工具的问题,而是一个有趣的问题,我们经常从企业那里听到,那就是关于我们服务的个性化能力。
企业通常遵循特定的品牌指南,并需要能够反映其独特品牌声音和行业术语的 AI 解决方案。他们希望能够在规模上保持一致的沟通,无论是内部还是外部 – 无论他们是在写作还是翻译文档,他们都希望内容听起来像他们自己写的一样,具有他们特有的品牌风格。在 DeepL,我们的工具就是以此为目标。我们提供了一系列更具交互性和可定制性的功能,包括 DeepL 词汇表,该功能允许企业和专业人士为特定词语和短语自定义翻译;以及语气设置等功能。这种微调和使内容成为他们自己的能力对我们的客户来说是非常重要的。
随着DeepL的扩张和其AI模型被更广泛使用,您在开发语言AI系统时优先考虑哪些关键的道德考虑,特别是在处理敏感或机密信息时?
任何考虑使用 AI 工具的组织都应该在评估模型和公司时提出这些问题。许多 AI 解决方案没有提供足够的安全性,经常与第三方共享用户数据,并使用用户文本来训练他们的 AI 模型,从而产生不信任并使许多用户犹豫是否要使用这些工具来处理工作相关的文档。正如我之前提到的,DeepL 采取了不同的方法 – 安全性是我们使命和产品的核心。
我们的客户来自广泛的行业,包括金融服务和法律等高度监管的领域,他们的数据的保密性和安全性至关重要。我们的产品提供的核心是我们遵守最高的企业级隐私和安全标准,以保护用户数据,包括最先进的数据加密和 GDPR、ISO 27001 和 Soc2 Type 2 合规性。我们也不使用任何订阅者的文本来增强或训练我们的 AI 模型,因为我们了解到许多用户翻译敏感信息。
我们可以期待DeepL在产品开发方面的下一步是什么?是否有任何主要功能或创新让您特别兴奋?
我们是一家专注于有目的的创新的人工智能公司,我们的目标是为人们和企业解决语言问题。展望未来,我们将继续将客户反馈纳入我们的开发中,并专注于扩展我们的语言 AI 平台的功能,以使其成为一个更全面解决方案,满足所有语言相关的业务需求。我们今天从客户那里听到很多的是,他们希望我们提供更多的交互性和个性化。因此,扩展我们的功能和功能以满足这一点,对我们来说是一个非常有趣的领域,研究如何使 DeepL 体验对我们的用户来说更加动态和引人入胜。
在接下来的5到10年里,您认为DeepL的技术将如何融入更广泛的人工智能格局,尤其是人工智能继续迅速演变?
5年对人工智能开发来说是一个很长的时间,对我来说最重要的是接下来的12个月!我们正在努力将书面语言领域的革命和颠覆带到其他多模态能力中,我对此感到兴奋。
感谢这次精彩的采访,希望了解更多的读者请访问DeepL。












