访谈
德普尔首席科学家斯蒂芬·梅斯肯 – 采访系列

斯蒂芬·梅斯肯,德普尔首席科学家,已经在德普尔公司工作了五年多,推进公司的核心研究和科学领导。斯蒂芬·梅斯肯于2020年10月加入德普尔公司,担任研究科学家,2023年11月成为研究副总裁,2025年4月晋升为现任首席科学家。他此前曾在科隆-波恩地区的real.digital公司担任数据科学家,并在明斯特大学从事数学逻辑研究。他的职业生涯跨越了基础数学研究和应用人工智能,能够领导德普尔公司大规模语言模型和多语言人工智能系统的科学方向。
德普尔是一家德国人工智能公司,专注于构建先进的语言人工智能系统,实现准确、上下文感知的翻译和跨100多种语言的交流。德普尔公司成立于2017年,总部位于科隆,服务全球数百万用户,并通过订阅和API提供企业级解决方案。其平台已经扩展到语言人工智能套件,包括写作辅助和语音功能,旨在支持全球企业和组织的安全、可扩展的交流。
您从数学逻辑开始职业生涯,然后转向应用数据科学,最后领导德普尔的研究组织。回顾过去,您早期在形式推理方面的工作如何影响您现在对构建自主、企业级人工智能系统的思考?
我最初被集合论和数学逻辑领域吸引,是因为我渴望了解这些复杂系统的工作原理——从基本原理到越来越深入的层次。这种好奇心自童年以来一直伴随着我,也是我工作中最喜欢的方面。目前,挑战是以对现实世界可用性的强烈关注来推进人工智能开发。除了安全性和可信度之外,我致力于确保各类企业和用户能够从这项令人难以置信的技术中受益。到目前为止,趋势是不同的:大多数现实世界的人工智能使用要么是完全被动的(例如,您使用但不控制的推荐系统),要么主要由高度训练的技术人员使用(例如编码助手)。我希望弥合这一差距:每个个人和公司都应为成功做好准备,并能够以新的方式解决工作中的问题。
德普尔以高精度翻译闻名。这种语言建模基础如何影响公司早期关于超越翻译进入更广泛的人工智能系统的思考?
人工智能如此神奇的原因在于,非常相似的概念和想法可以在大不相同的领域中产生新的解决方案:国际象棋引擎、推荐系统、蛋白质折叠、自动驾驶汽车、翻译引擎等。所有这些都由相同的一套原理和技术驱动。我们已经掌握了这些技术近十年了,自然而然地思考新的问题。内部来说,这一直是如此,导致了词汇表、写作、语音、自定义中心等的发明。
作为首席科学家,您如何区分构建能够生成流畅输出的语言模型和构建能够在真实企业工作流中可靠运行的系统?
核心思想是非常相似的:我们需要深入了解用户的需求,并使我们的人工智能系统与这些目标和偏好保持一致。有时,这些需求是明显和明确的;有时,它们是微妙和未言明的。在任何情况下,确保我们生产的工作对用户具有高价值都是我们的职责。德普尔在这一领域一直出类拔萃,原因在于我们对客户的关注。我们不追求人工基准或学术出版物——我们追求客户满意度。这比以往任何时候都更为重要,因为我们正在扩大视野并帮助人们完成日常工作。
DeepL Agent代表着从辅助人工智能到自主执行的转变。在实践中,这种转变的最大技术挑战是什么?
迄今为止,构建DeepL Agent的最大挑战是可用性。多年来,人工智能生态系统主要为软件开发人员和技术专家服务。有了DeepL Agent,我们旨在改变这一点,并为每位知识工作者提供复杂问题解决和自动化的精密工具。为此,我们需要在识别、推理、规划和行动方面具有同等的复杂性。与其向用户呈现丰富但复杂的工具集,我们努力创造一个整合、无缝和优雅的解决方案,以实现端到端的辅助和工作流自动化。
从架构角度来看,哪些功能需要在企业环境中实施,以便人工智能系统能够被信任为自主运行?
对于广泛的行政任务,技术已经存在。DeepL Agent可以在您的环境中可靠地运行,需要时寻求建议,并在需要时提供人机验证。这种合成智能的水平几个月前还是纯粹的虚构。然而,还有很长的路要走。在接下来的几年里,人工智能代理将成为企业中的一个水平层——在后台不知疲倦地工作,与人类和其他代理合作,以消除繁琐的工作并赋予我们解决以前无法解决的问题的能力。
您谈到了深层次的语言理解作为负责人工智能代理的先决条件。在这种情况下,“深层次”是什么意思,超出了表面层次的流畅度?
语言是非常模糊和依赖上下文的——尤其是在专业领域。您可能已经经历过这样的事情:听到一群朋友讨论您不熟悉的爱好或专业领域…… 对外人来说可能没有意义,但他们之间却能完美地理解。我们希望人工智能辅助感觉像与一位经验丰富、值得信赖的同事交谈一样,您与他们有多年的合作经验。隐含的偏好应该保持隐含。您不应该反复解释如何完成工作。这可能看起来很明显,但要做到正确需要大量的研究。这就是我所说的“深层次”语言理解。
在部署可以采取真实行动而不仅仅是提供推荐的自主系统时,您如何处理安全保障和监督?
为了使人工智能辅助在商业环境中发挥作用,我们必须仔细平衡能力与控制。更大的能力带来了巨大的生产力机会,但如果不加控制,它就会成为一种负担。这是不可接受的。从第一天开始,DeepL Agent就配备了企业级的安全保障,采用多种形式。共享工作空间为用户提供了对数据和访问的精确控制,同时支持审计跟踪、人工监督和人机验证。此外,系统管理员对DeepL Agent可以导航的系统和机制有细粒度的控制,并且可以在代理操作基础工具时通知基础工具。
您在将想法从研究转移到生产时,如何在不牺牲可靠性或科学纪律的情况下做出决定?
研究和产品开发之间的差距比人们通常认为的要大。两者都以严谨的方式解决以前无法解决的问题,并详细记录什么有效、什么无效。然而,研究可以简化范围并假设一个更简单的世界模型,而产品开发必须考虑真实用户的复杂性。在人工智能辅助中,工具使用是一个主要例子。很容易假设环境总是为自动化做好准备,系统访问已经解决,API已经准备就绪。现实却不同。就像自动驾驶汽车必须处理今天的基础设施复杂性一样,人工智能代理必须在企业依赖的访问模式、数据和系统中有效地运行。这一早期认识是DeepL Agent设计的核心。
随着DeepL从专注的语言平台扩展到更广泛的企业人工智能系统,您如何决定哪些功能应该保持严格控制,哪些应该暴露给更自主的行为?
任务所需的控制水平由两个因素决定:执行任务的人或系统的可靠性以及错误的潜在影响。这同样适用于人和机器的执行。人工智能的可靠性在过去几年中大大提高,并将继续改进。因此,需要对越来越少的任务进行严格控制。最终,人工智能的可靠性将超过甚至人类专家的水平,用于许多任务。这也适用于控制机制,它们将越来越多地转向人工智能监督。内部来说,DeepL Agent已经这样做了,需要时会向用户寻求帮助,而不是自行纠正错误。
展望未来,您认为哪些语言理解或代理设计的突破将在未来两年内最强烈地塑造企业人工智能?
人工智能代理不仅将帮助完成单个任务,还将形成企业中一个合作的生产力层,代表我们工作,减少干扰,准确提供所需信息,并完全在后台解决问题和越来越复杂的任务。
感谢这次精彩的采访,希望了解更多的读者可以访问DeepL。












