Entrevistas
Stefan Mesken, Cientista-Chefe da DeepL – Série de Entrevistas

Stefan Mesken, Cientista-Chefe da DeepL, passou mais de cinco anos na DeepL, impulsionando sua pesquisa fundamental e liderança científica. Ele começou como Cientista de Pesquisa em outubro de 2020, progrediu para Vice-Presidente de Pesquisa em novembro de 2023 e assumiu sua posição atual em abril de 2025, em Munique. Antes de ingressar na DeepL, trabalhou como Cientista de Dados na real.digital, na região de Colônia-Bonn, e conduziu pesquisas em lógica matemática na Universidade de Münster. Sua carreira une pesquisa matemática fundamental e IA aplicada, o que o capacita a liderar a direção científica por trás dos modelos de linguagem em larga escala e dos sistemas de IA multilíngues da DeepL.
DeepL é uma empresa alemã de IA focada na criação de sistemas avançados de IA linguística que permitem tradução e comunicação precisas e contextuais em mais de 100 idiomas. Fundada em 2017 e sediada em Colônia, a empresa atende milhões de usuários em todo o mundo e fornece soluções de nível empresarial por meio de assinaturas e APIs. Sua plataforma expandiu-se além da tradução para um conjunto mais amplo de recursos de IA linguística, incluindo assistência de escrita e voz, projetados para oferecer suporte à comunicação segura e escalável para empresas e organizações globais.
Você iniciou sua carreira em lógica matemática antes de migrar para a ciência de dados aplicada e, eventualmente, liderar a organização de pesquisa da DeepL. Olhando para trás, como esse trabalho inicial em raciocínio formal influenciou sua maneira atual de pensar sobre a construção de sistemas de IA autônomos e de nível empresarial?
O que me atraiu para o campo da teoria dos conjuntos e da lógica matemática foi, em primeiro lugar, uma curiosidade insaciável para aprender como esses sistemas complexos funcionam – desde os princípios básicos até uma profundidade cada vez maior. Essa curiosidade tem sido uma constante na minha vida desde a infância. É também o aspecto do meu trabalho que mais amo. Atualmente, o desafio é impulsionar o desenvolvimento da IA com um foco intenso na usabilidade na vida real. Além da segurança e da confiança, dedico meu tempo a garantir que empresas e usuários de todos os tipos possam se beneficiar dessa tecnologia incrível. Até agora, a tendência tem sido diferente: a maior parte do uso da IA na vida real é totalmente passiva (por exemplo, sistemas de recomendação que você consome, mas não controla) ou utilizada principalmente por pessoas altamente treinadas e técnicas (por exemplo, assistentes de programação). Quero preencher essa lacuna: todos os indivíduos e empresas devem estar preparados para o sucesso e serem capazes de revolucionar a maneira como abordam o trabalho.
A DeepL construiu sua reputação com base em traduções de alta precisão. Como essa base em modelagem de linguagem moldou o pensamento inicial da empresa sobre ir além da tradução e alcançar sistemas de IA mais gerais?
O que torna a IA tão mágica é que conceitos e ideias muito semelhantes podem levar a novas soluções em domínios completamente diferentes: mecanismos de xadrez, sistemas de recomendação, dobramento de proteínas, carros autônomos, mecanismos de tradução e muitos outros. Todos eles são impulsionados pelo mesmo conjunto de princípios e técnicas. Tendo dominado essas técnicas ao longo de quase uma década, naturalmente pensamos em novos problemas para nos concentrarmos. Internamente, esse sempre foi o caso, o que levou à invenção do Glossário, do Write, do Voice, do Customization Hub e muito mais.
Como Cientista-Chefe, como você distingue entre construir modelos de linguagem que geram resultados fluentes e construir sistemas que possam operar de forma confiável dentro de fluxos de trabalho empresariais reais?
As ideias centrais são notavelmente semelhantes: precisamos entender profundamente o que nossos usuários desejam e, em seguida, alinhar nossos sistemas de IA a esses objetivos e preferências. Às vezes, essas preferências são óbvias e explícitas; outras vezes, são sutis e implícitas. Em ambos os casos, é nossa responsabilidade garantir que o trabalho que produzimos seja de alto valor para nossos usuários.
A DeepL sempre se destacou nesta área devido ao nosso foco no cliente. Não buscamos benchmarks artificiais ou publicações acadêmicas – buscamos a satisfação do cliente. Isso nunca foi tão importante quanto agora, à medida que expandimos nossos horizontes e auxiliamos as pessoas em seu trabalho diário.
O DeepL Agent representa uma mudança da IA assistiva para a execução autônoma. Quais foram os maiores desafios técnicos para fazer essa transição funcionar na prática?
De longe, o maior desafio na criação do DeepL Agent é a usabilidade. Durante anos, o ecossistema de IA atendeu principalmente a desenvolvedores de software e especialistas altamente técnicos. Com o DeepL Agent, nosso objetivo é mudar isso e equipar todos os profissionais do conhecimento com ferramentas sofisticadas para resolver e automatizar problemas complexos. Para alcançar esse objetivo, precisamos do mesmo nível de sofisticação em reconhecimento, raciocínio, planejamento e ação. Em vez de apresentar aos usuários um conjunto de ferramentas rico, porém complexo, trabalhamos arduamente para criar uma solução coesa, integrada e elegante para assistência de ponta a ponta e automação de fluxos de trabalho.
Do ponto de vista arquitetônico, quais capacidades precisam estar presentes para que um sistema de IA possa operar de forma autônoma em ambientes corporativos?
Para uma ampla gama de tarefas administrativas, a tecnologia já existe. O DeepL Agent pode atuar de forma confiável em seu ambiente, buscar aconselhamento quando necessário e oferecer verificação humana sempre que desejado. Esse nível de inteligência artificial era pura ficção há apenas alguns meses. No entanto, ainda há um longo caminho a percorrer. Nos próximos anos, os agentes de IA se tornarão uma camada horizontal nas empresas — trabalhando incansavelmente em segundo plano, colaborando com humanos e entre si para eliminar tarefas repetitivas e nos capacitar a resolver problemas antes inatingíveis.
Você mencionou a compreensão profunda da linguagem como um pré-requisito para agentes de IA responsáveis. O que significa "profundo" nesse contexto, além da fluência superficial?
A linguagem é notavelmente ambígua e dependente do contexto — especialmente em ambientes profissionais. Você provavelmente já passou por isso: ouvir um grupo de amigos discutindo um hobby que você não compartilha ou uma especialização profissional na qual você não tem experiência… Pode não fazer sentido para quem está de fora, mas, de alguma forma, eles se entendem perfeitamente. Queremos que a assistência por IA seja tão natural quanto conversar com um colega de trabalho experiente e de confiança com quem você colabora há anos. Preferências implícitas devem permanecer implícitas. Você não deveria ter que explicar repetidamente como deseja que o trabalho seja feito. Isso pode parecer óbvio, mas requer muita pesquisa para ser implementado corretamente. É isso que quero dizer com compreensão "profunda" da linguagem.
Como abordar as salvaguardas e a supervisão ao implantar sistemas autônomos que podem tomar medidas concretas em vez de apenas fazer recomendações?
Para que a assistência por IA funcione em contextos empresariais, devemos equilibrar cuidadosamente capacidade e controle. Maior capacidade cria imensas oportunidades de produtividade, mas, se não for controlada, torna-se um problema. Isso não pode acontecer. Desde o primeiro dia, o DeepL Agent foi equipado com salvaguardas de nível empresarial, implementadas de diversas formas. Espaços de trabalho compartilhados oferecem aos usuários controle preciso sobre os dados e o acesso, além de possibilitar trilhas de auditoria, supervisão humana e verificação com intervenção humana. Adicionalmente, os administradores de sistema têm controle granular sobre os sistemas que o DeepL Agent pode navegar e mecanismos para notificar as ferramentas subjacentes quando estiverem sendo operadas pelo agente.
Que lições você aprendeu sobre como levar ideias da pesquisa para a produção sem sacrificar a confiabilidade ou o rigor científico?
A lacuna entre pesquisa e desenvolvimento de produtos é maior do que se imagina. Ambos começam com uma abordagem rigorosa para resolver problemas antes insolúveis e um registro meticuloso do que funciona e do que não funciona. Enquanto a pesquisa pode simplificar o escopo e assumir um modelo de mundo mais simples, o desenvolvimento de produtos deve levar em conta a complexidade dos contextos reais dos usuários. Em assistência por IA, o uso de ferramentas é um excelente exemplo. É tentador presumir que os ambientes estarão sempre preparados para a automação, com o acesso ao sistema configurado e as APIs prontas. A realidade é diferente. Assim como os carros autônomos precisam lidar com toda a complexidade da infraestrutura atual, os agentes de IA devem operar de forma eficaz dentro dos padrões de acesso, dados e sistemas dos quais as empresas dependem. Essa constatação inicial está no cerne do design do DeepL Agent.
À medida que o DeepL se expande de uma plataforma de linguagem focada para um sistema de IA empresarial mais abrangente, como decidir quais recursos devem permanecer rigorosamente controlados e quais devem ser expostos para um comportamento mais autônomo?
O nível de controle necessário para uma tarefa é determinado por dois fatores: a confiabilidade do humano ou sistema que a executa e o impacto potencial de erros. Isso se aplica igualmente à execução humana e à execução por máquina. A confiabilidade da IA aumentou consideravelmente nos últimos anos e continuará a melhorar. Portanto, um controle rigoroso será necessário para um número cada vez menor de tarefas. Em última análise, a confiabilidade da IA superará até mesmo os níveis de especialistas humanos para muitas tarefas. Isso também se aplica aos mecanismos de controle, que passarão cada vez mais para a supervisão da IA. Internamente, o DeepL Agent já faz isso, solicitando ajuda dos usuários sempre que a autocorreção não for possível.
Olhando para o futuro, quais avanços na compreensão da linguagem ou no design de agentes você acredita que irão moldar de forma mais significativa a IA empresarial nos próximos dois anos?
Os agentes de IA não se limitarão a auxiliar em tarefas individuais. Eles formarão uma camada de produtividade colaborativa nas empresas, trabalhando em nosso benefício para reduzir distrações, preparar e apresentar informações exatamente quando necessário e resolver problemas e tarefas cada vez mais complexas, tudo em segundo plano.
Obrigado pela ótima entrevista, os leitores que desejam saber mais devem visitar DeepL.












