Entrevistas

Anthony Deighton, CEO da Tamr – Série de Entrevistas

Published August 15, 2024

Updated April 27, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Anthony Deighton é CEO da Tamr. Ele tem 20 anos de experiência construindo e escalando empresas de software empresarial. Recentemente, ele passou dois anos como Chief Marketing Officer na Celonis, estabelecendo sua liderança na categoria de software de Mineração de Processos e criando programas de geração de demanda que resultaram em um crescimento de 130% na receita anual recorrente (ARR). Anteriormente, ele atuou por mais de 10 anos na Qlik, crescendo a empresa de uma desconhecida empresa de software sueca para uma empresa pública — em funções que variam de liderança de produto, marketing de produto e, finalmente, como CTO. Ele começou sua carreira na Siebel Systems, aprendendo a construir empresas de software empresarial em uma variedade de funções de produto.

Você pode compartilhar alguns marcos importantes de sua jornada na indústria de software empresarial, particularmente seu tempo na Qlik e Celonis?

Eu comecei minha carreira em software empresarial na Siebel Systems e aprendi muito sobre como construir e escalar empresas de software empresarial com a equipe de liderança lá. Eu me juntei à Qlik quando era uma pequena empresa de software desconhecida da Suécia com 95% da pequena equipe de 60 pessoas localizada em Lund, Suécia. Eu brinco que, como eu não era engenheiro ou vendedor, fui colocado no comando do marketing. Eu construí a equipe de marketing lá, mas, com o tempo, meu interesse e contribuições gravitaram em direção à gestão de produto, e eventualmente me tornei Chief Product Officer. Nós levamos a Qlik ao mercado público em 2010 e continuamos como uma empresa pública de sucesso. Depois disso, queríamos fazer algumas aquisições, então eu comecei uma equipe de M&A. Após um longo e razoavelmente bem-sucedido período como empresa pública, eventualmente vendemos a Qlik para uma empresa de private equity chamada Thoma Bravo. Foi, como eu gosto de dizer, o ciclo de vida completo de uma empresa de software empresarial. Após deixar a Qlik, eu me juntei à Celonis, uma pequena empresa de software alemã tentando ganhar sucesso vendendo nos EUA. Novamente, eu gerenciei o marketing como CMO. Nós crescemos muito rapidamente e construímos uma função de marketing global muito bem-sucedida.

Tanto a Celonis quanto a Qlik se concentravam na parte frontal do desafio de análise de dados – como vejo e entendo os dados? No caso da Qlik, era sobre dashboards; no caso da Celonis, era sobre processos de negócios. Mas um desafio comum em ambos era os dados por trás dessas visualizações. Muitos clientes reclamavam que os dados estavam errados: registros duplicados, registros incompletos, silos de dados ausentes. É isso que me atraiu para a Tamr, onde senti que, pela primeira vez, podemos resolver o desafio dos dados empresariais bagunçados. Os primeiros 15 anos da minha carreira em software empresarial foram gastos visualizando dados; espero que os próximos 15 possam ser gastos limpando esses dados.

Como suas experiências iniciais moldaram sua abordagem para construir e escalar empresas de software empresarial?

Uma lição importante que eu aprendi na transição de Siebel para Qlik foi o poder da simplicidade. A Siebel era um software muito poderoso, mas foi morta no mercado pela Salesforce.com, que fez um CRM com muito menos recursos (“um brinquedo”, como a Siebel costumava chamá-lo), mas os clientes podiam colocá-lo em funcionamento rapidamente porque era entregue como uma solução SaaS. Parece óbvio hoje, mas na época a sabedoria era que os clientes compravam recursos, mas o que aprendemos é que os clientes investem em soluções para resolver seus problemas de negócios. Então, se seu software resolve o problema deles mais rapidamente, você vence. A Qlik foi uma solução simples para o problema de análise de dados, mas foi radicalmente mais simples. Como resultado, pudemos vencer concorrentes mais ricos em recursos, como Business Objects e Cognos.

A segunda lição importante que eu aprendi foi em minha transição de carreira do marketing para o produto. Nós pensamos nesses domínios como distintos. Em minha carreira, eu encontrei que eu me movo fluidamente entre o produto e o marketing. Há um vínculo íntimo entre o que você constrói e como você descreve para os clientes potenciais. E há um vínculo igualmente importante entre o que os prospectos exigem e o que o produto deve ser construído. A capacidade de se mover entre essas conversas é um fator crítico de sucesso para qualquer empresa de software empresarial. Um motivo comum para o fracasso de uma startup é acreditar que “se você construir, eles virão”. Essa é a crença comum de que, se você apenas construir software legal, as pessoas vão se alinhar para comprá-lo. Isso nunca funciona, e a solução é um processo de marketing robusto conectado com o seu processo de desenvolvimento de software.

A última ideia que eu compartilharei liga meu trabalho acadêmico ao meu trabalho profissional. Eu tive a oportunidade, na faculdade de negócios, de cursar uma aula sobre a teoria da inovação disruptiva de Clay Christensen. Em meu trabalho profissional, eu tive a oportunidade de experimentar tanto ser o disruptor quanto ser disruptado. A lição-chave que eu aprendi é que qualquer inovação disruptiva é resultado de uma mudança de plataforma exógena que torna o impossível finalmente possível. No caso da Qlik, foi a disponibilidade de plataforma de servidores de grande memória que permitiu que a Qlik disruptasse a informação de relatórios baseada em cubos tradicional. Na Tamr, a disponibilidade de plataforma de aprendizado de máquina em escala permite que nós disruptemos o MDM baseado em regras manuais em favor de uma abordagem baseada em IA. É importante sempre descobrir qual é a mudança de plataforma que está impulsionando sua disruptura.

O que inspirou o desenvolvimento do MDM nativo em IA, e como ele difere das soluções de MDM tradicionais?

O desenvolvimento da Tamr surgiu do trabalho acadêmico no MIT (Instituto de Tecnologia de Massachusetts) sobre resolução de entidades. Sob a liderança acadêmica do vencedor do Prêmio Turing, Michael Stonebraker, a pergunta que a equipe estava investigando era “podemos vincular registros de dados em centenas de milhares de fontes e milhões de registros”. À primeira vista, isso é um desafio insuperável porque, quanto mais registros e fontes, mais registros cada possível correspondência precisa ser comparada. Os cientistas da computação chamam isso de “problema n-quadrado” porque o problema aumenta geometricamente com a escala.

Os sistemas de MDM tradicionais tentam resolver esse problema com regras e grandes quantidades de curadoria de dados manual. As regras não escalonam porque você nunca pode escrever regras suficientes para cobrir todos os casos de bordo, e gerenciar milhares de regras é uma impossibilidade técnica. A curadoria manual é extremamente cara porque depende de humanos para tentar trabalhar com milhões de registros e comparações possíveis. Isso explica a baixa adoção do mercado de soluções de MDM tradicionais. Francamente, ninguém gosta de MDM tradicional.

A ideia simples da Tamr foi treinar uma IA para fazer o trabalho de ingestão de fontes, correspondência de registros e resolução de valores. O grande thing sobre a IA é que ela não come, não dorme e não tira férias; ela também é altamente paralelizável, então pode lidar com grandes volumes de dados e processá-los para melhorá-los. Então, onde o MDM costumava ser impossível, agora é finalmente possível alcançar dados limpos, consolidados e atualizados (veja acima).

Quais são os maiores desafios que as empresas enfrentam com o gerenciamento de dados, e como a Tamr aborda essas questões?

O primeiro, e possivelmente o mais importante desafio que as empresas enfrentam no gerenciamento de dados, é que os usuários de negócios não usam os dados que elas geram. Ou dito de outra forma, se as equipes de dados não produzem dados de alta qualidade que as organizações usem para responder a perguntas analíticas ou otimizar processos de negócios, então elas estão desperdiçando tempo e dinheiro. Uma saída primária da Tamr é uma página 360 para cada registro de entidade (pense: cliente, produto, peça, etc.) que combina todos os dados subjacentes de primeira e terceira parte para que os usuários de negócios possam ver e fornecer feedback sobre os dados. Como uma wiki para seus dados de entidade. Essa página 360 também é a entrada para uma interface conversacional que permite que os usuários de negócios façam perguntas e respondam com os dados. Então, o trabalho número um é dar ao usuário os dados.

Por que é tão difícil para as empresas dar aos usuários dados que eles amam? Porque há três problemas difíceis subjacentes a esse objetivo: carregar uma nova fonte, corresponder os novos registros aos dados existentes e corrigir os valores/campos nos dados. A Tamr torna fácil carregar novas fontes de dados porque sua IA mapeia automaticamente novos campos para um esquema de entidade definido. Isso significa que, independentemente do que uma nova fonte de dados chama de um campo específico (exemplo: cust_name), ele é mapeado para a definição central correta daquela entidade (exemplo: “nome do cliente”). O próximo desafio é vincular registros que são duplicados. Duplicação, nesse contexto, significa que os registros são, de fato, a mesma entidade do mundo real. A IA da Tamr faz isso e até usa fontes de terceiros como “verdade fundamental” para resolver entidades comuns, como empresas e pessoas. Um bom exemplo disso seria vincular todos os registros em muitas fontes para um cliente importante, como “Dell Computer”. Por fim, para qualquer registro dado, pode haver campos que estão em branco ou incorretos. A Tamr pode inferir os valores de campo corretos a partir de fontes internas e de terceiros.

Você pode compartilhar uma história de sucesso onde a Tamr melhorou significativamente o gerenciamento de dados e os resultados de negócios de uma empresa?

A CHG Healthcare é um grande jogador na indústria de alocação de saúde, conectando profissionais de saúde qualificados com instalações que precisam deles. Seja por meio de médicos temporários da Locums, enfermeiros da RNnetwork ou soluções mais amplas da própria CHG, eles fornecem soluções de alocação personalizadas para ajudar as instalações de saúde a funcionar suavemente e fornecer cuidados de qualidade aos pacientes.

Seu valor fundamental é conectar os profissionais de saúde certos com a instalação certa no momento certo. Seu desafio era que não tinham uma visão unificada e precisa de todos os profissionais em sua rede. Dada a sua escala (7,5 milhões+ de profissionais), era impossível manter seus dados precisos com abordagens baseadas em regras tradicionais sem quebrar o banco com curadores humanos. Eles também não podiam ignorar o problema, pois suas decisões de alocação dependiam disso. Dados ruins para eles podiam significar que um profissional obtém mais turnos do que pode lidar, levando ao esgotamento.

Usando as capacidades avançadas de IA/ML da Tamr, a CHG Healthcare reduziu os registros duplicados de médicos em 45% e quase eliminou completamente a preparação de dados manual que estava sendo feita por recursos escassos de dados e análise. E, o mais importante, ao ter uma visão confiável e precisa dos profissionais, a CHG é capaz de otimizar o alocação, permitindo que eles forneçam uma melhor experiência ao cliente.

Quais são os principais conceitos errados sobre a IA no gerenciamento de dados, e como a Tamr ajuda a dissipar esses mitos?

Um conceito errado comum é que a IA precisa ser “perfeita” ou que as regras e a curadoria humana são perfeitas em contraste com a IA. A realidade é que as regras falham o tempo todo. E, mais importante, quando as regras falham, a única solução é mais regras. Então, você tem uma confusão inadministrável de regras. E a curadoria humana também é falível. Os humanos podem ter boas intenções (embora nem sempre), mas não são sempre certos. O que é pior, alguns curadores humanos são melhores do que outros ou simplesmente podem tomar decisões diferentes dos outros. A IA, por outro lado, é probabilística por natureza. Podemos validar estatisticamente quão precisa são essas técnicas e, quando o fazemos, descobrimos que a IA é menos cara e mais precisa do que qualquer alternativa concorrente.

A Tamr combina a IA com o refinamento humano para a precisão dos dados. Você pode elaborar sobre como essa combinação funciona na prática?

Os humanos fornecem algo excepcionalmente importante para a IA – eles fornecem o treinamento. A IA é realmente sobre escalar esforços humanos. O que a Tamr procura nos humanos são os poucos exemplos (“rótulos de treinamento”) que a máquina pode usar para definir os parâmetros do modelo. Na prática, isso parece os humanos passando um tempo pequeno com os dados, dando à Tamr exemplos de erros e erros nos dados, e a IA executa essas lições em todo o conjunto de dados. Além disso, à medida que novos dados são adicionados ou os dados mudam, a IA pode apresentar instâncias em que está lutando para tomar decisões confiantes (“correspondências de baixa confiança”) e pedir entrada humana. Essa entrada, é claro, vai refinar e atualizar os modelos.

Qual é o papel dos grandes modelos de linguagem (LLMs) nos processos de qualidade e enriquecimento de dados da Tamr?

Primeiramente, é importante ser claro sobre o que os LLMs são bons. Fundamentalmente, os LLMs são sobre linguagem. Eles produzem sequências de texto que significam algo e podem “entender” o significado do texto que lhes é fornecido. Então, você poderia dizer que são máquinas de linguagem. Então, para a Tamr, onde a linguagem é importante, usamos os LLMs. Um exemplo óbvio é em nossa interface conversacional que fica por cima de nossos dados de entidade, que carinhosamente chamamos de nosso CDO virtual. Quando você fala com seu CDO real, ele entende você e responde usando a linguagem que você entende. É exatamente isso que esperamos de um LLM e é exatamente como o usamos nessa parte de nosso software. O que é valioso sobre a Tamr nesse contexto é que usamos os dados de entidade como contexto para a conversa com nosso vCDO. É como se seu CDO real tivesse todos os melhores dados empresariais à sua disposição quando responde às suas perguntas – não seria ótimo?

Além disso, há instâncias em que, ao limpar valores de dados ou imputar valores ausentes, queremos usar uma interpretação baseada em linguagem de valores de entrada para encontrar ou corrigir um valor ausente. Por exemplo, você pode perguntar do texto “5mm parafuso de bola” qual é o tamanho da peça, e um LLM (ou uma pessoa) responderia corretamente “5mm”.

Por fim, subjacentes aos LLMs estão modelos de incorporação que codificam o significado da linguagem em tokens (pense em palavras). Esses podem ser muito úteis para calcular comparações linguísticas. Então, enquanto “5” e “cinco” não compartilham caracteres em comum, eles são muito próximos em significado linguístico. Então, podemos usar essa informação para vincular registros juntos.

Como você vê o futuro do gerenciamento de dados evoluindo, especialmente com os avanços em IA e aprendizado de máquina?

A era “Big Data” do início dos anos 2000 deve ser lembrada como a era “Small Data”. Embora uma grande quantidade de dados tenha sido criada nos últimos 20+ anos, habilitada pela commoditização do armazenamento e do processamento, a maioria dos dados que teve um impacto nas empresas é relativamente pequena em escala — relatórios básicos de vendas e clientes, análise de marketing e outros conjuntos de dados que poderiam facilmente ser representados em um dashboard. O resultado é que muitas das ferramentas e processos usados no gerenciamento de dados são otimizados para ‘pequenos dados’, o que é por que a lógica baseada em regras, suplementada pela curadoria humana, ainda é tão proeminente no gerenciamento de dados.

A forma como as pessoas querem usar os dados está mudando fundamentalmente com os avanços em IA e aprendizado de máquina. A ideia de “agentes de IA” que podem realizar autonomamente uma porção significativa do trabalho de uma pessoa só funciona se esses agentes tiverem os dados de que precisam. Se você espera que um agente de IA atue na linha de frente do suporte ao cliente, mas você tem cinco representações de “Dell Computer” em seu CRM e não está conectado com informações de produto em seu ERP, como você pode esperar que eles forneçam um serviço de alta qualidade quando alguém da Dell entrar em contato?

A implicação disso é que nossas ferramentas e processos de gerenciamento de dados precisarão evoluir para lidar com a escala, o que significa abraçar a IA e o aprendizado de máquina para automatizar mais atividades de limpeza de dados. Os humanos ainda desempenharão um papel importante na supervisão do processo, mas fundamentalmente precisamos pedir às máquinas que façam mais, para que não seja apenas os dados em um único dashboard que sejam precisos e completos, mas a maioria dos dados na empresa.

Quais são as maiores oportunidades para as empresas hoje em dia quando se trata de aproveitar melhor seus dados?

Aumentar o número de maneiras pelas quais as pessoas podem consumir dados. Não há dúvida de que melhorias nas ferramentas de visualização de dados tornaram os dados muito mais acessíveis em toda a empresa. Agora, os líderes de dados e análise precisam olhar além do dashboard para encontrar maneiras de entregar valor com os dados. Interfaces como páginas 360 internas, grafos de conhecimento e assistentes conversacionais estão sendo habilitadas por novas tecnologias e dão aos consumidores potenciais de dados mais maneiras de usar os dados em seu fluxo de trabalho diário. É particularmente poderoso quando esses são incorporados nos sistemas que as pessoas já usam, como CRMs e ERPs. A maneira mais rápida de criar mais valor a partir dos dados é trazendo os dados para as pessoas que podem usá-los.

Obrigado pela grande entrevista; leitores que desejam aprender mais devem visitar Tamr.

Unite.AI

Anthony Deighton, CEO da Tamr – Série de Entrevistas

You may like