Entrevistas
Anthony Deighton, CEO de Tamr – Serie de entrevistas

Anthony Deighton es el CEO de Tamr. Tiene 20 años de experiencia en la construcción y escalado de empresas de software empresarial. Más recientemente, pasó dos años como Director de Marketing en Celonis, estableciendo su liderazgo en la categoría de software de Minería de Procesos y creando programas de generación de demanda que resultaron en un crecimiento del 130% de ARR. Antes de eso, ocupó durante más de 10 años puestos en Qlik, haciéndolo crecer desde una desconocida empresa de software sueca hasta una empresa pública, en puestos que van desde el liderazgo de productos, marketing de productos y finalmente como CTO. Comenzó su carrera en Siebel Systems aprendiendo a construir empresas de software empresarial en una variedad de puestos de productos.
¿Puede compartir algunos hitos clave de su trayectoria en la industria de software empresarial, particularmente su tiempo en Qlik y Celonis?
Comencé mi carrera en software empresarial en Siebel Systems y aprendí mucho sobre la construcción y escalado de empresas de software empresarial del equipo de liderazgo allí. Me uní a Qlik cuando era una pequeña y desconocida empresa de software sueca con el 95% del pequeño equipo de 60 personas ubicado en Lund, Suecia. Bromeo diciendo que, como no era ingeniero ni vendedor, me pusieron a cargo del marketing. Construí el equipo de marketing allí, pero con el tiempo mi interés y contribuciones se desplazaron hacia la gestión de productos, y finalmente me convertí en Director de Producto. Sacamos a Qlik a la bolsa en 2010, y continuamos como una empresa pública exitosa. Después de eso, queríamos hacer algunas adquisiciones, así que comencé un equipo de fusiones y adquisiciones. Después de una larga y razonablemente exitosa carrera como empresa pública, finalmente vendimos Qlik a una empresa de capital privado llamada Thoma Bravo. Fue, como me gusta decir, el ciclo de vida completo de una empresa de software empresarial. Después de dejar Qlik, me uní a Celonis, una pequeña empresa de software alemana que intentaba tener éxito vendiendo en EE. UU. Nuevamente, dirigí el marketing como CMO. Crecimos muy rápidamente y construimos una función de marketing global muy exitosa.
Tanto Celonis como Qlik se centraron en el frente de la desafío de análisis de datos: ¿cómo veo y entiendo los datos? En el caso de Qlik, se trataba de paneles de control; en el caso de Celonis, se trataba de procesos empresariales. Pero un desafío común en ambos fue el dato detrás de estas visualizaciones. Muchos clientes se quejaban de que los datos estaban mal: registros duplicados, registros incompletos, silos de datos perdidos. Esto es lo que me atrajo a Tamr, donde sentí que por primera vez podríamos resolver el desafío de los datos empresariales desordenados. Los primeros 15 años de mi carrera en software empresarial se dedicaron a visualizar datos, espero que los próximos 15 se dediquen a limpiar esos datos.
¿Cómo moldearon sus experiencias tempranas su enfoque para construir y escalar empresas de software empresarial?
Una lección importante que aprendí en el cambio de Siebel a Qlik fue el poder de la simplicidad. Siebel era un software muy potente, pero fue superado en el mercado por Salesforce.com, que creó un CRM con muchas menos características (“un juguete” según Siebel), pero los clientes podían configurarlo rápidamente porque se entregaba como una solución SaaS. Parece obvio hoy en día, pero en ese momento la sabiduría era que los clientes compraban características, pero lo que aprendimos es que los clientes invierten en soluciones para resolver sus problemas empresariales. Así que, si su software resuelve su problema más rápido, usted gana. Qlik fue una solución simple al problema de análisis de datos, pero fue radicalmente más simple. Como resultado, pudimos superar a competidores más ricos en características como Business Objects y Cognos.
La segunda lección importante que aprendí fue en mi transición de carrera del marketing a los productos. Pensamos en estos dominios como distintos. En mi carrera, he encontrado que me muevo fluidamente entre el producto y el marketing. Hay un vínculo íntimo entre qué producto construyes y cómo lo describes a los clientes potenciales. Y hay un vínculo igualmente importante entre lo que los prospectos demandan y qué producto debemos construir. La capacidad de moverse entre estas conversaciones es un factor crítico de éxito para cualquier empresa de software empresarial. Una razón común para el fracaso de una startup es creer que “si lo construyes, ellos vendrán”. Esta es la creencia común de que si solo construyes software genial, la gente hará cola para comprarlo. Esto nunca funciona, y la solución es un proceso de marketing robusto conectado con su proceso de desarrollo de software.
La última idea que compartiré vincula mi trabajo académico con mi trabajo profesional. Tuve la oportunidad en la escuela de negocios de tomar una clase sobre la teoría de la innovación disruptiva de Clay Christensen. En mi trabajo profesional, he tenido la oportunidad de experimentar tanto ser el disruptor como ser disruptado. La lección clave que he aprendido es que cualquier innovación disruptiva es el resultado de un cambio de plataforma exógeno que hace que lo imposible sea finalmente posible. En el caso de Qlik, fue la disponibilidad de plataforma de servidores de gran memoria que permitió a Qlik disruptar la informática tradicional basada en cubos. En Tamr, la disponibilidad de plataforma de aprendizaje automático a escala nos permite disruptar el MDM basado en reglas manuales en favor de un enfoque basado en IA. Es importante siempre averiguar qué cambio de plataforma impulsa su disrupción.
¿Qué inspiró el desarrollo de la gestión de datos maestros (MDM) nativa de IA, y cómo difiere de las soluciones de MDM tradicionales?
El desarrollo de Tamr surgió del trabajo académico en el MIT (Instituto de Tecnología de Massachusetts) sobre resolución de entidades. Bajo el liderazgo académico del ganador del Premio Turing Michael Stonebraker, la pregunta que el equipo investigaba era “¿podemos vincular registros de datos en cientos de miles de fuentes y millones de registros?” En la superficie, este es un desafío insuperable porque, a medida que aumentan los registros y las fuentes, aumenta geométricamente el número de registros que cada posible coincidencia necesita ser comparada. Los científicos informáticos llaman a esto un “problema n-cuadrado” porque el problema aumenta geométricamente con la escala.
Los sistemas de MDM tradicionales intentan resolver este problema con reglas y grandes cantidades de curación de datos manual. Las reglas no escalan porque nunca se pueden escribir suficientes reglas para cubrir todos los casos de esquina y gestionar miles de reglas es una imposibilidad técnica. La curación manual es extremadamente costosa porque depende de los humanos para intentar trabajar a través de millones de registros y comparaciones posibles. Esto explica la pobre adopción del mercado de las soluciones de MDM tradicionales. Francamente, a nadie le gustan las MDM tradicionales.
La idea simple de Tamr fue entrenar a una IA para hacer el trabajo de ingesta de fuentes, coincidencia de registros y resolución de valores. Lo genial de la IA es que no come, no duerme ni se toma vacaciones; también es altamente paralelizable, por lo que puede abordar enormes volúmenes de datos y procesarlos para mejorarlos. Así que, donde antes la MDM era imposible, ahora es finalmente posible lograr datos limpios, consolidados y actualizados (ver arriba).
¿Cuáles son los mayores desafíos que enfrentan las empresas con su gestión de datos, y cómo aborda Tamr estos problemas?
El primer desafío, y posiblemente el más importante, que enfrentan las empresas en la gestión de datos es que sus usuarios comerciales no utilizan los datos que generan. O dicho de otra manera, si los equipos de datos no producen datos de alta calidad que sus organizaciones utilicen para responder a preguntas analíticas o optimizar procesos comerciales, entonces están desperdiciando tiempo y dinero. Una salida principal de Tamr es una página 360 para cada registro de entidad (piense: cliente, producto, parte, etc.) que combina todos los datos subyacentes de primera y tercera parte para que los usuarios comerciales puedan ver y proporcionar comentarios sobre los datos. Como una wiki para sus datos de entidad. Esta página 360 también es la entrada para una interfaz conversacional que permite a los usuarios comerciales hacer y responder preguntas con los datos. Así que, el trabajo uno es darle al usuario los datos.
¿Por qué es tan difícil para las empresas dar a los usuarios datos que les gusten? Porque hay tres problemas difíciles subyacentes que subyacen a este objetivo: cargar una nueva fuente, emparejar los nuevos registros con los datos existentes y corregir los valores/campos en los datos. Tamr facilita la carga de nuevas fuentes de datos porque su IA asigna automáticamente los nuevos campos a un esquema de entidad definido. Esto significa que, independientemente de lo que una nueva fuente de datos llame a un campo particular (por ejemplo, “cust_name”), se asigna al campo correcto de esa entidad (por ejemplo, “nombre del cliente”). El siguiente desafío es vincular registros que son duplicados. La duplicación en este contexto significa que los registros son, de hecho, la misma entidad del mundo real. La IA de Tamr lo hace, e incluso utiliza fuentes de terceros como “verdad fundamental” para resolver entidades comunes como empresas y personas. Un buen ejemplo de esto sería vincular todos los registros en muchas fuentes para un cliente importante como “Dell Computer”. Por último, para cualquier registro, puede haber campos que estén en blanco o incorrectos. Tamr puede inferir los valores de campo correctos a partir de fuentes internas y de terceros.
¿Puede compartir una historia de éxito en la que Tamr mejoró significativamente la gestión de datos y los resultados comerciales de una empresa?
CHG Healthcare es un jugador importante en la industria de contratación de personal de salud, conectando a profesionales de la salud capacitados con instalaciones que lo necesitan. Ya sea que se trate de médicos temporales a través de Locums, enfermeras con RNnetwork o soluciones más amplias a través de CHG en sí, proporcionan soluciones de contratación personalizadas para ayudar a las instalaciones de salud a funcionar sin problemas y brindar atención de calidad a los pacientes.
Su valoración fundamental es conectar a los profesionales de la salud adecuados con la instalación adecuada en el momento adecuado. Su desafío era que no tenían una visión unificada y precisa de todos los proveedores en su red. Dada su escala (7,5 millones+ de proveedores), era imposible mantener sus datos precisos con enfoques basados en reglas y legados sin romper el banco con curadores humanos. También no podían ignorar el problema, ya que sus decisiones de contratación dependían de él. Los malos datos para ellos podrían significar que un proveedor obtiene más turnos de los que puede manejar, lo que lleva al agotamiento.
Usando las capacidades avanzadas de IA/ML de Tamr, CHG Healthcare redujo los registros de médicos duplicados en un 45% y eliminó casi por completo la preparación de datos manual que estaba siendo realizada por recursos escasos de datos y análisis. Y lo más importante, al tener una visión confiable y precisa de los proveedores, CHG puede optimizar la contratación, lo que les permite brindar una mejor experiencia al cliente.
¿Cuáles son algunos conceptos erróneos comunes sobre la IA en la gestión de datos, y cómo ayuda Tamr a desvanecer estos mitos?
Un concepto erróneo común es que la IA tiene que ser “perfecta”, o que las reglas y la curación humana son perfectas en contraste con la IA. La realidad es que las reglas fallan todo el tiempo. Y, lo que es más importante, cuando las reglas fallan, la única solución es más reglas. Así que tienes un desastre inmanejable de reglas. Y la curación humana también es falible. Los humanos pueden tener buenas intenciones (aunque no siempre), pero no siempre están en lo correcto. Lo peor es que algunos curadores humanos son mejores que otros, o simplemente pueden tomar decisiones diferentes a las de otros. La IA, en contraste, es probabilística por naturaleza. Podemos validar a través de estadísticas qué tan precisas son estas técnicas, y cuando lo hacemos, encontramos que la IA es menos costosa y más precisa que cualquier alternativa competidora.
Tamr combina la IA con la refinación humana para la precisión de los datos. ¿Puede elaborar sobre cómo funciona esta combinación en la práctica?
Los humanos proporcionan algo excepcionalmente importante a la IA: la capacitación. La IA se trata en realidad de ampliar los esfuerzos humanos. Lo que Tamr busca en los humanos es el pequeño número de ejemplos (“etiquetas de capacitación”) que la máquina puede usar para establecer los parámetros del modelo. En la práctica, esto se parece a que los humanos pasan un poco de tiempo con los datos, dando a Tamr ejemplos de errores y errores en los datos, y la IA ejecuta esas lecciones en todo el conjunto de datos. Además, a medida que se agregan nuevos datos o los datos cambian, la IA puede presentar instancias en las que lucha por tomar decisiones confiables (“coincidencias de baja confianza”) y pedirle al humano que proporcione información. Esta información, por supuesto, se utiliza para perfeccionar y actualizar los modelos.
¿Cuál es el papel de los grandes modelos de lenguaje (LLM) en los procesos de calidad y enriquecimiento de datos de Tamr?
Primero, es importante ser claro sobre lo que son buenos los LLM. Fundamentalmente, los LLM son sobre el lenguaje. Producen cadenas de texto que significan algo, y pueden “entender” el significado del texto que se les proporciona. Así que podrías decir que son máquinas de lenguaje. Así que, para Tamr, donde el lenguaje es importante, usamos LLM. Un ejemplo obvio es en nuestra interfaz conversacional que se encuentra sobre nuestros datos de entidad, a la que cariñosamente llamamos nuestro CDO virtual. Cuando hablas con tu CDO real, entienden y responden usando un lenguaje que entiendes. Esto es exactamente lo que esperaríamos de un LLM, y es exactamente cómo lo usamos en esa parte de nuestro software. Lo valioso de Tamr en este contexto es que usamos los datos de entidad como contexto para la conversación con nuestro vCDO. Es como si tu CDO real tuviera todos tus mejores datos empresariales a su alcance cuando responde a tus preguntas, ¿no sería genial?
Además, hay instancias en las que, al limpiar los valores de los datos o inferir los valores perdidos, queremos usar una interpretación basada en el lenguaje de los valores de entrada para encontrar o corregir un valor perdido. Por ejemplo, podrías preguntar desde el texto “5mm de bola de cojinete” cuál es el tamaño de la parte, y un LLM (o una persona) respondería correctamente “5mm”.
Por último, subyacentes a los LLM están los modelos de incrustación que codifican el significado del lenguaje en tokens (piense en palabras). Estos pueden ser muy útiles para calcular la comparación lingüística. Así que, mientras que “5” y “cinco” no comparten caracteres en común, son muy cercanos en significado lingüístico. Así que, podemos usar esta información para vincular registros entre sí.
¿Cómo ve el futuro de la gestión de datos evolucionando, especialmente con los avances en la IA y el aprendizaje automático?
La era de “Big Data” de principios de 2000 debería recordarse como la era de “Small Data”. Aunque se ha creado mucha data en los últimos 20+ años, habilitada por la commodity de almacenamiento y cómputo, la mayoría de los datos que han tenido un impacto en la empresa son relativamente pequeños: informes básicos de ventas y clientes, análisis de marketing y otros conjuntos de datos que podrían ser fácilmente representados en un panel de control. El resultado es que muchas de las herramientas y procesos utilizados en la gestión de datos están optimizados para “small data”, lo que explica por qué la lógica basada en reglas, complementada con la curación humana, sigue siendo tan prominente en la gestión de datos.
La forma en que la gente quiere usar los datos está cambiando fundamentalmente con los avances en la IA y el aprendizaje automático. La idea de “agentes de IA” que pueden realizar de forma autónoma una parte significativa del trabajo de una persona solo funciona si los agentes tienen los datos que necesitan. Si esperas que un agente de IA sirva en la primera línea del soporte al cliente, pero tienes cinco representaciones de “Dell Computer” en tu CRM y no está conectado con la información del producto en tu ERP, ¿cómo puedes esperar que brinden un servicio de alta calidad cuando alguien de Dell se comunica?
La implicación de esto es que nuestras herramientas y procesos de gestión de datos necesitarán evolucionar para manejar la escala, lo que significa abrazar la IA y el aprendizaje automático para automatizar más actividades de limpieza de datos. Los humanos seguirán desempeñando un papel importante en la supervisión del proceso, pero fundamentalmente necesitamos pedirle a las máquinas que hagan más para que no solo sea el dato en un solo panel de control el que sea preciso y completo, sino que sea la mayoría de los datos en la empresa.
¿Cuáles son las mayores oportunidades para las empresas hoy en día cuando se trata de aprovechar sus datos de manera más efectiva?
Aumentar la cantidad de formas en que la gente puede consumir datos. No hay duda de que las mejoras en las herramientas de visualización de datos han hecho que los datos sean mucho más accesibles en toda la empresa. Ahora, los líderes de datos y análisis necesitan buscar más allá del panel de control para formas de entregar valor con los datos. Interfaces como páginas internas 360, gráficos de conocimiento y asistentes conversacionales están siendo habilitadas por nuevas tecnologías y dan a los consumidores potenciales de datos más formas de usar los datos en su flujo de trabajo diario. Es particularmente poderoso cuando estas se incrustan en los sistemas que la gente ya usa, como CRMs y ERPs. La forma más rápida de crear más valor a partir de los datos es llevando los datos a las personas que pueden usarlos.
Gracias por la gran entrevista, los lectores que deseen aprender más pueden visitar Tamr.












