Interviews
Anthony Deighton, CEO von Tamr – Interview-Reihe

Anthony Deighton ist CEO von Tamr. Er hat 20 Jahre Erfahrung im Aufbau und Skalieren von Unternehmen für Unternehmenssoftware. Zuletzt war er zwei Jahre als Chief Marketing Officer bei Celonis tätig und etablierte deren Führungsposition in der Kategorie Process Mining-Software und schuf Nachfragegenerierungsprogramme, die zu einem Wachstum des Jahresumsatzes von 130 % führten. Davor war er über 10 Jahre bei Qlik und wuchs es von einem unbekannten schwedischen Softwareunternehmen zu einem börsennotierten Unternehmen — in Rollen von Produktführung, Produktmarketing und schließlich als CTO. Er begann seine Karriere bei Siebel Systems und lernte, wie man Unternehmenssoftwareunternehmen in verschiedenen Produktrollen aufbaut.
Können Sie einige wichtige Meilensteine aus Ihrer Reise in der Unternehmenssoftware-Industrie teilen, insbesondere Ihre Zeit bei Qlik und Celonis?
Ich begann meine Karriere in der Unternehmenssoftware bei Siebel Systems und lernte viel über den Aufbau und das Skalieren von Unternehmenssoftwareunternehmen von dem Führungsteam dort. Ich trat Qlik bei, als es ein kleines, unbekanntes schwedisches Softwareunternehmen mit 95 % des kleinen 60-köpfigen Teams in Lund, Schweden, war. Ich scherze, dass ich, da ich kein Ingenieur oder Verkäufer war, für das Marketing verantwortlich gemacht wurde. Ich baute das Marketing-Team dort auf, aber im Laufe der Zeit wandten sich meine Interessen und Beiträge dem Produktmanagement zu, und schließlich wurde ich zum Chief Product Officer. Wir brachten Qlik 2010 an die Börse und setzten unsere erfolgreiche Arbeit als börsennotiertes Unternehmen fort. Danach wollten wir einige Akquisitionen durchführen, also gründete ich ein M&A-Team. Nach einer langen und vernünftig erfolgreichen Laufbahn als börsennotiertes Unternehmen verkauften wir Qlik schließlich an ein Private-Equity-Unternehmen namens Thoma Bravo. Es war, wie ich es gerne sage, der vollständige Lebenszyklus eines Unternehmens für Unternehmenssoftware. Nach meinem Ausscheiden bei Qlik trat ich Celonis bei, einem kleinen deutschen Softwareunternehmen, das versuchte, in den USA Erfolg zu haben. Wiederum leitete ich das Marketing als CMO. Wir wuchsen sehr schnell und bauten eine sehr erfolgreiche globale Marketingfunktion auf.
Beide, Celonis und Qlik, konzentrierten sich auf die Vorderseite der Datenanalyse-Herausforderung – wie sehe ich und verstehe Daten? Im Fall von Qlik waren das Dashboards; im Fall von Celonis waren es Geschäftsprozesse. Aber eine gemeinsame Herausforderung bei beiden war die Daten hinter diesen Visualisierungen. Viele Kunden beschwerten sich, dass die Daten falsch seien: doppelte Einträge, unvollständige Einträge, fehlende Dateninseln. Dies ist es, was mich zu Tamr gezogen hat, wo ich das Gefühl hatte, dass wir zum ersten Mal in der Lage sein könnten, die Herausforderung der chaotischen Unternehmensdaten zu lösen. Die ersten 15 Jahre meiner Karriere in der Unternehmenssoftware verbrachte ich damit, Daten zu visualisieren; ich hoffe, dass die nächsten 15 Jahre damit verbracht werden können, diese Daten zu bereinigen.
Wie haben Ihre frühen Erfahrungen Ihre Herangehensweise an den Aufbau und das Skalieren von Unternehmenssoftware-Unternehmen geprägt?
Eine wichtige Lektion, die ich beim Wechsel von Siebel zu Qlik lernte, war die Macht der Einfachheit. Siebel war sehr leistungsfähige Software, aber sie wurde am Markt von Salesforce.com getötet, die ein CRM mit vielen weniger Funktionen erstellte (ein “Spielzeug”, wie Siebel es nannte), aber Kunden konnten es schnell in Betrieb nehmen, weil es als SaaS-Lösung bereitgestellt wurde. Es scheint heute offensichtlich, aber zu dieser Zeit war die Weisheit, dass Kunden Funktionen kaufen, was wir jedoch lernten, ist, dass Kunden in Lösungen investieren, um ihre Geschäftsprobleme zu lösen. Wenn also Ihre Software ihr Problem schneller löst, gewinnen Sie. Qlik war eine einfache Lösung für das Datenanalyse-Problem, aber es war radikal einfacher. Als Ergebnis konnten wir mehr funktionsreiche Wettbewerber wie Business Objects und Cognos schlagen.
Die zweite wichtige Lektion, die ich in meiner Karriere beim Übergang von Marketing zu Produkt lernte, war, dass es eine enge Verbindung zwischen dem Produkt, das Sie bauen, und der Art und Weise gibt, wie Sie es potenziellen Kunden beschreiben. Und es gibt eine ebenso wichtige Verbindung zwischen dem, was Interessenten fordern, und dem, was wir bauen sollten. Die Fähigkeit, zwischen diesen Gesprächen zu wechseln, ist ein kritischer Erfolgsfaktor für jedes Unternehmenssoftware-Unternehmen. Ein häufiger Grund für das Scheitern eines Startups ist die Überzeugung, dass “wenn Sie es bauen, werden sie kommen”. Dies ist die gängige Überzeugung, dass wenn Sie einfach coole Software bauen, die Leute Schlange stehen werden, um sie zu kaufen. Das funktioniert nie, und die Lösung ist ein robuster Marketingprozess, der mit Ihrem Software-Entwicklungsprozess verbunden ist.
Die letzte Idee, die ich teilen werde, verbindet meine akademische Arbeit mit meiner beruflichen Arbeit. Ich hatte die Gelegenheit, an der Business School einen Kurs über Clay Christensens Theorie der disruptiven Innovation zu besuchen. In meiner beruflichen Laufbahn hatte ich die Gelegenheit, sowohl den Disruptor als auch den Disruptierten zu sein. Die wichtigste Lektion, die ich gelernt habe, ist, dass jede disruptive Innovation das Ergebnis einer externen Plattformverschiebung ist, die es endlich möglich macht. Im Fall von Qlik war es die Verfügbarkeit von Servern mit großem Speicher, die es Qlik ermöglichte, die traditionelle cube-basierte Berichterstattung zu stören. Bei Tamr ermöglicht die Verfügbarkeit von Machine Learning im großen Maßstab uns, die manuelle, regelbasierte MDM durch einen AI-basierten Ansatz zu stören. Es ist wichtig, immer zu verstehen, welche Plattformverschiebung Ihre Störung antreibt.
Was inspirierte die Entwicklung von AI-nativer Master Data Management (MDM) und wie unterscheidet sie sich von traditionellen MDM-Lösungen?
Die Entwicklung von Tamr entstand aus akademischer Arbeit am MIT (Massachusetts Institute of Technology) über Entity-Resolution. Unter der akademischen Leitung des Turing-Preisträgers Michael Stonebraker untersuchte das Team die Frage, ob man Datenrekorde über Hunderttausende von Quellen und Millionen von Rekorden hinweg verknüpfen kann. Auf den ersten Blick ist dies eine unüberwindbare Herausforderung, da das Problem mit der Anzahl der Quellen und Rekorden geometrisch ansteigt.
Traditionelle MDM-Systeme versuchen, dieses Problem mit Regeln und großen Mengen an manueller Datenkuratierung zu lösen. Regeln skalierten nicht, da man nie genug Regeln schreiben kann, um jeden möglichen Randfall abzudecken, und das Management von Tausenden von Regeln ist eine technische Unmöglichkeit. Manuelle Kuratierung ist extrem teuer, da sie auf Menschen angewiesen ist, die versuchen, Millionen von möglichen Rekorden und Vergleichen zu durcharbeiten. Zusammen genommen erklärt dies die schlechte Marktdurchdringung traditioneller MDM-Lösungen (Master Data Management). Ehrlich gesagt, mag niemand traditionelle MDM.
Tamrs einfache Idee war, einen AI zu trainieren, um die Arbeit der Quellenzuführung, der Rekordverknüpfung und der Wertauflösung zu übernehmen. Das Gute an AI ist, dass es nicht isst, schläft oder Urlaub macht; es ist auch hochgradig parallelisierbar, sodass es große Datenmengen verarbeiten und daran arbeiten kann, sie zu verbessern. Also, wo MDM früher unmöglich war, ist es jetzt endlich möglich, saubere, konsolidierte und aktuelle Daten zu erhalten (siehe oben).
Welche sind die größten Herausforderungen, denen Unternehmen bei der Datenverwaltung gegenüberstehen, und wie löst Tamr diese Probleme?
Die erste und wahrscheinlich wichtigste Herausforderung, der Unternehmen bei der Datenverwaltung gegenüberstehen, ist, dass ihre Geschäftsanwender die generierten Daten nicht nutzen. Oder anders ausgedrückt: Wenn Daten-Teams keine hochwertigen Daten produzieren, die ihre Organisationen nutzen, um analytische Fragen zu beantworten oder Geschäftsprozesse zu optimieren, dann verschwenden sie Zeit und Geld. Ein primäres Ergebnis von Tamr ist eine 360-Seite für jeden Entitätsrekord (denken Sie an: Kunden, Produkt, Teil usw.), die alle zugrunde liegenden 1. und 3. Parteiendaten kombiniert, sodass Geschäftsanwender die Daten sehen und Feedback dazu geben können. Wie ein Wiki für Ihre Entitätsdaten. Diese 360-Seite ist auch die Eingabe für eine konversationale Schnittstelle, die es Geschäftsanwendern ermöglicht, Fragen zu stellen und mit den Daten zu antworten. Also, Job eins ist, dem Anwender die Daten zu geben.
Warum ist es so schwer für Unternehmen, den Anwendern Daten zu liefern, die sie lieben? Weil es drei primäre harte Probleme gibt, die diesem Ziel zugrunde liegen: das Laden einer neuen Quelle, das Verknüpfen neuer Rekord in die bestehenden Daten und das Korrigieren der Werte/Felder in den Daten. Tamr macht es einfach, neue Datenquellen zu laden, da sein AI automatisch neue Felder in ein definiertes Entitätsschema abbildet. Dies bedeutet, dass unabhängig davon, wie eine neue Datenquelle ein bestimmtes Feld bezeichnet (Beispiel: “Kundenname”), es dem richtigen zentralen Entitätsdefinition zugeordnet wird (Beispiel: “Kundenname”). Die nächste Herausforderung ist, doppelte Rekord zu verknüpfen. Doppelung in diesem Kontext bedeutet, dass die Rekord tatsächlich dieselbe reale Entität sind. Tamrs AI macht dies und verwendet sogar externe 3. Partei-Quellen als “Ground Truth”, um gemeinsame Entitäten wie Unternehmen und Personen aufzulösen. Ein gutes Beispiel dafür wäre, alle Rekord über viele Quellen für einen wichtigen Kunden wie “Dell Computer” zu verknüpfen. Schließlich kann es für jeden gegebenen Rekord Felder geben, die leer oder falsch sind. Tamr kann die korrekten Feldwerte aus internen und 3. Partei-Quellen ableiten.
Können Sie eine Erfolgsgeschichte teilen, in der Tamr die Datenverwaltung und die Geschäftsergebnisse eines Unternehmens wesentlich verbessert hat?
CHG Healthcare ist ein wichtiger Akteur in der Gesundheitspersonalvermittlung, der qualifizierte Gesundheitsfachkräfte mit Einrichtungen verbindet, die sie benötigen. Ob es sich um temporäre Ärzte durch Locums, Krankenschwestern mit RNnetwork oder umfassendere Lösungen durch CHG selbst handelt, sie bieten maßgeschneiderte Personalvermittlungslösungen, um Gesundheitseinrichtungen reibungslos zu betreiben und eine qualitativ hochwertige Patientenversorgung zu gewährleisten.
Ihre grundlegende Wertschöpfung besteht darin, die richtigen Gesundheitsdienstleister mit der richtigen Einrichtung zur richtigen Zeit zu verbinden. Ihre Herausforderung bestand darin, dass sie keine genaue, einheitliche Sicht auf alle Anbieter in ihrem Netzwerk hatten. Angesichts ihrer Größe (7,5 Mio. + Anbieter) war es unmöglich, ihre Daten mit herkömmlichen, regelbasierten Ansätzen genau zu halten, ohne ein Vermögen für menschliche Kuratoren auszugeben. Sie konnten das Problem auch nicht ignorieren, da ihre Personalentscheidungen davon abhängig waren. Schlechte Daten könnten für sie bedeuten, dass ein Anbieter mehr Schichten erhält, als er bewältigen kann, was zu Burnout führen kann.
Mit Tamrs fortschrittlichen AI/ML-Fähigkeiten reduzierte CHG Healthcare die doppelten Arztrekord um 45 % und eliminierte fast vollständig die manuelle Datenvorbereitung, die von knappen Daten- und Analyse-Ressourcen durchgeführt wurde. Und am wichtigsten ist, dass CHG durch die vertrauenswürdige und genaue Sicht auf die Anbieter in der Lage ist, die Personalvermittlung zu optimieren und so eine bessere Kundenerfahrung zu liefern.
Was sind einige gängige Missverständnisse über KI in der Datenverwaltung, und wie hilft Tamr, diese Mythen zu zerstreuen?
Ein gängiges Missverständnis ist, dass KI “perfekt” sein muss oder dass Regeln und menschliche Kuratierung im Gegensatz zu KI perfekt sind. Die Realität ist, dass Regeln immer wieder versagen. Und was noch wichtiger ist, wenn Regeln versagen, ist die einzige Lösung mehr Regeln. Also haben Sie ein unüberschaubares Durcheinander an Regeln. Und menschliche Kuratierung ist fehlerhaft. Menschen mögen gute Absichten haben (obwohl nicht immer), aber sie sind nicht immer richtig. Was schlimmer ist, einige menschliche Kuratoren sind besser als andere oder machen einfach andere Entscheidungen als andere. KI hingegen ist probabilistisch von Natur aus. Wir können durch Statistiken überprüfen, wie genau diese Techniken sind, und wenn wir dies tun, stellen wir fest, dass KI weniger teuer und genauer ist als jede konkurrierende Alternative.
Tamr kombiniert KI mit menschlicher Verfeinerung für die DatenGenauigkeit. Können Sie erläutern, wie diese Kombination in der Praxis funktioniert?
Menschen liefern etwas außerordentlich Wichtiges für KI – sie liefern die Schulung. KI ist eigentlich das Skalieren menschlicher Bemühungen. Wonach Tamr bei Menschen sucht, ist die kleine Anzahl von Beispielen (“Trainingslabels”), die die Maschine verwenden kann, um die Modellparameter zu setzen. In der Praxis sieht dies so aus, dass Menschen eine kleine Menge Zeit mit den Daten verbringen und Tamr Beispiele für Fehler und Fehler in den Daten liefern, und die KI läuft diese Lektionen über das gesamte Datenset. Wenn neue Daten hinzugefügt werden oder Daten geändert werden, kann die KI Instanzen identifizieren, bei denen sie Schwierigkeiten hat, zuverlässige Entscheidungen zu treffen (“niedrige Vertrauenswürdigkeitsübereinstimmungen”), und den Menschen um Input bitten. Diese Eingabe wird natürlich verwendet, um die Modelle zu verfeinern und zu aktualisieren.
Welche Rolle spielen Large Language Models (LLMs) in Tamrs Datenqualitäts- und Anreicherungsprozessen?
Zunächst ist es wichtig, klarzustellen, was LLMs gut können. Grundlegend sind LLMs auf Sprache ausgerichtet. Sie produzieren Textzeichenfolgen, die etwas bedeuten, und sie können die Bedeutung von Text verstehen, der ihnen übergeben wird. Man könnte also sagen, dass sie Sprachmaschinen sind. Also verwenden wir bei Tamr LLMs, wo Sprache wichtig ist. Ein offensichtliches Beispiel ist unsere konversationale Schnittstelle, die auf unseren Entitätsdaten sitzt, die wir liebevoll unseren virtuellen CDO nennen. Wenn Sie mit Ihrem realen CDO sprechen, verstehen sie Sie und antworten mit Sprache, die Sie verstehen. Genau so verwenden wir es in diesem Teil unserer Software. Was wertvoll an Tamr in diesem Kontext ist, ist, dass wir die Entitätsdaten als Kontext für die Konversation mit unserem vCDO verwenden. Es ist, als ob Ihr realer CDO alle besten Unternehmensdaten zur Verfügung hat, wenn er auf Ihre Fragen antwortet – wäre das nicht großartig!
Darüber hinaus gibt es Fälle, in denen wir bei der Reinigung von Datenwerten oder der Ergänzung fehlender Werte eine sprachbasierte Interpretation von Eingabewerten verwenden möchten, um einen fehlenden Wert zu finden oder zu korrigieren. Zum Beispiel könnten Sie fragen, aus dem Text “5mm-Kugellager” welche Größe das Teil hat, und ein LLM (oder eine Person) würde korrekt “5mm” antworten.
Schließlich sind unter LLMs Einbettungsmodelle, die die sprachliche Bedeutung in Token (denken Sie an Wörter) kodieren. Diese können sehr nützlich für die Berechnung der linguistischen Vergleichbarkeit sein. Also können wir diese Informationen verwenden, um Rekord zu verknüpfen.
Wie sehen Sie die Zukunft der Datenverwaltung, insbesondere mit den Fortschritten in KI und Machine Learning?
Die “Big Data”-Ära der frühen 2000er Jahre sollte als “Kleine Daten”-Ära in Erinnerung bleiben. Obwohl in den letzten 20+ Jahren viel Daten erstellt wurden, ermöglicht durch die Verbilligung von Speicher und Rechenleistung, hatte die Mehrheit der Daten, die in Unternehmen einen Einfluss hatten, relativ kleine Skalierbarkeit – grundlegende Verkaufs- und Kundenberichte, Marketing-Analytics und andere Datensätze, die leicht in einem Dashboard dargestellt werden konnten. Die Folge ist, dass viele der in der Datenverwaltung verwendeten Tools und Prozesse für “Kleine Daten” optimiert sind, was der Grund dafür ist, dass regelbasierte Logik, ergänzt durch menschliche Kuratierung, in der Datenverwaltung noch so prominent ist.
Die Art und Weise, wie Menschen Daten nutzen möchten, ändert sich grundlegend mit den Fortschritten in KI und Machine Learning. Die Idee von “KI-Agenten”, die einen erheblichen Teil der Arbeit einer Person autonom ausführen können, funktioniert nur, wenn die Agenten die Daten haben, die sie benötigen. Wenn Sie von einem KI-Agenten erwarten, dass er an vorderster Front im Kundenservice eingesetzt wird, aber Sie haben fünf Darstellungen von “Dell Computer” in Ihrem CRM und es ist nicht mit Produktinformationen in Ihrem ERP verbunden, wie können Sie dann erwarten, dass er eine hochwertige Dienstleistung liefert, wenn jemand von Dell kontaktiert?
Die Implikation davon ist, dass unsere Datenverwaltungstools und -prozesse sich anpassen müssen, um mit der Skalierbarkeit umzugehen, was bedeutet, dass wir KI und Machine Learning nutzen müssen, um mehr Datenreinigungsaktivitäten zu automatisieren. Menschen werden immer noch eine wichtige Rolle bei der Überwachung des Prozesses spielen, aber grundlegend müssen wir die Maschinen bitten, mehr zu tun, damit es nicht nur die Daten in einem einzelnen Dashboard sind, die genau und vollständig sind, sondern die Mehrheit der Daten im Unternehmen.
Welche sind die größten Chancen für Unternehmen heute, wenn es darum geht, ihre Daten effektiver zu nutzen?
Die Erhöhung der Anzahl von Möglichkeiten, wie Menschen Daten nutzen können. Es besteht kein Zweifel, dass Verbesserungen in Datenvisualisierungstools Daten für das gesamte Unternehmen zugänglicher gemacht haben. Jetzt müssen Daten- und Analyseführer über das Dashboard hinausgehen, um Möglichkeiten zu finden, mit Daten Mehrwert zu schaffen. Schnittstellen wie interne 360-Seiten, Wissensgraphen und konversationale Assistenten werden durch neue Technologien ermöglicht und bieten potenziellen Datenverbrauchern mehr Möglichkeiten, Daten in ihrem täglichen Arbeitsablauf zu nutzen. Es ist besonders leistungsstark, wenn diese in die Systeme integriert sind, die die Menschen bereits verwenden, wie CRM- und ERP-Systeme. Der schnellste Weg, mehr Wert aus Daten zu schöpfen, ist, die Daten zu den Menschen zu bringen, die sie nutzen können.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Tamr besuchen.












