インタビュー
アンソニー・デイトン、TamrのCEO – インタビュー・シリーズ

アンソニー・デイトンは、TamrのCEOです。彼は、20年間でエンタープライズ・ソフトウェア・カンパニーの構築と拡大に経験を積んでいます。最近では、Celonisで2年間、チーフ・マーケティング・オフィサーとして、プロセス・マイニング・ソフトウェア・カテゴリでのリーダーシップを確立し、130%のARR成長につながる需要生成プログラムを作成しました。その前には、Qlikで10年以上、スウェーデンの小さなソフトウェア・カンパニーから公開カンパニーまで成長させ、プロダクト・リーダーシップ、プロダクト・マーケティング、そして最終的にCTOとして様々な役割を果たしました。彼は、Siebel Systemsでキャリアを始め、エンタープライズ・ソフトウェア・カンパニーの構築方法を学びました。
エンタープライズ・ソフトウェア・インダストリーでのキャリア、特にQlikとCelonisでの経験から得た重要なマイルストーンを共有してください。
私はエンタープライズ・ソフトウェアでのキャリアをSiebel Systemsで始め、そこでエンタープライズ・ソフトウェア・カンパニーの構築と拡大方法を学びました。私は、スウェーデンの小さなソフトウェア・カンパニーで構成されていたQlikに参加しました。当時、60人のチームのうち95%がスウェーデンのルンドにありました。私は、エンジニアでもセールスパーソンでもなかったので、マーケティングを担当することになりました。私はそこでマーケティング・チームを構築しましたが、時間の経過とともに、私の興味と貢献はプロダクト・マネジメントに向かい、最終的にチーフ・プロダクト・オフィサーになりました。2010年にQlikを公開し、成功した公開カンパニーとして続けました。その後、M&Aチームを立ち上げて、いくつかの買収を行いました。公開カンパニーとして長く成功していたQlikを、最終的にプライベート・エクイティ・ファームのThoma Bravoに売却しました。私は、これをエンタープライズ・ソフトウェア・カンパニーの完全なライフ・サイクルと呼びます。Qlikを離れた後、米国で売上を伸ばそうとしていた小さなドイツのソフトウェア・カンパニーであるCelonisに参加しました。再び、マーケティングを担当することになり、非常に成功したグローバル・マーケティング・ファンクションを構築しました。
QlikとCelonisの両方は、データ・アナリティクスの課題の前半に焦点を当てていました。つまり、「どのようにしてデータを視覚化し、理解することができるか?」です。Qlikの場合、それはダッシュボードでしたが、Celonisの場合、それはビジネス・プロセスでした。しかし、両方の共通の課題は、これらの視覚化の背後にあるデータでした。多くの顧客は、「データが間違っている」と苦情を言っていました。重複したレコード、不完全なレコード、欠落したデータのシロです。これが、私をTamrに惹きつけた理由です。そこで、私は初めて、エンタープライズ・データの混乱した課題を解決できるのではないかと思いました。私のエンタープライズ・ソフトウェア・キャリアの最初の15年間は、データの視覚化に費やされました。次の15年間は、データをクリーンアップすることにかけることを希望しています。
初期の経験がエンタープライズ・ソフトウェア・カンパニーの構築と拡大へのアプローチをどのように形作ったかについて説明してください。
SiebelからQlikへの移行で学んだ重要な教訓の1つは、シンプルさの力です。Siebelは非常に強力なソフトウェアでしたが、Salesforce.comによって市場で殺されました。Salesforce.comは、より少ない機能を持つCRMを作成しました(Siebelはそれを「玩具」と呼んでいました)が、SaaSソリューションとして提供されたため、顧客はすぐに設定して使用することができました。現在では当たり前ですが、その当時、顧客は機能を購入するものだと思われていました。しかし、実際は、ソフトウェアがビジネス・プロブレムを解決する速度が重要であることがわかりました。したがって、ソフトウェアが問題をより迅速に解決できる場合は、勝つことができます。Qlikは、データ・アナリティクスの課題に対するシンプルなソリューションでしたが、より革新的でした。結果として、より多くの機能を持つ競合他社であるBusiness ObjectsやCognosを打ち負かすことができました。
2つ目の重要な教訓は、私のキャリアでマーケティングからプロダクトへの移行で学んだことです。私たちはこれらのドメインを異なるものだと思いますが、私のキャリアでは、プロダクトとマーケティングの間を自由に移動しています。プロダクトを構築することと、潜在的な顧客にそれを説明することとの間には密接な関連性があります。また、需要とプロダクトの構築との間にも同様の関連性があります。プロダクトとマーケティングの会話の間を移動する能力は、エンタープライズ・ソフトウェア・カンパニーにとっての重要な成功要因です。スタートアップの失敗する理由の1つは、「構築すれば、来る」という信念です。これは、ただソフトウェアを構築すれば、誰かがそれを購入してくれるという信念です。しかしそれは決して機能しません。解決策は、ソフトウェア開発プロセスと接続された堅牢なマーケティング・プロセスです。
最後に、学術的な仕事と専門的な仕事を結びつけるアイデアを共有します。私は、ビジネス・スクールでクレイ・クリステンセンの破壊的イノベーションの理論についてのクラスを受ける機会がありました。専門的な仕事では、破壊者となることも、破壊されることも経験しました。学んだ重要な教訓は、どの破壊的イノベーションも、不可能を可能にする外部のプラットフォーム・シフトの結果であるということです。Qlikの場合、それは大容量のサーバーのプラットフォームの可用性でした。サーバーは、Qlikが伝統的なキューブベースのレポートを破壊することを可能にしました。Tamrの場合、それは機械学習のプラットフォームの可用性でした。機械学習は、ルールベースのMDMをAIベースのアプローチに置き換えることを可能にしました。常に、どのプラットフォーム・シフトが破壊を駆り立てているかを理解することが重要です。
AIネイティブのマスター・データ・マネジメント(MDM)の開発に何がインスパイアしたのか、そして、それは従来のMDMソリューションとどのように異なるのかについて説明してください。
Tamrの開発は、MIT(マサチューセッツ工科大学)でのエンティティ・レゾリューションに関する学術的な仕事から生まれました。チューリング賞受賞者のマイケル・ストーンブレーカー博士の指導の下で、チームは、「数百万のレコードと数千のソースをまたいでデータ・レコードをリンクできるか」という疑問を探究しました。表面上は、レコードとソースが増えるにつれて、比較する必要があるレコードの数が幾何級数的に増加するため、不可能な課題です。
従来のMDMシステムは、ルールと大量の手動でのデータ・キュレーションでこの課題を解決しようとします。ルールはスケールしません。なぜなら、すべてのコーナー・ケースをカバーするために十分なルールを書くことができず、数千のルールを管理することは技術的に不可能だからです。手動でのキュレーションは非常に高価です。なぜなら、人間が数百万の可能なレコードと比較を処理するために働かなければならないからです。これらを組み合わせると、従来のMDMソリューションの市場での採用が悪い理由が説明できます。正直に言えば、誰も従来のMDMが好きではありません。
Tamrのシンプルなアイデアは、ソースのインジェスト、レコードのマッチング、値の解決をAIに学習させることでした。AIの素晴らしい点は、食事を取ったり、睡眠を取ったり、休暇を取ったりしないことです。また、高度に並列化できるため、巨大なデータを処理して改善することができます。従来、MDMは不可能でしたが、Tamrでは、クリーンで統合された最新のデータを達成することが可能になりました。
企業がデータ・マネジメントで直面する最大の課題は何ですか。また、Tamrはこれらの課題をどのように解決しますか。
企業がデータ・マネジメントで直面する最大の課題は、ビジネス・ユーザーが生成されたデータを使用しないことです。言い換えると、データ・チームが、高品質のデータを生成しない場合、または組織が分析的な質問に答えたり、ビジネス・プロセスを最適化したりするために使用しない場合、時間とお金を無駄にしていることになります。Tamrの主な出力は、各エンティティ・レコード(顧客、製品、部品など)に対する360ページで、すべての基礎となる1次元と3次元のデータを組み合わせてビジネス・ユーザーがデータを表示してフィードバックできるようにします。エンティティ・データのウィキのようなものです。この360ページは、ビジネス・ユーザーがデータで質問をして答えることができる会話型インターフェースの入力でもあります。したがって、仕事の1つは、ユーザーにデータを提供することです。
企業がユーザーに好きなデータを提供することが難しい理由は、3つの主要な難しい問題があるためです。新しいソースをロードすること、既存のデータに新しいレコードをマッチングすること、データの値/フィールドを修正することです。Tamrは、新しいソースのデータをロードすることを容易にします。AIは自動的に新しいフィールドを定義されたエンティティ・スキーマにマッピングします。つまり、新しいデータ・ソースが特定のフィールド(例:cust_name)を何と呼ぶかに関係なく、それが中央のエンティティ定義(例:「顧客名」)にマッピングされることを意味します。次の課題は、重複したレコードをリンクすることです。重複したレコードとは、実際には同じ現実世界のエンティティであるレコードです。TamrのAIはこれを行い、さらに、外部の3次元ソースを「グラウンド・トゥルース」として使用して共通のエンティティ(会社や人など)を解決します。「Dell Computer」のような重要な顧客のレコードをすべてのソースでリンクすることが良い例です。最後に、レコードごとに、空または不正確なフィールドがある場合があります。Tamrは、内部および3次元ソースから正しいフィールドの値を推測できます。
Tamrを使用して、企業のデータ・マネジメントとビジネス成果を大幅に改善した成功事例を共有してください。
CHG Healthcareは、ヘルスケア・スタッフィング・インダストリーの主要プレイヤーであり、スキルを持ったヘルスケア・プロフェッショナルを必要とする施設に接続しています。テンポラリー・ドクター、ナース、またはCHG自身を通じた幅広いソリューションなど、カスタマイズされたスタッフィング・ソリューションを提供して、ヘルスケア施設がスムーズに運営され、高品質のケアを患者に提供できるようにします。
彼らの基本的な価値提案は、正しいヘルスケア・プロバイダーを正しい施設に正しい時間に接続することです。彼らの課題は、ネットワーク内のすべてのプロバイダーに対する正確で統一されたビューがなかったことです。彼らの規模(750万以上のプロバイダー)では、レガシーのルール駆動型アプローチでは、人間のキュレーターに多大な費用を費やさずにデータを正確に保つことは不可能でした。また、データが悪いと、プロバイダーが処理できる以上のシフトを割り当てられ、バーンアウトにつながる可能性があるため、問題を無視することもできませんでした。
Tamrの高度なAI/ML機能を使用して、CHG Healthcareは、重複した医師のレコードを45%削減し、ほぼ完全にデータおよび分析リソースによって行われていた手動でのデータ・プレパレーションを排除しました。さらに、プロバイダーに対する信頼性の高い統一されたビューを持つことで、CHGはスタッフィングを最適化し、より良い顧客体験を提供できるようになりました。
データ・マネジメントにおけるAIの一般的な誤解と、Tamrがこれらの神話を如何にして払拭するかについて説明してください。
一般的な誤解は、AIが「完全」でなければならない、またはルールと人間のキュレーションが完璧であるというものです。現実は、ルールが常に失敗することです。また、ルールが失敗すると、唯一の解決策はさらに多くのルールです。したがって、管理不能なルールの混乱に陥ります。人間のキュレーションも誤りです。人間は良い意図を持っているかもしれません(しかし、常にそうではありません)が、常に正しくありません。さらに、人間のキュレーターの中には、他のキュレーターよりも優れています。あるいは、他のキュレーターとは異なる決定を下します。AIは、性質上、確率的なものです。私たちは、統計的にこれらの技術の精度を検証できます。そして、私たちがそうするとき、AIは、どの競合他社よりも費用効率が良く、正確であることがわかります。
Tamrは、データの精度のためにAIと人間の改良を組み合わせます。実践では、この組み合わせはどのように機能しますか。
人間は、AIに何が重要かを教えます。AIは、実際には人間の努力をスケールアップすることです。Tamrが人間から求めるのは、機械がモデル・パラメータを設定するために使用できる「トレーニング・ラベル」と呼ばれる少数の例です。実践では、人間が少しの時間をデータと共に費やし、Tamrにデータの誤りやミスの例を提供し、AIがそれらのレッスンを全データセットに適用します。さらに、新しいデータが追加されたり、データが変更されたりすると、AIは、自信を持って決定を下すのに苦労しているインスタンスを浮き彫りにし、人間の入力を求めることができます。この入力は、当然、モデルを改良して更新するために使用されます。
大規模な言語モデル(LLM)は、Tamrのデータ品質とエンリッチメント・プロセスでどのような役割を果たしますか。
まず、LLMが何に優れているかを明確にすることが重要です。基本的に、LLMは言語についてです。LLMは、意味のあるテキストの文字列を生成し、与えられたテキストの意味を「理解」できます。したがって、Tamrでは、言語が重要な場合にLLMを使用します。1つの明らかな例は、エンティティ・データの上に配置された会話型インターフェースで、仮想CDOと呼んでいます。実際のCDOと話すとき、彼らはあなたを理解し、あなたが理解できる言語で応答します。これが、LLMを使用することの期待です。また、Tamrの価値は、エンティティ・データを会話のコンテキストとして使用することです。実際のCDOがあなたのベストなエンタープライズ・データをすべて手元に持っていて、あなたの質問に答えることができると思いませんか。素晴らしいでしょう。
さらに、データの値をクリーンアップしたり、欠落した値を推測したりする場合、入力値の言語ベースの解釈を使用して欠落した値を見つけたり修正したりするインスタンスがあります。たとえば、「5mmボール・ベアリング」というテキストから部品のサイズが何であるかを尋ねると、LLM(または人間)は正しく「5mm」と答えるでしょう。
最後に、LLMの下にある埋め込みモデルは、言語の意味をトークン(単語など)にエンコードし、言語の比較を計算するのに非常に役立ちます。したがって、「5」と「five」は文字が共通していませんが、言語的意味では非常に近いものです。これらの情報を使用してレコードをリンクすることができます。
AIと機械学習の進歩とともに、データ・マネジメントの将来はどのように進化するでしょうか。
2000年代初頭の「ビッグ・データ」時代は、むしろ「スモール・データ」時代と呼ばれるべきです。過去20年以上で多くのデータが生成されてきましたが、エンタープライズで影響を与えたデータの大部分は、基本的なセールスおよび顧客レポート、マーケティング・アナリティクス、ダッシュボードで簡単に表現できるデータセットなど、小規模なものです。結果として、多くのデータ・マネジメントのツールとプロセスは、「スモール・データ」に最適化されています。したがって、ルールベースのロジックと人間のキュレーションがまだデータ・マネジメントで普及しています。
AIと機械学習の進歩により、データの使用方法が根本的に変わりつつあります。AIエージェントが顧客サポートの最前線で自律的に作業することを期待する場合、顧客が問い合わせてきたときに、5つの「Dell Computer」の表現と製品情報が接続されていない場合、優れたサービスを提供することが期待できますか。
これは、データ・マネジメントのツールとプロセスがスケールを扱えるように進化する必要があることを意味します。つまり、データのクリーンアップ活動の自動化にAIと機械学習を活用する必要があります。人間はプロセスを監督する役割を果たしますが、基本的に、人間は機械に、現在人間が行っている多くのタスクを実行するように求める必要があります。ダッシュボード内のデータのみが正確で完全であるのではなく、エンタープライズ内の大部分のデータが正確で完全であることを目指します。
企業がデータをより効果的に活用するための最大の機会は何ですか。
データを消費できる方法の数を増やすことです。データ・ビジュアライゼーション・ツールの改善により、データがエンタープライズ内でよりアクセスしやすくなりました。現在、データおよびアナリティクス・リーダーは、ダッシュボード以外の方法でデータの価値を提供する方法を探す必要があります。内部の360ページ、ノウレッジ・グラフ、会話型アシスタントなどのインターフェースは、新しいテクノロジーによって可能になっており、潜在的なデータ・コンシューマーがデータを使用する方法を提供しています。既存のシステム(CRMやERPなど)に組み込まれている場合は、特に強力です。データの価値をより迅速に生み出す最も速い方法は、データを使用できる人々にデータを提供することです。












