Connect with us

인터뷰

Anthony Deighton, Tamr의 CEO – 인터뷰 시리즈

mm

Anthony Deighton은 Tamr의 CEO입니다. 그는 20년간의 경험을 가지고 있으며, 엔터프라이즈 소프트웨어 회사들을 구축하고 확장해 왔습니다. 최근 2년간 Celonis에서 Chief Marketing Officer로 일하며, Process Mining 소프트웨어 카테고리에서 리더십을 확립하고, 130%의 ARR 성장을 이룩한 수요 생성 프로그램을 만들었습니다. 그 이전에는 Qlik에서 10년 이상 일하며, 작은 스웨덴 소프트웨어 회사에서 공공 회사로 성장하는 과정에서 다양한 역할을 맡았습니다. 그는 Siebel Systems에서 경력을 시작하여, 다양한 제품 역할을 통해 엔터프라이즈 소프트웨어 회사들을 구축하는 방법을 배웠습니다.

엔터프라이즈 소프트웨어 산업에서 귀하의 여정에서 일부 주요 이정표를 공유할 수 있습니까? 특히 Qlik과 Celonis에서 일한 경험을 말해주세요.

저는 Siebel Systems에서 엔터프라이즈 소프트웨어를 시작했습니다. 그리고 Qlik에 합류했을 때, 그것은 작은, 알려지지 않은 스웨덴 소프트웨어 회사였습니다. 60명의 팀원 중 95%가 스웨덴의 Lund에 위치해 있었습니다. 저는 엔지니어나 세일즈맨이 아니었기 때문에, 마케팅을 담당하게 되었습니다. 저는 마케팅 팀을 구축했지만, 시간이 지남에 따라 저의 관심과 기여는 제품 관리로 이동했습니다. 그리고 결국 Chief Product Officer가 되었습니다. 우리는 2010년에 Qlik을 상장시켰고, 성공적인 공공 회사로 계속 성장했습니다. 이후에 우리는 몇몇 인수를 하려고 했기 때문에, 저는 M&A 팀을 시작했습니다. 공공 회사로 합리적으로 성공적인 경력을 마친 후, 우리는 Qlik을 Thoma Bravo라는 사모펀드 회사에 매각했습니다. 이것은 엔터프라이즈 소프트웨어 회사의 전체 생명 주기를 말합니다. Qlik을 떠난 후, 저는 Celonis에 합류했습니다. Celonis는 미국에서 성공을 거두려고 하는 작은 독일 소프트웨어 회사였습니다. 다시 한번, 저는 마케팅을 담당했습니다. 우리는 매우 빠르게 성장했으며, 성공적인 글로벌 마케팅 기능을 구축했습니다.

Celonis와 Qlik은 모두 데이터 분석의 전면에 초점을 두었습니다. Qlik의 경우에는 대시보드였습니다. Celonis의 경우에는 비즈니스 프로세스였습니다. 그러나 두 회사 모두에서 공통적인 도전은 데이터 자체였습니다. 많은 고객들이 데이터가 잘못되었다고 불평했습니다. 중복된 레코드, 불완전한 레코드, 누락된 데이터 실이 있었습니다. 이것이 저를 Tamr에 끌렸던 이유입니다. 여기서 처음으로, 우리는 엔터프라이즈 데이터의 문제를 해결할 수 있을 것이라고 생각했습니다. 저의 첫 15년은 데이터를 시각화하는 데 보냈지만, 다음 15년은 데이터를 정리하는 데 보낼 수 있을 것이라고 생각합니다.

초기 경험은 어떻게 귀하의 엔터프라이즈 소프트웨어 회사 구축 및 확장 접근법을 형성했나요?

Siebel에서 Qlik으로의 전환에서 배운 중요한 교훈은 단순성의 힘입니다. Siebel은 매우 강력한 소프트웨어였지만, Salesforce.com에 의해 시장에서 패배했습니다. Salesforce.com은 기능이 적었지만, 고객이 빠르게 구축할 수 있는 SaaS 솔루션을 제공했습니다. 이는 오늘날에는 당연한 것처럼 보이지만, 당시에는 고객이 기능을 구매한다고 생각했습니다. 그러나 우리는 고객이 비즈니스 문제를 해결하는 솔루션에 투자한다는 것을 배웠습니다. 따라서 귀하의 소프트웨어가 더 빠르게 문제를 해결할 수 있다면, 귀하는 승리합니다. Qlik은 데이터 분석 문제에 대한 단순한 솔루션을 제공했습니다. 그러나 그것은 더 많은 기능을 가진 경쟁자들보다 더 단순했습니다. 따라서 우리는 Business Objects와 Cognos와 같은 더 많은 기능을 가진 경쟁자들을 이길 수 있었습니다.

제2의 중요한 교훈은 마케팅에서 제품으로의 경력 전환에서 배웠습니다. 우리는 이 두 영역을 별개로 생각합니다. 그러나 저의 경력에서, 저는 제품과 마케팅 사이를 유연하게 이동했습니다. 제품을 구축하는 것과 잠재 고객에게 제품을 설명하는 것 사이에는 밀접한 링크가 있습니다. 또한, 잠재 고객의 요구와 우리가 구축해야 하는 제품 사이에도 중요한 링크가 있습니다. 이러한 대화 사이를 이동하는 능력은 모든 엔터프라이즈 소프트웨어 회사의 중요한 성공 요소입니다. 스타트업의 실패 이유 중 하나는 “만들면 오겠군”이라는 믿음입니다. 이것은 단지 소프트웨어를 구축하면 사람들이 그것을 खरीद으러 올 것이라는 믿음을 말합니다. 이것은 절대 작동하지 않으며, 해결책은 소프트웨어 개발 과정을 연결한 강력한 마케팅 프로세스입니다.

마지막으로, 저는 학술 연구와 전문 연구를 연결하는 아이디어를 공유하겠습니다. 저는 비즈니스 학교에서 Clay Christensen의 혁신적 혁신 이론에 대한 수업을 들었습니다. 전문 연구에서, 저는 혁신을 주도하는 사람과 혁신의 대상이 되는 사람 모두를 경험했습니다. 배운 중요한 교훈은, 모든 혁신적 혁신은 외인적 플랫폼 시프트의 결과라는 것입니다. 이것은 불가능한 것을终于 가능하게 만듭니다. Qlik의 경우,それは큰 메모리 서버의 플랫폼 가용성으로, Qlik이 전통적인 큐브 기반 보고서를 혁신할 수 있었습니다. Tamr에서는, 기계 학습의 플랫폼 가용성이 우리에게 수동 규칙 기반 MDM을 AI 기반 접근법으로 혁신할 수 있게 해줍니다. 항상 귀하의 혁신을 주도하는 플랫폼 시프트를 파악하는 것이 중요합니다.

Tamr의 AI 네이티브 마스터 데이터 관리(MDM)의 개발은 무엇으로부터 영감을 받았으며, 전통적인 MDM 솔루션과 어떻게 다릅니까?

Tamr의 개발은 MIT에서 엔티티 해결에 대한 학술 연구에서 비롯되었습니다. 튜링 상 수상자 Michael Stonebraker의 학술 리더십下的 팀은 “수백만개의 레코드와 수십만개의 소스에서 데이터 레코드를 연결할 수 있는가?”라는 질문을 조사했습니다. 이는 기본적으로 n-제곱 문제입니다. 전통적인 MDM 시스템은 규칙과 수동 데이터 큐레이션으로 이 문제를 해결하려고 합니다. 규칙은 확장할 수 없으며, 수동 큐레이션은 매우 비용이 많이 듭니다. 이것이 전통적인 MDM 솔루션의 시장 채택이 부족한 이유입니다. 사실, 아무도 전통적인 MDM을 좋아하지 않습니다.

Tamr의 간단한 아이디어는 소스 摂取, 레코드 매칭, 및 값 해결을 위한 AI를 훈련하는 것입니다. AI는 먹지 않으며, 휴식을 취하지 않으며, 휴가를 가지지 않습니다. 또한, 매우 병렬화 가능하여,大量의 데이터를 처리할 수 있습니다. 따라서, MDM은 이제 가능합니다.

회사들은 데이터 관리에서 어떤 가장 큰 도전을 직면하고 있으며, Tamr은 이러한 문제를 어떻게 해결합니까?

첫째, 가장 중요한 도전은 비즈니스 사용자가 생성한 데이터를 사용하지 않는다는 것입니다. 또는, 데이터 팀이 높은 품질의 데이터를 생성하지 못하여, 조직이 분석적 질문에 답하거나 비즈니스 프로세스를 최적화할 수 없다는 것입니다. Tamr의 주요 출력은 각 엔티티 레코드(고객, 제품, 부품 등)에 대한 360 페이지입니다. 이것은 비즈니스 사용자가 데이터를 볼 수 있고, 피드백을 제공할 수 있는 위키 같은 것입니다. 이 360 페이지는 또한, 사용자가 데이터와 대화할 수 있는 대화형 인터페이스의 입력입니다. 따라서, 첫째, 사용자에게 데이터를 제공하는 것입니다.

회사들이 사용자에게 데이터를 제공하는 것이 इतन難한 이유는 무엇입니까? 새로운 소스를 로드하는 것이 어렵기 때문입니다. 레코드를 매칭하는 것이 어렵기 때문입니다. 또한, 필드/값을 수정하는 것이 어렵기 때문입니다. Tamr은 새로운 소스를 쉽게 로드할 수 있게 해줍니다. AI는 자동으로 새로운 필드를 정의된 엔티티 스키마에 매핑합니다. 예를 들어, “cust_name” 필드는 “고객 이름”으로 매핑됩니다. 다음 도전은 레코드를 연결하는 것입니다. Tamr의 AI는 이를 수행하며, 외부 3자 소스를 “GROUND TRUTH”로 사용하여 공통 엔티티를 해결합니다. 예를 들어, “Dell Computer”의 모든 레코드를 연결하는 것입니다. 마지막으로, 레코드에 빈 또는 잘못된 필드가 있을 수 있습니다. Tamr은 내부 및 3자 소스에서 올바른 필드 값을 추측할 수 있습니다.

Tamr이 회사들의 데이터 관리와 비즈니스 결과를 크게 개선한 성공 사례를 공유할 수 있습니까?

CHG Healthcare는 의료 인력 부문에서 주요 플레이어입니다. 그들은 의료 시설에 맞는 의료 전문가를 연결합니다. 그들의 기본 가치 제안은 의료 제공자와 시설을 연결하는 것입니다. 그러나 그들의 도전은, 그들이 네트워크에 정확한 통일된 의료 제공자 뷰를 가지고 있지 못했다는 것입니다. 규칙 기반 접근 방식으로는,_legacy 접근 방식으로는, 데이터를 정확하게 유지하는 것이 불가능했습니다. 또한, 수동 데이터 준비를 위해 귀중한 데이터 및 분석 리소스를 사용할 수 없었습니다. Tamr의 고급 AI/ML 기능을 사용하여, CHG Healthcare는 중복된 의사 레코드를 45% 줄였습니다. 또한, 수동 데이터 준비를 거의 완전히 없애고, 데이터 및 분석 리소스를 다른 곳으로 이동할 수 있었습니다. 가장 중요한 것은, 의료 제공자에 대한 신뢰할 수 있는 뷰를 가지고, 스태핑을 최적화하여, 고객에게 더 나은 경험을 제공할 수 있었습니다.

데이터 관리에서 AI에 대한 일반적인 오해는 무엇이며, Tamr은 이러한 신화를 어떻게 풀어줍니까?

일반적인 오해는 AI가 “완벽”해야 한다는 것입니다. 또는, 규칙과 수동 큐레이션이 완벽하다는 것입니다. 실제로는 규칙이 항상 실패합니다. 또한, 규칙이 실패할 때, 유일한 해결책은 더 많은 규칙입니다. 따라서, 관리할 수 없는 규칙의 메스를 갖게 됩니다. 또한, 수동 큐레이션은 취약합니다. 인간은 좋은 의도를 가지고 있을 수 있지만, 항상 옳지 않을 수 있습니다. 또한, 일부 인간 큐레이터는 다른 사람보다 더 좋을 수 있거나, 다른 결정을 내릴 수 있습니다. AI는 확률적입니다. 우리는 기술을 통해 이러한 기술의 정확성을 검증할 수 있습니다. 그리고, 우리는 AI가 규칙이나 수동 큐레이션보다 더 저렴하고 정확하다는 것을 발견했습니다.

Tamr은 데이터 정확성을 위한 AI와 인간의 정화를 결합합니다. 실제로 이것이 어떻게 작동하는지 설명할 수 있습니까?

인간은 AI에게 매우 중요한 것을 제공합니다. 즉, 훈련을 제공합니다. AI는 실제로 인간의 노력을 확장하는 것입니다. Tamr이 인간에게 요청하는 것은, 기계가 모델 매개변수를 설정하는 데 사용할 수 있는 작은 예제(“훈련 레이블”)입니다. 실제로는, 인간이 데이터와 함께 작은 시간을 보내고, 데이터의 오류와 실수를 Tamr에게 제공합니다. 그리고 AI는 이러한 교훈을 전체 데이터 세트에 적용합니다. 또한, 새로운 데이터가 추가되거나 데이터가 변경되면, AI는 인간에게 입력을 요청할 수 있습니다. 이 입력은, 물론, 모델을 정제하고 업데이트하는 데 사용됩니다.

대규모 언어 모델(LLM)은 Tamr의 데이터 품질 및 강화 프로세스에서 어떤 역할을 합니까?

첫째, LLM이 무엇을 잘하는지 명확히 해야 합니다. 기본적으로, LLM은 언어에 관한 것입니다. 그것은 의미를 가진 문자열을 생성하며, 입력된 텍스트의 의미를 “이해”할 수 있습니다. 따라서, Tamr에서 언어가 중요한 경우, 우리는 LLM을 사용합니다. 한 가지 명확한 예는, 우리의 가상 CDO 위에 있는 대화형 인터페이스입니다. 실제 CDO와 마찬가지로, 사용자가 질문을 하면, 그것을 이해하고, 사용자가 이해할 수 있는 언어를 사용하여 응답합니다. 이것은 LLM이 사용되는 방식입니다. Tamr에서 가치 있는 점은, 엔티티 데이터를 대화의 컨텍스트로 사용한다는 것입니다. 실제 CDO가 모든 최고의 엔터프라이즈 데이터를 손가락 끝에 가지고 있는 것처럼, 사용자의 질문에 답변할 때, 모든 최고의 엔터프라이즈 데이터를 가지고 있는 것과 같습니다. 얼마나 좋을까요!

또한, 데이터 값을 정리하거나 누락된 값을 채우는 경우, 언어 기반의 입력 값을 사용하여 누락된 값을 찾거나 수정할 수 있습니다. 예를 들어, “5mm 볼 베어링”이라는 텍스트에서, 부품의 크기는 “5mm”이라는 것을 알 수 있습니다. 마지막으로, LLM의 밑바탕에는 언어 의미를 토큰(예: 단어)으로 인코딩하는 임베딩 모델이 있습니다. 이것은 언어적 비교를 계산하는 데 매우 유용합니다. 따라서, “5”와 “five”는 문자가 다르지만, 언어적 의미는 매우ใกล습니다. 따라서, 우리는 이 정보를 사용하여 레코드를 연결할 수 있습니다.

AI와 기계 학습의 발전과 함께 데이터 관리의 미래는 어떻게 될까요?

“빅 데이터” 시대는 “스몰 데이터” 시대로 기억될 것입니다. 많은 데이터가 생성되었지만, 대부분의 데이터는 상대적으로 작은 규모입니다. 대시보드에 표현할 수 있는 정도의 데이터입니다. 따라서, 데이터 관리를 위한 도구와 프로세스는 “스몰 데이터”에 최적화되어 있습니다. 규칙 기반 논리와 수동 큐레이션이 여전히 데이터 관리에서 많이 사용됩니다.

しかし, AI와 기계 학습의 발전과 함께, 데이터 관리의 미래는 달라질 것입니다. AI 에이전트가 사람의 많은 작업을 자동으로 수행할 수 있게 됩니다. 그러나, 이 에이전트들이 데이터를 필요로 할 것입니다. 따라서, 데이터 관리 도구와 프로세스는 확장성과 자동화를 위해 발전해야 합니다. 인간은 여전히 중요한 역할을 할 것입니다. 그러나, 기계는 더 많은 데이터 정리 작업을 수행해야 합니다. 데이터 관리의 미래는, 더 많은 데이터를 자동으로 정리하고, 더 많은 사용자가 데이터를 사용할 수 있도록 하는 것입니다.

사업체는 데이터를 더 효과적으로 사용하여 어떤 가장 큰 기회를 가지나요?

데이터를 소비할 수 있는 방법의 수를 증가시키는 것입니다. 데이터 시각화 도구의 개선으로, 데이터가 더 많은 사람에게 접근 가능해졌습니다. 그러나, 데이터와 분석 리더들은, 더 많은 가치를 창출하기 위해, 더 많은 방법으로 데이터를 제공해야 합니다. 내부 360 페이지, 지식 그래프, 대화형 보조工具 등은 새로운 기술로 가능해졌습니다. 이러한 도구는 사람들이 이미 사용하는 시스템에 통합되어, 더 많은 사람들이 데이터를 사용할 수 있도록 합니다. 데이터에서 더 빠르게 가치를 창출하는 가장 빠른 방법은, 데이터를 사용할 수 있는 사람들에게 데이터를 제공하는 것입니다.

감사합니다. 더 많은 정보를 원하는 독자는 Tamr를 방문할 수 있습니다.

앙투안은 Unite.AI의 비전있는 리더이자 공동 창립자로서, AI와 로봇공학의 미래를 형성하고 촉진하는 데 대한 불변의 열정에 의해 추동됩니다. 연쇄적인 기업가로서, 그는 AI가 사회에 대한 전기와 같은 파괴력을 가질 것이라고 믿으며, 종종 파괴적인 기술과 AGI의 잠재력에 대해 열광합니다.

作为 futurist, 그는 이러한 혁신이 우리의 세계를 어떻게 형성할지 탐구하는 데 전념하고 있습니다. 또한, 그는 Securities.io의 창립자로서, 미래를 재정의하고 전체 부문을 재형성하는 최첨단 기술에 투자하는 플랫폼입니다.