مقابلات
أنتوني دايتون، الرئيس التنفيذي لشركة Tamr – سلسلة المقابلات

أنتوني دايتون هو الرئيس التنفيذي لشركة Tamr. لديه 20 عامًا من الخبرة في بناء وتوسيع شركات البرمجيات المؤسسية. في الآونة الأخيرة، قضى عامين كchief ماركتينج في شركة Celonis، حيث أسس قيادتها في فئة برمجيات Process Mining وخلق برامج توليد الطلب التي أدت إلى نمو في الإيرادات السنوية بنسبة 130٪. قبل ذلك، شغل منصبًا لمدة 10 سنوات في شركة Qlik، حيث نمت من شركة برمجيات سويدية غير معروفة إلى شركة عامة – في أدوار من قيادة المنتج وتسويق المنتج وأخيرًا كchief التكنولوجيا. بدأ مسيرته المهنية في شركة Siebel Systems حيث تعلم كيفية بناء شركات برمجيات مؤسسية في مجموعة متنوعة من أدوار المنتج.
يمكنك مشاركة بعض المعالم الرئيسية من رحلتك في صناعة البرمجيات المؤسسية، خاصةً في وقتك في Qlik وCelonis؟
بدأت مسيرتي المهنية في برمجيات المؤسسات في شركة Siebel Systems وتعلمت الكثير عن بناء وتوسيع شركات البرمجيات المؤسسية من فريق القيادة هناك. انضممت إلى Qlik عندما كانت شركة برمجيات سويدية صغيرة غير معروفة مع 95٪ من فريق العمل الصغير المكون من 60 شخصًا يقع في لوند، السويد. أضحك قائلاً إنني لم أكن مهندسًا أو بائعًا،所以 وضعوني في charge من التسويق. بنيت فريق التسويق هناك، ولكن مع مرور الوقت، اهتماميและมشاركاتي تحولت نحو إدارة المنتج، وأخيرًا أصبحت رئيسًا لمنتج. أخذنا Qlik العامة في عام 2010، وواصلنا كشركة عامة ناجحة. بعد ذلك، أردنا القيام ببعض الاستحواذات، لذا بدأت فريق استحواذ. بعد جولة طويلة ومتناسقة كشركة عامة، باعت Qlik في النهاية إلى شركة رأس مال خاصة تسمى Thoma Bravo. كان هذا، كما أحب أن أقول، دورة حياة كاملة لشركة برمجيات مؤسسية. بعد مغادرة Qlik، انضممت إلى Celonis، شركة برمجيات ألمانية صغيرة تحاول تحقيق النجاح في بيعها في الولايات المتحدة. مرة أخرى، قمت بتشغيل التسويق كchief ماركتينج. نمت بسرعة وبنينا وظيفة تسويق عالمية ناجحة.
كلاً من Celonis وQlik ركز على الجزء الأمامي من تحدي تحليل البيانات – كيف أرى وأفهم البيانات؟ في حالة Qlik، كانت هذه لوحات التحكم؛ في حالة Celonis، كانت عمليات الأعمال. ولكن التحدي الشائع عبر كليهما كان البيانات الخلفية لهذه التصورات. شكى العديد من العملاء من أن البيانات كانت خاطئة: سجلات مكررة، سجلات غير كاملة، مساحات بيانات مفقودة. هذا ما جذبني إلى Tamr، حيث شعرت لأول مرة أننا قد نتمكن من حل تحدي البيانات المؤسسية المتضخمة. كانت أول 15 عامًا من مسيرتي المهنية في برمجيات المؤسسات مخصصة لتصوير البيانات، وأتمنى أن تكون القادمة 15 عامًا مخصصة لتنظيف هذه البيانات.
كيف شكلت تجاربك المبكرة نهجك في بناء وتوسيع شركات البرمجيات المؤسسية؟
درس مهم تعلمته في التحول من Siebel إلى Qlik هو قوة البساطة. كانت Siebel برمجيات قوية جدًا، ولكنها قتلت في السوق من قبل Salesforce.com، التي أنشأت برنامج CRM مع ميزات أقل بكثير (“لعبة” كانت Siebel تدعوها)، ولكن العملاء يمكنهم تشغيلها بسرعة لأنها تم توفيرها كحل سحابي. يبدو واضحًا اليوم، ولكن في ذلك الوقت كانت الحكمة هي أن العملاء يشترون الميزات، ولكن ما تعلمناه هو أن العملاء يستثمرون في حلول لحل مشاكلهم التجارية. إذا كان برنامجك يحل مشكلهم أسرع، فستفوز. كانت Qlik حلاً بسيطًا لمشكلة تحليل البيانات، ولكنها كانت بسيطة بشكل جذري. ونتيجة لذلك، كنا نتمكن من هزيمة منافسين أكثر ميزات مثل Business Objects وCognos.
الدرس المهم الثاني الذي تعلمته في تحولي الوظيفي من التسويق إلى المنتج. نعتقد أن هذه المجالات منفصلة. في مسيرتي، وجدت أنني أتحرك بسلاسة بين المنتج والتسويق. هناك صلة حميمة بين المنتج الذي تبنيه وكيف تصفه للعملاء المحتملين. وهناك صلة مهمة أيضًا بين ما يطالب به العملاء وما يجب أن نبني من منتج. القدرة على التحرك بين هذه المحادثات هي عامل نجاح حاسم لأي شركة برمجيات مؤسسية. سبب شائع لفشل شركة بدء التشغيل هو الاعتقاد ب “إذا بنيت، سيأتون”. هذا هو الاعتقاد الشائع بأنه إذا بنيت فقط برنامجًا رائعًا، سيستعيد الناس لشراءه. هذا لا يعمل أبدًا، والحل هو عملية تسويق قوية متصلة بعملية تطوير البرمجيات.
الفكرة الأخيرة التي سأمكنك من مشاركتها ترتبط بأعمالي الأكاديمية مع عملي المهني. كان لدي فرصة في مدرسة الأعمال لأخذ فصل دراسي حول نظرية الابتكار المدمر لClay Christensen. في عملي المهني، كان لدي فرصة لتجربة كلاً من كونه مدمرًا ومدمرًا. الدرس الرئيسي الذي تعلمته هو أن أي ابتكار مدمر هو نتيجة لتحول منصة خارجي يجعل المستحيل ممكنًا في النهاية. في حالة Qlik، كان هذا توافر الخوادم ذاكرة كبيرة التي سمحت لQlik بتعطيل التقارير التقليدية المعتمدة على المكعبات. في Tamr، توافر المنصة للمعلمين الآليين على نطاق واسع يسمح لنا بتعطيل إدارة البيانات الرئيسية القائمة على القواعد المدمرة لصالح نهج قائم على الذكاء الاصطناعي. من المهم دائمًا معرفة ما هو تحول المنصة الذي يدفع ابتكارك المدمر.
ما الذي ألهم تطوير إدارة البيانات الرئيسية الأصلية القائمة على الذكاء الاصطناعي (MDM)، وكيف تختلف عن حلول MDM التقليدية؟
تطوير Tamr خرج من العمل الأكاديمي في معهد ماساتشوستس للتكنولوجيا (MIT) حول حل الكيانات. تحت القيادة الأكاديمية للفائز بجائزة تURING Michael Stonebraker، كان السؤال الذي كان الفريق يحققه “هل يمكننا ربط سجلات البيانات عبر مئات الآلاف من المصادر وملايين السجلات”. على ظاهره، هذا هو تحدي لا يمكن التغلب عليه لأن هناك المزيد من السجلات والمصادر التي تحتاج كل سجل محتمل مطابقة إلى المزيد من السجلات. يسمي علماء الحاسوب هذا “مشكلة n-squared” لأن المشكلة تزداد بشكل هندسي مع النطاق.
حاولت أنظمة MDM التقليدية حل هذه المشكلة بالقواعد والتدقيق اليدوي للبيانات على نطاق واسع. لا تنجح القواعد لأنك لا تستطيع كتابة قواعد كافية لتغطية كل حالة حافة وتنسيق آلاف القواعد هو استحالة تقنية. التدقيق اليدوي مكلف للغاية لأنها تعتمد على البشر لمحاولة العمل من خلال ملايين السجلات والمقارنات المحتملة. معًا، هذا يفسر قبول السوق الضعيف لحلول MDM التقليدية (إدارة البيانات الرئيسية). بصراحة، لا أحد يحب MDM التقليدية.
كانت فكرة Tamr البسيطة هي تدريب الذكاء الاصطناعي على القيام بعمل استهلاك المصدر وتماثل السجل وتحديد القيمة. الشيء العظيم حول الذكاء الاصطناعي هو أنه لا يأكل أو ينام أو يأخذ عطلة؛ كما أنه قابل للتوسيع بشكل كبير، لذلك يمكنه التعامل مع كميات هائلة من البيانات والعمل على جعلها أفضل. لذلك، حيث كانت MDM تستحيل، أصبحت من الممكن تحقيق بيانات نظيفة وموحدة ومحدثة (انظر أعلاه).
ما هي أكبر التحديات التي تواجهها الشركات مع إدارة بياناتها، وكيف تتمثل Tamr في معالجة هذه القضايا؟
أول تحدي، ويمكن القول بأنه الأكثر أهمية، هو أن مستخدمي الأعمال لا يستخدمون البيانات التي تولدونها. أو قال بشكل مختلف، إذا لم تنتج فرق البيانات بيانات عالية الجودة التي تستخدمها المنظمات لحل الأسئلة التحليلية أو تسهيل العمليات التجارية، فإنهم يهدرون الوقت والمال. إخراج Tamr الرئيسي هو صفحة 360 لكل سجل كيان (فكر في: عميل، منتج، جزء، إلخ.) الذي يجمع جميع البيانات الأساسية والثانوية التحتية حتى يتمكن مستخدمو الأعمال من رؤية وتقديم ملاحظات على البيانات. مثل ويكي لبيانات الكيان. هذه الصفحة 360也是 مدخل إلى واجهة محادثية تسمح لمستخدمي الأعمال بالسؤال والاجابة على الأسئلة مع البيانات. لذا، الوظيفة الأولى هي إعطاء المستخدم البيانات.
لماذا من الصعب على الشركات إعطاء المستخدمين بيانات يحبونها؟ لأن هناك ثلاثة مشاكل صعبة أساسية تحقق هذا الهدف: تحميل مصدر جديد، وتماثل السجلات الجديدة في البيانات الحالية، وتصحيح القيم/الحقول في البيانات. يجعل Tamr من السهل تحميل مصادر بيانات جديدة لأن الذكاء الاصطناعي يخريطة تلقائيًا الحقول الجديدة إلى مخطط كيان محدد. هذا يعني أنه بغض النظر عما يسمى مصدر البيانات جديد حقل معين (مثال: cust_name) يتم تخطيطه إلى التعريف المركزي الصحيح للكيان (مثال: “اسم العميل”). التحدي التالي هو ربط السجلات التي هي مكررة. في هذا السياق، تعني التكرار أن السجلات هي في الواقع نفس الكيان في العالم الحقيقي. يقوم الذكاء الاصطناعي في Tamr بذلك، ويستخدم حتى مصادر خارجية من طرف ثالث ك “حقيقة أرضية” لتحديد الكيانات الشائعة مثل الشركات والأشخاص. مثال جيد على ذلك هو ربط جميع السجلات عبر العديد من المصادر لعميل مهم مثل “Dell Computer”. أخيرًا،对于 كل سجل قد توجد حقول فارغة أو غير صحيحة. يمكن لـTamr استنتاج قيم الحقول الصحيحة من المصادر الداخلية والخارجية.
يمكنك مشاركة قصة نجاح حيث تحسنت Tamr بشكل كبير إدارة بيانات شركة ونتائج أعمالها؟
CHG Healthcare هي لاعب رئيسي في صناعة التمويل الصحي، حيث توفر محترفين صحيين مهرة مع المرافق التي تحتاجها. سواء كانت أطباء مؤقتين من خلال Locums أو ممرضات مع RNnetwork أو حلول أوسع نطاقًا مع CHG نفسها، توفر حلول توظيف مخصصة للمرافق الصحية لمساعدتهم على العمل بسلاسة وتقديم رعاية جيدة للمرضى.
كان تحديهم الأساسي هو أنهم لم يكن لديهم صورة موحدة ودقيقة لجميع الم 제공ين في شبكتهم. نظرًا لحجمهم (7.5 مليون مزود)، كان من المستحيل الحفاظ على دقتهم مع نهج قديم قائم على القواعد دون كسر البنك على المحررين البشريين. كما لم يتمكنوا من تجاهل المشكلة لأن قرارات التمويل الخاصة بهم تعتمد عليها. البيانات السيئة بالنسبة لهم يمكن أن تعني أن مزودًا يحصل على المزيد من الوردية مما يمكنه التعامل معه، مما يؤدي إلى الإرهاق.
باستخدام قدرات Tamr المتقدمة لذكاء الأعمال والتعلم الآلي، خفضت CHG Healthcare السجلات المكررة للأطباء بنسبة 45٪ وألغت几乎 تمامًا التحضير اليدوي للبيانات الذي كان يتم تنفيذه بواسطة موارد نادرة من البيانات والتحليلات. وأهم من ذلك، من خلال الحصول على صورة موثوقة ودقيقة للمزودين، يمكن لـCHG تحسين التمويل، مما يسمح لهم بتسليم تجربة عملاء أفضل.
ما هي بعض المفاهيم الخاطئة الشائعة حول الذكاء الاصطناعي في إدارة البيانات، وكيف تساعد Tamr في دحض هذه الأساطير؟
مفهوم خاطئ شائع هو أن الذكاء الاصطناعي يجب أن يكون “مثاليًا”، أو أن القواعد والتدقيق البشري مثاليان في مقابل الذكاء الاصطناعي. الحقيقة هي أن القواعد فاشلة دائمًا. وأهم من ذلك، عندما تفشل القواعد، الحل الوحيد هو المزيد من القواعد. لذا، لديك فوضى غير قابلة للإدارة من القواعد. والتدقيق البشري قابل للخطأ أيضًا. قد يكون لدى البشر نوايا جيدة (على الرغم من أنهم ليسوا دائمًا كذلك)، ولكنهم ليسوا دائمًا على حق. ما هو أسوأ، هو أن بعض المحررين البشر أفضل من البعض الآخر، أو قد يتخذون قرارات مختلفة عن البعض الآخر. في المقابل، الذكاء الاصطناعي هو احتمالي بالطبيعة. يمكننا التحقق إحصائيًا من دقة هذه التقنيات، وعندما نفعل ذلك، نجد أن الذكاء الاصطناعي أقل تكلفة وأكثر دقة من أي بديل متنافس.
تجمع Tamr بين الذكاء الاصطناعي ورفinement البشري لضمان دقة البيانات. يمكنك توضيح كيفية عمل هذا المزيج في الممارسة؟
يوفّر البشر شيئًا استثنائيًا للذكاء الاصطناعي – يوفّرون التدريب. الذكاء الاصطناعي هو في الواقع حول توسيع جهود البشر. ما يبحث عنه Tamr من البشر هو عدد صغير من الأمثلة (“ملصقات التدريب”) التي يمكن للآلة استخدامها لتحديد معلمات النموذج. في الممارسة، ما يبدو عليه هو أن البشر يقضون وقتًا قصيرًا مع البيانات، ويعطون Tamr أمثلة على الأخطاء والأخطاء في البيانات، ويعمل الذكاء الاصطناعي على هذه الدروس عبر كامل مجموعة البيانات. بالإضافة إلى ذلك، عند إضافة بيانات جديدة أو تغييرها، يمكن للذكاء الاصطناعي إظهار الحالات التي يجد صعوبة في اتخاذ قرارات وثقة (“مطابقات وثقة منخفضة”) ويسأل الإنسان عن مدخلات. تذهب هذه المدخلات، بالطبع، إلى تحسين وتحديث النماذج.
ما الدور الذي تلعبه نماذج اللغة الكبيرة (LLMs) في عمليات جودة البيانات وتعزيز Tamr؟
أولاً، من المهم أن يكون واضحًا حول ما هي LLMs جيدة فيه. بشكل أساسي، LLMs هي حول اللغة. أنها تنتج سلاسل نصية تعني شيئًا، ويمكنها “فهم” معنى النص الممنوح لها. يمكنك أن تقول إنها آلات لغة. لذا، في Tamr، حيث تكون اللغة مهمة، نستخدم LLMs. مثال واضح هو واجهة المحادثة التي تقع فوق بيانات الكيان التي نسميها بفخرنا CDO الافتراضي. عندما تتحدث إلى CDO الحقيقي، فهمك ويستجيبون باستخدام لغة تفهمها. هذا هو بالضبط ما نتوقعه من LLM، وهذا هو بالضبط كيف نستخدمه في جزء من برامجنا. ما هو قيم في Tamr في هذا السياق هو أننا نستخدم بيانات الكيان كسياق للمحادثة مع vCDO. إنه مثل CDO الحقيقي لديك جميع أفضل بيانات المؤسسة في متناول يده عند الاستجابة لأسئلتك – أليس ذلك رائعًا!
بالإضافة إلى ذلك، هناك حالات حيث نريد استخدام تفسير لغة لتحديد قيمة مفقودة أو إصلاح قيمة مفقودة. على سبيل المثال، قد تسأل من النص “5mm ball bearing” ما هو حجم الجزء، وLLM (أو شخص) سوف يجيب بشكل صحيح “5mm”.
أخيرًا، تحت LLMs هناك نماذج تضمين ترميز معنى اللغة إلى رموز (فكر في الكلمات). هذه يمكن أن تكون مفيدة جدًا لحساب المقارنة اللغوية. لذا، بينما “5” و “five” لا تشترك في أي شخصيات، فهي قريبة جدًا في المعنى اللغوي. لذا، يمكننا استخدام هذه المعلومات لربط السجلات معًا.
كيف ترى مستقبل إدارة البيانات يتطور، خاصة مع التطورات في الذكاء الاصطناعي والتعلم الآلي؟
يجب أن تذكر “عصر البيانات الكبيرة” في أوائل العقد الأول من القرن الحادي والعشرين باسم “عصر البيانات الصغيرة”. بينما تم إنشاء الكثير من البيانات خلال العشرين عامًا الماضية، مدعومًا بتكلفة تخزين وعمليات الحواسيب، فإن معظم البيانات التي كان لها تأثير في المؤسسة هي بمقياس صغير – تقارير مبيعات وعمليات أساسية وتحليلات تسويقية ومجموعات بيانات أخرى يمكن أن تظهر بسهولة في لوحة تحكم. النتيجة هي أن العديد من الأدوات والعمليات المستخدمة في إدارة البيانات مُحسّنة ل “البيانات الصغيرة”، وهو السبب في أن المنطق القائم على القواعد، المُكمل بالتدقيق البشري، لا يزالprominent في إدارة البيانات.
الطريقة التي يريد الناس استخدام البيانات تتغير بشكل أساسي مع التطورات في الذكاء الاصطناعي والتعلم الآلي. فكرة “وكلاء الذكاء الاصطناعي” الذين يمكنهم أداء جزء كبير من وظيفة الشخص تلقائيًا يعمل فقط إذا كان لديهم الوكلاء البيانات التي يحتاجونها. إذا كنت تنتظر وكلاء الذكاء الاصطناعي للعمل في الخطوط الأمامية لدعم العملاء، ولكن لديك خمسة تمثيلات ل “Dell Computer” في نظام إدارة علاقات العملاء الخاص بك، وترتبط بمعلومات المنتج في نظام التخطيط للموارد الخاص بك، كيف تتوقع منهم تقديم خدمة عالية الجودة عندما يصل شخص ما من Dell؟
الاستنتاج من هذا هو أن أدوات إدارة البيانات وعملياتنا ستحتاج إلى التطور لمواجهة النطاق، مما يعني تبني الذكاء الاصطناعي والتعلم الآلي لتأتمتة المزيد من أنشطة تنظيف البيانات. سيظل البشر يلعبون دورًا كبيرًا في الإشراف على العملية، ولكن بشكل أساسي، намنح الآلات أن تفعل المزيد حتى لا تكون البيانات فقط في لوحة تحكم واحدة دقيقة و كاملة، ولكن معظم البيانات في المؤسسة.
ما هي أكبر الفرص للشركات اليوم عندما يتعلق الأمر بتحسين استخدام بياناتهم بشكل أكثر فعالية؟
زيادة عدد الطرق التي يمكن للأشخاص استهلاك البيانات. لا شك في أن تحسينات أدوات التصور البيانية جعلت البيانات أكثر سهولة الوصول إليها في جميع أنحاء المؤسسة. الآن، يحتاج قادة البيانات والتحليلات إلى النظر إلى ما وراء لوحة التحكم لطرق لتسليم القيمة بالبيانات. الواجهات مثل صفحات 360 الداخلية ورسوم المعرفة والمساعدين المحادثية يتم تمكينها من خلال تقنيات جديدة، وتمنح المستهلكين المحتملين للبيانات المزيد من الطرق لاستخدام البيانات في سير عملهم اليومي. إنه قوي بشكل خاص عندما يتم دمجها في الأنظمة التي يستخدمها الناس بالفعل، مثل أنظمة إدارة علاقات العملاء وأنظمة التخطيط للموارد. السبيل الأسرع لإنشاء المزيد من القيمة من البيانات هو إحضار البيانات إلى الأشخاص الذين يمكنهم استخدامها.
شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Tamr.












