访谈
Datatron 首席执行官 Victor Thu – 采访系列

Victor Thu 是 Datatron 的首席执行官,Datatron 是一个帮助企业利用机器学习的平台,通过加速部署、提前发现问题和提高管理多个模型的效率。
您的背景是产品营销、上市和产品管理,如何让您进入机器学习和人工智能领域?
我热爱技术,我的一些亲密朋友甚至称我为“技术低语者”。我喜欢把复杂的技术话题翻译成人们可以理解的语言,并且我喜欢学习新技术,以了解对人们来说最重要的技术背后的原因。
我第一次接触到所谓的“现代人工智能”是在观看斯坦福大学人工智能教授费伊·李博士的主题演讲时。李博士的主题演讲非常吸引人,这成为我职业生涯的转折点。那个演讲让我相信,这就是我下一步要做的事情。我想成为利用人工智能和机器学习解决商业挑战的下一个技术浪潮的一部分。
从那时起,我与多家人工智能和机器学习初创公司合作,利用技术解决实际的商业需求。我与具有博士学位的机器学习科学家密切合作,他们给我提供了大量的人工智能和机器学习知识。并且,我仍然在不断学习,因为这个领域正在迅速发展。
所以,真正让我进入人工智能和机器学习领域的是我对技术的热情和如何利用它来帮助他人。
Datatron 专注于 MLOps,对于不熟悉这个术语的读者,您可以描述一下它是什么吗?
MLOps 本质上是将从原型到生产的高度手工过程编码和简化。
人们的一个最大误解是,一旦数据科学家构建了他们的人工智能模型,他们就可以快速地将其投入生产。然而,现实是,模型可能需要一年才能部署。
延迟的主要原因是,开发模型的专家可能不具备软件工程专业知识。一个很好的类比是,设计摩天大楼的建筑师不一定是建造它们的开发商。
MLOps 本质上是模型开发者和软件工程师之间的桥梁。与其花费超过 12 个月的时间将模型投入生产,MLOps 可以将这个漫长的过程缩短到仅仅几天。
在您为我们撰写的 2021 年 9 月的一篇文章中,您讨论了“将解决方案投入生产的主要障碍不是模型的质量,而是缺乏基础设施来支持公司这样做。”为什么这是大多数公司面临的障碍?
有几个因素导致了这个问题。
- 对“免费”开源软件的过度浪漫化。 首先,我想强调,我们喜欢开源软件,并且坚信它帮助行业通过巨大的进步向前发展。然而,很多人不了解开源软件在人工智能和机器学习方面的复杂性。今天,人工智能和机器学习人才严重短缺。当你将其与找到知道如何处理人工智能和机器学习代码的独特属性的软件工程师(机器学习工程师或 MLOps 工程师)结合起来时,期望通过弄清楚 300 多个开源 MLOps 项目来构建企业级 MLOps 平台,这是注定要失败的。
- 缺乏支持工程团队的基础设施。 公司需要更好的环境来让工程师成功。需要有适当的带宽和预算来为团队提供正确的工具。人工智能是一项相对较新的技术。从事人工智能的企业并不总是知道如何快速将模型投入生产,这就是为什么 MLOps 是如此重要的工具。
使用 MLOps 如何解决基础设施不足的问题?
MLOps 通过以下四种方式解决基础设施不足的问题:
- 无需专有代码更改:数据科学家希望能够在他们的环境中构建适合业务用例的模型,因此,任何需要代码更改的 MLOps 流程都会使模型的完整性复杂化。
- 自动化/脚本化:许多团队以硬编码的方式编写模型,这需要花费大量时间。MLOps 自动化了整个过程,节省了大量时间和精力。
- 简化更新:人工智能模型会定期更改以适应其环境。有时,数据科学家需要频繁更新模型。没有 MLOps,就没有办法避免这种重复更新。
- 管理底层基础设施:为了部署模型,需要计算网络和存储,这需要人工智能和机器学习模型的独特属性。MLOps 工具具有利用正确的资源来相应地扩展它们的能力。
还有一些企业需求通常不会在构建自己的 MLOps 工具时被考虑,例如基于角色的访问控制(RBAC)、集成和互操作性、对不同机器学习工具的支持、解决安全漏洞以及核心团队成员的意外离开。
您对人工智能治理的重要性有什么看法?
有无数关于人工智能模型不能正常工作的恐怖故事,从错误地标记某些人群到为上市公司造成巨大的财务损失。
人工智能治理对于企业在生产中运行人工智能模型来说至关重要。话虽如此,它与其他 IT 或业务治理并无不同。今天,当您的 IT 在云中或甚至在自己的数据中心运行应用程序时,他们有各种工具来确保应用程序正常运行。
一旦您在生产中运行人工智能模型,您需要有机制和工具来为业务和数据科学家提供模型正在执行的内容的可见性。
尤其是在人工智能和机器学习的这一初期阶段,没有“设置并忘记”的选项。开始时,您需要监控模型的行为并进行相应的调整。具有适当的监控功能以便在模型行为超出预期边界时提醒您至关重要。
模型风险管理(MRM)还需要考虑参与模型开发和部署的不同个人。您如何确保模型的完整性?或者,您如何确保来自不同群体的个人不会意外地将您的模型用于它们不打算使用的用例?所有这些都是团队需要问自己的问题。
Datatron 如何帮助模型风险管理?
MLOps 允许快速更新和更改模型。例如,如果一个模型错误地拒绝贷款申请,MLOps 允许您将模型回滚并重新引入一个新模型,从而以简单的方式管理风险。
它通过一个简单的仪表板保护模型免受偏差漂移的影响,并在生产中保持关键指标,该仪表板使用来自高级概述的详细数据,可以被业务决策者轻松理解。
Datatron 平台的人工智能治理提供了比一般监控功能更高级的功能,提供了更多的上下文和逻辑,以显示与客户用例更相关的模型的清晰可见性。
在 Datatron 的一篇博客文章中,您描述了 Datatron 如何采纳可靠人工智能的口号。您可以描述一下您对可靠人工智能的看法吗?
当我们提出这个概念时,我们思考了为什么我们今天如此舒适地飞行于商业飞机。尽管有很多关于伦理人工智能、负责任的人工智能等的讨论,企业的主要需求是能够可靠地使用人工智能和机器学习,就像他们的员工可以登上商业飞机一样。
使用诸如“伦理人工智能”、“负责任的人工智能”等术语,实际上源于当前的人工智能模型不能按预期工作的问题,因此被认为不可靠。企业不愿意使用人工智能,因为他们没有信心认为他们的模型没有偏见。这意味着他们的模型不可靠,Datatron 致力于改变这一点。
您还想分享关于 Datatron 的其他信息吗?
我们是少数几个在高压力场景中获得超级碗经验的 MLOps 玩家,例如与 Domino’s Pizza 合作,轻松快速地在生产中部署人工智能模型,并在超级碗期间接受了最终测试。
MLOps 确实是帮助人工智能和机器学习模型进入生产同时节省资源和降低成本的方法。我们是成功人工智能和机器学习模型的可持续来源,并且是收入的催化剂。公司终于可以从他们的人工智能和机器学习项目中获得投资回报率。无论您的利润率如何,您都可以使用 MLOps 获得成果。
感谢这次精彩的采访,希望了解更多的读者可以访问 Datatron。












