思想领袖
机器学习模型成功的四大因素

作者:Jason Revelle,Datatron 首席技术官 Datatron
专家、分析师和实施经验丰富的人都在赞扬机器学习(ML)的优点,导致越来越多的企业采用机器学习用于各种用途。其声誉在于能够实现人工智能和数字化转型。然而,尽管机器学习具有巨大的潜力,但也存在一个缺点:对于需要在生产环境中管理机器学习的团队来说,工作可能会变得非常困难。
企业正在使用机器学习执行各种任务,例如分类健康风险、处理文档、预测价格、检测欺诈、预防性维护等。团队在历史数据上训练和评估模型,直到它们似乎符合性能和准确性目标。企业渴望通过预测、分类或预测未来结果并采取相应措施来获得机器学习所承诺的高价值回报。
然而,这一切业务价值都带来了高昂的运营成本。一旦模型“准备好”后,其自动化通过可靠的交付机制会产生运营复杂性和风险,需要警惕性。为了使这些项目高效且有效,交付和运营团队必须整体管理机器学习生命周期。数据必须可用且质量符合训练时的预期。
很快就显现出,这与其他工程努力不同,您需要以新的方式思考挑战,以真正成为一个人工智能驱动的公司。以下是四个需要考虑的因素,以便在机器学习中取得成功,特别是在机器学习模型中。
1. 如何能够快速部署多个版本在幕后
机器学习模型需要一个依赖于实际生产数据的迭代过程。专注于投资具有部署目标的能力,这些目标可以运行和记录结果,而无需生产系统或客户看到这些结果。您需要轻松、流畅地部署,直到您拥有喜欢的模型。从长远来看,假设模型需要大量的调整以及比较当前版本和新候选版本以获得更好的结果,这将更加有效和经济。
2. 了解您的团队承诺的内容通常不会符合传统的应用程序中心的“批准软件”政策。
随着机器学习的快速增长和多样化,它拥有一个不断扩大的技术提供商名单,包括大型和小型公司。IT需要维护适当的支持、安全扫描和控制以适应您的操作环境。但是,请注意:将相同的控制和流程应用于您的机器学习实践可能会在您开始之前显著降低您的潜在回报。
还需要注意,数据科学家需求量很大。如果他们觉得自己被迫在不改变使用的技术或使用方式的情况下交付更好的结果,他们很容易找到另一份工作。
3. 了解机器学习模型开发生命周期与软件开发生命周期不同
软件开发和创建机器学习模型是非常不同的过程;将后者视为前者可能会导致灾难。将模型交付视为另一个软件发布的企业最终会在跨越能力(如监控和分析)方面存在差距,并且在创作者和运营人员之间的知识转移方面存在高昂的开销,具有顺序、延长的时间表。部署和支持模型的专家需要了解模型和数据的工作原理,而不仅仅是服务可靠性和错误代码的故障排除。合适的人才、数据和运营专家的混合团队,以及合适的工具,将使您能够测试和解释不仅软件的执行情况,还有响应的准确性和可解释性。
还需要采用基于成功的方法来审计机器学习模型,因为它们是有缺陷的。如果您希望公司的数据科学家即使事情出错时也能相信机器学习模型的预测(意识到这将发生),那么机器学习模型的审计过程应该以允许机器学习模型被迭代和改进的方式设计。
4. 为规模做计划
您需要部署具有自动部署系统(如Kubernetes或Docker Swarm)的机器智能工具。这将帮助您实现多个目标。您将能够动态地生成机器学习工作负载,并自动监控任务以检测故障,使用AI算法提醒操作员注意任何潜在问题。您还将能够将来自多个来源的分析报告合并到一个集中仪表板中,以确保机器学习模型按预期运行。
掌握学习曲线
在开始机器学习项目之前,了解机器学习模型可以为您的组织带来巨大的优势和效率至关重要,但如果不正确管理,它们可能会自行发展。了解风险和运营复杂性,并牢记上述四个提示。有了坚实的基础,您将能够创建和轻松更改机器学习模型,以满足您的业务目标。到您的组织,他们可以自行发展,如果不正确管理,了解风险和运营复杂性,从一开始就牢记上述四个提示。有了坚实的基础,您将能够创建和轻松更改机器学习模型,以满足您的业务目标。












