思想领袖
规划、验证和生产一个成功的AI驱动的企业解决方案

企业正在加速其人工智能(AI)计划的步伐。Algorithmia的一项研究显示,76%的CIO正在优先考虑和增加他们的IT预算,以更大程度地关注AI和机器学习(ML)解决方案。组织也认识到数据的重要性,大多数组织都承认80%的企业数据是非结构化的。
非结构化数据正在以惊人的速度在企业堆栈中产生和增长。测量单位已经从TB转变为PB。因此,IT专业人员、CDO和CIO必须应对一些新的挑战,以满足对可用数据和可行见解的日益增长的需求。尽管AI具有巨大的潜力来改变任何行业,但到2022年底,只有15%的AI解决方案将会成功,而且更少的解决方案将会产生正的ROI。
最大的问题是,大多数企业AI解决方案由于期望不一致而无法见天日。围绕AI的可能性仍然存在误解,项目继续以基于炒作的模型为基础进行构想。产品或模型与企业日常运营的现实相差甚远。其他降低成功率的因素包括:成本超支、缺乏AI中心、缺乏经验丰富的人才、数据不可用以及过时的政策等等。
规划为企业AI成功铺平道路
非结构化数据是指缺乏预定义数据模型的数据,包括从文本密集的文档和网站到图像、视频文件、聊天机器人、音频流和社交媒体帖子等一切。随着企业架构中非结构化数据的增加,拥有一个高效且增量的计划以满足所有公司利益相关者的目标至关重要。组织层面的典型目标可能包括:流程自动化、欺诈检测、改善客户体验、改善安全性、增加销售额等。虽然其中一些目标可以通过结构化数据有效地实现,但规划非结构化数据可能具有挑战性。
通常,规划从确定组织内的机会领域开始。虽然高层管理人员可能有一个宏伟的AI愿景,但确定一个具有高影响力、低风险和持续数据增长的领域至关重要。一个很好的例子是银行和金融行业的贷款处理功能。从贷款发放到服务,贷款处理中充满了手动流程,信息被手动输入系统,重复进行。贷款申请的尽职调查涉及大量的文档提交,这带来了多种风险。然而,AI可以在工作流程的各个领域应用,包括文档处理和欺诈检测。这也是一个具有持续年增长数据的领域。
规划阶段需要考虑的其他关键步骤包括定义可衡量的成功标准、制定统一的数据战略、持续的培训和反馈,以及衡量用户体验、可扩展性和基础设施。
定义可衡量的成功标准(避免把马车放在马前!)
谷歌的早期成功往往归因于该公司制定了目标关键结果(OKR)。虽然这种方法可以应用于任何商业或个人目标,但将这种经过验证的方法应用于您的AI战略可能会带来一些有希望的结果。然而,非结构化数据是一个正在发展的问题,整个行业都在尝试解决它。鉴于这些挑战,业务领导者应该提出各种问题来确定“什么”和“为什么”。例如,如果提高生产力是主要目标,两个可以回答的问题是:
- 我应该计划通过自动化提高生产率吗?
- 我应该计划解决80%的问题,还是解决100%提交的所有案例?
回答这些问题会导致两种不同的实施之旅,决定哪一个适合您的企业至关重要。
在非结构化数据中,另一个模糊的衡量标准是准确性。在贷款处理的例子中,客户提交的文档具有如此多的变异性,以至于商业和技术领导者必须就如何衡量AI解决方案的准确性达成一致。如果生产力是实施AI解决方案的目标之一,那么就需要确定其他影响生产力的领域。这可以通过仔细检查当前的现状流程,并重新想象带有AI自动化的流程来实现。通常,新的自动化会导致流程中出现新的步骤,例如手动异常管理、注释、培训等。有了这些步骤,就更容易确定如何衡量准确性。
数据是所有企业的生命线
非结构化数据具有很高的信息结构和呈现方式的变异性。企业充满了以文档形式呈现的信息,文档本质上具有复杂的结构,包括段落、句子和多维表格结构。除了文档外,组织还越来越多地投资于聊天机器人、监控社交媒体数据和其他形式的非结构化数据,如新闻、图像和视频。
大多数组织低估了他们手头可用的和可访问的数据量。通常,挑战只是克服合规性限制并在组织内共享数据。然而,拥有干净和高变异性的数据可以更好地评估问题并设计出最佳解决方案。
另一个重要因素是您从这些非结构化数据中期待的结果。这将确保准确的真实数据、训练数据和测试数据。回到贷款处理的例子,如果AI解决方案的结果是确定申请人的平均日余额,真实数据和训练数据可以专注于银行对账单。然而,如果重点是确定通过提交的银行对账单来确定欺诈申请人,则需要访问更广泛的文档以获取必要的真实数据和训练数据。
从验证到生产的扩展
开展一个可衡量的验证(PoC)可以确保所有利益相关者了解AI解决方案的挑战、结果和价值主张。然而,验证并不等同于生产就绪的解决方案。验证使组织能够确定差距,刺激设计思维以获得生产解决方案,并简化应实现的目标和关键结果。为了从验证到可扩展的解决方案,组织应该计划复杂的数据场景,包括不断变化的数据、缺乏标记数据以及形式和格式的高变异性。同样重要的是重新想象工作流程、重新培训工作人员以及确定合适的基础设施、成本、性能、数据架构、信息安全和服务级别协议(SLA)。
绝对必须评估整个工作流程和业务流程,以便从任何AI解决方案中获得最佳结果。从行为经济学中汲取灵感,比较结果与现有的参考点(也称为“参考依赖性”)至关重要,这样在生产之前就可以通过设计思维和流程重映射来预期更好的效率。
这个场景假设业务和技术领导者已经在验证的基础上同意了MI或深度学习方法。一些问题陈述可能是确定性的,可以采用统计方法来解决问题,而其他挑战可能需要MI和神经网络方法的组合来实现所需的结果。
一些AI解决方案需要自然语言处理(NLP)的集成。虽然通用语言模型可以作为基础步骤,但大多数模型都不是为满足每个企业问题陈述的独特需求而设计的,需要进行微调。同时,大多数高管可能会对像GPT3这样的巨型模型感到兴奋,这些模型需要大量的计算能力,并且可能会直接影响公司的ROI。这些模型可能不是适合贵公司的合适选择。
您的AI驱动的验证只是一个漫长过程的开始,请记住以下几点:
- 不要在验证阶段选择一个复杂的问题来解决
- 应用设计思维并审查您的端到端流程;预测和管理风险
- 准确性并不是唯一的衡量标准;设计和计划构建一个价值驱动的解决方案,而不是实现100%的准确性
- 评估您的AI方法;不要计划基于炒作的模型,而是选择最优的、模块化的方法
- 管理所有利益相关者的期望,以确保最成功的结果
- 设计您的解决方案和架构,以适应数据的增长和最优的ROI
AI驱动解决方案的最佳实践
今天,大多数企业都在进行一个或多个AI项目。尽管有良好的意图和辛勤的工作,但许多企业AI计划都未能达到预期,无法扩展,也没有产生所需的ROI。将人工智能作为核心业务组件进行整合需要时间,但成功的组织遵循的一些最佳实践包括:
- 从AI中心开始:许多大型企业,即使不是科技公司,也已建立了AI中心,以最大限度地增加他们的成功机会。AI中心汇集了必要的专业知识、资源和人员,以使基于AI的转型计划成为可能。主要的好处包括:
- 在一个地方集中AI学习、资源和人才
- 制定统一的AI愿景和商业战略
- 标准化AI方法、平台和流程
- 确定新的收入机会,用于AI和创新
- 通过使AI可用于所有业务功能来扩大数据科学工作
- 高层买入:AI战略最成功的方法是从上到下。为了在整个组织中成功扩展试点,需要领导者的买入、必要的技能和数据,以及确保模型在时间推移中保持准确性的组织结构。
- 数据的可用性:大多数组织由于各种合规性原因而拥有孤立的数据。然而,数据是任何AI解决方案的生命线,数据的提供是至关重要的。除了提供数据外,数据的分类和清理也是必不可少的。开发准确的真实数据和训练数据可以成就或毁掉一个AI解决方案。
- 架构:利用AI是任何组织的一种范式转变,需要新的思考和规划方式。设计一个最优的技术和运营架构可以增加您的成功机会。这包括拥有新的功能,如ML运营、数据运营、迭代训练和注释等。
- 模块化和灵活性:AI驱动的解决方案仍处于初期阶段,尤其是当组织处理大量非结构化数据时。设计和构建一个模块化和灵活的解决方案,以适应业务和其日益增长的挑战至关重要。
建立和实施AI战略对大多数组织来说具有巨大的潜力,使用案例是无穷无尽的。机器学习和深度学习解决方案触及组织的各个方面,从销售和营销到日常运营。然而,像建造一枚火箭或发明一个新的小工具一样,成功不会一下子实现。AI驱动的解决方案应该分阶段实施,并在较小的胜利基础上逐步建设。












