Connect with us

思想领袖

规划、PoC 和生产一个成功的 AI 驱动的企业解决方案

mm

企业正在加速其人工智能(AI)计划的步伐。Algorithmia 的一项研究显示,76% 的 CIO 优先考虑并增加了他们的 IT 预算,以更大程度地关注 AI 和机器学习(ML)解决方案。组织也认识到数据的重要性,大多数组织都接受这样一个事实:80% 的企业数据是非结构化的。

非结构化数据正在以惊人的速度在企业堆栈中产生和增长。测量单位已经从 terabyte 转变为 petabyte。因此,IT 专业人员、CDO 和 CIO 必须应对一些新挑战,以满足对可用数据和可执行洞察的日益增长的需求。尽管 AI 有巨大的潜力来改变任何行业,但到 2022 年底,只有 15% 的 AI 解决方案将会成功,而且更少的解决方案将会产生正面的 ROI。

最大的问题是,大多数企业 AI 解决方案由于期望不一致而无法见到天日。围绕 AI 的可能性仍然存在误解,项目继续基于炒作驱动的模型。最终产品或模型与日常企业运营的实际情况相差甚远。其他导致成功率较低的因素包括:成本超支、缺乏 AI 中心(CoE)、缺乏经验丰富的人才、数据不可用以及过时的政策等。

规划为企业 AI 成功铺平了道路

非结构化数据是指缺乏预定义数据模型的数据,包括从文本密集的文档和网站到图像、视频文件、聊天机器人、音频流和社交媒体帖子等一切。随着企业架构中非结构化数据的增加,拥有一个高效且增量的计划以满足所有公司利益相关者的目标至关重要。典型的组织级目标可以包括:流程自动化、欺诈检测、改善客户体验、提高安全性、增加销售额等。虽然其中一些目标可以通过结构化数据有效地实现,但规划非结构化数据可能具有挑战性。

规划通常从识别组织内的机会领域开始。虽然高层管理人员可能有一个宏伟的 AI 愿景,但识别一个具有高影响力、低风险和持续增长的数据领域至关重要。一个很好的例子是银行和金融行业的贷款处理功能。从贷款origination到servicing,手动流程中信息被重复地输入到系统中。贷款申请的尽职调查涉及大量文档提交,这带来了多个风险。然而,AI 可以在工作流程的各个领域应用,包括文档处理和欺诈检测。这也是一个数据每年持续增长的领域。

规划阶段需要考虑的其他关键步骤包括定义可衡量的成功标准、制定统一的数据战略、持续训练和反馈、衡量用户体验、可扩展性和基础设施。

定义可衡量的成功标准(避免将马车放在马前!)

Google 的早期成功往往归因于该公司建立了目标关键结果(OKR)。虽然这种方法可以应用于任何商业或个人目标,但将这种成熟的方法应用于您的 AI 战略可能会带来一些有前途的结果。然而,关于非结构化数据,行业正在尝试解决一个不断演变的问题。鉴于这些挑战,业务领导者应该提出各种问题来确定“什么”和“为什么”。例如,如果提高生产力是关键目标,两个可以回答的问题是:

  • 我是否应该计划通过自动化提高生产率?
  • 我是否应该计划解决 80% 的问题,适用于 100% 的所有提交案例?

回答这些问题将导致两种不同的实施之旅,决定哪一个适合您的企业至关重要。

关于非结构化数据,另一个模糊的衡量标准是 准确性。在贷款处理的例子中,客户提交的文档有很大变异性,因此对于业务和技术领导者来说,达成一致关于如何衡量 AI 解决方案的准确性至关重要。如果生产力是引入 AI 解决方案的目标之一,那么识别其他影响生产力的领域将是必要的。这可以通过密切审视当前的现状流程并重新想象带有 AI 自动化的流程来实现。通常,新的自动化会导致流程中的新步骤,例如手动异常管理、注释、训练等。有了这些步骤,就可以更容易地确定如何衡量准确性。

数据是所有企业的生命血液

非结构化数据具有很高的变异性,信息以多种方式结构化和呈现。企业充满了以文档形式呈现的信息,文档本质上具有复杂的结构,包括段落、句子和多维表格结构。除了文档外,组织越来越多地投资于聊天机器人、监控社交媒体数据和其他形式的非结构化数据,例如新闻、图像和视频。

大多数组织低估了他们手头上可用的和可访问的数据量。通常,挑战只是克服合规性限制并在组织内共享数据。然而,拥有干净和高变异性的数据可以更好地评估问题和设计最优解决方案。

另一个重要因素是考虑您从这些非结构化数据中期待的结果。这将确保准确的真实数据、训练数据和测试数据。回到贷款处理的例子,如果 AI 解决方案的结果是确定申请人的平均日余额,真实数据和训练数据可以专注于银行对账单。然而,如果重点是通过提交的银行对账单确定欺诈申请人,则需要访问更广泛的文档以获得必要的真实数据和训练数据。

从 PoC 到生产的扩展

开展可衡量的概念验证(PoC)可以确保所有利益相关者了解 AI 解决方案的挑战、结果和价值主张。然而,PoC 不同于生产就绪解决方案。PoC 允许组织识别差距、激发生产解决方案的设计思维,并简化应实现的关键结果和目标。为了从 PoC 转变为可扩展的解决方案,组织应该为复杂的数据场景做好规划,包括不断变化的数据、标记数据的不可用性和形式和格式的高变异性。同样重要的是重新想象工作流程、重新培训员工并确定正确的基础设施、成本、性能、数据架构、信息安全和服务级别协议(SLA)。

绝对至关重要的是要评估整个工作流程和业务流程,以便从任何 AI 解决方案中获得最佳结果。从行为经济学中得到的启发,比较结果与现有的参考点(也称为“参考依赖性”)至关重要,此时可以通过设计思维和流程重映射预期更好的效率。

这个场景假设业务和技术领导者已经就 PoC 基础上同意了 MI 或深度学习方法。一些问题陈述可能是确定性的,可以采用统计方法来解决问题,而其他挑战可能需要结合 MI 和神经网络方法来实现所需的结果。

一些 AI 解决方案需要自然语言处理(NLP)的集成。虽然一般语言模型作为基础步骤发挥作用,但大多数模型并非旨在满足每个企业问题陈述的独特需求,需要进行微调。同时,大多数高管可能会对像 GPT3 这样的巨型模型感到兴奋,这些模型需要大量的计算能力,并且会直接影响公司的 ROI。这些模型可能不适合您的公司。

您的 AI 驱动的 PoC 只是漫长过程的开始,请牢记以下几点:

  • 不要在 PoC 阶段选择复杂的问题来解决
  • 应用设计思维,审查您的端到端流程;预测和管理风险
  • 准确性不是唯一的衡量标准;设计和计划构建一个价值驱动的解决方案,而不是实现 100% 的准确性
  • 评估您的 AI 方法;不要计划基于炒作的模型,而是选择最优的、模块化的方法
  • 管理所有利益相关者的期望,以确保最成功的结果
  • 设计您的解决方案和架构以适应数据的增长,实现最优的 ROI

AI 驱动解决方案的最佳实践

今天,大多数企业都正在开展一个或多个 AI 项目。尽管有良好的意图和努力,但许多企业 AI 程序未能达到预期,无法扩展,也没有产生所需的 ROI。将人工智能作为核心业务组件需要时间,但成功组织遵循的一些最佳实践包括:

  • 从 AI 中心开始:许多大型企业,甚至非科技企业,已经建立了 AI 中心(AI CoE)以最大限度地增加他们的成功机会。AI CoE 将必要的专业知识、资源和人员聚集在一起,以允许基于 AI 的转型计划。主要的好处包括:
    • 在一个地方集中 AI 学习、资源和人才
    • 制定统一的 AI 愿景和业务战略
    • 标准化 AI 方法、平台和流程
    • 确定新的收入机会,用于 AI 和创新
    • 通过使 AI 面向所有业务功能扩展数据科学工作
  • 高层支持:AI 战略最成功的方式是从上到下。为了在整个组织中成功扩展试点,需要高层支持、必要的技能和数据,以及确保模型在时间推移中保持准确性的组织结构。
  • 数据的可用性:大多数组织由于各种合规性原因而拥有孤立的数据。然而,数据是任何 AI 解决方案的生命血液,数据的提供是至关重要的。除了提供数据外,数据的分类和清理也是必不可少的。开发准确的真实数据和训练数据可以成就或毁掉一个 AI 解决方案。
  • 架构:利用 AI 对于任何组织来说都是一个范式转变,需要新的思考和规划方式。设计最优的技术和运营架构可以增加您的成功机会。这包括拥有新的功能,如 ML 操作、数据操作、迭代训练和注释等。
  • 模块化和灵活性:AI 驱动的解决方案仍处于初期阶段,尤其是当组织处理大量非结构化数据时。设计和构建一个模块化和灵活的解决方案至关重要,这个解决方案可以随着业务和其日益增长的挑战而扩展。

建立和实施 AI 战略对大多数组织来说具有巨大的潜力,使用案例是无穷无尽的。机器学习和深度学习解决方案触及组织的各个方面,从销售和营销到日常运营。然而,就像建造一枚火箭或发明一个新的小工具一样,成功不会一下子实现。AI 驱动的解决方案应该分阶段实施,并在一段时间内建立在较小的胜利之上。

Prabhod Sunkara 是 nRoad, Inc 的联合创始人和首席运营官,这是一家专门为金融服务领域的非结构化数据开发的自然语言处理(NLP)平台,也是第一个宣布“对文档宣战”的公司。在加入 nRoad 之前,Prabhod 曾在产品开发、运营和解决方案架构等领域担任过各种领导职务。他对构建和交付结果驱动的 AI 解决方案的热情成功地改善了大型全球金融公司(如 Bank of America、Merrill Lynch、Morgan Stanley 和 UBS)的流程。