Connect with us

思想领袖

数据是人工智能战略中默默无闻的英雄

mm

人工智能淘金热 – 从试验和实验到企业规模和战略

摩尔定律 在人工智能领域已经完全发挥作用。人工智能需求旺盛,每个企业都在采用人工智能。创新也在助推这一需求,新的人工智能模型、人工智能代理和新技术不断涌现。这对企业来说是一个根本性的转变 – 人工智能的试验和实验阶段,尤其是生成式人工智能,正在逐渐消失。企业意识到,人工智能需要成为企业战略的一部分,以实现规模化和真正的业务差异化。人工智能已经成为大多数董事会的讨论话题,带来了战略创新和预算。

数据:人工智能战略中的第一块多米诺骨牌

任何人工智能战略中的一个关键考虑因素是数据。数据对于人工智能模型来说至关重要,人工智能模型需要数据来变得有意义、智能和特定于领域和企业。人工智能模型根据模型的调优和输入的数据来预测结果。两者都依赖于数据的质量、多样性、时效性和结构。

根据最近的 IDC 预测,人工智能预计将在 2030 年前将全球经济提高近 20 万亿美元,这不仅是由模型驱动的,也是由大量投资于支撑模型的基础数据和基础设施驱动的。

如果训练数据仅包含狭窄的子集,会导致模型偏差,过时的数据会导致结果不相关,糟糕的数据会导致人工智能结果不佳。因此,数据是企业数据战略中的第一块多米诺骨牌。即使拥有最好的团队和最先进的技术,如果数据多米诺骨牌倒下,整个人工智能战略也会迅速崩溃。

正如 Gartner 的 2024 年报告 关于数据和分析趋势的报告中提到的,随着企业规模化采用人工智能,数据变得至关重要,成功的领导者将是那些 在数据上建立信任并以此为战略领导 的人。

为您的人工智能战略做出关键战略数据决策

以下是您和您的企业为准备数据以支持人工智能战略需要做出的 5 个关键考虑因素:

1. 复用您的数据景观 – 许多企业没有复用数据管理、数据治理、数据存储和分析景观来支持人工智能。许多服务于关键报告和分析的数据也可以对人工智能至关重要。因此,首先从企业现有的数据资产开始是非常重要的。当然,这需要用正确的数据质量措施来增强。

关键问题 – 我们的企业中有哪些数据,它们的状况如何?

2. 元数据和数据血统 – 对于现有的数据,元数据(即关于数据的数据)可能与数据本身一样重要,甚至更重要。例如,业务术语可以标记在数据上,以帮助识别相关的上下文,例如 RAG 模型。当用户询问保险企业中某个索赔的状态时,所有标记为“索赔状态”的数据属性都可以用作人工智能模型的上下文来响应。数据血统也有助于理解数据流动,帮助人工智能模型识别可信的数据源。

根据最近的 ISASA 博客,人工智能治理至关重要,需要正确的元数据和数据血统来扩展。

关键问题 – 我们的数据是否正确标记了业务和技术元数据?我们是否收集数据血统来理解数据如何从端到端流动?

3. 数据治理和合规性 – 确保您的数据得到良好的治理和管理,并且任何合规性和隐私法规都应用于数据。人工智能战略应该继承和扩展这些治理和法规,而不是从头开始。例如,如果客户希望其数据按照 GDPR 法规匿名化,人工智能模型应该既在匿名化的数据集上进行训练,也在匿名化的数据集上运行。

关键问题 – 我们是否有数据治理和合规性计划?如果没有,我们需要为人工智能战略制定哪些关键方面?

4. 将主数据视为您的 AI 四分卫 – 关键的主数据,包含有关企业关键实体的数据,应该作为人工智能战略的基础。例如,如果客户的 360 度视图存在,任何客户领域的人工智能战略(如客户流失预测)都应该利用此主数据以避免任何数据缺失或不完整。当然,这可以与来自特定数据源的更多信息结合使用。

关键问题 – 我是否拥有关键的主数据域,并且它们是否与数据景观的其他部分完全连接?

5. 数据及其价值 – 数据不应该被视为成本中心,而应该以其价值来衡量,既包括人工智能的价值,也包括业务的价值。这需要数据成为董事会和 CXO 讨论的话题,除了人工智能之外。

关键问题 – 我的董事会和 CXO 是否理解数据对组织的价值?如果没有,我们如何确保这一点被理解,特别是在企业的人工智能战略背景下?

模型来来去去,但数据始终存在。

随着您的人工智能战略的演进,新的模型和人工智能创新将涌现。这个领域的创新速度令人惊叹。但随着时间的推移,人工智能模型将变得平凡;您企业中的真正区别不是使用哪种模型,而是如何使其上下文化,并使用什么数据来训练、微调和运行它。

如果您正在制定人工智能战略,不要从模型开始。从问题开始:我们是否拥有支持它的数据?

Siddharth (Sidd) Rajagopal 是 Informatica 的 Field CTO 组织的首席架构师。在他的角色中,他与企业的高级高管接触,通过分享他的见解和经验,提供有关数据和数据管理的思想领导。