锡德哈斯(Sidd)拉贾戈帕尔是Informatica公司Field CTO组织的首席架构师。在他的角色中,他与企业的高级主管合作,分享他的见解和经验,为数据和数据管理提供思想领导。
AI淘金热 – 从试验和实验到企业规模和战略摩尔定律在AI领域已经完全发挥作用。AI正受到热烈追捧,每个企业都在采用AI。创新也在助推这一需求,新的AI模型、AI代理和新技术不断涌现。这对企业来说是一个根本性的转变 – AI试验和实验的时代已经渐渐消失,企业正在意识到AI需要成为企业战略的一部分,以实现规模化和真正的业务差异化。AI已经成为大多数董事会讨论的话题,导致战略创新和预算的增加。数据:AI战略的第一块多米诺在任何AI战略中,数据都是一个关键的考虑因素。数据对于AI模型来说至关重要,因为它使得模型能够上下文化、智能化和特定化于领域和企业。AI模型根据模型的调优和输入的数据预测结果。两者都依赖于数据的质量、多样性、时效性和结构。根据最近的IDC预测,到2030年,AI预计将推动全球经济增长近20万亿美元,这不仅是由模型驱动的,也是由大量投资于支撑模型的基础数据和基础设施驱动的。如果训练数据仅包含狭窄的子集,模型就会产生偏见;如果数据过时,结果就会变得无关紧要;如果数据质量差,AI结果也会很差。因此,数据是企业数据战略的第一块多米诺。如果没有好的数据,即使拥有最好的团队和最先进的技术,AI战略也会迅速崩溃。正如Gartner的2024年报告关于数据和分析的顶级趋势所指出的,随着AI的扩展,组织依赖于数据;成功的领导者将是那些在数据上建立信任并以此为战略领导的企业。为您的AI战略做出的关键战略数据决策以下是5个关键考虑因素,您和您的企业需要为准备数据以支持AI战略做出决定:1. 重新利用您的数据景观 – 许多企业没有重新利用数据管理、数据治理和数据存储与分析的基础设施来支持AI。服务于关键报告和分析的数据也可能对AI至关重要。因此,首先要开始使用企业中已经存在的数据资产。当然,这需要与适当的数据质量措施相结合。关键问题 – 我们的企业中有哪些数据,它们的状态如何?2. 元数据和数据血统 – 对于现有的数据,元数据(即关于数据的数据)可能与数据本身一样重要,甚至更重要。例如,在保险企业中,业务术语标记在数据上可以帮助识别RAG模型的相关上下文。当用户询问索赔状态时,所有标记为“索赔状态”的数据属性都可以作为AI模型的上下文来响应。数据血统也有助于理解数据的流动,帮助AI模型识别可靠的数据源。根据最近的ISACA博客,AI治理至关重要,需要适当的元数据和数据血统来扩展。关键问题 – 我们的数据是否正确标记了业务和技术元数据?我们是否收集数据血统来理解数据的流动?3. 数据治理和合规性 – 确保您的数据得到良好的治理和管理,并且任何合规性和隐私法规都应用于数据。然后,AI战略应该继承和扩展这些治理和法规,而不是从头开始。例如,如果客户希望其数据按照GDPR法规匿名化,AI模型应该在匿名化的数据集上进行训练和操作。关键问题 – 我们是否有数据治理和合规性计划?如果没有,我需要为AI战略做出哪些关键决定?4. 将主数据作为您的AI四分卫 – 关键的主数据,包含关于企业关键实体的信息,应该作为AI战略的基础。例如,如果客户的360度视图存在,任何关于客户领域的AI战略(如客户流失预测)都应该利用这些主数据以避免数据缺失或不完整。当然,这可以与来自特定数据源的更多信息结合使用。关键问题 – 我是否拥有关键的主数据域,并且它们是否与数据景观的其他部分完全连接?5. 数据及其价值...