思想领袖

数据是人工智能战略中默默无闻的英雄

Published May 1, 2025

Updated April 26, 2026

Siddharth (Sidd) Rajagopal, Chief Architect at Informatica

人工智能淘金热 – 从试验和实验到企业规模和战略

摩尔定律在人工智能领域已经完全发挥作用。人工智能需求旺盛，每个企业都在采用人工智能。创新也在助推这一需求，新的人工智能模型、人工智能代理和新技术不断涌现。这对企业来说是一个根本性的转变 – 人工智能的试验和实验阶段，尤其是生成式人工智能，正在逐渐消失。企业意识到，人工智能需要成为企业战略的一部分，以实现规模化和真正的业务差异化。人工智能已经成为大多数董事会的讨论话题，带来了战略创新和预算。

数据：人工智能战略中的第一块多米诺骨牌

任何人工智能战略中的一个关键考虑因素是数据。数据对于人工智能模型来说至关重要，人工智能模型需要数据来变得有意义、智能和特定于领域和企业。人工智能模型根据模型的调优和输入的数据来预测结果。两者都依赖于数据的质量、多样性、时效性和结构。

根据最近的 IDC 预测，人工智能预计将在 2030 年前将全球经济提高近 20 万亿美元，这不仅是由模型驱动的，也是由大量投资于支撑模型的基础数据和基础设施驱动的。

如果训练数据仅包含狭窄的子集，会导致模型偏差，过时的数据会导致结果不相关，糟糕的数据会导致人工智能结果不佳。因此，数据是企业数据战略中的第一块多米诺骨牌。即使拥有最好的团队和最先进的技术，如果数据多米诺骨牌倒下，整个人工智能战略也会迅速崩溃。

正如 Gartner 的 2024 年报告关于数据和分析趋势的报告中提到的，随着企业规模化采用人工智能，数据变得至关重要，成功的领导者将是那些 在数据上建立信任并以此为战略领导 的人。

为您的人工智能战略做出关键战略数据决策

以下是您和您的企业为准备数据以支持人工智能战略需要做出的 5 个关键考虑因素：

1. 复用您的数据景观 – 许多企业没有复用数据管理、数据治理、数据存储和分析景观来支持人工智能。许多服务于关键报告和分析的数据也可以对人工智能至关重要。因此，首先从企业现有的数据资产开始是非常重要的。当然，这需要用正确的数据质量措施来增强。

关键问题 – 我们的企业中有哪些数据，它们的状况如何?

2. 元数据和数据血统 – 对于现有的数据，元数据（即关于数据的数据）可能与数据本身一样重要，甚至更重要。例如，业务术语可以标记在数据上，以帮助识别相关的上下文，例如 RAG 模型。当用户询问保险企业中某个索赔的状态时，所有标记为“索赔状态”的数据属性都可以用作人工智能模型的上下文来响应。数据血统也有助于理解数据流动，帮助人工智能模型识别可信的数据源。

根据最近的 ISASA 博客，人工智能治理至关重要，需要正确的元数据和数据血统来扩展。

关键问题 – 我们的数据是否正确标记了业务和技术元数据？我们是否收集数据血统来理解数据如何从端到端流动?

3. 数据治理和合规性 – 确保您的数据得到良好的治理和管理，并且任何合规性和隐私法规都应用于数据。人工智能战略应该继承和扩展这些治理和法规，而不是从头开始。例如，如果客户希望其数据按照 GDPR 法规匿名化，人工智能模型应该既在匿名化的数据集上进行训练，也在匿名化的数据集上运行。

关键问题 – 我们是否有数据治理和合规性计划？如果没有，我们需要为人工智能战略制定哪些关键方面?

4. 将主数据视为您的 AI 四分卫 – 关键的主数据，包含有关企业关键实体的数据，应该作为人工智能战略的基础。例如，如果客户的 360 度视图存在，任何客户领域的人工智能战略（如客户流失预测）都应该利用此主数据以避免任何数据缺失或不完整。当然，这可以与来自特定数据源的更多信息结合使用。

关键问题 – 我是否拥有关键的主数据域，并且它们是否与数据景观的其他部分完全连接?

5. 数据及其价值 – 数据不应该被视为成本中心，而应该以其价值来衡量，既包括人工智能的价值，也包括业务的价值。这需要数据成为董事会和 CXO 讨论的话题，除了人工智能之外。

关键问题 – 我的董事会和 CXO 是否理解数据对组织的价值？如果没有，我们如何确保这一点被理解，特别是在企业的人工智能战略背景下?

模型来来去去，但数据始终存在。

随着您的人工智能战略的演进，新的模型和人工智能创新将涌现。这个领域的创新速度令人惊叹。但随着时间的推移，人工智能模型将变得平凡；您企业中的真正区别不是使用哪种模型，而是如何使其上下文化，并使用什么数据来训练、微调和运行它。

如果您正在制定人工智能战略，不要从模型开始。从问题开始：我们是否拥有支持它的数据？

Siddharth (Sidd) Rajagopal, Chief Architect in the Field CTO Organization at Informatica

Siddharth (Sidd) Rajagopal 是 Informatica 的 Field CTO 组织的首席架构师。在他的角色中，他与企业的高级高管接触，通过分享他的见解和经验，提供有关数据和数据管理的思想领导。

Unite.AI

数据是人工智能战略中默默无闻的英雄

人工智能淘金热 – 从试验和实验到企业规模和战略

数据：人工智能战略中的第一块多米诺骨牌

You may like