Unite.AI

思想领袖10 months ago

为何数据是AI战略中默默无闻的英雄

AI淘金热——从试点实验到企业级规模与战略在AI领域，摩尔定律正切实发挥着作用。AI需求旺盛，每家企业都在采用AI。创新也在助长这一需求，新的AI模型、AI智能体以及新技术不断涌现。这正为企业带来根本性的转变——AI，特别是生成式AI，作为试点、酷炫实验和展示的阶段已基本消退。企业正意识到，AI需要作为企业战略的一部分嵌入其中，以实现规模化并创造真正的业务差异化。AI已成为大多数董事会会议室的话题，从而催生了战略创新和预算。数据：AI战略中的第一张多米诺骨牌任何AI战略的一个关键考量都应是数据。数据对于AI模型具备情境感知能力、智能化以及特定于领域和企业至关重要。AI模型根据模型的调优方式以及提供给它的输入来预测结果。这两者都取决于数据的质量、多样性、时效性和结构。根据近期的一份IDC预测，到2030年，AI预计将为全球经济带来近20万亿美元的增长，这不仅由模型驱动，也由支撑这些模型的底层数据和基础设施的巨额投资所驱动。使用狭窄子集的训练数据会导致模型产生偏见，过时的数据会导致无关的结果，而低质量的数据只会导致糟糕的AI结果。因此，数据是企业数据战略中的第一张多米诺骨牌。即使拥有最优秀的人才和尖端技术，如果数据这张骨牌倒下，整个AI战略也会迅速崩塌。正如Gartner 2024年关于顶级数据和分析趋势的报告所指出的，组织在利用AI扩展时依赖于数据，而成功的领导者将是那些建立对其数据的信任并战略性地以其为主导的人。为您的AI战略做出的关键战略性数据决策以下是您和您的企业需要为AI战略准备数据时考虑的5个关键要点：1. 复用您的数据架构——许多企业没有为AI复用其数据管理、数据治理、数据存储和分析架构。大量服务于关键报告和分析的数据对AI也可能至关重要。因此，从企业已有的数据资产开始非常重要。当然，这需要辅以正确的数据质量措施。需要提出的关键问题 – 我们企业拥有哪些数据，其状况如何？2. 元数据与数据血缘——对于现有的数据，元数据（即关于数据的数据）对于AI可能同样关键，甚至更为关键。例如，标记在数据上的业务术语可以帮助识别RAG模型的相关上下文。当用户在保险企业询问理赔状态时，所有标记为”理赔状态”的数据属性都可以用作AI模型响应的上下文。数据血缘也有助于理解数据的流动，帮助AI模型识别可信的数据源。根据近期ISASA的一篇博客，AI治理至关重要，并且需要正确的元数据和数据血缘来实现扩展。需要提出的关键问题 – 我们的数据是否用业务和技术元数据进行了适当标记？我们是否收集数据血缘以了解数据如何端到端流动？3. 数据治理与合规性——确保您的数据得到良好的治理和管理，并且任何合规性和隐私法规都适用于数据。AI战略应继承并扩展这些治理和法规，而不是从头开始。例如，如果客户要求根据GDPR法规对其数据进行匿名化处理，那么AI模型就应该在匿名化数据集上进行训练和运行。需要提出的关键问题 – 我们是否有数据治理和合规计划？如果没有，我的AI战略需要落实哪些关键方面？4. 将主数据视为您的AI四分卫——关键的主数据包含企业关键实体的信息，应作为您AI战略的基础。例如，如果存在客户的360度视图，那么任何客户领域的AI战略（如客户流失预测）都应利用此主数据，以避免遗漏或不完整的数据。当然，这可以与来自特定数据源的更多信息相结合。需要提出的关键问题 – 我是否拥有完整的关键主数据域，并且它们与我的其他数据架构相连接？5. 数据及其价值——数据不应被视为成本中心，而应根据其对AI和业务的价值来衡量。这要求数据成为董事会和CXO层面的议题，而不仅仅是AI议题。需要提出的关键问题 – 我的董事会和CXO们是否理解数据对组织的价值？如果没有，我们如何确保他们理解这一点，尤其是在企业AI战略的背景下？模型来来去去，但数据永存。随着您的AI战略发展，新的模型和AI创新将会出现。这个领域的创新速度令人震惊。但随着时间的推移，AI模型将商品化；您企业真正的差异化因素不在于您使用哪个模型，而在于它如何通过训练、微调和运行于其上的数据进行情境化。如果您正在制定AI战略，不要从模型开始。从这个问题开始：我们是否有支持它的数据？