Connect with us

Unite.AI

Siddharth (Sidd) Rajagopal, Informatica公司首席架构师 Siddharth (Sidd) Rajagopal Informatica公司首席架构师

锡德哈斯（Sidd）拉贾戈帕尔是Informatica公司Field CTO组织的首席架构师。在他的角色中，他与企业的高级主管合作，分享他的见解和经验，为数据和数据管理提供思想领导。

最新文章

思想领袖 2025年5月1日

为什么数据是AI战略的默默英雄

AI淘金热 – 从试验和实验到企业规模和战略摩尔定律在AI领域已经完全发挥作用。AI正受到热烈追捧，每个企业都在采用AI。创新也在助推这一需求，新的AI模型、AI代理和新技术不断涌现。这对企业来说是一个根本性的转变 – AI试验和实验的时代已经渐渐消失，企业正在意识到AI需要成为企业战略的一部分，以实现规模化和真正的业务差异化。AI已经成为大多数董事会讨论的话题，导致战略创新和预算的增加。数据：AI战略的第一块多米诺在任何AI战略中，数据都是一个关键的考虑因素。数据对于AI模型来说至关重要，因为它使得模型能够上下文化、智能化和特定化于领域和企业。AI模型根据模型的调优和输入的数据预测结果。两者都依赖于数据的质量、多样性、时效性和结构。根据最近的IDC预测，到2030年，AI预计将推动全球经济增长近20万亿美元，这不仅是由模型驱动的，也是由大量投资于支撑模型的基础数据和基础设施驱动的。如果训练数据仅包含狭窄的子集，模型就会产生偏见；如果数据过时，结果就会变得无关紧要；如果数据质量差，AI结果也会很差。因此，数据是企业数据战略的第一块多米诺。如果没有好的数据，即使拥有最好的团队和最先进的技术，AI战略也会迅速崩溃。正如Gartner的2024年报告关于数据和分析的顶级趋势所指出的，随着AI的扩展，组织依赖于数据；成功的领导者将是那些在数据上建立信任并以此为战略领导的企业。为您的AI战略做出的关键战略数据决策以下是5个关键考虑因素，您和您的企业需要为准备数据以支持AI战略做出决定：1. 重新利用您的数据景观 – 许多企业没有重新利用数据管理、数据治理和数据存储与分析的基础设施来支持AI。服务于关键报告和分析的数据也可能对AI至关重要。因此，首先要开始使用企业中已经存在的数据资产。当然，这需要与适当的数据质量措施相结合。关键问题 – 我们的企业中有哪些数据，它们的状态如何?2. 元数据和数据血统 – 对于现有的数据，元数据（即关于数据的数据）可能与数据本身一样重要，甚至更重要。例如，在保险企业中，业务术语标记在数据上可以帮助识别RAG模型的相关上下文。当用户询问索赔状态时，所有标记为“索赔状态”的数据属性都可以作为AI模型的上下文来响应。数据血统也有助于理解数据的流动，帮助AI模型识别可靠的数据源。根据最近的ISACA博客，AI治理至关重要，需要适当的元数据和数据血统来扩展。关键问题 – 我们的数据是否正确标记了业务和技术元数据？我们是否收集数据血统来理解数据的流动?3. 数据治理和合规性 – 确保您的数据得到良好的治理和管理，并且任何合规性和隐私法规都应用于数据。然后，AI战略应该继承和扩展这些治理和法规，而不是从头开始。例如，如果客户希望其数据按照GDPR法规匿名化，AI模型应该在匿名化的数据集上进行训练和操作。关键问题 – 我们是否有数据治理和合规性计划？如果没有，我需要为AI战略做出哪些关键决定?4. 将主数据作为您的AI四分卫 – 关键的主数据，包含关于企业关键实体的信息，应该作为AI战略的基础。例如，如果客户的360度视图存在，任何关于客户领域的AI战略（如客户流失预测）都应该利用这些主数据以避免数据缺失或不完整。当然，这可以与来自特定数据源的更多信息结合使用。关键问题 – 我是否拥有关键的主数据域，并且它们是否与数据景观的其他部分完全连接?5. 数据及其价值...