思想领袖

如何通过可信数据基础设施让组织现代化、治理和自信地采用人工智能

mm

您的业务拥有什么数据?这些数据从哪里来?这些数据流经哪些系统?

在2026年,如果您无法回答这些问题,那么您就没有可信的数据基础设施来现代化、治理和自信地采用人工智能。

当前的人工智能讨论正在错误的抽象层次上进行。每个人都在讨论最新的模型、Copilot集成等。但真正的问题是,您是否足够了解自己的数据,以至于可以信任任何人工智能系统!

这里有龙

中世纪的制图师在未探索的区域绘制怪物。短语“这里有龙”出现在Hunt-Lenox球体上。它的意思是,我们不知道这里有什么——假设最坏的情况!

大多数组织的数据资产中存在这样的区域。有像生产数据库和核心事务系统这样的熟悉区域,还有其他区域。影子数据库、某人桌子下的测试数据库或使用生产数据设置的暂存环境。

您无法导航未绘制的区域,您当然不应该在未绘制的基础上构建人工智能系统。

我们对这个景观了解多少?

这不仅仅是一个假设性的比喻。 Redgate的2026年数据库景观状态报告,该报告对全球2000多名IT专业人员进行了调查,提供了对这些未绘制区域在实践中的情况的了解。

  • 74%的组织现在运行两个或两个以上的数据库平台,其中25%运行四个或更多。数据不仅仅存在于一个地方;它分布在平台、云环境和遗留系统中。每个平台都有自己的访问控制、自己的查询模式、自己的怪癖。当数据如此分散时,问题不是您是否有盲点,而是您有多少盲点!
  • 39%仍然依赖手动测试和部署。每次手动部署都带来风险,可能没有遵循清单,数据来源不明确,数据生命周期不明确。
  • 47%的多平台组织曾经历过安全或隐私问题。这里确实有龙!

尽管存在这些明显的问题,58%的组织愿意为人工智能效率而接受更高的风险。然而,如果您拥有合适的基础设施,这并不一定如此。

现代化

大多数数据库现代化项目并非因为技术不起作用而失败。它们之所以失败,是因为没有人完全了解旧系统,例如存储过程,它们编码了没有人记录的业务规则,以及系统之间的隐式数据合同,这些合同只存在于已经离开的人的头脑中。

这就是 Chesterton 的围栏原理应用于数据资产:在移除某些东西之前,您需要了解为什么它是以这种方式构建的!

在实践中,这意味着以与应用程序代码相同的严谨性对待数据库更改。版本控制、自动化部署、可重复的过程;应用程序团队多年前采用的做法在数据库方面仍然很少见。当数据库更改是手动和未跟踪的时,现代化过程中的每一步都带有隐藏的风险。您不能自信地迁移您无法可靠部署的东西。

测试数据是另一个盲点。希望现代化其数据资产的组织需要验证一切都能在另一侧正常工作。然而,使用生产数据副本进行测试会带来自己的问题:敏感数据可能会出现在访问控制较弱的环境中,没有人跟踪它存在多久,遵守义务会跟随数据,无论您是否打算复制它。可靠、具有代表性的测试数据不带来这些风险,是安全现代化数据库的先决条件。

成功现代化的组织将数据库DevOps和测试数据管理视为首要任务,而不是事后补充。

治理

有一个诱惑,认为人工智能治理只是一个简单的政策练习:1)编写一份文件,2)发布一个框架,3)勾选合规框。然而,只存在于文件中的治理就是戏剧。真正的治理意味着构建系统,使最佳实践成为默认选项,而不是人们必须记得去做的事情。

真正的治理还意味着一致地看到数据库部署管道、生产环境中运行的查询以及敏感数据的流向。这意味着知道(在操作上,而不是理论上)人工智能系统可以访问哪些数据、从哪里来以及谁批准了其使用。

这不是一个抽象的愿望。监管正在朝着这个方向发展。 欧盟人工智能法案根据风险水平对人工智能系统进行分类,并对高风险应用施加了特定的数据治理、可追溯性和人工监督义务。

ISO 42001,人工智能管理系统的国际标准,进一步规定组织必须证明如何以审计证据管理数据质量、来源和生命周期,跨人工智能系统。

共同的线索是,监管机构不会问您是否编写了治理政策。他们会问您是否可以向他们展示它是如何工作的:

您能否追踪特定决策的数据来源?

您能否证明敏感信息是按照您自己的规则处理的?

您能否证明您在纸面上描述的控制措施在生产环境中运行?

自信地采用人工智能

一旦您可以回答这些问题,您就建立了坚实的基础,并且处于很好的位置来采用人工智能。您现在对输入有信心,而不是更多的垃圾输入、垃圾输出问题。

从人工智能中获得真正价值的组织不一定是拥有最先进模型的组织。它们是做了“枯燥”基础工作的组织,编目数据、建立血统、自动化部署、确保访问控制和测试数据质量。

当组织报告对安全性、准确性和合规性的担忧时,他们实际上是说,他们不够信任自己的基础设施,以至于无法信任在其上构建的内容。

不要落入同样的陷阱。现代化、治理,然后才能自信地采用人工智能。

您是否准备好采用人工智能?

希望采用人工智能的组织应该能够自信地回答以下三个问题:

  1. 您能否生成敏感数据在整个资产中存储位置的完整清单?
  2. 您能否追踪数据从源头到人工智能模型消费点的血统?
  3. 如果监管机构明天要求您说明PII的位置,您能否验证它不在任何测试环境中?

如果您不能,从这里开始!构建您的数据景观地图并彻底探索。再也没有龙了!

杰夫·福斯特(Jeff Foster)是Redgate的技术和创新总监,负责技术架构和推动可扩展、可持续的创新,并专注于利用人工智能来发展产品、增强客户价值和提高业务效率。