思想领袖

您的数据存储策略是否适用于AI?

mm

采用AI已经导致了对适当的数据管理的需求增加,公司现在面临着确保数据成熟度的压力。全球许多公司正在使用或探索AI,超过82%的公司正在积极利用或考虑将AI用于业务运营。然而,根据Gartner的报告,只有14%的网络安全领导者能够平衡数据安全和业务目标之间的关系。

随着更多的企业急于利用AI,他们需要确保自己正在以最高的数据成熟度运营,并拥有适当的框架来处理日益增加的关键数据。通过利用数据成熟度模型框架,组织可以找出优化数据使用的最有效方法,帮助确定安全性中的差距并促进更大的数据效率。作为这一框架的一部分,组织还需要成熟的数据管理策略。

数据管理策略中最被忽视的部分之一是拥有适当的存储要求来备份和存储关键数据。企业面临着许多数据安全威胁,适当的存储可能是唯一能够防止AI生成的数据由于勒索软件或其他灾难而丢失或篡改的方法。您的企业可能具备AI能力,但您的存储基础设施是否适用于AI?

为什么存储必须参与AI对话

有几个原因说明为什么适当的存储对于由AI创建和使用的数据至关重要——企业需要确保数据保持容易访问、对不断演变的威胁具有安全性、能够在灾难发生时恢复,并且必须针对AI工作负载进行优化。

可访问性很重要,因为开发人员必须能够快速高效地找到和利用数据来训练其他AI算法。这种数据通常被认为是“任务关键”数据,对业务运营最有价值。拥有这种数据是确保流程顺畅的关键。

这种数据在存储时也需要具有最高级别的安全性。鉴于96%的勒索软件攻击现在针对备份数据,存储需要能够抵御勒索软件并能够承受任何可能使数据面临风险的停机或中断。备份是攻击者的主要目标,因为它们使公司无法恢复数据,从而更有可能支付赎金来检索关键数据。在此期间,企业可能会变得无力抵抗,并面临IT停机的延长时间,这可能会对股东、客户和员工造成声誉和经济损失。

网络安全攻击并不是存储可能丢失或篡改的唯一原因。生产数据,即企业日常运营中使用的数据,应该始终被视为已被销毁或损坏。因此,具有金色恢复副本或关键数据的干净、可靠和隔离副本是必需的。意外删除、覆盖数据或其他由人为错误引起的错误都可能损害您的数据。软件和硬件故障,例如损坏或病毒,也可能使您的数据面临风险,特别是如果您的软件和硬件没有最新的更新。最后,停电、洪水和极端天气等环境因素都是确保备份数据可以恢复的良好理由。

此外,AI工具可以以指数级的速度产生大量数据,传统的存储架构可能无法跟上需要存储的数据量。因此,AI存储必须能够高效地处理大量工作负载。使用可扩展和安全的数据存储,例如分层存储解决方案,将提供最佳功能,以便数据被监控和保存。

最适合AI数据的存储(无需破产)

分层备份存储可以确保重要数据快速可访问,是最具成本效益的解决方案之一。它允许数据保留,使数据可以在任何时候访问和重用。分层存储和备份根据数据的重要性和访问频率对数据进行组织。高优先级数据存储在快速、昂贵的存储介质上,例如SSD,而不太关键的数据存储在更便宜、更慢的介质上,例如HDD或云存储。特别是,AI数据应该存储在第0层或第1层,如上所述。第0层是用于任务关键数据的高速存储,具有NVMe媒体类型和全闪存存储阵列。第1层是用于经常访问的数据的高性能存储,具有SSD和混合闪存存储媒体类型。

进一步来说,尽可能频繁地备份存储在分层存储中的数据将在灾难发生时(例如人为错误或恶意篡改)允许快速访问。确保备份数据存储在多个位置,使用多种加密,并存储在各种媒体类型上,是确保备份安全的唯一方法。

在选择勒索软件防护备份和存储供应商时,必须确保选择能够承受可能使数据面临风险的任何灾难的不可变存储。需要注意的是,并非所有不可变存储都能兑现这一承诺。如果“不可变”数据可以被备份或存储管理员、供应商或攻击者覆盖,则它不是真正的不可变存储解决方案。了解真正不可变性的核心概念将有助于区分安全的备份系统和空洞的供应商声明。

以下五个要求有助于定义一个提供不可变性的备份存储环境:

  1. S3对象存储: 具有本地不可变性的完全记录的开源标准,允许独立的渗透测试
  2. 零时间不可变性: 备份数据必须在写入时即成为不可变数据
  3. 零访问破坏性操作: 没有管理员——无论是内部还是外部——都应该能够修改、删除或重置不可变数据。
  4. 备份软件和存储的分离: 备份软件和备份存储必须物理隔离,以防止被泄露的凭据被用于修改或销毁数据,并提供对其他灾难的恢复能力。
  5. 硬件形式: 专用设备隔离不可变存储与虚拟化的攻击面,并应在设置、更新和维护期间消除所有风险。

通过满足这些要求,组织可以确保不可变性,并确保无论发生什么——勒索软件、内部威胁还是凭据泄露——备份数据都保持受保护和可恢复的状态。

随着AI成为企业的一种常见工具,企业需要采用和识别更好的数据管理和基础设施,以确保数据成熟度。解决这一问题的答案可能在于分层存储和备份,这是保护由AI创建和训练的过量数据的最佳方法,并允许快速访问和保护这些关键且庞大的数据。

安东尼·库西马诺(Anthony Cusimano)在科技行业工作了十多年,担任过多个角色。他从开发人员开始,转向销售,然后转向营销。他是一位热衷于游戏的爱好者,始终关注最新的科技动态,以便在他的游戏电脑上获得尽可能多的帧数。安东尼目前是Object First的解决方案总监。