思想领袖
您的数据存储策略是否已为人工智能做好准备?

人工智能的采用增加了对适当数据治理的需求,公司现在面临着确保数据成熟度的压力。 全球许多公司正在使用或探索人工智能,超过 82% 的公司积极利用或考虑将人工智能用于业务运营。然而,根据 Gartner公司 只有 14% 的网络领导者能够在最大限度地提高数据利用效率和保护数据安全之间取得平衡,以实现业务目标。
随着越来越多的企业争相利用人工智能,他们需要确保自身数据成熟度达到峰值,并采用合适的框架来处理日益增长的关键数据。通过利用数据成熟度模型框架,企业可以找到优化数据使用的最有效方法,从而帮助找出安全漏洞并提高数据效率。作为该框架的一部分,企业还需要一个成熟的数据管理策略。
成熟的数据管理策略中最容易被忽视的部分之一是拥有适当的存储需求来备份和存储关键数据。企业在数据安全方面面临诸多威胁,而合适的存储来处理人工智能工作负载可能是防止人工智能生成的数据因勒索软件或其他灾难而丢失或被篡改的唯一方法。您的企业可能具备人工智能能力,但您的存储基础设施是否已为人工智能做好准备?
为什么存储必须参与人工智能对话
适当的存储对于人工智能创建和使用的数据至关重要,原因有几个——企业需要确保数据仍然易于访问、能够抵御不断演变的威胁、能够在发生灾难时恢复,并且必须针对人工智能工作负载进行优化。
可访问性至关重要,因为开发人员必须能够快速高效地查找和利用数据来训练其他 AI 算法。大多数情况下,这类数据被视为“任务关键型”,对业务运营而言可能最具价值。确保这类数据随时可用,是确保在关键时刻流程精简的关键。
这些数据在存储时也需要具有最高级别的安全性。鉴于 96% 的勒索软件攻击 如今,勒索软件攻击的目标已转向备份数据,存储需要具备防勒索软件功能,并能够承受企业可能面临的任何停机或中断。备份是攻击者的主要目标,因为它们使企业无法恢复数据,从而更有可能支付赎金来恢复关键数据。与此同时,如果企业“关键任务”数据无法访问,他们可能会陷入毫无防备的境地,并面临长时间的IT中断。这可能会造成声誉和经济损失,对股东、客户和员工都造成毁灭性打击。
网络安全攻击并非存储丢失或被篡改的唯一原因。生产数据,即企业日常运营中使用的数据,应始终视为已遭破坏或损坏。因此,黄金恢复副本,即关键数据的干净、可靠且隔离的副本至关重要。意外删除、数据覆盖或任何其他人为错误造成的错误都可能危及您的数据。软件和硬件故障(例如损坏或病毒)也可能使您的数据面临风险,尤其是在您的软件和硬件未安装最新更新的情况下。最后,停电、洪水和极端天气等环境因素都是确保您的备份数据能够恢复的必要条件。
此外,AI 工具能够以指数级的速度生成海量数据,而传统的存储架构可能无法满足存储数据量的需求。因此,AI 存储必须能够高效地处理海量工作负载。使用可扩展且安全的数据存储(例如分层存储解决方案)将发挥最佳性能,从而更好地监控和保存数据。
最佳的人工智能数据存储方式(无需花费太多)
分层备份存储可确保重要数据快速访问,是最具成本效益的解决方案之一。它允许数据保留,允许随时访问和重复使用数据。分层存储和备份根据数据的重要性和访问频率进行组织。高优先级数据存储在快速、昂贵的存储介质中,例如固态硬盘 (SSD),而不太重要的数据存储在更便宜、速度更慢的介质中,例如普通硬盘 (HDD) 或云存储。具体而言,考虑到上述要求,AI 数据应存储在第 0 层或第 1 层。第 0 层是用于关键任务数据的高速存储,采用 NVMe 介质类型和全闪存存储阵列。第 1 层是用于频繁访问数据的高性能存储,采用固态硬盘 (SSD) 和混合闪存存储介质类型。
更进一步,尽可能频繁地备份分层存储中的数据,以便在发生灾难(例如人为错误或恶意更改)时能够快速访问。确保备份数据的副本存储在多个位置、使用多种加密方式以及各种介质类型上,是确保备份安全的唯一方法。
在选择防勒索软件备份和存储供应商时,务必确保所选的不可变存储能够抵御任何可能危及数据安全的灾难。需要注意的是,并非所有不可变存储都能兑现这一承诺。如果“不可变”数据可以被备份或存储管理员、供应商或攻击者覆盖,那么它就不是真正的不可变存储解决方案。理解真正不可变性的核心概念,有助于区分安全备份系统与供应商的空洞宣传。
这五个要求有助于定义提供不变性的备份存储环境:
- S3 对象存储: 具有完整文档的开放标准,具有原生的不变性,可进行独立的渗透测试
- 零时间实现不变性: 备份数据在写入时必须是不可变的。
- 零破坏行为: 任何管理员(无论是内部还是外部)都不应该能够修改、删除或重置不可变数据。
- 备份软件和存储的细分:备份软件和备份存储必须物理隔离,以防止使用泄露的凭证来更改或破坏数据,并提供抵御其他灾难的能力。
- 硬件规格:专用设备将不可变存储与虚拟化攻击面隔离,并应消除设置、更新和维护过程中的所有风险。
通过满足这些要求,组织可以确保不变性,从而确保无论发生什么情况(勒索软件、内部威胁或凭证泄露),备份数据仍然受到保护且可恢复。
随着人工智能成为企业常用的工具,企业需要采用并确定更完善的数据管理和基础设施,以确保数据的成熟度。解决这个问题的答案或许在于分层存储和备份,这是保护人工智能创建和训练的海量数据的最佳方式,并确保能够快速访问和保护这些关键且海量的数据。










