思想领袖
选择存储以支持 AI/ML 计划

由 Candida Valois,Field CTO,Americas,Scality
ML 和 AI 的采用速度不断加快,这并不令人惊讶,考虑到其许多用例所带来的商业洞察和行业转型。普华永道预测,到 2030 年,AI 可能会为全球经济贡献近 16 万亿美元。这相当于当地经济的 GDP 增加 26%。
这些技术需要大量的非结构化数据来运行,这些数据通常以视频、图像、文本和语音的形式出现。这种类型的工作负载需要一种新的数据存储方法;旧的方法是不够的。随着此类工作负载的出现,应用程序需要更快地访问大量数据——数据是在云端、边缘和本地创建的。这些高强度工作负载需要低延迟、支持不同类型和大小的有效载荷的能力以及线性扩展的能力。
需要的是一种新的数据交付方法,这种方法是应用程序中心的,而不是位置中心或技术中心的。随着 AI/ML 和分析的大规模采用,企业 IT 领导者需要在数据管理和存储方面进行重大转变。
处理所有文件大小
在 AI/ML 工作负载和数据存储方面,组织需要一种可以处理不同类型工作负载的解决方案,无论是小文件还是大文件。在某些情况下,您可能需要处理几十个 terabyte,而在其他情况下,则有许多 petabyte。不所有解决方案都适用于大文件,就像不所有解决方案都可以处理非常小的文件一样。诀窍是找到一种可以灵活地处理两者的解决方案。
可扩展性是必不可少的
为了确保准确性和速度,组织需要大量的数据集,因为这是 AI/ML 算法正确训练底层模型所需的。组织希望在容量和性能方面增长,但往往被传统的存储解决方案所阻碍。当他们尝试线性扩展时,他们无法做到。AI/ML 工作负载需要一种可以根据数据增长无限扩展的存储解决方案。
几百个 terabyte 就会使标准的文件和块存储解决方案达到最大容量;之后,它们就无法扩展。对象存储可以根据需求无限、弹性和无缝地扩展。对象存储与传统存储相比,重要的是它是一个完全平坦的空间,没有任何限制。用户不会遇到传统存储中的限制。
满足性能要求
容量扩展很重要,但这还不够。组织还需要在性能方面线性扩展的能力。不幸的是,许多传统的存储解决方案在扩展容量时会以牺牲性能为代价。因此,当组织需要在容量方面线性扩展时,性能往往会达到瓶颈或下降。
标准存储范式由组织成层次结构的文件组成,包括目录和子目录。此架构在数据容量小时工作得很好,但随着容量的增长,性能会在某个点由于系统瓶颈和文件查找表的限制而受到影响。然而,对象存储提供了一个无限的平面命名空间,因此,只需添加更多节点,即可扩展到 petabyte 及更大容量。因此,您可以在扩展容量的同时扩展性能。
支持 AI/ML 项目的存储
随着 AI 和 ML 的流行,组织必须采用一种新的存储方法。这种新方法必须使他们能够正确地建立、运行和扩展他们的 AI/ML 计划。AI/ML 训练是一个明确的需求,因此今天可用的部分企业级对象存储软件是为了满足这一需求而构建的。企业可以从小规模开始,先使用一台服务器,然后根据需要扩展容量和性能。这些项目还需要分析应用程序的性能,而快速的对象存储可以提供此功能。此外,对象存储提供了跨多个云的完整数据生命周期管理,并从边缘到核心提供了灵活性。
企业需要高效地处理数据,对象存储可以通过让应用程序轻松访问本地数据(甚至在多个云中)来实现这一点。其低延迟、可扩展性和灵活性使对象存储成为 AI/ML 计划的强大盟友。
