AI正在改变存储行业游戏规则

AI已经不再是存储行业的附庸者,而是统治者。

在AI时代,数据存储的逻辑正在发生根本变化。从前,存储系统只需“把数据放好”。而现在,它必须“把数据快速、智能地喂给AI模型”。如何服务AI,已经成了衡量一家存储厂商战略眼光和技术堆栈深度的新标尺。

一场从“存”到“用”的迁徙

过去,存储行业的核心竞争力是速度、容量和稳定性;而在AI浪潮下,新的问题浮现:存储系统如何成为AI数据管道的一部分?

当下主流的大语言模型(LLM)和AI代理(Agent)训练或推理过程,依赖大量结构化与非结构化数据,尤其是文件、对象和日志类型的原始数据。而这些数据,并不是拿来就能用的。它们必须经过识别、定位、筛选、向量化等步骤,才能变成模型可消化的“信息食粮”。

这条“AI数据管道”,正在从“边缘数据采集”一路延伸到“模型推理端”,中间涉及数据湖、数据库、向量数据库、文件系统、并行存储、KV缓存机制等等(上图)。

AI正在逼迫传统存储行业重构产品架构与战略重心。

Qumulo 与 VAST:两种完全不同的思路

存储厂商对于AI浪潮的态度正在分化。

一端是保守派的Qumulo——“我们只管存,不插手AI。” 他们的策略是维持标准块存储、文件存储和对象存储协议的兼容性,不主动参与AI管道,仅通过自家的NeuralCache进行内部AI优化。

另一端是激进派的VAST Data,直接打包构建AI栈。他们不仅支持Nvidia GPUDirect打通GPU与数据之间的高速通道,还开发了集成向量数据库、事件驱动实时数据流、Agent构建工具和推理环境的完整AI OS。这不是单纯的“适配AI”,而是直接“下场造AI”。

其余厂商,则分布在两者之间的光谱上:

  • 大厂如Dell、HPE、Hitachi Vantara等,正在通过合作伙伴构建“AI工厂”;
  • Cloudian、IBM、Pure Storage等已支持GPUDirect;
  • NetApp、MinIO、Scality等也正悄然拓展AI数据服务功能。

这是一场关于“角色转变”的博弈:是继续做一个“存储配角”,还是升级为AI生态的“信息供给中枢”?

GPUDirect:从“文件”走向“对象”

AI浪潮最先推动的一项底层变革,是GPUDirect技术的普及。

最初,GPUDirect只支持文件形式的数据传输。但现在,它正向S3对象存储延伸,通过RDMA通道直接送数据到GPU中,从而极大地减少I/O延迟和数据复制步骤。

这项技术现已被Cloudian、DDN、Dell、HPE、IBM、NetApp、Pure、VAST等厂商广泛支持。但多产品线供应商(如Dell、HPE)的不同产品支持程度尚不一致。

更进一步的,是获得Nvidia BasePOD/SuperPOD认证,以及整合其企业AI微服务(如NeMo、NIM、NIXL)。目前,Dell、DDN、Hitachi、HPE、NetApp、VAST等已经实现这种深度融合。

再进一步?只有VAST跳出来说:我们直接自己做AI操作系统。

KV缓存管理:AI推理的新“存储前线”

另一个被AI催生的新战场,是GPU高带宽内存(HBM)中的KV缓存。

当大模型运行时,会把中间的tokens和vectors缓存到HBM中。但内存是有限的。当缓存满了、数据被替换,如果后续还需要这些被踢出的内容,就要重新计算,增加推理时间。

于是,一种新的“缓存分层架构”出现:将KV缓存数据写入本地直连SSD(Tier 0)或RDMA访问的网络存储(Tier 1),实现快速调用,减少重复计算。

目前,VAST、Hammerspace 和 WEKA 已经支持这一策略。这个看似边缘的优化,实际上正在重塑AI推理的存储逻辑。谁掌握了KV缓存管理,谁就掌握了AI响应速度。

云厂商、边缘厂商和“被遗忘”的备份供应商

在AI时代,不仅是传统存储厂商要改变。云存储服务商、边缘文件系统、甚至备份与归档系统也难逃重构命运。

  • AWS、Azure、GCP等云厂商在自研AI芯片的同时,也在强化自己的存储接口(如S3 Express),试图再造一个更快的GPUDirect。
  • CTERA、Nasuni 等边缘文件服务厂商需要将数据“上送”到中心GPU节点,它们能否适配Nvidia边缘AI框架,尚未明朗。
  • 数据管理工具(如Komprise、Datadobi)虽擅长筛选和移动数据,但目前还没进入Nvidia的视野。

最尴尬的是备份厂商。很多AI项目的训练数据就藏在备份系统中,但它们几乎不愿开放API访问。这也造成了“AI数据管道三分天下”的碎片化局面。

总结:存储行业的AI断层正在成形

AI不会等你准备好再来,它是以“吞噬者”的姿态压迫一切基础设施向其靠拢。

在这场变革中,存储行业也迎来了“重新洗牌”:谁能成为AI世界的“数据血脉”,谁就有机会超越传统的价值边界。

可以肯定的是——未来的存储行业,不是为人类设计的,而是为AI。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

隐私已经死去,软件正在吃掉世界,数据即将爆炸