多年来,存储管理员和网络管理员之间的"壁垒"一直是企业数据中心的固有特征。我在职业生涯早期担任网络工程师时,存储领域对我来说就像一个黑盒子,对大多数公司而言,情况依然如此。
这是因为这些网络的运行方式不同。存储团队专注于IOPS和耐久性,而网络团队则关注延迟和吞吐量。但在英伟达GTC 2026大会上,首席执行官黄仁勋刚刚推出了一个有效打破这道壁垒的平台:英伟达BlueField-4 STX存储架构。
英伟达发布了一个模块化参考架构,与传统的基于中央处理器的存储设计相比,Token吞吐量提升多达5倍,能效提升4倍。然而,重要的是要透过数字看本质。这项创新不仅仅是提升速度,而是重新定义了智能体人工智能时代的"存储"概念。
"上下文层"的崛起
我们正在从简单的"聊天机器人"时代迈向智能体AI时代——这些系统不仅仅回答问题,还能跨会话执行多步骤任务。这些智能体需要上下文工作记忆。
传统存储(如高容量通用阵列)对此来说太慢了。当AI智能体需要从10小时的对话或大型技术手册中回忆特定细节来执行下一步时,等待传统数据路径会创建瓶颈,让昂贵的图形处理器空闲等待,而没有什么比未被使用的GPU更浪费钱的了。
BlueField-4 STX引入了英伟达CMX(上下文内存存储)平台。这不仅仅是"更多磁盘",而是一个高性能上下文层,可以在机架间扩展GPU内存。它允许AI工厂以两倍速度摄取数据,并维持长上下文推理所需的响应性。
硬件协同:Vera Rubin平台
STX背后的技术差异化在于其与英伟达Vera Rubin平台的集成。该架构采用存储优化的BlueField-4处理器,结合了:
英伟达Vera CPU:处理复杂逻辑的重型工作。
英伟达ConnectX-9 SuperNIC:提供超低延迟管道。
英伟达Spectrum-X以太网:确保网络架构能够处理AI工厂的规模。
通过将存储任务从通用CPU转移到这种专门的STX架构,英伟达声称能效提升四倍。在电力可用性是数据中心扩展最大约束的时代,这不仅仅是"锦上添花"——而是扩展或停滞的区别所在。
为什么网络和存储管理员必须联合
这一公告等于最后通牒:孤岛必须结束。如果你是网络管理员,你现在也要做存储业务。如果你是存储管理员,你现在也要做网络业务。
网络就是存储总线:通过BlueField-4 STX和Spectrum-X,"存储"不再是线缆末端的一个盒子;它是网络架构本身的分布式层。性能调优现在需要深度理解RDMA、RoCE,以及数据如何在CMX层和GPU之间移动。
延迟是唯一重要的指标:在传统企业应用中,几毫秒的存储延迟令人烦恼。在智能体AI中,这对"Token流"来说是灾难性的。管理员必须协同工作,消除数据路径中的每一微秒摩擦。
统一管理:STX架构依赖英伟达DOCA和英伟达AI Enterprise软件。这意味着管理网络接口的软件栈与管理存储加速的软件栈是相同的。
基于极致协同设计构建
英伟达BlueField-4 STX架构是黄仁勋所说的极致协同设计的产物。在GTC上,英伟达为此举办了分析师会议,讨论了如何使用这种方法创建新解决方案。极致协同设计是一种多学科工程方法,将整个数据中心视为单一的集成单元,以消除网络和存储之间的传统"壁垒"。
通过紧密耦合Vera CPU、ConnectX-9 SuperNIC和Spectrum-X以太网,英伟达创建了一个分布式上下文层,使AI智能体能够以比基于CPU设计四倍的能效和五倍的Token吞吐量访问工作内存。这种协同确保网络有效地成为存储总线,为智能体AI的多步推理任务提供所需的超低延迟。
关于存储在这个协同设计生态系统中的作用,网络高级副总裁Kevin Deierling指出:"思考需要规划。你写一个待办清单。你需要把它存储在某个地方,所以当Jensen谈论STX和CMX时,CMX是其缓存优化版本。所有这些都需要优化,因为思考需要内存,而这种内存最终是整个数据中心协同设计优化的一部分。"
这只是英伟达使用这种方法创建的最新产品。其他产品包括Vera Rubin、Groq 3 LPX、Spectrum-X、IGX Thor等。正是这种系统级思考能力为英伟达创造了看似坚不可摧的护城河。
广泛的行业推动力
行业并没有等待观望这是否有效。合作伙伴名单堪称基础设施世界的"名人录"。
早期采用者:CoreWeave、Oracle Cloud和Mistral AI等云和AI领导者已经转向STX用于上下文内存。
基础设施合作伙伴:Dell Technologies、Hewlett Packard Enterprise、NetApp和Pure Storage(现为Everpure)等重量级厂商正在基于这一架构协同设计系统。
制造商:Supermicro和QCT已经在构建基于STX的物理机架。
结论
很容易将BlueField-4 STX视为存储优化的硬件升级,但它实际上是将存储作为集成组件引入AI工厂。它认识到AI存储不是关于长期归档——而是关于主动推理。
对于信息技术专业人员来说,GTC传达的信息是要保持领先。走出舒适区,开始学习另一面的知识。存储和网络正在融合,那些在孤岛中工作的工程师将被排除在外。2026年最成功的数据中心架构师将是那些能够在同一句话中说出"Spectrum-X"和"上下文内存"的人。
基于STX的平台预计将在2026年下半年上市。时间紧迫。
Q&A
Q1:英伟达BlueField-4 STX是什么?有什么特别之处?
A:BlueField-4 STX是英伟达推出的存储架构,它是一个模块化参考架构,与传统CPU存储设计相比,Token吞吐量提升5倍,能效提升4倍。它不仅仅是硬件升级,而是重新定义了智能体AI时代的存储概念,打破了传统网络与存储之间的壁垒。
Q2:为什么传统存储不适合智能体AI?
A:智能体AI需要上下文工作记忆来执行多步骤任务。当AI智能体需要从长时间对话或大型技术文档中回忆特定细节时,传统存储(如高容量通用阵列)速度太慢,会创建瓶颈,让昂贵的GPU空闲等待,造成资源浪费。
Q3:STX架构如何实现网络与存储的融合?
A:STX架构通过集成Vera CPU、ConnectX-9 SuperNIC和Spectrum-X以太网,创建了分布式上下文层。在这种架构下,网络本身就成为存储总线,存储不再是线缆末端的盒子,而是网络架构的分布式层,需要网络和存储管理员协同管理。