英伟达AI存储棋局（机架篇）——STX重构存储层级，NAND成核心扩容底座

产业分析 CFM闪存市场 M 2026-06-12 18:10

万亿级参数时代，存储割裂的分工模式“顶不住”了

AI模型参数突破万亿、上下文窗口迈向百万级Token，KV缓存作为AI推理的“工作记忆”，体量随之呈指数级增长，传统存储体系的不足日益凸显。

一方面，GPU的HBM容量有限且成本高昂，无法承载海量KV缓存，强行占用会导致算力资源紧张。另一方面，传统存储层级从GPU HBM到系统内存到本地SSD到共享存储，延迟从纳秒级飙升至毫秒级，频繁的交互导致GPU利用率下降。

为此，英伟达在Vera Rubin平台中推出BlueField-4 STX机架，搭载CMX平台，专为长上下文推理设计，通过硬件专用加速、重构存储层级，打破“内存墙”和“能效瓶颈”，让存储从数据保管者转变为AI推理性能的核心驱动力。

AI原生存储架构落地，STX加速存储访问

BlueField-4 STX是Vera Rubin平台五大核心机架之一，作为独立AI存储机架与GPU计算、CPU 编排、网络互联、推理加速机架并列。

图1 Vera Rubin机架组成

图片来源：CFM制作

英伟达将BlueField-4 STX定义为一种模块化参考架构，为AI原生数据存储提供系统架构模板，助力企业、云和AI服务商部署“加速存储基础设施”，以满足代理式AI所需的长上下文推理能力。

STX架构基于Vera Rubin平台打造，以专为存储优化的BlueField-4处理器（DPU）为核心，并协同Spectrum-X以太网、DOCA及AI Enterprise软件运行，搭载全新的CMX上下文记忆存储平台，将存储协议处理与数据服务从CPU卸载，直接在I/O路径中协调数据访问、元数据处理和存储服务，释放通用算力，并降低存储访问延迟、提高效率。

新增NAND中间缓存层，CMX重塑AI推理存储层级

现有存储层级并非为管理大量高频复用的推理上下文设计，短板凸显。大型推理集群的存储层级通常包括G1（GPU HBM）、G2（本地系统内存）、G3（本地存储）、G4（数据中心网络存储）。随着上下文的增长，KV Cache会迅速耗尽本地存储容量（G1-G3），同时将部分数据压入传统共享存储（G4），导致成本和功耗的增加并降低GPU利用率。

STX首个机架级部署方案集成了全新的NVIDIA CMX上下文内存存储平台。作为全新G3.5存储层级，CMX平台将KV Cache视为全新的AI原生数据类型，专门用于存放和检索LLM推理过程中生成的KV Cache数据，让上下文成为AI集群级系统间共享的高带宽资源。

图2 存储架构层级

图片来源：CFM制作

CMX平台的目标不是要取代GPU极速内存，而是在“快但小、成本高”和“大但慢、效率低”之间，建立一个容量、速度、成本均衡的中间层，让数据在各存储层级更高效地流动。相较于传统存储方案，CMX使长上下文与智能体推理的持续每秒Token处理量最高提升5倍、能效最高提升5倍。

CMX是一个以太网链接的闪存层（an Ethernet-attached flash tier），核心硬件构成包括BlueField-4 DPU和NVMe SSD。

·BlueField-4 DPU：赋能存储卸载，负责管理NVMe SSD，运行存储服务，并以高能效的方式为KV Cache卸载数据完整性和加密任务。

表1 BlueField-4 DPU规格配置

数据来源：NVIDIA

·NVMe SSD：CMX物理基础是闪存介质，主要为SSD。通过SSD集群为GPU提供加速的、共享的KV Cache存储池。据悉，CMX平台要求每个Rubin GPU配备16TB SSD，即一套NV72 Vera Rubin系统（含72个Rubin GPU）NAND容量达1152TB。

NAND成推理扩容核心介质，需求爆发且专用化加速

·存储分层体系重构，新增闪存层成为架构核心

STX架构重新定义了存储的角色。存储不仅存储首次与GPU、CPU并列作为独立机架出现，还从被动数据仓库升级为主动算力引擎。CMX平台的落地亦打破传统存储层级，新增专为KV Cache优化的上下文内存层，基于闪存介质支撑更大规模上下文的推理任务，推动存储从通用型向AI专用型转型。

·闪存角色跃迁，NAND成推理扩容关键

NAND Flash从被动存储介质升级为AI推理的“内存扩展池”。一方面，专为KV Cache设计的CMX平台推动NAND厂商优化产品架构，优化产品适配高带宽、低延迟、高IOPS的KV缓存场景。另一方面，单Vera Rubin机柜所需SSD容量达1152TB将带动企业级SSD需求爆发。

·上下文推理成本难题破局，AI存储需求迎放量

通过将KV Cache从昂贵HBM卸载至高性价比的CMX闪存层，BlueField-4 STX大幅降低了长上下文推理的运行成本，并实现能效提升高达4倍。这使得中小AI企业也能低成本部署长上下文推理服务，加速Agentic AI应用的普及和爆发式增长。海量部署将催生对存储系统的规模化、多元化需求，推动存储行业积极适配AI不同场景需求，推出新的专用产品线。

推荐：电脑用的少，手机扫一扫，资讯快一步！

报价中心

简讯快报

⊙44分钟前

据外媒报道，国内某国资背景企业已正式开始量产自主研发的浸没式深紫外（DUV）光刻机，标志着中国在关键芯片制造设备领域取得重大突破。该设备主攻28纳米浸没式DUV技术，整机国产化率超过85%，核心子系统均实现自研。量产计划方面，预计2026年内生产约5台，2027年将产能提升至约20台。首批设备将于今年8月起陆续交付给中芯国际、华虹半导体和长鑫存储等国内头部晶圆制造商，初期将主要用于产线测试与工艺验证。

⊙54分钟前

7月28日，日韩股市集体下跌。截至发稿，日经225指数跌超3%，韩国综指跌超7%。盘中，韩国交易所启动SIDECAR机制，暂停KOSPI程序化卖盘。存储概念个股方面，截至发稿，三星跌超9%，SK海力士跌超11%，铠侠跌超15%。

⊙1小时前 09:37

据韩媒报道，三星电子华城12号生产线改造工作自去年下半年开始，已于本月完成。三星电子计划将该生产线用于华城15号生产线的后端工艺（BEOL）。华城15号生产线负责量产业界最先进的DRAM，包括1b（第五代10nm级）和1c（第六代10nm级）DRAM。据悉，后端流程预计最早将于今年下半年投入使用，华城12号和15号生产线协同使用将加速三星电子DRAM产能的扩张。

⊙1小时前 09:20

当地时间7月27日，美股三大股指涨跌不一。截至收盘，道琼斯工业指数涨0.51%，报52210.08点；标普500指数涨0.02%，报7413.18点；纳斯达克综合指数跌0.18%，报24932.08点。其中，大型科技股涨跌互现，谷歌A、谷歌C均涨超2%，微软、高通、苹果涨超1%，AMD跌超5%，英伟达跌超4%，亚马逊跌0.31%；存储板块普遍收跌，闪迪跌超11%，SK海力士跌超7%，西部数据、希捷均跌超4%，美光跌超2%。

⊙16小时前 17:48

据《日经新闻》报道，贝恩资本在过去一年中出售了其持有的大部分铠侠股份，获得了约 2.5 万亿日元（约合149 亿美元）的收益，交易完成后，东芝重新成为铠侠的最大股东，持股比例为15%。一家持有铠侠约14%股份的特殊目的公司（SPC）成为铠侠第二大股东，而SK海力士被视为SPC的实际所有者，因为它持有可转换为SPC股权的可转换债券。目前SK海力士尚未将债券转换为股票，这意味着它目前不拥有投票权。任何转换都需要获得多个司法管辖区的反垄断批准，SK海力士才能成为有投票权的股东。

⊙17小时前 17:23

据韩媒报道，三星电子 MX 业务部门正积极考虑为在中国市场销售的中低端智能手机（以 Galaxy A 系列为代表）导入中国产 DRAM 内存。报道称，中国智能手机品牌由于存储器等成本持续飙升下调了中低端机型的出货目标，空出了一部分潜在市场，同时也释放了一定规模的较低成本中国产 LPDDR5X ，三星MX部门试图利用这部分内存，降低手机制造成本，从而以相对合理的价格扩大销量。

⊙17小时前 17:18

据外媒报道，苹果已向政府官员提出请求，希望获准在美国以外地区销售的设备中，使用长鑫存储和长江存储的存储芯片。然而，美光科技则积极游说反对上述请求。其高管警告称，允许美国科技企业向中国生产商采购，无论最终产品在何处销售，都将损害美国本土制造业的发展。

⊙17小时前 16:59

据韩媒报道，三星电子会长李在镕和OpenAI CEO Sam Altman于当地时间25日上午在其旧金山总部会面。OpenAI并未透露具体议题或议程。据悉，双方讨论了扩大在人工智能基础设施领域的合作，包括HBM、DRAM和先进晶圆代工技术。他们可能还讨论了将生成式人工智能应用于三星电子各项业务的转型计划。

⊙17小时前 16:45

据媒体报道，苹果计划在明年6月的全球开发者大会（WWDC）上发布其首款智能眼镜，代号为“N50”，并于同年晚些时候开始销售。该产品将配备麦克风和扬声器，支持音乐播放、通话和Siri语音助手通知。此外，它极有可能搭载人工智能（AI）功能和能够识别周围环境的摄像头。据报道，苹果此前考虑于今年晚些时候发布该产品并在明年年初上市，但因产品打磨及隐私策略完善等因素推迟发布。

⊙18小时前 16:31

据悉，韩国科学技术信息通信部与AMD正式签署了关于构建 AI 半导体生态系统的谅解备忘录。双方计划共同打造并验证集成 AMD CPU、GPU 和韩国国产 NPU 的异构 AI 计算基础设施。此外，双方还将合作范围进一步拓展至扩大 AI 半导体生态圈、培养专业人才以及具身智能等领域，以加速提升韩国的 AI 核心竞争力。

⊙19小时前 14:55

宜鼎国际第二季受惠存储价格走扬与AI需求同步升温，单季营收224.43亿元（新台币，下同），环比增长70.3%，同比增长641.1%，续创新高，业界预估其第二季毛利率有望突破6成、EPS则可望达约100元。

⊙20小时前 14:30

据外媒报道，尽管微软正在大力投资人工智能基础设施，并将 2026 自然年的资本支出预算调整至 1900 亿美元，但其整体算力需求仍显著超过供应。有高管表示，微软的自有算力资源“仅能”满足内部第一方业务和前沿人工智能实验室的需求，这导致对外提供云算力的 Azure 无法获得其所需的全部资源，使得微软云服务业务的增长受到抑制。

⊙23小时前 10:52

国家统计局工业司首席统计师于卫宁表示，上半年，人工智能与各领域加速融合，算力需求大幅增长，推动电子行业利润同比增长96.9%，拉动全部规模以上工业企业利润增长8.5个百分点，是规模以上工业企业利润较快增长的重要支撑。其中，服务器、高性能工作站相关领域中，计算机整机制造、计算机外围设备制造行业利润分别增长689.3%、305.8%；电子器件制造领域中，集成电路制造、半导体分立器件制造行业利润增长2579.5%、31.2%；电子元件及电子专用材料制造领域中，电子专用材料制造、电子电路制造行业利润增长209.7%、26.9%。

⊙昨天 07-27 10:09

据外媒报道，英伟达正与OpenAI洽谈，拟为其数据中心项目提供2500亿美元融资担保，涵盖数据中心的租赁和债务融资，但不包括中心内的英伟达芯片。知情人士透露，英伟达通过的担保将助力ChatGPT开发商租用软银能源子公司正在俄亥俄州南部开发的一座10吉瓦项目。据悉，该项目预计总成本将超过5000亿美元，其中包括数据中心内部的芯片。项目的第一阶段预计将于2028年完成，发电量约为800兆瓦。

⊙昨天 07-27 09:54

三星电子和博通签署谅解备忘录（MOU），以扩大双方在存储器和代工技术领域的战略合作，支持下一代人工智能基础设施。预计未来五年（到 2030 年）双方在存储器和晶圆代工领域的合作规模将超过 2000 亿美元。其中，在内存方面，三星和博通计划开展战略合作，提供业界领先的内存解决方案，包括高带宽内存（HBM），以支持博通的下一代人工智能加速器。

⊙昨天 07-27 09:48

7月27日，A股三大指数开盘涨跌不一，上证指数低开0.14%，深证成指低开0.04%，创业板指高开0.03%。个股方面，除长鑫外，存储概念股普遍走低，截至发稿，长鑫涨超408%，兆易跌超7%，德明利跌超4%，江波龙、大普微、佰维跌超3%，香农芯创跌超2%，联芸跌超1%。

⊙昨天 07-27 09:48

长鑫科技今日正式登陆科创板，开盘大涨471％至每股49.50元，此后回落，截至发稿，股价上涨440%至46.82元/股。

⊙昨天 07-27 09:38

近日，SK集团和英伟达宣布达成一项价值超过5000亿美元的全面合作协议。其中，SK Telecom近期宣布的在韩国建设2吉瓦级AI云平台的计划将采用NVIDIA DSX平台，并部署由SK海力士HBM4驱动的NVIDIA Vera Rubin加速计算技术，首个AI工厂计划于2027年上线；SK海力士也与英伟达达成了一项长期AI内存合作伙伴关系，确保英伟达获得稳定的下一代AI内存供应，并共同开发和优化下一代人工智能内存解决方案（包括HBM）。

⊙昨天 07-27 09:20

7月27日，日韩股市开盘上涨。截至发稿，日经225指数和韩国综指均转跌，分别跌0.62%和1.3%。存储概念个股方面，截至发稿，三星、SK海力士均涨超1%，铠侠跌超7%。

⊙07-24 18:19

东莞发布《东莞市推动AI服务器产业高质量发展实施方案》。这是东莞首个专门面向服务器产业的专项政策文件。根据《方案》，东莞提出，到2030年，全市服务器全产业链产值力争突破5000亿元。未来五年，东莞计划投入1000亿元，开发建设约9000亩的算力产业岛。