在2026年GTC大会上,英伟达发布专为智能体AI打造的Vera Rubin平台。Rubin GPU采用台积电3nm工艺,集成3360亿晶体管,配备288GB HBM4内存,带宽达22TB/秒;FP4推断算力达50 PFLOPS(Blackwell的5倍),训练算力35 PFLOPS(3.5倍)。整个Vera Rubin NVL72机架通过NVLink 6实现260TB/秒带宽,超过全球互联网总和。
与上一代Blackwell相比,Vera Rubin实现代际飞跃:单Token推理成本降至1/10,每瓦推理吞吐量提升10倍,训练混合专家大模型所需GPU资源仅为此前的四分之一。目前该平台已全面量产,预计2026下半年交付。