英伟达发布Vera Rubin:专为智能体AI打造,性能飞跃

智能应用 2026-03-17 09:23

在2026年GTC大会上,英伟达发布专为智能体AI打造的Vera Rubin平台。Rubin GPU采用台积电3nm工艺,集成3360亿晶体管,配备288GB HBM4内存,带宽达22TB/秒;FP4推断算力达50 PFLOPS(Blackwell的5倍),训练算力35 PFLOPS(3.5倍)。整个Vera Rubin NVL72机架通过NVLink 6实现260TB/秒带宽,超过全球互联网总和。

与上一代Blackwell相比,Vera Rubin实现代际飞跃:单Token推理成本降至1/10,每瓦推理吞吐量提升10倍,训练混合专家大模型所需GPU资源仅为此前的四分之一。目前该平台已全面量产,预计2026下半年交付。

简讯快报

更多