英伟达推出开源全模态模型Nemotron 3 Nano Omni,新模型仍延续Nano定位,强调高性价比与推理效率,总参数量约300亿,支持超长上下文,最高达百万Token。模型采用30B-A3B混合专家架构并在架构层面融合Mamba层和Transformer层。官方数据显示,该混合设计使得模型的内存和计算效率最高可提升4倍。在固定的用户交互延迟阈值下进行对比,该模型在视频推理任务中的有效系统容量比其他开放式全模态模型高出约9.2倍;在多文档推理任务中,有效系统容量高出约7.4倍。富士康、Palantir等AI与软件领域的公司目前已采用新模型,戴尔、甲骨文等公司正在对其进行评估。