英伟达推出开源全模态模型Nemotron 3 Nano Omni,新模型仍延续Nano定位,强调高性价比与推理效率,总参数量约300亿,支持超长上下文,最高达百万Token。
据介绍,该模型采用30B-A3B混合专家架构并在架构层面融合Mamba层和Transformer层。Mamba层负责提升长序列的处理效率和内存利用率,而Transformer层则保障了推理的精准度。官方数据显示,这种混合设计使得模型的内存和计算效率最高可提升4倍。
根据行业基准测试MediaPerf的结果,Nemotron 3 Nano Omni在所有评估任务中都实现了最高的吞吐量,并且在视频级标注任务中达到了最低的推理成本。 在固定的用户交互延迟阈值下进行对比,该模型在视频推理任务中的有效系统容量比其他开放式全模态模型高出约9.2倍;在多文档推理任务中,有效系统容量高出约7.4倍。
目前,已经采用 Nemotron 3 Nano Omni 的人工智能和软件公司包括Aible、Applied Scientific Intelligence (ASI)、Eka Care、富士康、H Company、Palantir 和Pyler,而戴尔科技、DocuSign、Infosys、K-Dense、Lila、Oracle和Zefr正在评估该模型。

