英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出

量子位2025-12-27

英伟达在开源模型上玩的很激进:“最高效的开放模型家族”Nemotron 3,混合Mamba-Transformer MoE架构、NVFP4低精度训练全用上。而且开放得很彻底:不仅开放模型权重,还要把超过10万亿token的训练数据、预训练和后训练软件、训练配方全部公开。与其他开源模型相比性能有竞争力,且速度快1.5-3.3倍。把Mamba和Transformer混着用Nemotron 3在架构层面...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法