快科技5月6日消息,NVIDIA宣布旗下開(kāi)源大模型Nemotron 3 Super登上EnterpriseOps-Gym排行榜開(kāi)源類(lèi)別首位,以平均27.3分的成績(jī)擊敗Kimi-K2.5、DeepSeek v3.2、MiniMax m2.7及GPT-OSS-120B等眾多競(jìng)爭(zhēng)對(duì)手。
具體排名顯示,Kimi-K2.5以26.2分位列第二,DeepSeek v3.2以23.8分排在第三,MiniMax m2.7以23.0分緊隨其后,GPT-OSS-120B以17.1分位列第五。
Nemotron 3 Super是NVIDIA在今年3月GTC大會(huì)上發(fā)布的混合專(zhuān)家模型,總參數(shù)量達(dá)到1200億,但每次推理僅激活其中120億參數(shù),在保持模型知識(shí)密度的同時(shí)大幅降低推理開(kāi)銷(xiāo)。
該模型采用了多項(xiàng)關(guān)鍵技術(shù)。潛在混合專(zhuān)家架構(gòu)通過(guò)壓縮輸入數(shù)據(jù),能夠在相同推理成本下激活并調(diào)用多達(dá)四倍數(shù)量的“專(zhuān)家子網(wǎng)絡(luò)”(專(zhuān)業(yè)化的神經(jīng)網(wǎng)絡(luò)模塊)來(lái)處理任務(wù)。
Nemotron 3 Super還原生支持100萬(wàn)token上下文窗口,在長(zhǎng)時(shí)間任務(wù)中可保持長(zhǎng)期記憶,有效避免目標(biāo)偏移問(wèn)題。其吞吐量較上一代Nemotron Super提升超過(guò)五倍。
在硬件適配方面,該模型針對(duì)NVIDIA Blackwell架構(gòu)進(jìn)行原生NVFP4預(yù)訓(xùn)練,在B200上的推理速度比H100使用FP8格式快四倍,同時(shí)保持模型精度。
此外,借助NVIDIA NeMo Gym與NeMo RL框架,該模型在21種環(huán)境配置下完成了多環(huán)境強(qiáng)化學(xué)習(xí)后訓(xùn)練,總計(jì)部署了超過(guò)120萬(wàn)次訓(xùn)練環(huán)境。
NVIDIA Nemotron 3系列開(kāi)源模型覆蓋Nano、Super和Ultra三條產(chǎn)品線(xiàn)。NVIDIA還同步推出了Nemotron 3 Nano Omni,宣稱(chēng)可將AI吞吐量提升九倍。
本文轉(zhuǎn)載自快科技,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)聯(lián)系快科技通知我方刪除,我方將在收到通知后第一時(shí)間刪除內(nèi)容!本文只提供參考并不構(gòu)成任何投資及應(yīng)用建議。本站擁有對(duì)此聲明的最終解釋權(quán)。