DoNews3月17日消息,3 月 17 日在美國加州圣何塞舉行的 2026 年 GTC 大會上,英偉達為推動智能體 AI(Agentic AI)發(fā)展,發(fā)布 Vera Rubin AI 平臺。
英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛強調(diào),Vera Rubin 是一次代際飛躍,標志著其史上最大規(guī)?;A設施建設的開端,全面覆蓋從大規(guī)模預訓練到實時智能體推理的 AI 全生命周期。
在核心算力層面,新一代 NVL72 機架實現(xiàn)了效率的突破性提升。該機架通過 NVLink 6 連接 72 塊 Rubin GPU 與 36 塊 Vera CPU。
與上一代 Blackwell 平臺相比,該系統(tǒng)僅需四分之一的 GPU 即可完成混合專家大模型(MoE)訓練,同時每瓦推理吞吐量提升高達 10 倍,單 Token 成本降至十分之一。
此外,專為驗證 AI 模型結(jié)果設計的 Vera CPU 機架集成了 256 塊液冷 CPU,其運行效率達到傳統(tǒng) CPU 的兩倍,速度提升 50%。
為應對智能體系統(tǒng)低延遲和長上下文的需求,英偉達推出了 Groq 3 LPX 推理加速機架。該系統(tǒng)包含 256 個 LPU 處理器,與 Vera Rubin 結(jié)合后,每兆瓦推理吞吐量飆升至最高 35 倍。
在數(shù)據(jù)存儲方面,全新 BlueField-4 STX 機架構(gòu)建了 AI 原生存儲基礎架構(gòu)。借助全新的 DOCA Memos 框架,該系統(tǒng)能夠高效處理大型語言模型生成的海量鍵值(KV)緩存數(shù)據(jù),在大幅降低能耗的同時,將推理吞吐量提升最高 5 倍,從而實現(xiàn)更快速的 AI 多輪交互。