国模无码视频一区二区三区四区,亚洲日本香蕉视频

DoNews > 商業(yè) > 英偉達發(fā)布 Vera Rubin 平臺，單 Token 成本降至 1/10

英偉達發(fā)布 Vera Rubin 平臺，單 Token 成本降至 1/10

楊亮 2026-03-17 08:47:12

519423

分享到

DoNews3月17日消息，3 月 17 日在美國加州圣何塞舉行的 2026 年 GTC 大會上，英偉達為推動智能體 AI（Agentic AI）發(fā)展，發(fā)布 Vera Rubin AI 平臺。

英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛強調(diào)，Vera Rubin 是一次代際飛躍，標志著其史上最大規(guī)?；A設施建設的開端，全面覆蓋從大規(guī)模預訓練到實時智能體推理的 AI 全生命周期。

在核心算力層面，新一代 NVL72 機架實現(xiàn)了效率的突破性提升。該機架通過 NVLink 6 連接 72 塊 Rubin GPU 與 36 塊 Vera CPU。

與上一代 Blackwell 平臺相比，該系統(tǒng)僅需四分之一的 GPU 即可完成混合專家大模型（MoE）訓練，同時每瓦推理吞吐量提升高達 10 倍，單 Token 成本降至十分之一。

此外，專為驗證 AI 模型結(jié)果設計的 Vera CPU 機架集成了 256 塊液冷 CPU，其運行效率達到傳統(tǒng) CPU 的兩倍，速度提升 50%。

為應對智能體系統(tǒng)低延遲和長上下文的需求，英偉達推出了 Groq 3 LPX 推理加速機架。該系統(tǒng)包含 256 個 LPU 處理器，與 Vera Rubin 結(jié)合后，每兆瓦推理吞吐量飆升至最高 35 倍。

在數(shù)據(jù)存儲方面，全新 BlueField-4 STX 機架構(gòu)建了 AI 原生存儲基礎架構(gòu)。借助全新的 DOCA Memos 框架，該系統(tǒng)能夠高效處理大型語言模型生成的海量鍵值（KV）緩存數(shù)據(jù)，在大幅降低能耗的同時，將推理吞吐量提升最高 5 倍，從而實現(xiàn)更快速的 AI 多輪交互。

關于我們| 電子協(xié)議| 合作聯(lián)系| 京ICP備2025120072號

網(wǎng)站信息

京公網(wǎng)安備11010802023059號