DoNews2月12日消息,2月11日,智譜正式發(fā)布新一代大模型GLM-5。摩爾線程基于SGLang推理框架,在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,Day-0完成了全流程適配與驗(yàn)證。

憑借MUSA架構(gòu)廣泛的算子覆蓋與強(qiáng)大的生態(tài)兼容能力,摩爾線程成功打通了模型推理全鏈路,并深度釋放MTT S5000的原生FP8加速能力,在確保模型精度的同時(shí)顯著降低了顯存占用,實(shí)現(xiàn)了GLM-5的高性能推理。
GLM-5與MTT S5000的國(guó)產(chǎn)雙強(qiáng)聯(lián)合,將為開(kāi)發(fā)者帶來(lái)可對(duì)標(biāo)國(guó)際頂尖模型的極致編程體驗(yàn)。無(wú)論是在函數(shù)補(bǔ)全、漏洞檢測(cè)還是Debug場(chǎng)景中,該組合均表現(xiàn)卓越,以顯著增強(qiáng)的邏輯規(guī)劃能力,從容應(yīng)對(duì)各類(lèi)復(fù)雜的長(zhǎng)程任務(wù)挑戰(zhàn)。
MTT S5000是專(zhuān)為大模型訓(xùn)練、推理及高性能計(jì)算而設(shè)計(jì)的全功能GPU智算卡,基于第四代MUSA架構(gòu)“平湖”打造。其單卡AI算力最高可達(dá)1000 TFLOPS,配備80GB顯存,顯存帶寬達(dá)到1.6TB/s,卡間互聯(lián)帶寬為784GB/s,完整支持從FP8到FP64的全精度計(jì)算。
依托MUSA全棧平臺(tái),MTT S5000原生適配PyTorch、Megatron-LM、vLLM及SGLang等主流框架,助力用戶實(shí)現(xiàn)“零成本”代碼遷移。無(wú)論是構(gòu)建萬(wàn)卡級(jí)大規(guī)模訓(xùn)練集群,還是部署高并發(fā)、低延遲的在線推理服務(wù),MTT S5000均展現(xiàn)出對(duì)標(biāo)國(guó)際主流旗艦產(chǎn)品的卓越性能與穩(wěn)定性,旨在為行業(yè)筑牢堅(jiān)實(shí)、易用的國(guó)產(chǎn)算力底座。