久久久九九九一级大片a|一级黄片黄片一级一级|三级无码视频免费操人视频|成人精品A片亚州一区二区|亚洲日韩欧美在线一二区|91丝袜一区二区|国摸私拍电影一区二区爱|免费久久久久久久久久久久|免费国产黄色av发布网址|国产精品人妻人伦a 6 2v久动漫

別只看DeepSeek-V4了,華為的國產(chǎn)算力才是底牌

撰文 | 雁 ?秋

編輯 | 李信馬

題圖 | 豆包AI

AI圈盼DeepSeekV4久矣!

自從2025年初發(fā)布V3以后,DeepSeek斷斷續(xù)續(xù)發(fā)布了幾個沒什么火花的版本:V3.1、V3.2-Exp,跑分都和前代差不多。

直到424日,DeepSeek正式開源DeepSeek-V4預覽版,同步推出?V4-Pro與?V4-Flash兩大版本。

  • V4-Pro,總參數(shù)1.6萬億,每次推理激活490億。定位旗艦,對標頂級閉源模型。

  • V4-Flash,總參數(shù)2840億,激活130億。定位經(jīng)濟,更小更快。

圖源:DeepSeek官網(wǎng)

源神回歸瞬間刷屏,不僅登上科技熱榜,華豐科技、寒武紀、摩爾線程、中芯國際等概念股更是直線拉升。

官方公布了DeepSeek-V4系列的API定價:

V4-Pro在輸入命中緩存的情況下為1/百萬tokens,輸入未命中緩存則為12/百萬tokens,輸出為24/百萬tokens;

V4-Flash在輸入命中緩存僅0.2/百萬tokens,未命中輸入1/百萬tokens,輸出2/百萬tokens。

圖源:DeepSeek官網(wǎng)

然而,高端算力短缺,是頂級大模型落地的最大瓶頸。對此,DeepSeek表示V4-Pro服務吞吐十分有限,預計下半年昇騰950超節(jié)點批量上市后,價格會大幅下調(diào)。

一句下半年批量上國產(chǎn)算力,揭開了以昇騰950為核心的國產(chǎn)算力生態(tài)發(fā)展趨勢——從「備選」走向「剛需」,成為重構(gòu)AI成本的關(guān)鍵力量。

DeepSeek此前的訓練主要依賴英偉達,但隨著美國對華芯片出口管制升級,中國AI算力面臨高強度的壓力——迫切需要原生的、可自主掌握的芯片。

觀察發(fā)現(xiàn),V4技術(shù)報告第3.1節(jié)專門寫了一句,「我們在英偉達GPU和華為昇騰NPU兩個平臺上均驗證了細粒度EP(專家并行)方案?!?/span>

這是DeepSeek官方第一次在正式文檔中,把昇騰和英偉達并列寫進硬件驗證清單。業(yè)內(nèi)推測,部分訓練大概率用的還是英偉達芯片,但在與昇騰的適配上,它顯然達到了前所未有的原生水平。

據(jù)IDC最新報告,2025年國產(chǎn)GPUAI芯片廠商的市場份額攀升至41%,總出貨量約400萬張。其中,昇騰出貨量排名第一,占總量近半,阿里平頭哥緊隨其后,百度昆侖芯、寒武紀并列第三。此外,海光信息、沐曦、天數(shù)智芯等廠商穩(wěn)步放量,成為緊緊跟隨的第二梯隊。

頂尖模型正在適配國產(chǎn)算力、生態(tài)協(xié)同初現(xiàn)雛形。

01、抓住算力主權(quán)

昇騰與英偉達有著相似的成長軌跡,都是在試錯與迭代中摸爬滾打。

但雙方始終有個核心差異:英偉達的根基是GPUCUDA架構(gòu),而昇騰CANN選擇完全自主研發(fā)的NPU,從運行、驅(qū)動、虛擬指令集到編譯器?,每一個核心環(huán)節(jié)都掌握在自己手里。

這一選擇的意義在于,從根源上避免成為CUDA生態(tài)的附庸。

昇騰的自我革命首先從芯片開始。據(jù)公開信息,昇騰早期產(chǎn)品在算力配比、編程靈活性、細粒度訪存能力、低精度格式支持及社區(qū)參與度等方面存在不足。

經(jīng)過一系列芯片架構(gòu)的大幅調(diào)整,20263月的合作伙伴大會上,成果終于揭曉:

搭載昇騰950PR處理器的Atlas 350加速卡,單卡FP4算力達1.56P,為英偉達H202.87倍;HBM容量112GB,較H20提升16%;內(nèi)存訪問粒度從512字節(jié)壓縮到128字節(jié),小算子訪存效率提升4倍。

同時,昇騰實現(xiàn)了國內(nèi)首個真正意義上的FP8商用。這意味著,在市場智能體爆發(fā)、Token處理量激增的節(jié)點,可以用更少的算力干更多的活。

據(jù)悉2025DeepSeek采用英偉達產(chǎn)品實現(xiàn)FP8創(chuàng)新時,昇騰團隊羨慕得不得了,但因相關(guān)限制無法及時推出對應產(chǎn)品。如今,市場對新一代昇騰950芯片的接受速度超出了不少人的預期。

但需要注意的是,950在特定情況下,單卡推理能力是英偉達H20的近3倍,但在整體性能上,英偉達仍處于旗艦水平。未來昇騰會選擇特定場景優(yōu)化,還是全面對標旗艦?

對此昇騰方面給出了明確回應,昇騰做的是通用型產(chǎn)品,芯片架構(gòu)也一直在向更通用的方向改進,但每一代芯片都有確定性的改進方向,而不是追求每個方面都有巨幅提升。

950的升級獲得了客戶的反饋積極,從試用到下單的周期大幅縮短。以前需要一兩個月才考慮下單,現(xiàn)在一個星期就可以。據(jù)昇騰內(nèi)部人士透露,這得益于產(chǎn)品成熟度的提升,和當前旺盛的市場需求,在來北京的前一天,還有客戶專門跑去深圳找我們簽單,都是千萬卡起步。原本過完年就已售罄的產(chǎn)能,如今正在重新拉高供給線。盡管如此,團隊方面仍保持謙遜:950并不完美,還有很多事要做。

一個美好且正向的閉環(huán)出現(xiàn):國產(chǎn)算力規(guī)模越大、成本越低,模型服務價格就越低,開發(fā)者的采用意愿就越高,從而帶動更大的算力需求。

隨著這個循環(huán)成立,昇騰將成為中國AI繞開CUDA依賴、走向自主加速的核心驅(qū)動力。它也不再只是能用的替代品,而是開始建立好用的競爭力。

02、生態(tài)重構(gòu):把麻花團拆開

過去幾年,即便是昇騰內(nèi)部也承認,CANN生態(tài)的開放度和易用性遠遠不夠。昇騰的軟件體系如同?“?花團”?般糾纏在一起?,升級時牽一發(fā)而動全身?,極大影響開發(fā)者體驗。

昇騰的打法是:底層我自主,上層全兼容,架構(gòu)拆開,核心開源。目標很明確,讓開發(fā)者來了就不想走,更愿意一起玩。

想要達到這個目的,需要填平的不是技術(shù)斷層,而是長期積累起來的使用習慣和信任差距。讓90多個以海外團隊為主導的開源項目接納中國硬件作為原生支持,遠比想象中困難,昇騰團隊的辦法是靠技術(shù)語言說話,親自前往開源社區(qū)現(xiàn)場交流,用能力證明自己。

昇騰做了一件近乎自我開刀的事——重新設計架構(gòu)、?重寫軟件,完成架構(gòu)解耦與獨立升級,將復雜體系拆分為一個個結(jié)構(gòu)化模塊,每個模塊可獨立更新、獨立開源。為了讓開發(fā)者?“不換門?、不折騰”?,昇騰全力推動生態(tài)兼容?,主動融入主流開發(fā)體系,開發(fā)者若對某個模塊不滿意?,可自主修改、優(yōu)化。

據(jù)了解,整套工作原計劃一年半完成,最終壓縮至四個月。目前,開源倉庫從最初的20多個漲到70多個,外部伙伴和高校的項目也在往里進。為了避免變成一言堂,社區(qū)的技術(shù)指導委員會硬性要求外部成員不低于50%,每月開會,前前后后開了200多次,規(guī)則一起定,路一起走。

開發(fā)者是生態(tài)的核心活力來源,昇騰現(xiàn)在有1.3萬底層算子開發(fā)者,這個數(shù)字已經(jīng)跟英偉達同領(lǐng)域的萬級規(guī)??待R。社區(qū)月活躍開發(fā)者2000人,作為偏底層的項目,比PyTorch社區(qū)的900多月活還高。

對于如何吸引習慣于CUDA生態(tài)的開發(fā)者,昇騰方面認為沒有什么絕招:就是看你做得好不好,對開發(fā)者有沒有價值哪個更能實現(xiàn)你的需求,你就選哪個。

昇騰內(nèi)部強調(diào),客戶的成功是華為成功的前提。能支持他拼過同行,你就有了優(yōu)勢??蛻艮D(zhuǎn)了一圈回來說還是你們最好,就是這個道理。AI這個沒有標準、快速變化的賽道,不存在壓制,拼的是第一時間支持新模型、快速解決安全等后顧之憂的能力。

生態(tài)是一個的問題。沒有銷售量和使用量,談生態(tài)就是空談。昇騰一位負責人直言,“我把外部開發(fā)者等同于不要錢的員工,讓他們真正成為生態(tài)體系的一員。據(jù)透露,他們已準備好2000萬激勵資金,希望開發(fā)者們快點給我花完,最好這個季度花完,下個季度我再發(fā)2000萬。

未來極有可能出現(xiàn)一種趨勢,上層軟件和開源社區(qū)的特性都是基于昇騰原生的。這是我們的目標,現(xiàn)在要做的就是維持在95%以上,把分母中加上越多我的東西越好。

尾聲

DeepSeek-V4的發(fā)布稿最后寫了這樣一句話:「不誘于譽,不恐于誹,率道而行,端然正己。」

這句話出自《荀子·非十二子》,意思是不為虛名所誘惑,不因誹謗而恐懼,遵循道義行事,端正自身行為。

這種態(tài)度,放在這些年的AI圈尤為珍貴。浪潮一波接一波,先是ChatGPT橫空出世,后有DeepSeek驚艷亮相,再到2026年初Agent(智能體)的全面爆發(fā),每一次技術(shù)浪潮似乎都為行業(yè)帶來了潑天的富貴

機會的天降也掩蓋了產(chǎn)品內(nèi)在的不足。昇騰走過彎路,也被市場的潑天富貴掩蓋過問題,關(guān)鍵是要能從熱潮中識別出產(chǎn)品改進點,持續(xù)投入,自我迭代。

面臨外部的制約,昇騰直面最根本的問題——芯片與生態(tài)。在他們看來,任何試圖單純在軟件層面模仿CUDA的行為,本質(zhì)上都是在為英偉達的生態(tài)添磚加瓦,一旦緊急情況發(fā)生,所有軟硬件都將瞬間全廢

回過頭來看,昇騰的自主路徑走得不算快,但卻很踏實。這正是荀子所說的做人做事的態(tài)度,專注于做正確的事,而非活在別人的評價里。

標簽: 華為
Copyright ? DoNews 2000-2026 All Rights Reserved
京ICP備2025120072號