久久久九九九一级大片a|一级黄片黄片一级一级|三级无码视频免费操人视频|成人精品A片亚州一区二区|亚洲日韩欧美在线一二区|91丝袜一区二区|国摸私拍电影一区二区爱|免费久久久久久久久久久久|免费国产黄色av发布网址|国产精品人妻人伦a 6 2v久动漫

中國(guó)AI算力的突圍,昇騰生態(tài)的“破”與“立”

文|白 ? 鴿?

編|王一粟

“如果 DeepSeek 先在華為平臺(tái)上發(fā)布,那對(duì)我們來(lái)說(shuō)將是災(zāi)難性的?!? 月 15 日,英偉達(dá) CEO 黃仁勛在接受 Dwarkesh Patel 的播客專(zhuān)訪時(shí),說(shuō)了一句分量很重的話(huà)。

而現(xiàn)在,黃仁勛口中的災(zāi)難正逐漸演變成為現(xiàn)實(shí)。

4 月 24 日,DeepSeek V4 預(yù)覽版正式發(fā)布并開(kāi)源,Pro 版 1.6 萬(wàn)億總參數(shù)、百萬(wàn) token 上下文,在 Agent、數(shù)學(xué)推理、世界知識(shí)等維度登頂開(kāi)源模型第一梯隊(duì)。

幾乎同一時(shí)間,華為也正式宣布,昇騰 950、A3 系列超節(jié)點(diǎn)同步完成 DeepSeek V4 全版本“發(fā)布即適配”與全鏈路優(yōu)化。

顯然,這不是一次普通的模型發(fā)布與芯片適配,而是中國(guó)大模型 + 中國(guó)算力的歷史性會(huì)師。

更關(guān)鍵的是,在 DeepSeek V4 的技術(shù)報(bào)告中,首次將昇騰 NPU 與英偉達(dá) GPU 并列寫(xiě)入硬件驗(yàn)證清單,明確細(xì)粒度 EP(專(zhuān)家并行)方案在兩大平臺(tái)均完成驗(yàn)證。

這是 DeepSeek 歷史上首次將中國(guó) AI 芯片與英偉達(dá) GPU 并列寫(xiě)入硬件驗(yàn)證清單,確立對(duì)等地位。這也意味著,中國(guó)算力不再是海外生態(tài)的補(bǔ)充選項(xiàng),而是與全球頂級(jí)硬件平起平坐的核心選擇。

顯然,當(dāng)全球 AI 算力長(zhǎng)期被英偉達(dá) CUDA 生態(tài)壟斷、大模型訓(xùn)練與推理高度依賴(lài)海外硬件時(shí),一個(gè)被無(wú)數(shù)人期待的“中國(guó)版 AI 算力生態(tài)”正在悄然成型。

那么,中國(guó) AI 算力生態(tài),究竟是如何掀了英偉達(dá)那張坐了十幾年的“桌子”?

中國(guó) AI 算力,不做 CUDA 仿制品

“一卡難求,包括我自己,我們雖然生產(chǎn)卡,但是我想用卡也很難?!比A為昇騰專(zhuān)家在此前媒體溝通會(huì)上表示,如此坦誠(chéng)得令人意外。

這份坦誠(chéng),其實(shí)也揭示了昇騰乃至整個(gè)中國(guó) AI 算力產(chǎn)業(yè)曾經(jīng)面臨的真實(shí)困境:擁有算力硬件,并不等于擁有生態(tài),即便如華為,在自家生態(tài)的建設(shè)初期,也同樣面臨“有卡難用”的窘境。

時(shí)間拉回 2018 年,昇騰自己的 AI 框架 CANN 初生。

用華為昇騰專(zhuān)家的話(huà)說(shuō),那時(shí)的昇騰深知自己的硬件和軟件“是不完美的”。

而早期的 AI 競(jìng)爭(zhēng)主要聚焦在框架層面,大家都在討論哪種框架更好用。但后來(lái),所有人都意識(shí)到,真正的生態(tài)護(hù)城河是 CUDA,而 CUDA 的背后,是英偉達(dá)的 GPU。

因此,華為逐漸看清:“根本的根本其實(shí)還是芯片,因?yàn)橛ミ_(dá)的生態(tài)其實(shí)是構(gòu)建在 GPU 上,CUDA 是使能 GPU,CANN 是使能 NPU 的?!?/strong>

在不斷的探索與妥協(xié)中前行多年后,昇騰在 2025 年做出了一個(gè)“痛下決心”的決定:必須從根本上解決生態(tài)問(wèn)題。

當(dāng)然,這個(gè)決心,也并非憑空而來(lái),是市場(chǎng)的一次次“救援”與“警醒”,推動(dòng)了這場(chǎng)變革。

ChatGPT 的浪潮、DeepSeek 的崛起、以及“龍蝦”(OpenClaw)引爆的 Agent 熱潮,每一次 AI 的范式革新,都讓昇騰看到自身在架構(gòu)靈活性、算力配比、編程方式上的不足。

例如,為應(yīng)對(duì) Agent 帶來(lái)的 Token 算力爆發(fā),昇騰“無(wú)論如何拼盡全力把 FP8、FP4 提前弄出來(lái)”,因?yàn)樾碌牡途雀袷侥転榭蛻?hù)帶來(lái)翻倍的算力價(jià)值。

決心易下,但道路難行。想要構(gòu)建一個(gè)能與 CUDA 生態(tài)競(jìng)爭(zhēng)的全新體系,無(wú)異于在高速行駛的汽車(chē)上更換發(fā)動(dòng)機(jī)。

彼時(shí),面對(duì)英偉達(dá) CUDA 構(gòu)筑的深厚護(hù)城河,業(yè)界曾有過(guò)“仿制”的聲音——做一個(gè) CUDA 的“復(fù)制品”似乎是一條捷徑。

但華為昇騰專(zhuān)家明確否定了這條路:“如果仿一個(gè) CUDA,做出來(lái)的其實(shí)就是 CUDA 2 號(hào)。一旦出現(xiàn)危機(jī)時(shí)刻,我們可能什么都不能用了?!?/p>

于是,一場(chǎng)痛定思痛的自我革命開(kāi)始了。

華為決定堅(jiān)持走自己的路,把底層的虛擬指令集、編譯器、運(yùn)行時(shí)能力全部掌握在自己手里。這就像在別人的地基上蓋房子,永遠(yuǎn)不如自己打地基來(lái)得穩(wěn)固。

軟硬一體全面革新,用開(kāi)源開(kāi)放重構(gòu)地基

想要掀翻英偉達(dá)的桌子,光有決心是不夠的,畢竟英偉達(dá)早已經(jīng)構(gòu)筑了從硬件 GPU 到軟件 CUDA 生態(tài)的全棧式核心競(jìng)爭(zhēng)力。

因此,中國(guó) AI 算力想要突圍,就需要既有能打的硬件產(chǎn)品,還要有與之媲美的軟件生態(tài)。

硬件層面,就不得不提到昇騰最新的產(chǎn)品——Ascend 950。

當(dāng)前,隨著 DeepSeek V4 大模型、OpenClaw 等 Agent 智能體的爆發(fā),對(duì)算力提出了更極致的要求:更低的精度(FP8/FP4)、更強(qiáng)的長(zhǎng)序列處理能力、以及對(duì) Token 推理的極致優(yōu)化。

此背景下,昇騰在硬件層面也進(jìn)行了大刀闊斧的改革,尤其是在昇騰 950 芯片上。

一方面,增加對(duì) SIMT 編程支持,即針對(duì) 950 芯片,昇騰新增了 SIMT(單指令多線程)編程支持,細(xì)化了 Cache Line 粒度。

這一改變直接提升了可編程性和性能表現(xiàn),解決了以往編程靈活性不足的問(wèn)題。

另外,昇騰 950 還全面支持 mxFP4/mxFP8 低精度數(shù)據(jù)格式,這不僅是為了適配大模型特征,更是為了在同等算力下實(shí)現(xiàn) Token 吞吐量的翻倍,直接提升客戶(hù)的性?xún)r(jià)比。

硬件層面大刀闊斧的改革,也就使得,昇騰在特定場(chǎng)景(如多模態(tài)生成、推薦)上已展現(xiàn)出性能優(yōu)勢(shì),甚至達(dá)到"2 倍、3 倍”于業(yè)界水平。

這對(duì)于客戶(hù)來(lái)說(shuō),就是真金白銀的性?xún)r(jià)比。而這無(wú)疑也給昇騰芯片的市場(chǎng)帶來(lái)驚人的回報(bào)。

華為昇騰專(zhuān)家分享了兩個(gè)生動(dòng)的案例:

一是客戶(hù)測(cè)試最新的昇騰 950 后,“測(cè)了不到一個(gè)禮拜說(shuō)可以了,可以下單了”。

二是一些此前因顧忌國(guó)際壓力而猶豫的客戶(hù),現(xiàn)在“主動(dòng)聯(lián)系我們”,“跑到深圳找我們簽單”??蛻?hù)的評(píng)價(jià)最直接:“轉(zhuǎn)了一圈發(fā)現(xiàn)還是你們最好?!?/p>

如果說(shuō) 950 芯片是昇騰的“心臟”,CANN 就是昇騰的“靈魂”。

據(jù)了解,在軟件層面,CANN(異構(gòu)計(jì)算架構(gòu))也經(jīng)歷了“脫胎換骨”的改造,昇騰選擇了一條最艱難,但也最徹底的路,即重構(gòu) CANN 架構(gòu),全面開(kāi)源開(kāi)放。

開(kāi)源開(kāi)放到底開(kāi)的是什么?“其實(shí)沒(méi)有那么復(fù)雜,就是把我們這一套系列原來(lái)像麻花團(tuán)一樣團(tuán)在一起的東西,一塊一塊結(jié)構(gòu)化的拆開(kāi)。每一塊的能力對(duì)外都方便的讓人看的到,能編程的時(shí)候能調(diào)用的到,并且代碼開(kāi)源?!比A為昇騰專(zhuān)家的這段話(huà),道出了本質(zhì)。

過(guò)去的 CANN 可能是一個(gè)高效但封閉的黑盒,而現(xiàn)在,他們要將其變成一個(gè)透明、可插拔、可參與的樂(lè)高積木。這項(xiàng)工作“不亞于把軟件重寫(xiě)一遍”,華為昇騰專(zhuān)家透露,團(tuán)隊(duì)原本計(jì)劃用一年半時(shí)間完成的架構(gòu)解耦,最終在“華為式”的壓強(qiáng)投入下,僅用 4 個(gè)月便宣告完成。

在具體的重構(gòu)策略上,是在底層虛擬指令集等核心層堅(jiān)持自研,確保自主根基;在上層編程接口(如 Triton 等)全力兼容主流開(kāi)發(fā)習(xí)慣,降低開(kāi)發(fā)者遷移門(mén)檻。

用華為昇騰專(zhuān)家的話(huà)說(shuō),是“堅(jiān)持走自己的路”,同時(shí)“尊重業(yè)界的開(kāi)發(fā)使用習(xí)慣”。

但生態(tài)建設(shè)不是自說(shuō)自話(huà)。因此,昇騰選擇了主動(dòng)融入全球主流開(kāi)源社區(qū),目前昇騰已與 Triton、PyTorch、vLLM 等 90 多個(gè)主流 AI 開(kāi)源社區(qū)實(shí)現(xiàn)深度對(duì)接。

這個(gè)過(guò)程極為不易,華為昇騰專(zhuān)家分享了一個(gè)細(xì)節(jié):為了讓 Triton 社區(qū)(來(lái)自 OpenAI)原生支持昇騰,團(tuán)隊(duì)曾從早晨 8 點(diǎn)談到晚上 10 點(diǎn)多,用技術(shù)語(yǔ)言說(shuō)服對(duì)方。

最終,昇騰成為了“國(guó)內(nèi)首個(gè) Triton 原生認(rèn)證的后端”,并推動(dòng)這些社區(qū)在發(fā)布版本前,將昇騰硬件納入其 CI(持續(xù)集成)測(cè)試體系。這意味著,昇騰從“外部插件”變成了“內(nèi)部原生支持”。

如果說(shuō)芯片是肌肉,CANN 就是神經(jīng)系統(tǒng)?,F(xiàn)如今,華為把 CANN 進(jìn)行了分層解耦,像搭積木一樣讓開(kāi)發(fā)者可以靈活調(diào)用。更重要的是,它開(kāi)始全面兼容業(yè)界主流的開(kāi)發(fā)習(xí)慣。

繁榮生態(tài),從“獨(dú)角戲”到“大合唱”

技術(shù)再先進(jìn),如果開(kāi)發(fā)者用不起來(lái),生態(tài)就是空中樓閣,“只有讓開(kāi)發(fā)者把昇騰用得更順、想得更遠(yuǎn)、跑得更快,生態(tài)才能真正繁榮?!?/strong>

為此,昇騰打出了一套“組合拳”,主要解決開(kāi)發(fā)者“一卡難求”和“遷移成本高”的痛點(diǎn)。

為了降低門(mén)檻,昇騰決定向社區(qū)提供全年 4000 張卡的免費(fèi)算力資源,其中超過(guò)一半是最新的昇騰 950,開(kāi)發(fā)環(huán)境拉起時(shí)間從 90 分鐘縮短至 5 分鐘以?xún)?nèi)。同時(shí),無(wú)論是個(gè)人開(kāi)發(fā)者還是高校學(xué)生,都可以在 AtomGit 社區(qū)上免費(fèi)使用算力,實(shí)現(xiàn)“邊開(kāi)發(fā)、邊驗(yàn)證、邊落地”。

除了算力,昇騰還設(shè)立了 2000 萬(wàn)元的專(zhuān)項(xiàng)激勵(lì)基金,專(zhuān)門(mén)面向個(gè)人開(kāi)發(fā)者、高校學(xué)生等群體。無(wú)論是算子開(kāi)發(fā)、框架適配、模型遷移還是創(chuàng)新應(yīng)用,只要對(duì)生態(tài)有貢獻(xiàn),就有機(jī)會(huì)獲得激勵(lì)。

華為昇騰專(zhuān)家直言:“如果 2000 萬(wàn)花完了我再追加,今年一定要把這個(gè)錢(qián)做下去?!边@種“撒錢(qián)”式的投入,本質(zhì)上是對(duì)開(kāi)發(fā)者時(shí)間的尊重和對(duì)生態(tài)繁榮的渴望。

截至目前,開(kāi)源 4 個(gè)多月后,昇騰 CANN 在 AtomGit 上的倉(cāng)庫(kù)從 20 多個(gè)增長(zhǎng)到 40 多個(gè),加上外部伙伴的項(xiàng)目,總計(jì)達(dá) 70 多個(gè)。

更可喜的是,出現(xiàn)了“自己的 CANN"——一些企業(yè)和高校基于開(kāi)源版本,開(kāi)發(fā)了滿(mǎn)足自身特定需求的分支。例如,中石油、南方電網(wǎng)等傳統(tǒng)行業(yè)客戶(hù),自發(fā)基于昇騰開(kāi)源軟件進(jìn)行開(kāi)發(fā)適配。

華為昇騰專(zhuān)家對(duì)此樂(lè)見(jiàn)其成:“開(kāi)源取得了我們不知道的、從來(lái)沒(méi)有想過(guò)的效果?!?/p>

另外,面對(duì)海量的模型適配、算子開(kāi)發(fā)需求,人力終有窮盡。

為此,昇騰推出了全套的 Agent 工具鏈。例如,一個(gè)集成了華為經(jīng)驗(yàn)的“模型工程全流程 Agent",能在 1 分鐘內(nèi)找到模型,1 小時(shí)內(nèi)驗(yàn)證,1 天內(nèi)完成在昇騰上的部署。團(tuán)隊(duì)甚至將優(yōu)化、調(diào)優(yōu)的"Skills"開(kāi)源,讓其他 Agent 也能調(diào)用,目標(biāo)是將 AI 開(kāi)發(fā)從“專(zhuān)家手藝”變成“全民工程”。

事實(shí)上,昇騰生態(tài)的崛起,其意義遠(yuǎn)超過(guò)一個(gè)商業(yè)產(chǎn)品的成功。它回答了一個(gè)關(guān)鍵問(wèn)題:在 AI 算力底座領(lǐng)域,中國(guó)除了追趕,能否走出一條不同的、可持續(xù)的道路?

顯然,在 DeepSeek V4 發(fā)布的當(dāng)下,AI 算力競(jìng)爭(zhēng)已進(jìn)入深水區(qū)。昇騰生態(tài)的全面革新,不僅僅是一次產(chǎn)品的升級(jí),更是一次生態(tài)哲學(xué)的勝利。

它證明了中國(guó) AI 算力底座不需要做誰(shuí)的“影子”,通過(guò)“底層做厚、體驗(yàn)做輕”,通過(guò)“全面開(kāi)源、全面兼容”,完全有能力構(gòu)建起一個(gè)繁榮、自主、開(kāi)放的 AI 世界。

回到文章開(kāi)頭的那個(gè)問(wèn)題,昇騰和 DeepSeek 聯(lián)手,真的掀了英偉達(dá)的桌子嗎?

從某種意義上說(shuō),他們已經(jīng)把桌子掀翻了,他們打破了“除了英偉達(dá)別無(wú)選擇”的壟斷局面,為中國(guó) AI 產(chǎn)業(yè)構(gòu)建了一個(gè)安全、可靠、高性能的新選擇。

當(dāng)然,這場(chǎng)比拼還遠(yuǎn)未結(jié)束,英偉達(dá)依然強(qiáng)大,生態(tài)的建設(shè)也不是一朝一夕之功。

但至少在 2026 年的今天,我們看到了一個(gè)充滿(mǎn)希望的未來(lái)。

特別聲明:本文為合作媒體授權(quán) DoNews 專(zhuān)欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表 DoNews 專(zhuān)欄的立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問(wèn)都請(qǐng)聯(lián)系idonews@donews.com)

標(biāo)簽: 華為
Copyright ? DoNews 2000-2026 All Rights Reserved
京ICP備2025120072號(hào)