為了把利潤留在自己鍋里,字節(jié)選擇下場造芯。
近日,據(jù)藍(lán)鯨科技報(bào)道,字節(jié)跳動芯片研發(fā)團(tuán)隊(duì)將開始規(guī)?;衅福唧w招聘城市涵蓋北京、上海、深圳等,所需職位包括芯片架構(gòu)、soc設(shè)計(jì)等。
該知情人士透露,字節(jié)跳動芯片研發(fā)團(tuán)隊(duì)目前核心集中于芯片設(shè)計(jì)環(huán)節(jié),圍繞公司自身業(yè)務(wù)開展專用硬件定制與優(yōu)化,面向云端場景研發(fā)多款采用先進(jìn)半導(dǎo)體工藝的復(fù)雜芯片,以提升性能、降低算力成本。
“目前字節(jié)芯片團(tuán)隊(duì)已實(shí)現(xiàn)多次一版成功流片,早期多個項(xiàng)目進(jìn)入量產(chǎn)部署階段,覆蓋多個主流先進(jìn)工藝節(jié)點(diǎn),整體研發(fā)與落地節(jié)奏穩(wěn)步推進(jìn)?!?/p>
而在團(tuán)隊(duì)規(guī)模上面,據(jù)雷達(dá)Finance報(bào)道,字節(jié)的AI芯片團(tuán)隊(duì)和CPU團(tuán)隊(duì)人數(shù)較多,其中,AI芯片方向人數(shù)過半,達(dá)500人以上,CPU團(tuán)隊(duì)在200人左右。
然而,千人團(tuán)隊(duì)的集結(jié)僅僅是一個開始,真正的博弈才剛剛拉開序幕。
面對日益增長的AI投入,自研芯片能否幫助字節(jié)跳動徹底擺脫“給英偉達(dá)打工”的魔咒,將昂貴的算力成本轉(zhuǎn)化為火山引擎的獨(dú)家利潤?又能否復(fù)刻谷歌TPU的神話,利用極致的軟硬協(xié)同重新定義MaaS市場的定價權(quán)?
而對于寒武紀(jì)等剛剛盈利的國產(chǎn)芯片廠商而言,大廠的每一次流片成功,究竟是市場繁榮的信號,還是那個殘酷的“去中介化”倒計(jì)時?
01
昂貴的“過路費(fèi)”
字節(jié)不得不算的千億開支賬
自研芯片,是一筆不得不算的經(jīng)濟(jì)賬。
據(jù)金融時報(bào)報(bào)道,字節(jié)跳動2026年的資本開支擬達(dá)到約1600億元人民幣,高于2025年約1500億元人民幣的投入,其中約一半資金將用于采購先進(jìn)半導(dǎo)體芯片以開發(fā)AI模型和應(yīng)用,而若獲準(zhǔn)采購更多先進(jìn)芯片,還會進(jìn)一步大幅增加資本開支。
如果倒退回五年前,用于AI芯片的這筆錢字節(jié)跳動花得起,也愿意花。
彼時,AI在字節(jié)的版圖中僅僅是一個“優(yōu)化項(xiàng)”,主要用于推薦算法的提效或廣告系統(tǒng)的精準(zhǔn)度提升。但隨著“豆包”大模型及豆包、即夢等AI應(yīng)用的全面爆發(fā),情況發(fā)生了根本性的逆轉(zhuǎn)。據(jù)QuestMobile數(shù)據(jù)顯示,豆包APP在2025年底的月活用戶已穩(wěn)居國內(nèi)AI類應(yīng)用榜首,且用戶時長呈指數(shù)級增長。
與此同時,作為字節(jié)跳動B端業(yè)務(wù)全新增長極的火山引擎,也在經(jīng)歷一場前所未有的算力饑渴。
在經(jīng)歷了將大模型價格打入“厘時代”的激進(jìn)價格戰(zhàn)后,火山引擎通過極致性價比策略,正在將日均處理Token推向了百萬萬億級別。這種以價換量的策略雖然搶占了MaaS的市場份額,但也讓底層的算力承壓達(dá)到了臨界點(diǎn),火山不僅要支撐內(nèi)部數(shù)億用戶的即時交互,還要響應(yīng)外部企業(yè)客戶海量的API調(diào)用。
于是,當(dāng)AI業(yè)務(wù)從“錦上添花”變成了公司的“核心增長極”,算力消耗的性質(zhì)也變了:它不再是研發(fā)投入,而是每一分鐘都在流血的運(yùn)營成本。
當(dāng)數(shù)以十萬計(jì)的GPU在機(jī)房轟鳴,每一秒鐘流走的不僅是電費(fèi),更是被英偉達(dá)等上游硬件廠商切走的巨額利潤。對于擁有數(shù)億日活用戶的“豆包”和視頻生成模型而言,推理環(huán)節(jié)的算力消耗遠(yuǎn)超訓(xùn)練環(huán)節(jié),這恰恰是成本失控的“重災(zāi)區(qū)”。
如果繼續(xù)依賴價格昂貴的通用GPU來處理海量的用戶請求,不僅意味著持續(xù)給供應(yīng)商“打工”,更意味著火山引擎在對外提供MaaS服務(wù)時,難以掌握定價的主動權(quán)。
這并非危言聳聽,看看供應(yīng)商的財(cái)報(bào)就知道“打工”打得有多慘烈。
在AI芯片的賣方市場里,定價權(quán)完全掌握在上游手中。據(jù)The Information分析,英偉達(dá)高端GPU的毛利率長期維持在70%以上的高位。對于字節(jié)跳動這樣千億級采購規(guī)模的超級大客戶來說,這意味著每花100塊錢買芯片,就有70塊錢是在給黃仁勛交“過路費(fèi)”。
即便是在被視為“平替”的國產(chǎn)芯片領(lǐng)域,情況也并未好轉(zhuǎn)太多。以字節(jié)跳動核心供應(yīng)商之一的寒武紀(jì)為例,其2025年財(cái)報(bào)顯示,受益于互聯(lián)網(wǎng)大廠的瘋狂掃貨,公司不僅實(shí)現(xiàn)了歷史性盈利,其思元系列推理卡的毛利率也隨著規(guī)模效應(yīng)開始攀升,公司毛利率也超過50%。
于是,一個很殘酷但也很清晰的邏輯浮現(xiàn)了:上游芯片廠商的超額利潤,本質(zhì)上就是字節(jié)跳動和火山引擎的成本黑洞。
在存量競爭時代,供應(yīng)商的每一分利潤,都是字節(jié)可以挖掘的降本空間。既然推理芯片并不需要像訓(xùn)練芯片那樣追求極致的通用性和雙精度計(jì)算能力,那么為什么要把這幾百億的利潤拱手讓人?
更何況,在全球科技巨頭的牌桌上,“自研芯片”早已不是一道成本選擇題,而是一道能力證明題——證明你是否有資格成為真正的云巨頭。
放眼海外,谷歌早在十三年前就開啟了TPU的研發(fā)。而當(dāng)外界大力爭搶英偉達(dá)顯卡時,谷歌卻默默祭出了TPU。正是憑借TPU與TensorFlow框架的軟硬一體化,谷歌在保證自家搜索、YouTube推薦等龐大業(yè)務(wù)算力需求的同時,將單位算力成本壓縮到了競爭對手的幾分之一,甚至還開始了TPU的外售,扮演起了“第二英偉達(dá)”的角色。
目光轉(zhuǎn)回國內(nèi),阿里云走的也是自研的道路。
1月底,平頭哥官網(wǎng)上線了最新一代AI芯片“真武810E”,性能直接對標(biāo)海外芯片巨頭英偉達(dá)的H20,出貨量已達(dá)10萬片,超過寒武紀(jì),在國產(chǎn)GPU廠商中屬于第一梯隊(duì)。并在阿里云實(shí)現(xiàn)多個萬卡集群部署,并服務(wù)了國家電網(wǎng)、小鵬汽車等400多家客戶。
更重要的是,阿里云也借此實(shí)現(xiàn)了“平頭哥+阿里云+千問模型”黃金三角的閉環(huán)。
據(jù)雷峰網(wǎng)采訪的推理框架優(yōu)化專家張濤解析,“以DeepSeek推出大型MoE模型為例,其本質(zhì)便是在云端集群場景下實(shí)現(xiàn)了極致的模型與硬件的co-design,以此最大化釋放算力性能,而阿里的全棧自研將是更‘激進(jìn)’的原生適配方案?!?/p>
對于字節(jié)跳動而言,前有谷歌TPU的“珠玉在前”,后有阿里PPU的“近身示范”,此時下場造芯,不僅是出于成本控制的防守,更是為了在MaaS戰(zhàn)爭中復(fù)刻谷歌神話的進(jìn)攻。當(dāng)算力成本決定了模型定價的底線,沒有自研芯片的云廠商,注定只能是英偉達(dá)的“售票員”,永遠(yuǎn)無法觸碰到商業(yè)閉環(huán)的核心利潤。
為了不當(dāng)這個“售票員”,字節(jié)跳動必須掌握這種“量體裁衣”的技術(shù)。
正如張濤所言,極對于互聯(lián)網(wǎng)企業(yè)來說,極致的Co-design才是破局關(guān)鍵。相比于采購?fù)ㄓ肎PU,自研的ASIC芯片更像是一把精準(zhǔn)的手術(shù)刀,它能針對字節(jié)獨(dú)有的推薦算法和Transformer架構(gòu)進(jìn)行深度定制,剔除所有冗余的通用功能,把每一顆晶體管都用在刀刃上。
業(yè)界估算,這種極致的專用性,能將單位算力成本降低50%以上。這不僅僅是技術(shù)指標(biāo)的勝利,更是商業(yè)邏輯的質(zhì)變:當(dāng)采購規(guī)模突破了“自研盈虧平衡點(diǎn)”,下場造芯就從一種可有可無的技術(shù)儲備,變成了巨頭博弈中必須跨越的生存門檻。
只有把算力的“水龍頭”徹底掌握在自己手里,字節(jié)跳動才能在未來慘烈的模型價格戰(zhàn)中,擁有不用看別人臉色的底氣。
02
芯片“去中介化”
誰在寒冬里發(fā)抖?
然而,商業(yè)世界的甲之蜜糖,往往是乙之砒霜。
當(dāng)字節(jié)跳動決心將那幾百億的“超額利潤”留在自己鍋里時,對于剛剛在2025年嘗到甜頭的國產(chǎn)芯片廠商而言,這不僅僅意味著丟失了一個大客戶,更意味著一場關(guān)于“去中介化”的生命倒計(jì)時正式開啟。
回顧這段關(guān)系的起點(diǎn),字節(jié)跳動與寒武紀(jì)的聯(lián)手,從一開始就帶有濃厚的“備胎”色彩。
如果將時間軸撥回兩年前,這是一場在極端外部壓力下的“抱團(tuán)取暖”。彼時,受制于禁令因素,A100/H100軍無法正常供應(yīng),雖然隨后推出了H800、H20等“閹割版”的產(chǎn)品,但這把懸在頭頂?shù)倪_(dá)摩克利斯之劍讓所有互聯(lián)網(wǎng)巨頭都感到脊背發(fā)涼。在供應(yīng)鏈最黑暗的時刻,字節(jié)跳動急需一個“Plan B”來對沖英偉達(dá)隨時可能斷供的風(fēng)險(xiǎn)。
而作為國產(chǎn)AI芯片“第一股”的寒武紀(jì),憑借其思元系列產(chǎn)品,成為了當(dāng)時為數(shù)不多能拿出量產(chǎn)現(xiàn)貨、且軟件棧相對成熟的供應(yīng)商。
這是一場典型的“基于恐懼的采購”,而非“基于性能的優(yōu)選”。
據(jù)產(chǎn)業(yè)鏈調(diào)研數(shù)據(jù)顯示,2023年至2024年間,字節(jié)跳動在瘋狂掃貨英偉達(dá)合規(guī)芯片的同時,開始向寒武紀(jì)下達(dá)了規(guī)??捎^的意向訂單。這些芯片并沒有立刻被部署在核心的推薦算法集群中,而是主要用于部分非核心業(yè)務(wù)的推理場景測試。
這種合作在2025年達(dá)到了頂峰:隨著字節(jié)AI產(chǎn)品爆發(fā),推理算力需求激增,而英偉達(dá)產(chǎn)能吃緊,寒武紀(jì)的思元590芯片成功切入了字節(jié)的供應(yīng)鏈體系,填補(bǔ)了部分算力缺口。
正是得益于字節(jié)跳動、百度、阿里等互聯(lián)網(wǎng)大廠的這種“避險(xiǎn)性采購”,寒武紀(jì)迎來了它成立以來的最高光時刻。
2025年,寒武紀(jì)營收實(shí)現(xiàn)了驚人的翻倍式增長,一舉突破60億元人民幣大關(guān),同比增長率超過200%;更重要的是,它終于跨越了那道困擾了自身多年的財(cái)務(wù)天塹,實(shí)現(xiàn)了歷史性的首次年度盈利。
而在資本市場上,寒武紀(jì)的股價隨著這份“超預(yù)期”的成績單聞風(fēng)起舞。從2025年初開始,其股價猶如坐上了火箭,一路擊穿各大阻力位,市值一度逼近5000億大關(guān)。那段時間,券商研報(bào)都在用最亢奮的語調(diào)高呼“中國的英偉達(dá)已經(jīng)誕生”,科技股論壇都在討論思元系列如何在成為字節(jié)的“太子”,甚至還有字節(jié)入股寒武紀(jì)的小作文傳出。
投資者們篤定地認(rèn)為,國產(chǎn)替代的終局已經(jīng)到來,寒武紀(jì)將像當(dāng)年的英偉達(dá)一樣,躺在互聯(lián)網(wǎng)巨頭的算力軍備競賽中,坐享高毛利的紅利。
然而,繁榮的表象之下,是極其脆弱的地基。
寒武紀(jì)的業(yè)績爆發(fā),本質(zhì)上是建立在“英偉達(dá)供給不足”和“巨頭自研尚未到位”這兩個時間差之上的。這是一種典型的“窗口期紅利”。對于字節(jié)跳動而言,2024年到2025年的大規(guī)模采購,更多是一場“基于恐懼的避險(xiǎn)”和“不得不完成的任務(wù)”,而非基于技術(shù)與信任的合作。
產(chǎn)業(yè)鏈知情人士曾向超聚焦透露,字節(jié)跳動在彼時掃貨寒武紀(jì)思元590芯片,核心訴求非常簡單:填坑。?在英偉達(dá)高端算力受限、國產(chǎn)自研芯片尚未量產(chǎn)的空窗期,字節(jié)需要大量的現(xiàn)貨來維持“豆包”模型指數(shù)級增長的推理需求,并且作為互聯(lián)網(wǎng)第一大廠也有責(zé)任與義務(wù)扶持國產(chǎn)算力。
換句話說,大廠買你,不是因?yàn)槟悴豢商娲?,而是因?yàn)楫?dāng)時只有你“有貨”。
而當(dāng)時間來到2026年,當(dāng)字節(jié)跳動的1000人芯片團(tuán)隊(duì)完成了從架構(gòu)設(shè)計(jì)到流片驗(yàn)證的全部拼圖時,這個昂貴的“備胎”也將逐漸失去存在的意義。
寒武紀(jì)作為一家獨(dú)立的芯片設(shè)計(jì)公司,其產(chǎn)品迭代周期通常遵循傳統(tǒng)的硬件規(guī)律,一款芯片從定義到量產(chǎn)往往需要18到24個月。這意味著,當(dāng)字節(jié)跳動的算法團(tuán)隊(duì)在2026年提出了一個新的稀疏化注意力機(jī)制時,他們?nèi)绻褂煤浼o(jì)的芯片,可能要等到2027年底才能用上硬件加速。
但在字節(jié)內(nèi)部,這個邏輯被徹底重寫了。
隨著“SeedChip”項(xiàng)目的落地,字節(jié)的算法團(tuán)隊(duì)可以直接和芯片團(tuán)隊(duì)坐在同一個辦公室里。這是一種物理距離歸零帶來的化學(xué)反應(yīng): 算法工程師上午提出的算子優(yōu)化需求,芯片架構(gòu)師下午就能將其寫入指令集,甚至直接調(diào)整片上內(nèi)存的配比。通過這種極致的Co-design,字節(jié)可以在幾個月內(nèi)實(shí)現(xiàn)硬件層面的迭代支持。
當(dāng)字節(jié)可以用更低的成本、更快的迭代速度來滿足自身需求時,繼續(xù)維持寒武紀(jì)的高毛利采購,就違背了商業(yè)的基本邏輯。
而這場危機(jī),不僅僅屬于寒武紀(jì)。
目光放寬到整個國產(chǎn)芯片賽道,壁仞科技、摩爾線程等獨(dú)角獸公司,同樣面臨著被大廠“降維打擊”的風(fēng)險(xiǎn)。這些公司的商業(yè)模式,在很大程度上都是試圖成為“中國的英偉達(dá)”,即通過設(shè)計(jì)通用的高性能GPU,賣給云廠商和智算中心。
但現(xiàn)實(shí)是,他們最大的潛在客戶阿里云、字節(jié)跳動、騰訊云、百度智能云,無一例外都在瘋狂布局自研芯片。
阿里的PPU已經(jīng)證明了這條路的可行性。其自研的AI芯片已經(jīng)在阿里內(nèi)部的推薦和推理業(yè)務(wù)中大面積鋪開,并且開始探索外售的道路。如果說阿里云是第一個吃螃蟹的人,那么字節(jié)跳動就是那個緊隨其后、且胃口更大的掠食者。
這便是“中間商”在巨頭博弈時代的宿命。
在云計(jì)算和AI的產(chǎn)業(yè)鏈條中,處于中游的第三方獨(dú)立芯片設(shè)計(jì)廠商,正面臨著前所未有的“夾層擠壓”。
向上,他們無法像英偉達(dá)那樣擁有無可撼動的CUDA生態(tài)護(hù)城河,能夠讓客戶“不得不買”;向下,他們又面臨著大廠自研芯片的極致性價比競爭。于是,當(dāng)最大的客戶變成了最強(qiáng)的競爭對手,第三方廠商的生存空間將被壓縮到極限。
未來,以字節(jié)、阿里為代表的互聯(lián)網(wǎng)巨頭,絕不會僅僅將自研芯片鎖在自家的機(jī)房里做“內(nèi)部特供”。商業(yè)的邏輯永遠(yuǎn)是追求規(guī)模效應(yīng)的最大化:當(dāng)“SeedChip”或“真武”經(jīng)過了內(nèi)部數(shù)百萬卡級別的打磨驗(yàn)證,良率穩(wěn)定、成本極低時,它們必然會走向?qū)ν馐圪u。
屆時,這些互聯(lián)網(wǎng)巨頭將完成最可怕的跨界:它們既是最大的云服務(wù)商,也是最大的芯片供應(yīng)商。而在這種降維打擊下,留給寒武紀(jì)等“特種生存派”的路,只剩下兩條。
第一條路是成為英偉達(dá)。
在這條路上,你要做的不僅僅是畫出最好的電路圖,而是要構(gòu)建出像CUDA一樣堅(jiān)不可摧的軟件生態(tài)護(hù)城河。放眼全球,能走通這條路的獨(dú)立廠商只有英偉達(dá)一個,這需要“天時地利人和”的極致配合。
回顧英偉達(dá)的崛起,那是建立在長達(dá)15年的“孤獨(dú)長跑”之上的。黃仁勛在AI爆發(fā)前的荒原里,每年燒掉數(shù)億美金推廣CUDA,那時沒有巨頭盯著他,沒有云廠商搶他的生意,他擁有充足的時間窗口去“猥瑣發(fā)育”,將顯卡從游戲工具一點(diǎn)點(diǎn)改造成AI引擎。
但現(xiàn)在,這個“天時”已經(jīng)徹底消失了。
在AI已經(jīng)成為全球科技軍備競賽核心的今天,任何一家初創(chuàng)公司想要重走一遍CUDA之路,都會發(fā)現(xiàn)周圍早已是巨頭環(huán)伺。你沒有十年的時間去慢慢培養(yǎng)開發(fā)者生態(tài),因?yàn)樽止?jié)和阿里們的自研芯片明天就會上線,直接用PyTorch/TensorFlow的底層適配繞過你的生態(tài)壁壘;你也沒有從容試錯的機(jī)會,因?yàn)橘Y本市場和客戶不再相信長周期的神話。
這條路意味著要在巨頭的眼皮底下再造一個英偉達(dá),但殘酷的是,這注定是一場九死一生的突圍。
第二條路,則是更現(xiàn)實(shí)的賣身互聯(lián)網(wǎng)。
對于大多數(shù)無法成為英偉達(dá)的國產(chǎn)芯片廠商而言,這或許是最好的歸宿。與其在巨頭的夾縫中被“去中介化”慢慢絞殺,不如在自己技術(shù)尚有價值、團(tuán)隊(duì)尚有戰(zhàn)力的時候,選擇并入巨頭的版圖,融合成為字節(jié)或阿里內(nèi)部的一個硬件部門。這并非失敗,而是另一種形式的“上岸”。
對于寒武紀(jì)而言,2025年的盈利或許是短暫輝煌的起點(diǎn),但也可能是大廠“去中介化”前最后的狂歡。
在這個贏家通吃的算力時代,單純的“硬件中間商”正在失去存在的土壤。未來的牌桌上,只有兩類玩家:要么強(qiáng)大到能像英偉達(dá)一樣,制定規(guī)則,讓巨頭為你打工; 要么,聰明到能像Annapurna一樣,融入巨頭,成為規(guī)則的一部分。
除此之外,已無更多坦途了。
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點(diǎn),不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)