
圖1:移動云磐石智算交換機(jī)
圖2:超節(jié)點AI算力集群
在大會現(xiàn)場,記者也先后看到華為、中興、中科海光、超聚變等廠商展示超節(jié)點AI集群服務(wù)器,在奔向AI+時代當(dāng)中,AI算力的需求發(fā)生了哪些變化?頭部通信運營商、互聯(lián)網(wǎng)巨頭是怎樣看待這些變化?國產(chǎn)算力芯片又有了哪些最新的進(jìn)展?記者結(jié)合最新的實地采訪和前沿產(chǎn)品和大家分析。
中移動+三大互聯(lián)網(wǎng)巨頭布局AI智算,大型自主算力供給亟需國產(chǎn)芯片突破
鵬城實驗室高效能云計算所所長余躍表示,2025年以來,國內(nèi)外算力發(fā)展模式呈現(xiàn)不同路徑,國外十萬卡集群在如火如荼的建設(shè)當(dāng)中,特別像“星際之門”這樣規(guī)模的集群快速建設(shè),全球算力資源正在加速向少數(shù)國家、少數(shù)科技巨頭集中,呈現(xiàn)出高度不均衡的發(fā)展態(tài)勢。中國算力總量居世界第二位,但單體算力與國外大型算力相比尚存在差距,亟需通過有組織方式推進(jìn)分散算力的互聯(lián)協(xié)同。

“從通信層、計算層、網(wǎng)絡(luò)層和應(yīng)用層形成全棧式的關(guān)鍵挑戰(zhàn),算力網(wǎng)的四大技術(shù)大山分別是:一、大型自主算力供給與應(yīng)用,比如從千卡走向萬卡,從萬卡走向十萬卡,十萬卡集群以華為384超節(jié)點Atlas 900 A3 SuperProD為代表,在上面能否訓(xùn)練大模型方向的智能化服務(wù);二、芯光纖通信與網(wǎng)絡(luò)傳輸,即算力從局域網(wǎng)到廣域,芯片互聯(lián)集群走向IDC之間的互聯(lián),大型的傳輸如何解決;三、協(xié)同調(diào)度和算力協(xié)同標(biāo)準(zhǔn),不同的算力中心使用不同的芯片,彼此之間有不同的異構(gòu),中間的計算層的互聯(lián)適配非常難;四、安全可信的計算環(huán)境?!?余躍分析說。
考慮到美國禁止高端算力芯片向中國供應(yīng),大型自主算力供給已經(jīng)成為目前的卡點。美國人工智能芯片龍頭企業(yè)英偉達(dá)CEO黃仁勛預(yù)測,預(yù)測今年中國AI市場約有500億美元的機(jī)會,并且每年還會增長50%。
電子發(fā)燒友通過多位供應(yīng)鏈人士了解到,按保守計算,2024年中國市場英偉達(dá)H20系列芯片出貨量約為60萬-80萬枚,某國產(chǎn)主流AI芯片出貨量約為30萬-40萬枚。中國2024年對AI芯片的需求大約100萬枚。而2025年,中國移動、字節(jié)跳動、騰訊、阿里都在加大算力設(shè)施的投入力度,意味著需要更多AI芯片采購。
據(jù)悉,2025年中國移動在智算領(lǐng)域投入373億元,AI直接投資超百億元,智算總規(guī)模達(dá)61.3 EFLOPS,并啟動50億元級AI推理設(shè)備集采,全面構(gòu)建“云-邊-端”一體化智算體系。此外,公開消息顯示,字節(jié)跳動2025年AI資本投入1600億元人民幣,其中AI芯片采購采用了海外和國產(chǎn)芯片雙渠道模式。
8月13日,騰訊總裁劉熾平在Q2業(yè)績會表示,元寶、AI搜索等多個應(yīng)用場景的用戶數(shù)提升帶來推理負(fù)載占比提升,公司考慮推理芯片供應(yīng)渠道側(cè)具備多種選擇。鑒于海外高端芯片貿(mào)易政策仍存在較大不確定性,騰訊有望依托華為、寒武紀(jì)、海光等國產(chǎn)廠商的推理芯片滿足相關(guān)算力需求。
8月21日,DeepSeek更新模型版本至DeepSeek-V3.1,新版本模型相比前代模型能在更短時間內(nèi)給出答案,具備更強的Agent能力,新版本模型使用了UE8M0 FP8 Scale參數(shù)精度,DeepSeek表示新精度格式針對即將發(fā)布的下一代預(yù)計將國產(chǎn)芯片設(shè)計。
9月24日,在2025年阿里云棲大會上,阿里巴巴集團(tuán)CEO兼阿里云智能集團(tuán)董事長吳泳銘宣布了公司迄今為止最激進(jìn)的AI投資計劃,未來三年(2025–2027年)將投入超過3800億元人民幣,用于云計算與AI硬件基礎(chǔ)設(shè)施建設(shè)。資金用于建設(shè)AI算力中心和AI芯片、服務(wù)器集群采購,以及通義千問大模型等AI基礎(chǔ)模型研發(fā)。
支持UE8MO FP8精度,國產(chǎn)算力芯片新品迭出
2025年,在出口管制與國產(chǎn)替代雙重刺激下,國產(chǎn)AI算力芯片進(jìn)入“新品爆發(fā)期”。AI芯片呈現(xiàn)三大發(fā)展趨勢:高效能(提升單位功耗算力輸出)、高精度(增強數(shù)據(jù)處理準(zhǔn)確性)、軟硬協(xié)同(優(yōu)化芯片與軟件棧適配性),其中,高精度計算能力的突破尤為關(guān)鍵。
10月10日,在2025中國移動伙伴大會2層華為展區(qū)前,昇騰384超節(jié)點Atlas 900 A3 SuperProD最受矚目。該產(chǎn)品通過總線技術(shù)實現(xiàn)384個NPU之間的大帶寬低延時互聯(lián),算力規(guī)模300 PFlops,單卡的推理量,從每秒600Token躍升到現(xiàn)在每秒2300Token,提升4倍,成功打破跨機(jī)通信帶寬性能瓶頸,實現(xiàn)從服務(wù)器級到矩陣級的資源供給模式轉(zhuǎn)變。

圖:華為超節(jié)點產(chǎn)品Atlas 900SuperPoD 電子發(fā)燒友拍攝
早在9月18日華為全連接大會2025上,華為副董事長、輪值董事長徐直軍宣布:“華為發(fā)布了最新超節(jié)點產(chǎn)品Atlas 950SuperPoD和Atlas 960SuperPoD超節(jié)點,分別支持8192及15488張昇騰卡,在卡規(guī)模、總算力、內(nèi)存容量、互聯(lián)帶寬等關(guān)鍵指標(biāo)上全面領(lǐng)先,在未來多年都將是全球最強算力的超節(jié)點。Atlas 950SuperPoD預(yù)計2025年四季度上市,Atlas 960SuperPoD預(yù)計2027年四季度上市?!?/p>
徐直軍介紹,未來三年華為規(guī)劃多款昇騰算力芯片,包括昇騰 950PR、950DT、以及昇騰960和970,其中昇騰950PR 將在2026年第一季度對外推出,該芯片采用了華為自研HBM。
據(jù)悉,昇騰950PR芯片架構(gòu)新增支持低精度數(shù)據(jù)格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重點提升向量算力,提升互聯(lián)寬帶2.5倍,支持華為自研HBM高帶寬內(nèi)存,分為HiBL 1.0和HiZQ 2.0兩個版本。規(guī)格方面,HiBL 1.0容量128GB,帶寬1.6TB/s;HiZQ 2.0容量144GB,帶寬4TB/s。
此外,昇騰950DT采用HiZQ 2.0內(nèi)存,可提升推理Decode(解碼)性能,提升訓(xùn)練性能,提升內(nèi)存容量和帶寬。
寒武紀(jì)則在7月份的上海人工智能大會展示了最新的云端智能訓(xùn)練芯片思元590,采用 MLUarch05 全新架構(gòu),實測訓(xùn)練性能較在售旗艦產(chǎn)品大幅提升,提供了更大的內(nèi)存容量和更高的內(nèi)存帶寬,其 IO 和片間互聯(lián)接口也實現(xiàn)大幅升級,讓 AI 運算速度更快,處理復(fù)雜任務(wù)更得心應(yīng)手 。
海光信息在AI大算力芯片(DCU)領(lǐng)域已形成“深算一號、二號、三號、四號”的梯次迭代,并率先實現(xiàn)商業(yè)落地,成為國產(chǎn)GPU陣營里唯一能穩(wěn)定盈利、批量供貨的玩家。記者在中移動合作伙伴大會現(xiàn)場看到,中興海光服務(wù)器廣泛部署中國移動關(guān)鍵業(yè)務(wù)場景,HYGON DCU深算二號K100-AI是訓(xùn)推一體機(jī),覆蓋邊緣一體機(jī)到大型數(shù)據(jù)中心的集群部署。

圖:中興海光合作推出訓(xùn)推一體機(jī) 電子發(fā)燒友拍攝
海光信息的新一代AI 算力芯片同樣表現(xiàn)出色,采用 7 納米制程技術(shù),配備 16 核處理器,運算速度相比前一代提升了 50%,功耗卻大幅降低。海光信息官方微信也顯示,9月29日,DeepSeek-V3.2-Exp發(fā)布并且開源,引入稀疏Attention架構(gòu),海光DCU第一時間實現(xiàn)無縫適配+深度調(diào)優(yōu),高效支持Tilelang算子,確保大模型算力“零等待”部署。
百度今年推出最新一代昆侖芯P800系列產(chǎn)品,采用昆侖芯100%自研的XPU-P架構(gòu),憑借卓越的計算性能、完善的軟件生態(tài)和領(lǐng)先的大規(guī)模部署能力,該芯片已在國產(chǎn)AI芯片行業(yè)內(nèi)率先實現(xiàn)3萬卡集群的成功部署。
本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。微信號zy1052625525。需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱zhangying@huaqiu.com。
-
華為
+關(guān)注
關(guān)注
218文章
36162瀏覽量
262614 -
寒武紀(jì)
+關(guān)注
關(guān)注
13文章
218瀏覽量
75051
發(fā)布評論請先 登錄
端側(cè)AI爆發(fā)!斯貝達(dá)全棧自研技術(shù),助力國產(chǎn)AI算力崛起
國內(nèi)首個國產(chǎn)AI推理千卡集群落地,采用云天勵飛全自研AI推理芯片
中科曙光3套scaleX萬卡超集群落地國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點
中科曙光scaleX萬卡超集群重塑超大規(guī)模算力基礎(chǔ)設(shè)施
中科曙光scaleX萬卡超集群背后的持續(xù)創(chuàng)新
墨芯人工智能千卡集群正式簽約入駐新疆算力中心
國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?
華為發(fā)布全球最強算力超節(jié)點和集群
壁仞科技聯(lián)合三方打造國產(chǎn)算力集群落地
從萬卡集群到十萬卡集群,燧原科技始終踐行算力普惠
華為領(lǐng)銜,三劍客入局!十萬卡智算集群落地,國產(chǎn)算力芯片強勢崛起
評論