當(dāng)大模型從技術(shù)探索邁向規(guī)模化應(yīng)用深水區(qū),“算力供需失衡”與“推理成本高企”已成為制約產(chǎn)業(yè)發(fā)展的關(guān)鍵瓶頸。
在近期舉辦的ICCAD2025“IC設(shè)計(jì)與應(yīng)用創(chuàng)新論壇”上,云天勵(lì)飛副總裁羅憶發(fā)表主題演講,立足全球AI算力格局從訓(xùn)練轉(zhuǎn)向推理的時(shí)代變局,解讀了通過(guò)基礎(chǔ)設(shè)施優(yōu)化實(shí)現(xiàn)推理降本的核心邏輯,并重點(diǎn)分享了云天勵(lì)飛創(chuàng)新的GPNPU架構(gòu),為國(guó)產(chǎn)AI芯片的發(fā)展提供了切實(shí)可行的思路。
行業(yè)雙拐點(diǎn)將至:推理算力成主力,國(guó)產(chǎn)芯片迎替代窗口期
“從訓(xùn)練‘狂飆’到推理‘深耕’,AI產(chǎn)業(yè)正進(jìn)入價(jià)值落地的關(guān)鍵階段。”羅憶在演講中開(kāi)篇點(diǎn)題。他引用數(shù)據(jù)稱(chēng),2025年年中我國(guó)AI日均Token推理量已突破30萬(wàn)億,一年半內(nèi)增長(zhǎng)超300倍;預(yù)計(jì)到年底,AI推理算力消耗將首次超過(guò)訓(xùn)練,成為驅(qū)動(dòng)算力需求的核心引擎。
與此同時(shí),國(guó)產(chǎn)芯片的替代浪潮正在加速。在海外高端GPU供應(yīng)受限及國(guó)內(nèi)“人工智能+”行動(dòng)等政策支持的雙重影響下,國(guó)產(chǎn)AI芯片市場(chǎng)占比持續(xù)提升,預(yù)計(jì)年底其使用量有望首次超越國(guó)外芯片,迎來(lái)歷史性的替代窗口期。羅憶強(qiáng)調(diào):“第四次工業(yè)革命中,AI推理芯片是核心。中國(guó)要實(shí)現(xiàn)算力自主可控,必須在效率與成本上找到差異化突破路徑?!?/p>
解碼AI推理降本:四個(gè)維度協(xié)同優(yōu)化提升大模型推理性?xún)r(jià)比
大模型規(guī)模化落地的核心挑戰(zhàn),在于“效果-性能-成本”的平衡難題,高質(zhì)量大模型推理的百萬(wàn)Token成本高企,是產(chǎn)業(yè)規(guī)?;闹匾款i。
云天勵(lì)飛給出了“Token經(jīng)濟(jì)學(xué)公式”:百萬(wàn)Token成本 = (年資本開(kāi)支+年?duì)I運(yùn)成本) ÷ (加速卡年吞吐量×設(shè)備利用率),將大模型推理成本優(yōu)化指向“硬件投入、運(yùn)維消耗、軟件優(yōu)化、生態(tài)適配”四個(gè)維度。
云天勵(lì)飛解法:GPNPU 打造國(guó)產(chǎn)自主算力底座
面對(duì)國(guó)產(chǎn)工藝約束與產(chǎn)業(yè)規(guī)?;枨螅铺靹?lì)飛創(chuàng)新性提出 GPNPU架構(gòu),核心是融合 GPU 的通用性與 NPU 的高能效,通過(guò)“算力積木” 架構(gòu)、3D 堆疊存儲(chǔ)等關(guān)鍵技術(shù)破解行業(yè)痛點(diǎn)?!八懔Ψe木” 架構(gòu)實(shí)現(xiàn)了國(guó)產(chǎn)工藝下的全鏈路自主可控,達(dá)成 “一次流片、多規(guī)格輸出”,算力覆蓋 8T 至 256T,貫穿端、邊、云全場(chǎng)景部署需求。
羅憶最后提到,云天勵(lì)飛正加速迭代第五代GPNPU架構(gòu)“Nova 500”,聚焦帶寬與能效升級(jí),全力沖刺“百萬(wàn)Token成本1元內(nèi)”目標(biāo)。未來(lái),云天勵(lì)飛愿攜手產(chǎn)業(yè)鏈伙伴,讓算力從精英資源走向普惠,成為社會(huì)智能化的公共底座,為中國(guó)搶占第四次工業(yè)革命制高點(diǎn)貢獻(xiàn)力量!
-
IC設(shè)計(jì)
+關(guān)注
關(guān)注
38文章
1405瀏覽量
108401 -
gpu
+關(guān)注
關(guān)注
28文章
5258瀏覽量
136037 -
云天勵(lì)飛
+關(guān)注
關(guān)注
0文章
184瀏覽量
12693
原文標(biāo)題:ICCAD 2025|解碼AI推理降本之道,GPNPU創(chuàng)新架構(gòu)筑牢國(guó)產(chǎn)算力底座
文章出處:【微信號(hào):IntelliFusion2,微信公眾號(hào):云天勵(lì)飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
銳成芯微四大IP平臺(tái)亮相ICCAD-Expo 2025
華大九天亮相ICCAD-Expo 2025
安路科技亮相ICCAD-Expo 2025
中芯國(guó)際亮相ICCAD-Expo 2025
行芯科技亮相ICCAD-Expo 2025
中科芯亮相ICCAD-Expo 2025
成都華微亮相ICCAD-Expo 2025
芯行紀(jì)亮相ICCAD-Expo 2025
旋極星源亮相ICCAD-Expo 2025
巨霖科技精彩亮相ICCAD-Expo 2025
英諾達(dá)亮相ICCAD-Expo 2025
奇捷科技亮相ICCAD-Expo 2025
芯盛智能亮相ICCAD-Expo 2025
芯原精彩亮相ICCAD-Expo 2025
云天勵(lì)飛亮相ICCAD-Expo 2025
評(píng)論