2025年11月23日,第二十二屆中國(guó)國(guó)際半導(dǎo)體博覽會(huì)(IC China 2025)在北京國(guó)家會(huì)議中心啟幕。在24日舉辦的“人工智能及大模型芯片論壇” 上,云天勵(lì)飛智算研究院副院長(zhǎng)沈宇亮發(fā)表主題演講,深度解析大模型時(shí)代推理算力變革趨勢(shì),分享以 GPNPU 創(chuàng)新架構(gòu)為核心的全場(chǎng)景產(chǎn)品布局。
時(shí)代變局:推理需求爆發(fā),國(guó)產(chǎn)芯片迎戰(zhàn)略機(jī)遇
從AlexNet 開(kāi)啟深度學(xué)習(xí),到 ChatGPT 引爆大模型革命,AI 已從感知智能邁入認(rèn)知智能,成為第四次工業(yè)革命核心驅(qū)動(dòng)力。中國(guó)憑借數(shù)據(jù)規(guī)模、場(chǎng)景開(kāi)放與工程化創(chuàng)新三重優(yōu)勢(shì),正緊跟全球技術(shù)前沿,在AI賽道形成獨(dú)特競(jìng)爭(zhēng)力。
2025年作為“AI Agent 落地元年”,大模型迭代周期壓縮至周甚至小時(shí)級(jí),國(guó)內(nèi)外主流模型密集升級(jí),開(kāi)源低成本模型推動(dòng) AI 推理規(guī)?;l(fā)展,Token 消耗量指數(shù)級(jí)增長(zhǎng),算力需求重心從訓(xùn)練全面轉(zhuǎn)向推理。沈宇亮指出,AI 基礎(chǔ)設(shè)施已進(jìn)入以“高效推理”為核心訴求的算力基建2.0 時(shí)代,疊加海外高端 GPU 供應(yīng)受限與 “人工智能 +” 政策支持,國(guó)產(chǎn)推理芯片迎來(lái)前所未有的機(jī)遇。
技術(shù)破局:GPNPU架構(gòu)實(shí)現(xiàn)“百萬(wàn) Token”極致性價(jià)比
針對(duì)云端推理的性能、成本、精度挑戰(zhàn),云天勵(lì)飛創(chuàng)新提出GPNPU(General-Purpose Neural Processing Unit)架構(gòu),核心路徑是融合 GPU 通用性與 NPU 高能效。以 “算力積木” 設(shè)計(jì)和 3D 堆疊存儲(chǔ)為核心創(chuàng)新,聚焦提升 “資本開(kāi)支Token轉(zhuǎn)化率” 與 “運(yùn)營(yíng)開(kāi)支 Token 轉(zhuǎn)化率”,通過(guò)全棧協(xié)同優(yōu)化,為大模型組合應(yīng)用與復(fù)合智能體部署提供核心算力支撐,實(shí)現(xiàn) “百萬(wàn)Token的極致性價(jià)比”。
全場(chǎng)景布局:賦能AI 規(guī)?;涞?/p>
架構(gòu)創(chuàng)新是國(guó)產(chǎn)芯片差異化突破的關(guān)鍵。深耕AI芯片十余年的云天勵(lì)飛,已商用四代 NPU 架構(gòu)芯片,構(gòu)建起覆蓋云邊端全場(chǎng)景的推理芯片矩陣:面向云端大算力推理的“深穹”系列,為互聯(lián)網(wǎng)大廠與企業(yè)級(jí)用戶提供國(guó)產(chǎn)算力支撐;面向邊緣計(jì)算的“深界”系列,已應(yīng)用于家庭計(jì)算主機(jī)等產(chǎn)品開(kāi)發(fā);面向具身智能的“深擎”系列,服務(wù)新興智能機(jī)器人領(lǐng)域。
正在研發(fā)的NOVA 500系列將全面升級(jí) GPNPU 架構(gòu),通過(guò)3D堆疊存儲(chǔ)與軟硬協(xié)同設(shè)計(jì),實(shí)現(xiàn)生態(tài)兼容性、性能與能效三重提升;NOVA 600系列將探索光電一體化互聯(lián),構(gòu)建高性價(jià)比算力網(wǎng)絡(luò),力爭(zhēng)將每百萬(wàn) Token 推理成本降低百倍以上,降至分級(jí)成本水平。
未來(lái),云天勵(lì)飛將持續(xù)深耕GPNPU 架構(gòu)迭代與產(chǎn)品創(chuàng)新,聚焦推理算力的性能突破與成本優(yōu)化,攜手產(chǎn)業(yè)鏈伙伴深化生態(tài)合作,構(gòu)建覆蓋“架構(gòu)-芯片-方案-應(yīng)用”的高效 AI 推理生態(tài),助力中國(guó)在第四次工業(yè)革命中搶占全球 AI 算力制高點(diǎn)。
-
半導(dǎo)體
+關(guān)注
關(guān)注
339文章
31185瀏覽量
266253 -
人工智能
+關(guān)注
關(guān)注
1819文章
50284瀏覽量
266787 -
云天勵(lì)飛
+關(guān)注
關(guān)注
0文章
184瀏覽量
12693
原文標(biāo)題:IC China2025 | GPNPU架構(gòu)創(chuàng)新,引領(lǐng)AI算力基建2.0時(shí)代
文章出處:【微信號(hào):IntelliFusion2,微信公眾號(hào):云天勵(lì)飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
巨霖科技亮相2025中國(guó)國(guó)際半導(dǎo)體博覽會(huì)
愛(ài)芯元智亮相2025中國(guó)國(guó)際半導(dǎo)體博覽會(huì)
云天勵(lì)飛亮相2025中國(guó)國(guó)際半導(dǎo)體博覽會(huì)
評(píng)論