2025年,人工智能產(chǎn)業(yè)步入規(guī)模化應(yīng)用深水區(qū),大模型技術(shù)迭代加速,對算力規(guī)模與效率提出更高要求。在這一背景下,9月,中科曙光依托國家先進計算產(chǎn)業(yè)創(chuàng)新中心,聯(lián)合產(chǎn)業(yè)鏈上下游20多家企業(yè)共同推出AI計算開放架構(gòu),推動產(chǎn)業(yè)從封閉走向開放,從單點突破走向系統(tǒng)優(yōu)化。
系統(tǒng)創(chuàng)新:打造開放架構(gòu)的硬件基礎(chǔ)
面對AI算力需求爆發(fā)式增長,曙光率先在硬件架構(gòu)上實現(xiàn)突破。在11月的世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會上,正式發(fā)布全球首款單機柜級640卡超節(jié)點scaleX640。scaleX640采用“一拖二”系統(tǒng)設(shè)計,單機柜實現(xiàn)最大640卡超高速總線互連,通過雙超節(jié)點組成千卡級計算單元。通過正交架構(gòu)、浸沒相變液冷等技術(shù),系統(tǒng)PUE降至1.04,算力密度相比業(yè)界傳統(tǒng)架構(gòu)提升20倍。
在12月的光合組織人工智能創(chuàng)新大會上,曙光進一步推出scaleX萬卡超集群系統(tǒng)。現(xiàn)場展示的系統(tǒng)由16個scaleX640超節(jié)點通過自研scaleFabric網(wǎng)絡(luò)互連而成,依靠RDMA技術(shù)使萬卡集群并行效率得到顯著提升,總算力規(guī)模超過5EFlops,網(wǎng)絡(luò)總體成本降低30%。
在產(chǎn)品創(chuàng)新方面,基于AI計算開放架構(gòu)理念設(shè)計的scaleX超節(jié)點及超集群系統(tǒng),支持多品牌加速卡,兼容主流AI軟件生態(tài),為突破AI算力瓶頸提供新選擇。目前,基于開放架構(gòu)的系列產(chǎn)品已在高校、科研院所、企業(yè)等30多個行業(yè)領(lǐng)域獲得應(yīng)用。
技術(shù)共享:構(gòu)建五層開放能力體系
曙光認識到,真正的開放需要全棧技術(shù)能力的共享。中科曙光協(xié)同產(chǎn)業(yè)鏈伙伴,推進部件級、系統(tǒng)層、基礎(chǔ)設(shè)施層、軟件層和數(shù)據(jù)集等五層技術(shù)能力開放,降級創(chuàng)新門檻與研發(fā)成本,以促進算力普惠與生態(tài)創(chuàng)新。
基礎(chǔ)設(shè)施層面,曙光數(shù)創(chuàng)牽頭編制冷板式液冷系統(tǒng)國家標(biāo)準(zhǔn),推動液冷技術(shù)標(biāo)準(zhǔn)化。軟件層面,曙光推出UPTK通用異構(gòu)編程工具包,通過對異構(gòu)計算運行時接口進行標(biāo)準(zhǔn)化定義,使開發(fā)者無需關(guān)注底層架構(gòu)差異,即可實現(xiàn)“一套代碼、多端部署”。此外,曙光還推出OneScience科學(xué)大模型開發(fā)平臺、DeepAI深算智能引擎等模型軟件的開放共享。截至目前,模型下載量超80萬次,鏡像下載量超200萬次。數(shù)據(jù)層面,中科天機全球率先發(fā)布“高分辨率氣象數(shù)據(jù)共享計劃”,先后共享模式數(shù)據(jù)、歷史數(shù)據(jù)集、融合數(shù)據(jù),實現(xiàn)了從比肩到超越歐洲中期天氣預(yù)報中心(ECMWF)數(shù)據(jù)的跨越式突破,賦能科研教育、新能源、低空經(jīng)濟、農(nóng)業(yè)、交通等行業(yè),并驅(qū)動大模型革新。
產(chǎn)業(yè)協(xié)同:建立開放架構(gòu)聯(lián)合實驗室
在產(chǎn)業(yè)協(xié)作方面,依托光合組織,曙光聯(lián)合20多家上下游企業(yè)共同推進建設(shè)“AI計算開放架構(gòu)聯(lián)合實驗室”,重點解決芯片與基礎(chǔ)軟件協(xié)同、模型-硬件適配優(yōu)化等實際問題,破解“硬件墻”“生態(tài)墻”壁壘。
此外,光合組織人工智能創(chuàng)新大會上還公布了科學(xué)智能聯(lián)合攻關(guān)行動、AI計算開放架構(gòu)聯(lián)合實驗室首批項目組協(xié)同創(chuàng)新計劃,旨在匯聚頂尖力量,針對科學(xué)大模型、多元異構(gòu)算力融合、統(tǒng)一基礎(chǔ)軟件棧、超大規(guī)模集群優(yōu)化等共性關(guān)鍵技術(shù)開展聯(lián)合攻關(guān),將開放協(xié)作深入研發(fā)源頭。
從單點突破到系統(tǒng)優(yōu)化,曙光AI計算開放架構(gòu)的實踐表明,通過產(chǎn)業(yè)鏈協(xié)同破解復(fù)雜技術(shù)難題,是推動中國智算產(chǎn)業(yè)可持續(xù)發(fā)展的可行路徑。這一探索不僅為行業(yè)提供技術(shù)解決方案,更在產(chǎn)業(yè)協(xié)作機制上積累了寶貴經(jīng)驗。
-
AI
+關(guān)注
關(guān)注
91文章
40908瀏覽量
302493 -
人工智能
+關(guān)注
關(guān)注
1819文章
50284瀏覽量
266808 -
中科曙光
+關(guān)注
關(guān)注
5文章
514瀏覽量
18979
原文標(biāo)題:2025答卷|開放,為了更好的計算
文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
2025年曙光存儲以先進存力構(gòu)建開放的算力底座并加速AI進化
2025年中科曙光DeepAI深算智能引擎完成全面進化
3年10億,攜手攻堅:“AI計算開放架構(gòu)聯(lián)合實驗室”協(xié)同創(chuàng)新計劃正式啟動
2025年中科曙光聯(lián)合多家企業(yè)共同推出AI計算開放架構(gòu)
評論