日前,在2025世界人工智能大會(WAIC)期間,商湯大裝置發(fā)布基于DeepLink的異構混合調度方案,將DeepLink深度融入商湯大裝置核心能力體系。該方案針對當前國產(chǎn)算力資源碎片化、異構芯片調度復雜、跨域訓練穩(wěn)定性不足等行業(yè)挑戰(zhàn),全面提升異構集群的協(xié)同效率與運行可靠性,加速國產(chǎn)AI算力從“可用”邁向“好用”,為大模型訓練提供強大而高效的支撐能力。
活動現(xiàn)場,商湯大裝置事業(yè)群產(chǎn)品總經(jīng)理盧國強和上海人工智能實驗室DeepLink高級解決方案專家王峰在WAIC UP魔盒直播間進行解讀,詳細介紹了相關的技術原理與產(chǎn)業(yè)價值。
打通軟硬壁壘
構建AI算力協(xié)同新路徑
DeepLink是由上海人工智能實驗室(上海AI實驗室)推出的人工智能開放計算體系,其目標是搭建在硬件芯片與深度學習軟件框架之間進行適配的橋梁,共建開放的軟硬件適配生態(tài)。DeepLink把AI芯片與基礎框架連接起來,上下游廠商基于DeepLink一次適配即可接入廣泛的算法生態(tài),實現(xiàn)軟硬件解耦,破除生態(tài)壁壘。
當下,大規(guī)模集群建設的同時,仍然存在軟硬件優(yōu)化適配不足、資源利用率低、供需失衡等問題。為更好的推進問題解決,上海AI實驗室率先探索并研發(fā)了DeepLink超大規(guī)??缬蚧煊柤夹g方案,通過訓練加速、異構通信、并行策略等核心技術,打破芯片架構差異帶來的協(xié)同壁壘,重構計算資源調度體系。
今年2月,上海AI實驗室聯(lián)合包括商湯在內的十余家合作伙伴,于上海建成了超大規(guī)??缬蚧煊柤涸停⒁言谇|量級參數(shù)的自研模型上,完成20天不間斷長穩(wěn)訓練,效率達單一芯片集群的90%。此突破成果為快速實現(xiàn)智算中心互聯(lián)、支撐超大模型混訓提供可行技術保障。其中,商湯大裝置為超大規(guī)模的混訓集群提供了算力調度和管理平臺,從而支持了多芯集群的穩(wěn)定運行。
共建異構算力生態(tài)
釋放超大規(guī)模異構算力集群價值
基于DeepLink的異構混合調度方案的發(fā)布,是商湯大裝置與上海AI實驗室長期協(xié)作的重要成果。商湯大裝置與DeepLink的深度融合,具備以下特點:
l多芯片協(xié)同調度:可實現(xiàn)多種國產(chǎn)芯片之間的協(xié)同通信與統(tǒng)一調度,并自動進行并行策略優(yōu)化和負載均衡,真正做到“不同芯片,同一平臺”的協(xié)同工作,釋放異構集群的計算潛力。
l高效混訓,穩(wěn)定可控:顯著提升了異構調度與彈性算力能力,以秒級彈性伸縮、分鐘級故障恢復等,保障大模型訓練過程穩(wěn)定、高效、可控。
l支持主流模型全流程運行:方案兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型,適配稠密模型與MoE架構,支持訓練與推理的高效執(zhí)行。
商湯大裝置事業(yè)群產(chǎn)品總經(jīng)理盧國強表示:“通過基于DeepLink的異構混合調度方案,商湯大裝置將為更多GPU適配、訓練和推理場景擴展、商業(yè)化落地提供更強助力。未來,商湯大裝置將與上海人工智能實驗室持續(xù)深化合作,加快國產(chǎn)AI算力芯片的適配與優(yōu)化,共筑國產(chǎn)AI生態(tài)底座,為智能時代的產(chǎn)業(yè)升級注入源源不斷的技術動能?!?/p>
-
AI
+關注
關注
91文章
40908瀏覽量
302489 -
商湯
+關注
關注
0文章
94瀏覽量
4418 -
大模型
+關注
關注
2文章
3746瀏覽量
5268
原文標題:商湯大裝置發(fā)布基于DeepLink的異構混合調度方案,加速國產(chǎn)算力從“可用”邁向“好用”
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
天數(shù)智芯助力DeepLink異構算力訓推一體化升級
壁仞科技與上海人工智能實驗室合作推出全新DeepLink混推方案
商湯大裝置SenseCore原生AI云平臺榮獲信通院5A卓越級認證
FPGA+GPU異構混合部署方案設計
商湯科技正式發(fā)布AI辦公智能體小浣熊3.0
商湯大裝置與綠盟科技達成深度合作
商湯科技聯(lián)合華為昇騰實現(xiàn)超節(jié)點適配多項創(chuàng)新
商湯大裝置重磅發(fā)布多項標志性成果
商湯大裝置算力Mall重磅發(fā)布
商湯大裝置聯(lián)合發(fā)布臨港AIDC算電協(xié)同平臺
商湯科技發(fā)布悟能具身智能平臺
商湯大裝置賦能WAIC 2025主題曲首發(fā)
爆款應用背后的商湯大裝置
潤和軟件發(fā)布StackRUNS異構分布式推理框架
商湯大裝置發(fā)布基于DeepLink的異構混合調度方案
評論