chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中科曙光scaleX萬(wàn)卡超集群重塑超大規(guī)模算力基礎(chǔ)設(shè)施

中科曙光 ? 來(lái)源:中科曙光 ? 2026-01-30 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在“人工智能+”行動(dòng)深入推進(jìn)的當(dāng)下,算力基礎(chǔ)設(shè)施已成為國(guó)家戰(zhàn)略競(jìng)爭(zhēng)力的核心,而超大規(guī)模集群的運(yùn)維管控難題卻日益凸顯。中科曙光scaleX萬(wàn)卡超集群打造的智能管理體系,正以“能管住-管得穩(wěn)-用得好”的進(jìn)階邏輯,重塑超大規(guī)模算力基礎(chǔ)設(shè)施的運(yùn)行范式,讓萬(wàn)級(jí)節(jié)點(diǎn)協(xié)同從行業(yè)痛點(diǎn)變?yōu)楦咝СB(tài)。

集群管理的基石,始于數(shù)字孿生構(gòu)建的“鏡像世界”。曙光將物理集群的業(yè)務(wù)、節(jié)點(diǎn)、網(wǎng)絡(luò)、供配電等全鏈路映射至數(shù)字空間,實(shí)現(xiàn)全域透明可視與精準(zhǔn)管控。在此基礎(chǔ)上,智能運(yùn)維助手以“實(shí)時(shí)分析-智能診斷-根因定位-故障恢復(fù)”四步流程,為運(yùn)維人員提供一體化視圖,讓集群狀態(tài)“看得見(jiàn)、摸得著”。

三層閉環(huán)架構(gòu)的智能化運(yùn)維平臺(tái),推動(dòng)集群從“可觀測(cè)”升級(jí)為“可決策、可執(zhí)行”。

在數(shù)據(jù)可觀測(cè)層,全量采集指標(biāo)與日志等數(shù)據(jù),通過(guò)CMDB清晰呈現(xiàn)資產(chǎn)拓?fù)?;在知識(shí)與算法層,結(jié)構(gòu)化沉淀專家經(jīng)驗(yàn),以“規(guī)則+數(shù)據(jù)”雙驅(qū)動(dòng)實(shí)現(xiàn)精準(zhǔn)異常檢測(cè);在場(chǎng)景自動(dòng)化層,針對(duì)常見(jiàn)和關(guān)鍵場(chǎng)景,定義標(biāo)準(zhǔn)化流程,通過(guò)自動(dòng)化工具實(shí)現(xiàn)故障自愈與復(fù)盤。

這套體系最終將集群長(zhǎng)期可用性鎖定在99.99%,意味著30天內(nèi)不可用時(shí)間不足4分鐘,將“故障”變成系統(tǒng)自動(dòng)化處理的日常狀態(tài)。

穩(wěn)定性是底線,算力效率是核心競(jìng)爭(zhēng)力。scaleX萬(wàn)卡超集群已實(shí)現(xiàn)單集群支撐15000+節(jié)點(diǎn)、服務(wù)12萬(wàn)+用戶,每秒并發(fā)調(diào)度萬(wàn)級(jí)任務(wù),背后離不開(kāi)三大關(guān)鍵調(diào)度能力。數(shù)據(jù)親和性算法優(yōu)先“讓任務(wù)找數(shù)據(jù)”,規(guī)避冗余遷移;智能調(diào)度引擎動(dòng)態(tài)匹配任務(wù)與資源,平衡優(yōu)先級(jí)、公平性與成本;多元融合調(diào)度則兼容HPC、AI、云原生任務(wù),兼顧吞吐與隔離,配合存算傳緊耦合優(yōu)化,使AI加速卡利用率提升55%。

值得關(guān)注的是,這套管理體系與硬件創(chuàng)新深度協(xié)同。依托單機(jī)柜640卡的超高密度設(shè)計(jì)、浸沒(méi)相變液冷技術(shù)及自主研發(fā)的高速網(wǎng)絡(luò)scaleFabric,管理系統(tǒng)可充分釋放5EFlops總算力,同時(shí)將PUE控制在1.04,實(shí)現(xiàn)高效能與低能耗的統(tǒng)一。作為“AI計(jì)算開(kāi)放架構(gòu)”成果,scaleX萬(wàn)卡超集群兼容多品牌加速卡,適配400+主流大模型,覆蓋大模型訓(xùn)練、金融風(fēng)控等多元場(chǎng)景。

曙光用技術(shù)實(shí)踐證明,超大規(guī)模智算集群的終極目標(biāo),不是節(jié)點(diǎn)數(shù)量的堆砌,而是構(gòu)建自感知、自診斷、自修復(fù)、自優(yōu)化的智能算力基礎(chǔ)設(shè)施,期待與更多產(chǎn)業(yè)伙伴攜手,突破算力瓶頸,共建中國(guó)AI計(jì)算開(kāi)放的新生態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 集群
    +關(guān)注

    關(guān)注

    0

    文章

    151

    瀏覽量

    17684
  • 中科曙光
    +關(guān)注

    關(guān)注

    5

    文章

    514

    瀏覽量

    18979
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1657

    瀏覽量

    16831

原文標(biāo)題:特寫(xiě)|萬(wàn)卡集群:管得好,才能算得強(qiáng)

文章出處:【微信號(hào):sugoncn,微信公眾號(hào):中科曙光】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中科曙光6萬(wàn)AI4S計(jì)算集群:用 "智融合" 重塑科學(xué)計(jì)算敘事

    超大規(guī)模集群,絕非簡(jiǎn)單的擴(kuò)容,是我國(guó)在 “人工智能 + 科學(xué)技術(shù)” 這一全球戰(zhàn)略制高點(diǎn)
    發(fā)表于 04-16 15:59 ?5091次閱讀

    中科曙光scaleX40節(jié)點(diǎn)革新AI存協(xié)同

    在當(dāng)前時(shí)代,以Token(詞元)為代表的需求已成為行業(yè)核心剛需,而穩(wěn)定、高效的運(yùn)轉(zhuǎn),
    的頭像 發(fā)表于 03-28 15:46 ?1610次閱讀

    中科曙光萬(wàn)集群刷新414.7億原子DFT精度模擬紀(jì)錄

    近日,中科曙光scaleX萬(wàn)集群聯(lián)合龍訊曠騰Ma
    的頭像 發(fā)表于 03-20 15:05 ?424次閱讀

    摩爾線程與中國(guó)移動(dòng)研究院等,聯(lián)合發(fā)布128高密節(jié)點(diǎn)參考設(shè)計(jì),定義超大規(guī)模底座新標(biāo)準(zhǔn)

    隨著全球智集群規(guī)模跨入“萬(wàn)時(shí)代”并向“十萬(wàn)”巔峰演進(jìn),傳統(tǒng)單機(jī)八
    發(fā)表于 03-17 08:40 ?843次閱讀

    中科曙光scaleX萬(wàn)集群筑牢超大規(guī)模硬核底座

    3月5日,2026年《政府工作報(bào)告》為產(chǎn)業(yè)劃下重點(diǎn):深化拓展“人工智能+”,實(shí)施超大規(guī)模集群、
    的頭像 發(fā)表于 03-10 14:35 ?774次閱讀

    中科曙光scaleX萬(wàn)集群專項(xiàng)測(cè)試任務(wù)已突破300項(xiàng)

    國(guó)家互聯(lián)網(wǎng)核心節(jié)點(diǎn)上線試運(yùn)行并啟動(dòng)邀測(cè)計(jì)劃以來(lái),一場(chǎng)依托國(guó)產(chǎn)“萬(wàn)”AI的創(chuàng)新驗(yàn)證正全面
    的頭像 發(fā)表于 03-06 16:16 ?894次閱讀

    中科曙光3套scaleX萬(wàn)集群落地國(guó)家互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)

    2月5日,由中科曙光提供的3套萬(wàn)集群系統(tǒng)在國(guó)家
    的頭像 發(fā)表于 02-09 10:32 ?683次閱讀

    中科曙光scaleX萬(wàn)集群背后的持續(xù)創(chuàng)新

    集群的發(fā)展浪潮正以超乎想象的速度襲來(lái),未來(lái)五年,十萬(wàn)級(jí)的集群將成為標(biāo)配。但一個(gè)核心挑戰(zhàn)
    的頭像 發(fā)表于 01-19 14:49 ?762次閱讀

    中科曙光scaleX萬(wàn)集群亮相中國(guó)制造“十四五”成就展

    12月29日,由中國(guó)國(guó)家博物館與工業(yè)和信息化部新聞宣傳中心聯(lián)合主辦的“筑基強(qiáng)國(guó)路—中國(guó)制造‘十四五’成就展”正式開(kāi)幕。經(jīng)專家評(píng)審委員會(huì)嚴(yán)格遴選,中科曙光scaleX萬(wàn)
    的頭像 發(fā)表于 12-30 15:49 ?641次閱讀

    燧原科技榮獲2025年超大規(guī)模集群創(chuàng)新應(yīng)用實(shí)踐成果

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通院”)成功召開(kāi)2025AI云產(chǎn)業(yè)發(fā)展大會(huì)。中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)理事長(zhǎng)聞庫(kù)、中國(guó)信通院副院長(zhǎng)王志勤出席會(huì)議并致辭。中國(guó)工程院院士鄭緯民作主旨報(bào)告。會(huì)議期間,發(fā)布了超大規(guī)模集群創(chuàng)新應(yīng)用實(shí)
    的頭像 發(fā)表于 12-29 09:59 ?501次閱讀
    燧原科技榮獲2025年<b class='flag-5'>超大規(guī)模</b>智<b class='flag-5'>算</b><b class='flag-5'>集群</b>創(chuàng)新應(yīng)用實(shí)踐成果

    總算5EFLOPS!可擴(kuò)展至10萬(wàn),國(guó)產(chǎn)集群部分性能超越NVL576

    中國(guó)在高性能計(jì)算領(lǐng)域的又一次重大突破。 ? 中科曙光高級(jí)副總裁李斌表示,面對(duì)人工智能基礎(chǔ)設(shè)施對(duì)性能、效率、可靠性、可擴(kuò)展性等方面的極致需求,ScaleX
    的頭像 發(fā)表于 12-24 09:24 ?4986次閱讀

    部分能力超越2027年NVL576,中科曙光發(fā)布scaleX萬(wàn)集群

    系統(tǒng)首次以真機(jī)形式亮相。 “scaleX萬(wàn)集群,是曙光發(fā)揮大型計(jì)算機(jī)系統(tǒng)研制經(jīng)驗(yàn)優(yōu)勢(shì),面向萬(wàn)
    發(fā)表于 12-18 18:30 ?1161次閱讀
    部分能力超越2027年NVL576,<b class='flag-5'>中科</b><b class='flag-5'>曙光</b>發(fā)布<b class='flag-5'>scaleX</b><b class='flag-5'>萬(wàn)</b><b class='flag-5'>卡</b><b class='flag-5'>超</b><b class='flag-5'>集群</b>

    中科曙光scaleX640節(jié)點(diǎn)亮相2025世界計(jì)算大會(huì)

    11月20日,在以“計(jì)算萬(wàn)物,湘約未來(lái)——智驅(qū)動(dòng)新質(zhì)生產(chǎn)”為主題的長(zhǎng)沙世界計(jì)算大會(huì)上,中科曙光sc
    的頭像 發(fā)表于 11-21 17:30 ?1152次閱讀

    640節(jié)點(diǎn)問(wèn)世:國(guó)產(chǎn)實(shí)現(xiàn)關(guān)鍵一躍

    單機(jī)柜級(jí)640節(jié)點(diǎn)ScaleX640,為如火如荼的競(jìng)爭(zhēng)注入了新的變量。 ? 這款被命名為Scal
    的頭像 發(fā)表于 11-11 09:26 ?2459次閱讀

    AI原生架構(gòu)升級(jí):RAKsmart服務(wù)器在超大規(guī)模模型訓(xùn)練中的突破

    近年來(lái),隨著千億級(jí)參數(shù)模型的崛起,AI訓(xùn)練對(duì)的需求呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。傳統(tǒng)服務(wù)器架構(gòu)在應(yīng)對(duì)分布式訓(xùn)練、高并發(fā)計(jì)算和顯存優(yōu)化等場(chǎng)景時(shí)逐漸顯露瓶頸。而RAKsmart為超大規(guī)模模型訓(xùn)練提供了全新的
    的頭像 發(fā)表于 04-24 09:27 ?891次閱讀