chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為發(fā)布AI容器技術Flex:ai,算力平均利用率提升30%

Carol Li ? 來源:電子發(fā)燒友網 ? 作者:李彎彎 ? 2025-11-26 08:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網綜合報道 2025年11月21日,在上海舉辦的“2025 AI容器應用落地與發(fā)展論壇”上,華為正式發(fā)布并開源了創(chuàng)新AI容器技術Flex:ai,為解決算力資源利用難題帶來了全新的思路和解決方案。

當前,AI產業(yè)正處于高速發(fā)展的黃金時期,海量算力需求如潮水般涌來。然而,算力資源利用率偏低的問題卻成為了產業(yè)發(fā)展的關鍵桎梏。具體表現(xiàn)為,小模型任務常常獨占整卡,導致大量資源閑置;大模型任務又因單機算力不足而難以支撐;更有大量缺乏GPU/NPU的通用服務器處于算力“休眠”狀態(tài)。這種供需錯配的現(xiàn)象,造成了嚴重的資源浪費,使得企業(yè)在算力投入上既面臨高昂的成本,又無法獲得理想的算力使用效率。

Flex:ai是基于Kubernetes容器編排平臺構建的XPU池化與調度軟件,它通過三大核心技術突破,實現(xiàn)了算力資源的精細化管理。

在算力資源切分方面,華為與上海交通大學聯(lián)合研發(fā)的XPU池化框架發(fā)揮了關鍵作用。該框架能夠將單張GPU/NPU算力卡精準切分至10%的虛擬單元,實現(xiàn)了單卡同時承載多個AI工作負載。這種一卡變多卡的技術,使得小模型訓推場景下的整體算力平均利用率提升了30%,大大提高了單卡的服務能力。

跨節(jié)點算力資源聚合技術則是華為與廈門大學合作的成果。通過跨節(jié)點拉遠虛擬化技術,將集群內各節(jié)點的空閑XPU算力聚合形成共享算力池。這一技術不僅為大模型任務提供了充足的資源支撐,還讓通用服務器能夠通過高速網絡轉發(fā)AI工作負載,實現(xiàn)了通用算力與智能算力資源的融合,打破了資源孤島。

多級智能調度技術由華為與西安交通大學共同打造。Hi Scheduler智能調度器能夠自動感知集群負載與資源狀態(tài),結合AI工作負載的優(yōu)先級、算力需求等多維參數(shù),對本地及遠端的虛擬化GPU、NPU資源進行全局最優(yōu)調度。即使在負載頻繁波動的場景下,也能保障AI工作負載的平穩(wěn)運行,讓每一份算力都物盡其用。

Flex:ai對標英偉達旗下Run:ai公司的核心技術,但具有獨特的優(yōu)勢。Run:ai主要服務于英偉達GPU生態(tài),而Flex:ai沒有生態(tài)限制,英偉達的GPU和華為昇騰NPU等算力卡都可以使用。它通過軟件創(chuàng)新,實現(xiàn)了對英偉達、昇騰及其他第三方算力資源的統(tǒng)一管理和高效利用,有效屏蔽了不同算力硬件之間的差異,為AI應用提供了更高效穩(wěn)定的資源支撐。

華為將Flex:ai開源在魔擎社區(qū)中,并與此前開源的多款AI工具共同組成完整的ModelEngine開源生態(tài)。

Flex:ai的能力已在真實產業(yè)場景中得到驗證。瑞金醫(yī)院與華為聯(lián)合打造的多模態(tài)病理大模型“RuiPath”,基于Flex:ai的技術支撐,將XPU資源可用度從40%提升至70%,破解了有限算力下的大規(guī)模訓練難題。隨著AI與容器技術的深度融合,未來的應用開發(fā)將更加智能化、自動化。Flex:ai的發(fā)布標志著AI基礎設施競爭正從“拼硬件”轉向“拼系統(tǒng)”,當軟件能真正駕馭硬件,當開源平臺打破廠商藩籬,AI發(fā)展的主動權才真正回到應用者手中。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    218

    文章

    36162

    瀏覽量

    262619
  • 算力
    +關注

    關注

    2

    文章

    1657

    瀏覽量

    16831
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邊緣AI臨界點:深度解析176TOPS香橙派AI Station的產業(yè)價值

    310P芯片的底層架構,深度剖析這款產品的技術細節(jié)、門檻及其在實際產業(yè)落地中的真實價值。 一、176TOPS的產業(yè)門檻:為何這是邊緣
    發(fā)表于 03-10 14:19

    GPU 利用率30%?這款開源智云平臺讓不浪費 1%

    作為 AI 開發(fā)者,你是否早已受夠這些困境:花數(shù)百萬采購的 GPU 集群,利用率常年低于 30%,閑置如同燒錢;跨 CPU/GPU/NP
    的頭像 發(fā)表于 01-26 14:20 ?268次閱讀

    AI送上太空,是終極方案還是瘋狂幻想?評論區(qū)說出你的陣營!

    AI
    江蘇易安聯(lián)
    發(fā)布于 :2026年01月06日 09:43:34

    亞太地區(qū)AI數(shù)據(jù)中心可持續(xù)發(fā)展的實現(xiàn)路徑與未來演進

    2024年英偉達提出了“AI工廠”的概念,將、存儲、網絡、能源管理與冷卻系統(tǒng)統(tǒng)一設計為一個完整生態(tài),強調“復用”和“資源共享”,通過
    的頭像 發(fā)表于 12-24 14:49 ?700次閱讀

    MWC Doha 2025|美格智能全新發(fā)布60 Tops AI、支持Linux系統(tǒng)的SNM982高AI模組

    11月25日,在MWCDoha展會期間,美格智能全新發(fā)布基于高通QCS8650平臺研發(fā)設計的SNM982高AI模組。搭載Linux5.15系統(tǒng),
    的頭像 發(fā)表于 11-25 16:34 ?2387次閱讀
    MWC Doha 2025|美格智能全新<b class='flag-5'>發(fā)布</b>60 Tops <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系統(tǒng)的SNM982高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b>模組

    華為發(fā)布并開源創(chuàng)新AI容器技術Flex:ai

    11月21日,2025AI容器應用落地與發(fā)展論壇在上海舉行。華為公司副總裁、數(shù)據(jù)存儲產品線總裁周躍峰博士在論壇上正式發(fā)布AI
    的頭像 發(fā)表于 11-25 15:34 ?763次閱讀

    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構計算效能

    前言AI已成為數(shù)字經濟時代的核心生產,但全球AI產業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計,行業(yè)
    的頭像 發(fā)表于 11-21 16:05 ?1283次閱讀
    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構<b class='flag-5'>算</b><b class='flag-5'>力</b>計算效能

    今日看點:消息稱已有模組企業(yè)調整原定產品規(guī)劃;華為發(fā)布 AI 領域突破性技術

    提升 GPU(圖形處理器)和 NPU(神經網絡處理器)等資源的利用率。目前,行業(yè)內資源的
    發(fā)表于 11-17 10:47 ?1329次閱讀

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術的不斷
    的頭像 發(fā)表于 09-19 15:26 ?2028次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術的不斷
    的頭像 發(fā)表于 09-19 15:25 ?1005次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    建立的基礎: ①支柱②數(shù)據(jù)支柱③計算支柱 1)AI
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升還是智力

    持續(xù)發(fā)展體現(xiàn)在: 1、收益遞減 大模型的基礎的需要極大的,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關的資源。 收益遞減體現(xiàn)在: ①模型大小 ②訓練數(shù)據(jù)量 ③訓練算法的優(yōu)化 2
    發(fā)表于 09-14 14:04

    睿海光電800G光模塊助力全球AI基建升級

    18%。 智中心建設:與國內AI獨角獸合作,提供支持液冷散熱的800G模塊集群,助力其大模型訓練效率提升30%。 邊緣計算網絡:在北美某5G運營商邊緣節(jié)點中,基于DML方案的SR8模
    發(fā)表于 08-13 19:05

    一文看懂AI集群

    ,可以給AI浪潮提供源源不斷的動力。那么,AI集群,到底是由哪些東西組成的呢?它為什么能夠提供澎湃的
    的頭像 發(fā)表于 07-23 12:18 ?1883次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    拼版怎么拼好,板廠經常說利用率太低,多收費用?

    做板的時候,板廠經常說我拼版利用率太低,要多收取費用,哪位大神知道怎么利用率
    發(fā)表于 05-14 13:42