chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

萬億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大模型

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2025-07-22 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2025年7月21日 /美通社/ --浪潮信息宣布元腦企智一體機(jī)已率先完成對Kimi K2 萬億參數(shù)大模型的適配支持,并實(shí)現(xiàn)單用戶70 tokens/s的流暢輸出速度,為企業(yè)客戶高效部署應(yīng)用大模型提供高處理性能和完善的軟件工具平臺(tái)支持。


Kimi K2是月之暗面推出的開源萬億參數(shù)大模型,創(chuàng)新使用了MuonClip優(yōu)化器進(jìn)行訓(xùn)練,大幅提升了模型的學(xué)習(xí)效率。K2在代碼生成、數(shù)學(xué)推理、Agent多步驟任務(wù)上展現(xiàn)出領(lǐng)先能力,評測指標(biāo)達(dá)到業(yè)界領(lǐng)先水平。自發(fā)布以來,K2在開發(fā)者和研究社區(qū)引起廣泛關(guān)注,迅速獲得在編碼輔助和Agent驅(qū)動(dòng)自動(dòng)化任務(wù)中的部署應(yīng)用。

Kimi K2的模型總參數(shù)量達(dá)1萬億,激活參數(shù)為320億。K2使用混合專家(MoE)模型結(jié)構(gòu),較DeepSeek V3采用了更大的參數(shù)量和更多的專家數(shù)。K2模型1萬億的參數(shù)量對AI計(jì)算系統(tǒng)提出至少1TB的顯存容量需求,384個(gè)路由專家所帶來的專家負(fù)載不均衡性對推理速度有很大影響。目前業(yè)界可公開訪問的K2 API的輸出速度一般低于20 tokens/s,這樣較低的性能對于編程或Agent類場景很不友好,會(huì)嚴(yán)重影響用戶體驗(yàn)。Kimi K2憑借其為智能體任務(wù)設(shè)計(jì)的架構(gòu)和優(yōu)秀的智能體驗(yàn),展現(xiàn)出巨大的應(yīng)用潛力,但提升推理速度和輸出穩(wěn)定性是其成為可信賴的生產(chǎn)力工具需要解決的核心挑戰(zhàn)。

元腦企智一體機(jī)采用元腦服務(wù)器NF5688G7作為算力底座,其搭載FP8計(jì)算引擎,配備1128GB HBM3e高速顯存,單臺(tái)服務(wù)器即可支持K2 萬億參數(shù)全量模型部署。NF5688G7服務(wù)器具備900GB/s的GPU P2P帶寬,為Kimi K2提供了專家間高速并行通信,最大化并行效率。該服務(wù)器可支持3200Gbps的RDMA擴(kuò)展網(wǎng)絡(luò),為預(yù)填充-解碼分離部署和大規(guī)模專家并行預(yù)留了充足的擴(kuò)展空間。

浪潮信息已完成元腦企智一體機(jī)對K2的適配,支持64K上下文長度和多路用戶實(shí)時(shí)并發(fā)訪問。基于SGLang推理框架,通過減少M(fèi)oE對齊塊大小內(nèi)核的小批量模式開銷和fused_moe的內(nèi)存消耗,并復(fù)用deepGEMM等高效算子,實(shí)現(xiàn)單用戶并發(fā)下輸出速度超過70 tokens/s,25用戶并發(fā)時(shí)每用戶輸出速度超過25 tokens/s。優(yōu)化后的計(jì)算性能可保證用戶在進(jìn)行復(fù)雜的代碼生成、長文本書寫或Agent調(diào)用時(shí),能夠獲得流暢、低延遲的交互體驗(yàn)。

wKgZO2h-PNGAL-wnAAF67yjafGk421.jpg


SGLang啟動(dòng)K2推理服務(wù),用戶交互時(shí)的解碼速度

元腦企智一體機(jī)提供了元腦企智(EPAI)平臺(tái)與K2大模型的無縫集成,為企業(yè)用戶提供了一套軟硬件協(xié)同優(yōu)化、開箱即用的端到端大模型私有化部署解決方案。通過元腦企智平臺(tái),企業(yè)可利用低代碼、可視化界面,便捷地進(jìn)行數(shù)據(jù)準(zhǔn)備、模型微調(diào)、知識(shí)檢索(RAG)和智能體(Agent)構(gòu)建。

元腦企智一體機(jī)已成功部署于金融、制造、能源、醫(yī)療等多個(gè)關(guān)鍵行業(yè),幫助企業(yè)快速、安全、經(jīng)濟(jì)地構(gòu)建專屬大模型應(yīng)用,加速產(chǎn)業(yè)智能化轉(zhuǎn)型步伐。

浪潮信息是全球領(lǐng)先的IT基礎(chǔ)設(shè)施產(chǎn)品、方案和服務(wù)提供商,通過發(fā)展新一代以系統(tǒng)為核心的計(jì)算架構(gòu),打造開放、多元、綠色的元腦智算產(chǎn)品和方案。浪潮信息致力于AI計(jì)算平臺(tái)、資源平臺(tái)和算法平臺(tái)的研發(fā)創(chuàng)新,并通過元腦生態(tài)攜手領(lǐng)先伙伴,加速人工智能的創(chuàng)新和應(yīng)用落地。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3746

    瀏覽量

    5268
  • Kimi
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    336
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Nullmax智能前視一體機(jī)方案獲量產(chǎn)定點(diǎn)

    Nullmax 攜手全球流汽車零部件供應(yīng)商,將為國內(nèi)某頭部車提供基于愛芯智 M57 芯片打造的 MaxDrive Basic 智能前視一體機(jī)方案,兼具高性能、快部署及高性價(jià)比優(yōu)勢
    的頭像 發(fā)表于 04-09 16:30 ?341次閱讀

    觸拓(CHUTO)戶外廣告一體機(jī),無懼酷暑全天候在線# 觸拓 #戶外觸摸一體機(jī)

    一體機(jī)
    深圳市觸拓科技有限公司
    發(fā)布于 :2026年04月08日 12:20:40

    OBOO鷗柏交互式查詢一體機(jī):展館里的智能信息導(dǎo)航站

    一體機(jī)
    鷗柏科技
    發(fā)布于 :2025年12月30日 19:04:58

    潤和軟件入選大模型一體機(jī)產(chǎn)業(yè)圖譜

    近日,由中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟與中國信息通信研究院聯(lián)合編制的《大模型一體機(jī)產(chǎn)業(yè)圖譜》正式發(fā)布。該圖譜系統(tǒng)梳理并收錄了國內(nèi)大模型一體機(jī)產(chǎn)業(yè)鏈上下游70余家代表性企業(yè),全面呈現(xiàn)我國大
    的頭像 發(fā)表于 12-10 17:56 ?1657次閱讀
    潤和軟件入選大<b class='flag-5'>模型</b><b class='flag-5'>一體機(jī)</b>產(chǎn)業(yè)圖譜

    澎峰科技最新推出Deep Fusion DF35智算一體機(jī)

    在人工智能加速落地的今天,企業(yè)部署大模型面臨成本、性能與數(shù)據(jù)安全的三重挑戰(zhàn)。澎峰科技最新推出的Deep Fusion DF35智算一體機(jī),以29000起的突破性定價(jià),將Qwen3-Next 80B FP16精度
    的頭像 發(fā)表于 10-13 16:51 ?1924次閱讀
    澎峰科技最新推出Deep Fusion DF35智算<b class='flag-5'>一體機(jī)</b>

    遠(yuǎn)景達(dá)掃碼模組適用于觸摸一體機(jī)終端的型號(hào)

    隨著數(shù)字化交互場景的拓展,遠(yuǎn)景達(dá)掃碼模組憑借其高效識(shí)別速度、多設(shè)備適配能力及穩(wěn)定運(yùn)行表現(xiàn),成為觸摸一體機(jī)終端的關(guān)鍵配置組件。本文結(jié)合技術(shù)參數(shù)與實(shí)際應(yīng)用案例,整理其適用于觸摸一體機(jī)的主流型號(hào)及技術(shù)特點(diǎn)
    的頭像 發(fā)表于 08-11 16:12 ?950次閱讀
    遠(yuǎn)景達(dá)掃碼模組適用于觸摸<b class='flag-5'>一體機(jī)</b>終端的型號(hào)

    浪潮信息發(fā)布&quot;SD200&quot;超節(jié)點(diǎn),面向萬億參數(shù)模型創(chuàng)新設(shè)計(jì)

    擴(kuò)展支持64路本土GPU芯片。SD200可實(shí)現(xiàn)單機(jī)內(nèi)運(yùn)行超萬億參數(shù)模型,并
    的頭像 發(fā)表于 08-08 22:17 ?768次閱讀
    浪潮信息發(fā)布&quot;<b class='flag-5'>元</b><b class='flag-5'>腦</b>SD200&quot;超節(jié)點(diǎn),面向<b class='flag-5'>萬億</b><b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    ?Groq LPU 如何讓萬億參數(shù)模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何讓萬億參數(shù)模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技? 最近,Moonshot AI 的千億參數(shù)
    的頭像 發(fā)表于 08-07 10:01 ?1298次閱讀

    硅基流動(dòng)攜手沐曦首發(fā)基于曦云的Kimi K2推理服務(wù)

    今天,硅基流動(dòng)聯(lián)合沐曦集成電路(上海)股份有限公司(簡稱“沐曦”),全球首發(fā)基于沐曦曦云 C550 集群的月之暗面 Kimi-K2模型商業(yè)化服務(wù)部署。該服務(wù)運(yùn)行于匯天網(wǎng)絡(luò)科技有限公司(簡稱“匯
    的頭像 發(fā)表于 07-23 17:33 ?2111次閱讀

    一體機(jī)主板步入大存儲(chǔ)時(shí)代,存儲(chǔ)突圍到性能質(zhì)變

    ,我們發(fā)現(xiàn)了客戶新的需求。一體機(jī)電腦場景在企業(yè)辦公多任務(wù)處理中,多開辦公軟件、數(shù)據(jù)報(bào)表處理卡頓,需要更多內(nèi)存支持多應(yīng)用同時(shí)流暢運(yùn)行。場景二專業(yè)設(shè)計(jì)與渲染、4K視頻剪
    的頭像 發(fā)表于 06-19 10:47 ?655次閱讀
    <b class='flag-5'>一體機(jī)</b>主板步入大存儲(chǔ)時(shí)代,存儲(chǔ)突圍到性能質(zhì)變

    開普云「開悟智核」:極致性價(jià)比的智能一體機(jī),破局大模型應(yīng)用難題

    當(dāng)下,AI一體機(jī)憑借開箱即用、數(shù)據(jù)可控等優(yōu)勢,成為行業(yè)大模型落地的重要載體之。然而實(shí)際應(yīng)用時(shí),用戶卻面臨諸多問題:算力成本與性能難以平衡;非滿血版模型存在“幻覺”、精度低等問題;由于
    的頭像 發(fā)表于 06-09 10:34 ?1289次閱讀
    開普云「開悟智核」:極致性價(jià)比的智能<b class='flag-5'>體</b><b class='flag-5'>一體機(jī)</b>,破局大<b class='flag-5'>模型</b>應(yīng)用難題

    松下4K手持式攝錄一體機(jī)AJ-UPX380介紹

    2025年第季度,松下正式推出4K手持式攝錄一體機(jī)AJ-UPX380,旨在為廣播及流媒體專業(yè)人士提供更高品質(zhì)的視頻制作解決方案。作為UPX系列專業(yè)攝錄一體機(jī)的新成員,AJ-UPX38
    的頭像 發(fā)表于 05-30 15:54 ?1875次閱讀