chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準(zhǔn)、穩(wěn)全面發(fā)展

沐曦MetaX ? 來(lái)源:沐曦MetaX ? 2023-06-20 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2023年6月17日,由紹興市人民政府主辦的 2023 中國(guó)(紹興)集成電路產(chǎn)業(yè)峰會(huì)隆重舉行,“ChatGPT風(fēng)向下的集成電路新趨勢(shì)”論壇及集成電路項(xiàng)目路演也同期舉行,為百余位產(chǎn)業(yè)從業(yè)者提供深入了解行業(yè)發(fā)展動(dòng)態(tài)和交流合作的機(jī)會(huì)。沐曦首席解決方案架構(gòu)師付軒受邀參會(huì)并發(fā)表演講。

付軒在“ChatGPT風(fēng)向下的集成電路新趨勢(shì)”論壇中發(fā)表主題為《蹄急而步穩(wěn):ChatGPT與高性能GPU戰(zhàn)略概覽》的主題演講,分析了ChatGPT的應(yīng)用特點(diǎn)及軟硬件需求,指出以ChatGPT為代表的大模型發(fā)展需要大的通用算力與矩陣算力作為支撐,并且作為基于GPU生態(tài)發(fā)展起來(lái)的模型,對(duì)GPU顯存、GPU間互聯(lián)通信、通用GPU編程框架及軟件生態(tài)等多方面均有很高的要求。因此,作為算力底座的GPU不僅需要算得快,還要算得準(zhǔn)、算得穩(wěn),不僅要提供高效計(jì)算,還要保證結(jié)果準(zhǔn)確,并且靈活可靠。

對(duì)此,可以采取以下策略:首先,針對(duì)ChatGPT大模型訓(xùn)練,大集群3D并行是一種有效方式,能夠集張量并行、流水并行和數(shù)據(jù)并行為一體,與只有數(shù)據(jù)并行的小模型相比,是一種完全不同的復(fù)雜并行結(jié)構(gòu)。在大模型推理方面,推理精度要求高,延遲容忍度高,帶來(lái)越來(lái)越多的云端高算力推理需求,更適合在數(shù)據(jù)中心中運(yùn)行,也符合“東數(shù)西算”的戰(zhàn)略規(guī)劃。同時(shí),基于高性能GPU生態(tài)的算法創(chuàng)新實(shí)現(xiàn)算子提速并極大減少顯存消耗,通用算力與矩陣算力的高效協(xié)作實(shí)現(xiàn)算子融合加速,穩(wěn)定可靠的千卡大集群、GPU軟硬件結(jié)合、“訓(xùn)推一體”優(yōu)化保障訓(xùn)練和推理的精度,均是能夠使大模型計(jì)算實(shí)現(xiàn)快、準(zhǔn)、穩(wěn)的可行性措施。

沐曦作為一家提供全棧GPU芯片及解決方案的企業(yè),其旗艦產(chǎn)品曦云C500系列通用GPU采用沐曦自研IP,能夠提供強(qiáng)大的多精度混合算力,同時(shí)配以大容量存儲(chǔ)和新一代高速IO接口及多卡互聯(lián)技術(shù),不論在矩陣算力、通用算力還是顯存規(guī)格方面均可全面支持大模型推理和訓(xùn)練,并廣泛應(yīng)用于人工智能、數(shù)據(jù)中心以及教育和科研等多種場(chǎng)景。同時(shí),沐曦自主研發(fā)的MXMACA軟件棧能夠全面兼容主流GPU生態(tài),為客戶提供軟硬件一體的應(yīng)用解決方案。目前,曦云MXC500芯片已于2023年6月13日成功回片點(diǎn)亮,預(yù)計(jì)將于今年年底實(shí)現(xiàn)量產(chǎn)。

總的來(lái)說(shuō),ChatGPT對(duì)于硬件和軟件均有需求,我們要更好地利用現(xiàn)有的GPU生態(tài),發(fā)揮通用算力與矩陣算力的全面優(yōu)勢(shì),做好算子的算法創(chuàng)新和加速。同時(shí),在做千卡大集群時(shí),單節(jié)點(diǎn)內(nèi)的多GPU互聯(lián)也是必須的。此外,當(dāng)前各種大模型創(chuàng)新層出不窮,我們要把各種各樣的大模型遷移到曦云C500上來(lái),因此生態(tài)兼容也至關(guān)重要。做到以上幾點(diǎn),大模型就能夠更好地在國(guó)內(nèi)實(shí)現(xiàn)高效迭代與應(yīng)用落地。

關(guān)于沐曦

沐曦致力于為異構(gòu)計(jì)算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓(xùn)練及通用計(jì)算,以及MXG系列GPU(曦彩)用于圖形渲染,滿足數(shù)據(jù)中心對(duì)“高能效”及“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)據(jù)中心建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的算力基石。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 集成電路
    +關(guān)注

    關(guān)注

    5446

    文章

    12487

    瀏覽量

    372869
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5111

    瀏覽量

    134512
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1596

    瀏覽量

    10096

原文標(biāo)題:沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準(zhǔn)、穩(wěn)全面發(fā)展

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DLInfer聯(lián)手股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地

    近期,上海 AI 實(shí)驗(yàn)室 DeepLink 團(tuán)隊(duì)推出的 DLInfer 通過(guò)支持 LMDeploy 主流模型推理,助力股份云 C500 落地 MinerU 多模態(tài)數(shù)據(jù)生成場(chǎng)景,G
    的頭像 發(fā)表于 12-09 14:55 ?388次閱讀
    DLInfer聯(lián)手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地

    股份GPU加速技術(shù)助力藥物研發(fā)降本增效

    股份科學(xué)計(jì)算團(tuán)隊(duì)近期取得突破性進(jìn)展,成功將主流分子動(dòng)力學(xué)模擬引擎GROMACS中的FEP計(jì)算全流程部署于GPU執(zhí)行,并實(shí)現(xiàn)2.5倍性能提升,相關(guān)成果獲得GROMACS官方團(tuán)隊(duì)的高度認(rèn)可,該
    的頭像 發(fā)表于 12-02 15:58 ?425次閱讀

    瀚海量子與股份達(dá)成戰(zhàn)略合作 量子計(jì)算軟件領(lǐng)軍者+高性能GPU芯片領(lǐng)軍者

    當(dāng)量子計(jì)算軟件領(lǐng)軍者遇上高性能GPU芯片領(lǐng)軍者,國(guó)產(chǎn)算力領(lǐng)域迎來(lái)一項(xiàng)重磅合作。 近日, 合肥瀚海量子科技有限公司(簡(jiǎn)稱“瀚海量子”)與集成電路(上海)股份有限公司(簡(jiǎn)稱“
    的頭像 發(fā)表于 11-24 19:02 ?2271次閱讀

    股份與上海電信完成首期GPU生態(tài)專家認(rèn)證培訓(xùn)

    近期,集成電路(上海)股份有限公司(以下簡(jiǎn)稱“股份”)攜手上海電信天翼云能力運(yùn)營(yíng)中心(以下簡(jiǎn)稱“云能力運(yùn)營(yíng)中心”)順利完成了首期GPU
    的頭像 發(fā)表于 10-31 10:33 ?287次閱讀

    首款全國(guó)產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    集成電路(南京)有限公司近日正式發(fā)布了首款全國(guó)產(chǎn)通用GPU——云C600,這標(biāo)志著國(guó)產(chǎn)高性能GPU實(shí)現(xiàn)歷史性突破。 據(jù)新華日?qǐng)?bào)報(bào)道顯示
    的頭像 發(fā)表于 10-19 20:04 ?4.5w次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡(jiǎn)稱"")于 2020 年 9 月成立于上海,其擁有技術(shù)完備、設(shè)計(jì)和產(chǎn)業(yè)化經(jīng)驗(yàn)豐富的團(tuán)隊(duì),曾主導(dǎo)過(guò)十多款世界主流高性能
    的頭像 發(fā)表于 10-17 15:06 ?852次閱讀

    云C系列產(chǎn)品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國(guó)產(chǎn)GPU語(yǔ)言TileLang,引發(fā)業(yè)界廣泛關(guān)注。作為國(guó)產(chǎn)高性能GPU的代表,云C系列產(chǎn)品已
    的頭像 發(fā)表于 10-14 09:25 ?743次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C系列產(chǎn)品已支持TileLang

    書生大模型實(shí)戰(zhàn)營(yíng)魔樂專場(chǎng)MeetUP精彩回顧

    近日,由書生大模型社區(qū)、、魔樂社區(qū)、算豐和 DaoCloud 道客等聯(lián)合打造的「書生大模型實(shí)戰(zhàn)營(yíng)魔樂專場(chǎng) MeetUP 暨頒獎(jiǎng)儀式」在上海漕河涇國(guó)際孵化中心圓滿落幕。
    的頭像 發(fā)表于 08-20 11:33 ?933次閱讀

    硅基流動(dòng)攜手首發(fā)基于云的Kimi K2推理服務(wù)

    天網(wǎng)絡(luò)”)運(yùn)營(yíng)的云C550 三千卡通用 GPU 國(guó)產(chǎn)集群。此次合作標(biāo)志著硅基流動(dòng)正式將該國(guó)產(chǎn)集群納入算力網(wǎng)絡(luò),進(jìn)一為大模型產(chǎn)業(yè)落地提
    的頭像 發(fā)表于 07-23 17:33 ?1589次閱讀

    PaddleScience完成與AI芯片適配

    當(dāng)前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計(jì)算、科學(xué)建模等多個(gè)方向。這一趨勢(shì)正加速形成面向"Al for Science"的國(guó)產(chǎn)智算生態(tài)新格局。
    的頭像 發(fā)表于 05-06 14:49 ?1418次閱讀

    云C500通用計(jì)算GPU與百度飛槳完成Ⅱ級(jí)兼容性測(cè)試

    近日,云C500通用計(jì)算GPU與百度飛槳已完成Ⅱ級(jí)兼容性測(cè)試。測(cè)試結(jié)果顯示,雙方兼容性表現(xiàn)良好,整體運(yùn)行穩(wěn)定。這是
    的頭像 發(fā)表于 03-31 14:22 ?1521次閱讀

    加速DeepSeek滿血版單卡C500異構(gòu)推理

    近日,基于開源KTransformers架構(gòu)的 CPU/GPU 異構(gòu)推理能力,云C500單卡GPU上成功實(shí)現(xiàn)DeepSeek-R1-
    的頭像 發(fā)表于 03-20 15:52 ?1936次閱讀

    Gitee AI 聯(lián)合首發(fā)全套 DeepSeek R1 千問(wèn)蒸餾模型,全免費(fèi)體驗(yàn)!

    、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個(gè)較小尺寸的 DeepSeek 模型。值得關(guān)注的是, 本次上線的四個(gè)模型均部署在國(guó)產(chǎn)
    的頭像 發(fā)表于 02-10 09:56 ?1114次閱讀
    Gitee AI 聯(lián)合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首發(fā)全套 DeepSeek R1 千問(wèn)蒸餾模型,全免費(fèi)體驗(yàn)!

    澎峰科技與完成聯(lián)合測(cè)試,實(shí)現(xiàn)全面兼容

    實(shí)現(xiàn)了全面兼容,為用戶提供了更為高效、穩(wěn)定的解決方案。 在測(cè)試過(guò)程中,澎峰科技與科技的技術(shù)團(tuán)隊(duì)緊密協(xié)作,對(duì)PerfXLM和PerfXCloud在云系列
    的頭像 發(fā)表于 01-21 15:20 ?993次閱讀

    澎峰科技計(jì)算軟件棧與GPU完成適配和互認(rèn)證

    ?近期,澎峰科技與完成了對(duì)PerfXLM(推理引擎)、PerfXCloud(大模型服務(wù)平臺(tái))與云系列通用計(jì)算
    的頭像 發(fā)表于 01-21 09:51 ?1229次閱讀