chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用 NVIDIA AI Enterprise 3.0 優(yōu)化生產(chǎn)級(jí) AI 的性能和效率

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-04-17 23:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA AI Enterprise 是一款端到端的安全云原生 AI 軟件套件。最近發(fā)布的 NVIDIA AI Enterprise 3.0 加入了幫助優(yōu)化生產(chǎn)級(jí) AI 性能與效率的新功能。本文將詳細(xì)介紹以下新功能及其工作原理

· Magnum IO GPUDirect Storage

· VMware vSphere 8.0的 GPU 虛擬化功能

· Red Hat Enterprise Linux(RHEL)KVM 8 和 9

· Fractional multi-vGPU 支持

· 對(duì) NVIDIA AI 的擴(kuò)展支持

生產(chǎn)級(jí) AI 功能

NVIDIA AI Enterprise 3.0 版本中的新 AI 工作流有助于縮短生產(chǎn)級(jí) AI 的開發(fā)時(shí)間。這些工作流是常見 AI 用例的參考應(yīng)用,包括聯(lián)絡(luò)中心智能虛擬助理、音頻轉(zhuǎn)錄、數(shù)字指紋等。

未加密的預(yù)訓(xùn)練模型也首次包括在內(nèi),這確保了 AI 的可解釋性并使開發(fā)者能夠查看模型的權(quán)重和偏差,并了解模型的偏差。

NVIDIA AI Enterprise 現(xiàn)在支持 NGC 目錄中發(fā)布的所有 NVIDIA AI 軟件。已經(jīng)使用過(guò) NGC 的開發(fā)者現(xiàn)在可以無(wú)縫過(guò)渡到 NVIDIA AI Enterprise 并使用支持 50 多個(gè) AI 框架、預(yù)訓(xùn)練模型和 SDK 的 NVIDIA Enterprise Support。

基礎(chǔ)設(shè)施性能功能

NVIDIA AI Enterprise 3.0 包含許多有助于優(yōu)化基礎(chǔ)設(shè)施性能的新功能,因此用戶可以從他們的 AI 投資中獲得最大收益并最大程度地節(jié)約成本和時(shí)間。下面將對(duì)這些功能進(jìn)行詳細(xì)說(shuō)明。

Magnum IO GPUDirect Storage

企業(yè)現(xiàn)在可以在部署 NVIDIA AI Enterprise 3.0 的情況下,利用 Magnum IO GPUDirect Storage 的性能優(yōu)勢(shì)來(lái)加速和擴(kuò)展他們的 AI 工作負(fù)載。GPUDirect Storage 1.4 打通了本地或遠(yuǎn)程存儲(chǔ)與 GPU 內(nèi)存之間的直接數(shù)據(jù)路徑,為復(fù)雜的工作負(fù)載提供無(wú)與倫比的性能。

GPUDirect Storage 簡(jiǎn)化并提高了存儲(chǔ)和 GPU 緩沖區(qū)之間的數(shù)據(jù)流的效率,適用于在 GPU 上消耗或產(chǎn)生數(shù)據(jù)而不需要 CPU 處理的應(yīng)用。該功能通過(guò)遠(yuǎn)程直接內(nèi)存訪問(wèn)(RDMA),在從存儲(chǔ)到 GPU 內(nèi)存的直接路徑上快速移動(dòng)數(shù)據(jù),減少延遲并通過(guò)消除回彈緩沖區(qū)產(chǎn)生的多余復(fù)制來(lái)減輕 CPU 的負(fù)擔(dān)。

GPUDirect Storage 帶來(lái)了明顯的性能提升。與 NumPy 相比,使用 NVIDIA DALI 進(jìn)行深度學(xué)習(xí)推理時(shí),性能提高了 7.2 倍。

美國(guó)國(guó)家航空航天局(NASA)的火星探測(cè)器演示項(xiàng)目使用 NVIDIA IndeX 和 GPUDirect Storage 以及 27000 多個(gè) NVIDIA GPU 來(lái)模擬逆向推進(jìn),在使用 PCIe 交換機(jī)和 NVLinks 以及 GPUDirect Storage 時(shí),帶寬提高了 5 倍。

406dec70-dd32-11ed-bfe3-dac502259ad0.png

圖 1. GPUDirect Storage 提供了一條從存儲(chǔ)出發(fā)、完全跳過(guò) CPU 的直接路徑,消除了綁定在 CPU 上的回彈緩沖。

VMware vSphere 8.0 的 GPU 虛擬化功能

NVIDIA AI Enterprise 3.0 引入了對(duì) VMware vSphere 8 的支持,包括多項(xiàng)可加速性能和提高運(yùn)行效率的功能。VMware 環(huán)境現(xiàn)在可以在一個(gè)虛擬機(jī)上添加多達(dá) 8 個(gè)虛擬 GPU,vGPU 數(shù)量比之前的版本多了一倍。這提高了大型 ML 模型的性能,為復(fù)雜的 AI 和 ML 工作負(fù)載提供了更高的可擴(kuò)展性。

隨著設(shè)備組的引入,IT 管理員現(xiàn)在可以更好的控制虛擬機(jī)的放置。vSphere 附帶的管理工具分布式資源調(diào)度(DRS)可確定虛擬機(jī)的最佳放置位置。

新的設(shè)備組功能提供了對(duì) PCIe 設(shè)備的洞察,這些設(shè)備在硬件層面上(通過(guò) NVLink 或 PCIe 開關(guān))相互配對(duì),IT 管理員可以從中選擇一個(gè)子集,提交給虛擬機(jī)作出 DRS 調(diào)度決策。

通過(guò)設(shè)備組,IT 管理員可以確保設(shè)備子集被一起分配給虛擬機(jī)。例如,如果用戶想要通過(guò)擴(kuò)展 GPU 來(lái)加速大型模型,IT 管理員可以創(chuàng)建一個(gè)包含 GPU 的設(shè)備組并通過(guò) NVLink 連接這些設(shè)備,比如圖 2 中的設(shè)備組 1。

如果用戶想要向外擴(kuò)展到多臺(tái)服務(wù)器以進(jìn)行分布式訓(xùn)練,可以使用共享同一 PCIe 交換機(jī)的 GPU 和 NIC 組成設(shè)備組,比如圖 2 中的設(shè)備組 2。

4091dd92-dd32-11ed-bfe3-dac502259ad0.png

圖 2. 有兩個(gè) GPU 的設(shè)備組(左)和服務(wù)器上有一個(gè) GPU 與網(wǎng)卡的設(shè)備組(右)

Red Hat Enterprise Linux KVM

NVIDIA AI Enterprise 3.0 將虛擬化支持?jǐn)U展至 Red Hat Enterprise Linux 8.4、8.6、8.7、9.0 和 9.1,使企業(yè)能夠?qū)?KVM 功能擴(kuò)展到他們的 AI 工作負(fù)載。通過(guò) RHEL KVM,管理員可以在一個(gè)虛擬機(jī)上添加多達(dá) 16 個(gè)虛擬 GPU,將計(jì)算密集型工作負(fù)載的處理速度提高數(shù)倍。

Fractional multi-vGPU 支持

管理員現(xiàn)在可以通過(guò) NVIDIA AI Enterprise 3.0,為一臺(tái)虛擬機(jī)配置多個(gè) Fractional vGPU,從而更加靈活地根據(jù)工作負(fù)載優(yōu)化虛擬機(jī)的配置。在該版本發(fā)布之前,每臺(tái)虛擬機(jī)只能通過(guò)一個(gè)或多個(gè)整數(shù)份 GPU 加速。

管理員現(xiàn)在能夠更加靈活地根據(jù)工作負(fù)載的計(jì)算需求,為一個(gè)虛擬機(jī)分配多個(gè)部分 vGPU 配置文件。例如,當(dāng)運(yùn)行具有不同計(jì)算需求的多個(gè)推理工作負(fù)載時(shí),管理員可以根據(jù)工作負(fù)載的內(nèi)存需求,為一個(gè)虛擬機(jī)分配不同數(shù)量幀緩沖器的 NVIDIA A100 Tensor Core GPU 的部分配置文件。

需要注意的是,所有部分配置文件必須是相同的板卡類型和系列??梢詫⒁粋€(gè)或多個(gè)物理 GPU 分成這些份額的 vGPU 配置文件。該功能在 VMware vSphere 8 和 RHEL KVM 8 和 9 上均可以使用。

40abb082-dd32-11ed-bfe3-dac502259ad0.png

圖 3. 將一個(gè)配置文件分成多個(gè) vGPU 分配給一個(gè)虛擬機(jī)

對(duì) NVIDIA AI 的擴(kuò)展支持

NVIDIA AI Enterprise 為 NGC 目錄中發(fā)布的所有 NVIDIA AI 軟件提供支持,該目錄目前包含 50 多個(gè)框架和模型。所有受支持的模型都標(biāo)有“NVIDIA AI Enterprise Supported”以幫助用戶輕松識(shí)別支持的軟件。

40c3de96-dd32-11ed-bfe3-dac502259ad0.png

圖 4. 所有 NVIDIA AI Enterprise 支持的模型在 NGC 目錄中都有標(biāo)注

總結(jié)

通過(guò)最新 3.0 版本的 NVIDIA AI Enterprise,企業(yè)可以使用最新的性能和效率優(yōu)化功能縮短生產(chǎn)級(jí) AI 的開發(fā)時(shí)間。NVIDIA LaunchPad 使用戶可以在私有加速計(jì)算環(huán)境中即時(shí)、短期訪問(wèn) NVIDIA AI Enterprise 軟件套件,包括各種動(dòng)手實(shí)操實(shí)驗(yàn)室。

即刻點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼在 NVIDIA On-Demand 上觀看 GTC 精選回放,包括主題演講相關(guān)精選、中國(guó)本地精選內(nèi)容、生成式 AI 專題以及全球各行業(yè)及領(lǐng)域最新成果!


原文標(biāo)題:使用 NVIDIA AI Enterprise 3.0 優(yōu)化生產(chǎn)級(jí) AI 的性能和效率

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4047

    瀏覽量

    97781

原文標(biāo)題:使用 NVIDIA AI Enterprise 3.0 優(yōu)化生產(chǎn)級(jí) AI 的性能和效率

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    8K視頻編解碼和AI推理任務(wù),降低延遲70%。 6 TOPS NPU 定制優(yōu)化 :針對(duì) YOLO/Transformer 等模型定制算子庫(kù),推理效率提升 5 倍。 2. 全面接口兼容,無(wú)縫生態(tài)系統(tǒng)遷移
    發(fā)表于 10-11 09:08

    NVIDIA DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個(gè)版本都擴(kuò)展了
    的頭像 發(fā)表于 07-04 14:27 ?983次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA <b class='flag-5'>3.0</b>版本的亮點(diǎn)解析

    全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計(jì)、營(yíng)銷及物流等方面的運(yùn)營(yíng)效率。
    的頭像 發(fā)表于 06-19 14:36 ?987次閱讀

    NVIDIA攜手合作伙伴提升AI智能體的交互能力

    NVIDIA Enterprise AI Factory 的經(jīng)驗(yàn)證設(shè)計(jì)和全新的 NVIDIA AI Blueprint 可幫助企業(yè)部署具有溝
    的頭像 發(fā)表于 05-22 09:52 ?825次閱讀

    NVIDIA助力安利生成式AI在效能和安全上破局

    依托 NVIDIA AI Enterprise 企業(yè)級(jí)解決方案,安利正在構(gòu)建安全、高效、可擴(kuò)展的 AI 基礎(chǔ)設(shè)施體系,全面提升算力資源調(diào)度能
    的頭像 發(fā)表于 05-10 09:28 ?1081次閱讀

    DevEco Studio AI輔助開發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開發(fā)效率再提升

    HarmonyOS應(yīng)用的AI智能輔助開發(fā)助手——CodeGenie,該AI助手深度集成在DevEco Studio中,提供鴻蒙知識(shí)智能問(wèn)答、鴻蒙ArkTS代碼補(bǔ)全/生成和萬(wàn)能卡片生成等功能,提升了開發(fā)效率,深受廣大
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    PIX GP模型的整合,并且針對(duì)模型進(jìn)行全鏈路微秒級(jí)分析,以確保最佳的端到端性能表現(xiàn)。在雙方的整個(gè)合作流程中,開發(fā)效率提升了30%。 天璣AI生態(tài)同樣拓展到了智能座艙領(lǐng)域。聯(lián)發(fā)科和絕影
    發(fā)表于 04-13 19:52

    NVIDIA AI Enterprise助力AI智能體重構(gòu)工作模式

    無(wú)論是為人道主義援助、客戶服務(wù)還是醫(yī)療健康而開發(fā),基于NVIDIA AI Enterprise軟件平臺(tái)構(gòu)建的 AI 智能體構(gòu)成了新型數(shù)字勞動(dòng)力,幫助專業(yè)人士以更低的成本、更大的影響力來(lái)
    的頭像 發(fā)表于 03-25 14:59 ?853次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè) NVIDIA NIM 微服務(wù)通過(guò) OCI 控制臺(tái)以原生方式提供。此外,Oracle 和 NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1211次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式<b class='flag-5'>AI</b>推理

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 與 NVIDIA AI Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè)
    發(fā)表于 03-19 15:24 ?479次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 <b class='flag-5'>AI</b> 推理

    FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    。? AI加速器的開發(fā):FPGA被廣泛用于開發(fā)專為AI算法優(yōu)化的加速器,例如深度學(xué)習(xí)推理加速器。這種定制化的硬件設(shè)計(jì)能夠顯著提升AI應(yīng)用的效率
    發(fā)表于 03-03 11:21

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    ,準(zhǔn)確率達(dá)到99.9%。 這一技術(shù)革新正在創(chuàng)造巨大的商業(yè)價(jià)值。在智慧城市領(lǐng)域,AI邊緣網(wǎng)關(guān)可以實(shí)現(xiàn)交通流量實(shí)時(shí)分析、違章行為智能識(shí)別;在工業(yè)互聯(lián)網(wǎng)中,能夠?qū)崿F(xiàn)設(shè)備預(yù)測(cè)性維護(hù)、生產(chǎn)工藝優(yōu)化;在智慧能源領(lǐng)域
    發(fā)表于 02-15 11:41

    AI自動(dòng)化生產(chǎn):深度學(xué)習(xí)在質(zhì)量控制中的應(yīng)用

    生產(chǎn)效率、保證產(chǎn)品質(zhì)量方面展現(xiàn)出非凡的能力。阿丘科技「AI干貨補(bǔ)給站」推出《AI自動(dòng)化生產(chǎn):深度學(xué)習(xí)在質(zhì)量控制中的應(yīng)用》文章,探討深度學(xué)習(xí)在
    的頭像 發(fā)表于 01-17 16:35 ?1236次閱讀
    <b class='flag-5'>AI</b>自動(dòng)<b class='flag-5'>化生產(chǎn)</b>:深度學(xué)習(xí)在質(zhì)量控制中的應(yīng)用

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    的“知識(shí)機(jī)器人”,提升全球數(shù)十億知識(shí)工作者的生產(chǎn)力。為了開發(fā) AI 智能體,企業(yè)需要解決信任、物理安全、網(wǎng)絡(luò)安全以及合規(guī)性等關(guān)鍵問(wèn)題。 全新 NVIDIA NIM AI Guardra
    發(fā)表于 01-17 16:29 ?286次閱讀

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運(yùn)行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開發(fā)提供強(qiáng)大助力。
    的頭像 發(fā)表于 01-08 11:01 ?891次閱讀