chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NGC目錄中的GPU優(yōu)化容器

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-01 11:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

借助 NVIDIA NGC 目錄中的 GPU 優(yōu)化容器,更快地開發(fā)和部署應(yīng)用。

什么是容器?

容器是一種便攜式軟件單元,可將應(yīng)用及其所有依賴項(xiàng)合并為一個(gè)軟件包,該軟件包不受底層主機(jī)操作系統(tǒng)限制。這樣無需再構(gòu)建復(fù)雜的環(huán)境,并簡化了應(yīng)用開發(fā)到部署的過程。

NVIDIA NGC 目錄包含一系列用于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、可視化和高性能計(jì)算(HPC)應(yīng)用的 GPU 優(yōu)化容器,這些容器均已經(jīng)過了性能、安全性和可擴(kuò)展性測試。

NGC 目錄中的容器的優(yōu)勢

輕松部署

內(nèi)置庫和依賴項(xiàng)可讓您輕松部署和運(yùn)行應(yīng)用。

加快訓(xùn)練速度

TensorFlow 和 PyTorch 等 NVIDIA AI 容器每月會提供針對性能優(yōu)化的更新版本,以便加快 AI 訓(xùn)練和推理速度。

運(yùn)行位置不受限制

在 bare metal、虛擬機(jī)(VM)和 Kubernetes 上,將容器部署在任意位置(云端、內(nèi)部私有云和邊緣)的多 GPU/多節(jié)點(diǎn)系統(tǒng)上。

放心部署

容器經(jīng)過常見漏洞和暴露(CVE)掃描(附有安全報(bào)告),并通過 NVIDIA AI Enterprise 得到了可選的企業(yè)支持。

性能優(yōu)化

NVIDIA 構(gòu)建的 Docker 容器每月都會更新,第三方軟件也會定期更新,以提供所需的功能,便于您從現(xiàn)有基礎(chǔ)架構(gòu)中獲得出色性能,并縮短找出解決方案的時(shí)間。

借助 BERT-Large 進(jìn)行自然語言處理

BERT-Large 利用 VoltaV100 和 Ampere A100 GPU 上的混合精度運(yùn)算和 Tensor Core,在保持目標(biāo)準(zhǔn)確性的同時(shí)縮短訓(xùn)練時(shí)間。

在單節(jié)點(diǎn)的 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 時(shí),BERT-Large 和訓(xùn)練的性能表現(xiàn)?;旌暇?。BERT 的批量大小:3 (V100)、24(A100)

用于圖像處理的 ResNet50 v1.5

此模型使用 Volta、Turing 和 NVIDIA Ampere GPU 體系架構(gòu)上的 Tensor Core 進(jìn)行混合精度訓(xùn)練,以加快訓(xùn)練速度。

在單節(jié)點(diǎn) 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 時(shí),ResNet 50 的性能表現(xiàn)?;旌暇取esNet50 批量大?。?6

用于深度學(xué)習(xí)的 Matlab

持續(xù)開發(fā) Matlab 深度學(xué)習(xí)容器可提高訓(xùn)練和推理性能。

Windows 10,Intel Xeon E5-2623 @2.4GHz,NVIDIA Titan V 12GB GPU

用于各種工作負(fù)載的容器

AI 容器

TensorFlow

TensorFlow 是一個(gè)用于高性能數(shù)值計(jì)算的開源軟件庫。

PyTorch

PyTorch 是具有 Python 前端的 GPU 加速型張量計(jì)算框架。

NVIDIA Triton 推理服務(wù)器

NVIDIA Triton 推理服務(wù)器是一種開源推理解決方案,可更大限度地提高 GPU 的利用率和性能。

NVIDIA TensorRT

NVIDIA TensorRT 是一個(gè)C++ 庫,可加快 NVIDIA GPU 上的高性能推理。

應(yīng)用框架

NVIDIA Clara

用于醫(yī)療成像的 NVIDIA Clara Train 是一個(gè)應(yīng)用框架,包含超過 20 個(gè)先進(jìn)的預(yù)訓(xùn)練模型、遷移學(xué)習(xí)和聯(lián)合學(xué)習(xí)工具、AutoML,以及 AI 輔助的標(biāo)記數(shù)據(jù)。

DeepStream

DeepStream 是一款流分析工具包,可用于基于 AI 的視頻、音頻和圖像理解和多傳感器處理。

NVIDIA Riva

NVIDIA Riva 是一個(gè)應(yīng)用框架,適用于在 GPU 上提供實(shí)時(shí)性能的多模態(tài)對話式 AI 服務(wù)。

Merlin Training

Merlin HugeCTR 是 NVIDIA Merlin 的組件,是一款專為推薦系統(tǒng)設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架。

HPC 容器

NAMD

NAMD 是一段并行分子動力學(xué)代碼,旨在實(shí)現(xiàn)生物大分子系統(tǒng)的高性能模擬。

GROMACS

GROMACS 是一款熱門的分子動力學(xué)應(yīng)用,用于模擬蛋白質(zhì)和脂質(zhì)。

Relion

Relion 采用經(jīng)驗(yàn)貝葉斯方法分析低溫電子顯微鏡(cryo EM)。

NVIDIA HPC SDK

NVIDIA HPC SDK 是編譯器、庫和工具的綜合套件,用于構(gòu)建、部署和管理 HPC 應(yīng)用。

點(diǎn)擊閱讀原文,了解更多 AI 和 HPC 容器相關(guān)內(nèi)容

NVIDIA 深度學(xué)習(xí)培訓(xùn)中心

我們的 NVIDIA 深度學(xué)習(xí)培訓(xùn)中心還推出了 AI 和 HPC 容器及 NGC 相關(guān)課程,您可以復(fù)制鏈接查看課程詳情。

使用容器實(shí)現(xiàn)高性能計(jì)算

學(xué)習(xí)使用容器化環(huán)境開發(fā)高性能計(jì)算(HPC)應(yīng)用程序,降低編碼的復(fù)雜性和可移植性,從而提高開發(fā)效率。

原文標(biāo)題:DevZone | AI和HPC容器

文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5682

    瀏覽量

    110096
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5259

    瀏覽量

    136039
  • 容器
    +關(guān)注

    關(guān)注

    0

    文章

    535

    瀏覽量

    23024

原文標(biāo)題:DevZone | AI和HPC容器

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA向Kubernetes社區(qū)捐贈動態(tài)資源分配GPU驅(qū)動程序

    此外,NVIDIA 在 KubeCon Europe 大會上宣布推出適用于 GPU 加速工作負(fù)載的機(jī)密容器解決方案、NVIDIA KAI Scheduler 更新,以及用于實(shí)現(xiàn)大規(guī)模
    的頭像 發(fā)表于 04-01 09:10 ?681次閱讀

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?499次閱讀

    使用USDRT優(yōu)化NVIDIA Omniverse的動態(tài)數(shù)據(jù)更改功能

    NVIDIA Omniverse 開發(fā),此前我們已探討了常見的性能瓶頸、如何使用 Tracy 等工具進(jìn)行問題定位,并初步介紹了 FSD(Fabric Scene Delegation
    的頭像 發(fā)表于 01-12 09:11 ?602次閱讀
    使用USDRT<b class='flag-5'>優(yōu)化</b><b class='flag-5'>NVIDIA</b> Omniverse的動態(tài)數(shù)據(jù)更改功能

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?3851次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時(shí)代的專業(yè) GPU 在真實(shí)應(yīng)用場景的表現(xiàn)究竟如何?今天,我們將通過深度實(shí)測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1804次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 現(xiàn)已全面上市,將基于 NVIDIA Blackwell 架構(gòu)的強(qiáng)大代理式與生成式 AI 能力帶到更多桌面和專業(yè)用戶手中。
    的頭像 發(fā)表于 12-24 10:32 ?1073次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB Blackwell <b class='flag-5'>GPU</b>現(xiàn)已全面上市

    NVIDIA Omniverse基于Container的部署推流方案

    為了讓客戶能夠高效安裝和部署 NVIDIA Omniverse 及 NVIDIA Isaac 平臺,NVIDIA 現(xiàn)已推出簡單便捷的容器化部署方案,以支持在數(shù)據(jù)中心的服務(wù)器
    的頭像 發(fā)表于 12-17 10:17 ?906次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse基于Container的部署推流方案

    在Python借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用
    的頭像 發(fā)表于 12-13 10:12 ?1388次閱讀
    在Python<b class='flag-5'>中</b>借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    Blackwell 架構(gòu) GPU 端專業(yè)圖形卡,高度僅為全高 GPU 的二分之一。如果您需要的是一塊半高顯卡,能適配小機(jī)箱,功耗不高,還要具備 AI 及光線追蹤性能的話,那么
    的頭像 發(fā)表于 11-28 09:39 ?6930次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南

    NVIDIA Isaac Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理 AI 功能和由 GPU 驅(qū)動的物理仿真,縮小仿真與現(xiàn)實(shí)世
    的頭像 發(fā)表于 09-23 17:15 ?2611次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點(diǎn)訓(xùn)練指南

    DeepSeek R1 MTP在TensorRT-LLM的實(shí)現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀(jì)錄,Multi-Token Prediction (MTP) 實(shí)現(xiàn)了大幅提速
    的頭像 發(fā)表于 08-30 15:47 ?4652次閱讀
    DeepSeek R1 MTP在TensorRT-LLM<b class='flag-5'>中</b>的實(shí)現(xiàn)與<b class='flag-5'>優(yōu)化</b>

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?4321次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1625次閱讀

    如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行GPU性能分析

    在大語言模型的強(qiáng)化學(xué)習(xí)訓(xùn)練過程,GPU 性能優(yōu)化至關(guān)重要。隨著模型規(guī)模不斷擴(kuò)大,如何高效地分析和優(yōu)化 GPU 性能成為開發(fā)者面臨的主要挑戰(zhàn)
    的頭像 發(fā)表于 07-23 10:34 ?2550次閱讀
    如何在Ray分布式計(jì)算框架下集成<b class='flag-5'>NVIDIA</b> Nsight Systems進(jìn)行<b class='flag-5'>GPU</b>性能分析

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3543次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>優(yōu)化</b>DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景<b class='flag-5'>中</b>的性能紀(jì)錄