chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA RTXMU改進游戲顯存分配

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Ethan Einhorn ? 2022-04-22 10:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

實時光線追蹤提升了電子游戲中的光照藝術(shù)效果,但該過程需要消耗大量算力。為了減少消耗,NVIDIA 開發(fā)了一款顯存實用程序,它將規(guī)整和二次分配技術(shù)相結(jié)合,可優(yōu)化和減少加速結(jié)構(gòu)的顯存消耗。我們已將此解決方案變?yōu)槊?RTXMU 的 SDK,并在今天將其作為開源版本提供。它專為支持各種 DXR 或 Vulkan 光線追蹤應(yīng)用程序而構(gòu)建。

通過利用 RTXMU 規(guī)整加速結(jié)構(gòu),可消除初始構(gòu)建操作中浪費的顯存。對于使用 RTXMU 的應(yīng)用程序,NVIDIA RTX 顯卡的顯存占用量減少了大約 50%。此外,利用 RTXMU 二次分配加速結(jié)構(gòu)緩沖區(qū)可防止出現(xiàn)碎片和浪費的空間。包含數(shù)千個不同的小 BLAS 的場景將從二次分配中受益匪淺。

RTXMU 如何立即提供幫助?

RTXMU 易于集成,可立即帶來好處。

二次分配和規(guī)整顯存管理器需要花費大量工程時間進行驗證。RTXMU 可縮短開發(fā)者將規(guī)整和二次分配技術(shù)集成到 RTX 游戲中所需的時間。

RTXMU 還會抽象化 BLAS 的顯存和規(guī)整狀態(tài)管理,并管理規(guī)整尺寸回讀和規(guī)整副本所需的所有屏障。

更深入地說,RTXMU 使用 BLAS 數(shù)據(jù)結(jié)構(gòu)的句柄間接層來防止錯誤管理 CPU 內(nèi)存(包括訪問已取消分配或不存在的 BLAS)。此外,二次分配通過將更多 BLAS 裝入 64 KB 或 4 MB 頁面中,帶來了提高 TLB(頁表緩存)命中率的好處。

簡而言之,RTXMU 讓開發(fā)者毫不費力地就能讓實時光線追蹤游戲和應(yīng)用程序更快速地運行。

關(guān)于作者

Ethan Einhorn 是一位有21年游戲行業(yè)經(jīng)驗的資深人士,曾擔任編輯、營銷、制作和創(chuàng)意指導(dǎo)等職位。目前,他是 NVIDIA 的高級產(chǎn)品營銷經(jīng)理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5513

    瀏覽量

    109200
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3342

    瀏覽量

    60011
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA CUDA 13.1版本的新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?1679次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助 NVIDIA Omniverse 庫和 Cosmos,開發(fā)者可以大規(guī)模生成基于物理學(xué)的合
    的頭像 發(fā)表于 12-01 09:25 ?625次閱讀

    NVIDIA ACE現(xiàn)已支持開源Qwen3-8B小語言模型

    為助力打造實時、動態(tài)的 NPC 游戲角色,NVIDIA ACE 現(xiàn)已支持開源 Qwen3-8B 小語言模型(SLM),可實現(xiàn) PC 游戲中的本地部署。
    的頭像 發(fā)表于 10-29 16:59 ?1066次閱讀

    借助NVIDIA Megatron-Core大模型訓(xùn)練框架提高顯存使用效率

    隨著模型規(guī)模邁入百億、千億甚至萬億參數(shù)級別,如何在有限顯存中“塞下”訓(xùn)練任務(wù),對研發(fā)和運維團隊都是巨大挑戰(zhàn)。NVIDIA Megatron-Core 作為流行的大模型訓(xùn)練框架,提供了靈活高效的并行化
    的頭像 發(fā)表于 10-21 10:55 ?882次閱讀
    借助<b class='flag-5'>NVIDIA</b> Megatron-Core大模型訓(xùn)練框架提高<b class='flag-5'>顯存</b>使用效率

    超過175款游戲和應(yīng)用現(xiàn)已支持NVIDIA DLSS 4

    超過 175 款游戲和應(yīng)用現(xiàn)已支持 DLSS 4,包括《生化危機:安魂曲》(Resident Evil Requiem)、《影之刃零》(Phantom Blade Zero)等支持光線追蹤的大作,升級的 NVIDIA RTX Remix、Project G-Assist
    的頭像 發(fā)表于 08-20 14:26 ?1124次閱讀

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    NVIDIA Jetson AGX Thor 開發(fā)者套件為您提供出色的性能和可擴展性。它由 NVIDIA Blackwell GPU和128 GB 顯存提供動力支持,提供高達 2070 FP4
    的頭像 發(fā)表于 08-11 15:03 ?1646次閱讀

    大模型推理顯存和計算量估計方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習大模型在各個領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應(yīng)用帶來了挑戰(zhàn)。為了解決這一問題,本文將探討大模型推理顯存和計算量的估計
    發(fā)表于 07-03 19:43

    超150款游戲現(xiàn)已支持NVIDIA Reflex

    NVIDIA Reflex 是一項顛覆性技術(shù),可降低 GeForce 顯卡、臺式電腦和筆記本電腦的 PC 延遲,讓玩家更迅速地作出反應(yīng),使其在多人游戲中更具競爭力,并且該技術(shù)能夠讓單人游戲擁有更快的響應(yīng)速度、更加爽快的體驗。
    的頭像 發(fā)表于 06-26 09:29 ?977次閱讀

    全球各大品牌利用NVIDIA AI技術(shù)提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計、營銷及物流等方面的運營效率。
    的頭像 發(fā)表于 06-19 14:36 ?1001次閱讀

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機,以及諸如 NVIDIA cuDSS 和
    的頭像 發(fā)表于 05-27 13:59 ?915次閱讀

    利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案

    全球領(lǐng)先的電子制造商正在利用 NVIDIA 技術(shù),構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案。
    的頭像 發(fā)表于 05-22 09:50 ?778次閱讀

    云電競服務(wù)器 工作原理

    實例,實現(xiàn)硬件資源的按需分配與隔離運行。 資源池化?:CPU、GPU、內(nèi)存等硬件資源整合為統(tǒng)一資源池,支持多租戶并行使用 彈性調(diào)度?:根據(jù)游戲負載自動調(diào)整資源配比(如《賽博朋克2077》運行時自動分配更高GPU
    的頭像 發(fā)表于 05-14 07:44 ?464次閱讀
    云電競服務(wù)器 工作原理

    NVIDIA發(fā)布DLSS 4技術(shù):多幀生成技術(shù)革新游戲體驗

    在1月23日,NVIDIA隨著RTX 50系列顯卡的問世,同步推出了全新的DLSS 4技術(shù)。這一技術(shù)憑借先進的多幀生成(MFG)功能,顯著提升了游戲的幀率,為玩家?guī)砹烁鼮榱鲿车?b class='flag-5'>游戲體驗。
    的頭像 發(fā)表于 01-24 15:29 ?1361次閱讀

    $1999 的 RTX 5090 來了

    和最具挑戰(zhàn)性的創(chuàng)意工作負載。使用全光線追蹤和最低延遲進行游戲。GeForce RTX 5090 采用 NVIDIA Blackwell 架構(gòu),配備 32GB 超高速 GDDR7 顯存,讓您無所不能。 Spec GPU 引擎規(guī)格
    的頭像 發(fā)表于 01-13 10:03 ?3178次閱讀
    $1999 的 RTX 5090 來了

    機械革命與NVIDIA聯(lián)手首發(fā)RTX 50系列游戲

    近日,在萬眾矚目的CES 2025國際消費電子展上,軟通動力旗下知名PC品牌機械革命攜手NVIDIA,全球同步首發(fā)了一系列搭載全新GeForce RTX 50系列筆記本電腦GPU的游戲本。這一
    的頭像 發(fā)表于 01-08 15:46 ?1370次閱讀