作為 NVIDIA 專業(yè)顯卡產(chǎn)品線中單槽性能的巔峰之作,NVIDIARTX PRO 4000 Blackwell 在各項(xiàng)核心指標(biāo)上均實(shí)現(xiàn)對(duì)前代NVIDIARTX 4000 Ada Generation 的全面超越。那么,這款劃時(shí)代的專業(yè) GPU 在真實(shí)應(yīng)用場(chǎng)景中的表現(xiàn)究竟如何?今天,我們將通過(guò)深度實(shí)測(cè),為您揭曉NVIDIA RTX PRO 4000 Blackwell相較于前代產(chǎn)品的性能躍遷。
測(cè)試環(huán)境

軟件測(cè)試列表

顯卡規(guī)格

軟件測(cè)試結(jié)果及分析
1. 計(jì)算性能:CUDA-Z
CUDA-Z 作為與 CPU-Z、GPU-Z 并列的硬件檢測(cè)工具,可直觀呈現(xiàn) GPU 顯卡的核心性能參數(shù),為用戶提供便捷的性能監(jiān)控與評(píng)估支持。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
2025 麗臺(tái)(上海)信息科技有限公司
本文所有測(cè)試結(jié)果均由麗臺(tái)科技實(shí)測(cè)得出,如果您有任何疑問(wèn)或需要使用此測(cè)試結(jié)果,請(qǐng)聯(lián)系麗臺(tái)科技(下同)
單精度浮點(diǎn)運(yùn)算性能是顯卡一項(xiàng)重要的指標(biāo),很多計(jì)算都是使用單精度完成的。從測(cè)試結(jié)果來(lái)看,RTX PRO 4000 Blackwell 的單精度性能是 RTX 4000 Ada 的1.59倍,RTX PRO 4000 的雙精度性能是 RTX 4000 Ada 的1.54倍,RTX PRO 4000 的 64 位整數(shù)計(jì)算能力是 RTX 4000 Ada 的1.53倍,RTX PRO 4000 的 32 位整數(shù)計(jì)算能力是 RTX 4000 Ada 的1.56倍。RTX PRO 4000 的 24 位整數(shù)計(jì)算能力是 RTX 4000 Ada 的1.47倍。
2. 圖形性能:SPECviewperf 15
SPECviewperf 15 是專用于評(píng)估顯卡專業(yè)圖形性能的基準(zhǔn)測(cè)試軟件,涵蓋 3ds Max、Maya、Catia、SolidWorks、Creo、Blender、Enscape 及 Unreal Engine 等主流設(shè)計(jì)軟件的性能測(cè)試,同時(shí)包含醫(yī)療成像與能源仿真等專業(yè)領(lǐng)域場(chǎng)景。該工具通過(guò)模擬軟件交互操作響應(yīng)速度進(jìn)行評(píng)分,最終量化顯卡的圖形處理能力相對(duì)性能。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從 SPECviewperf 15 的測(cè)試結(jié)果看,RTX PRO 4000 和 RTX 4000 Ada 的圖形交互性能在 Medical、Maya、3ds Max、Blender、energy 的測(cè)試中均有1.5倍左右的提升。RTX PRO 4000 在 Solidworks、Unreal_engine 的測(cè)試中是 RTX 4000 Ada 的1.2倍左右,RTX PRO 4000 在 Enscape 的測(cè)試中是 RTX 4000 Ada 的2.07倍,RTX PRO 4000 在 Catia、Creo 的測(cè)試中是 RTX 4000 Ada 的1.3倍左右,圖形性能普遍提升。
3. 實(shí)時(shí)渲染性能
3.1 FurMark
FurMark 是 GPU 測(cè)試領(lǐng)域的權(quán)威工具,專用于 OpenGL 圖形性能評(píng)估與系統(tǒng)穩(wěn)定性測(cè)試。本次測(cè)試聚焦兩大核心維度:其一,通過(guò) 4K 分辨率實(shí)時(shí)渲染場(chǎng)景評(píng)估 OpenGL 圖形處理性能;其二,在標(biāo)準(zhǔn)室溫環(huán)境下監(jiān)測(cè) GPU 的散熱效能與溫度穩(wěn)定性。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從 FurMark 的實(shí)時(shí)渲染測(cè)試結(jié)果中可以看出,RTX PRO 4000 的 OpenGL 4K 性能是 RTX 4000 Ada 的1.55倍。通過(guò)長(zhǎng)時(shí)間烤機(jī)(穩(wěn)定性測(cè)試),RTX PRO 4000 的溫度控制在 78 度以下。這個(gè)溫度是在顯卡滿載運(yùn)行的情況下測(cè)得的,反映了 RTX PRO 4000 在高負(fù)載下的散熱能力。
3.2 3DMark
3DMark 是專用于評(píng)估大型 3D 場(chǎng)景圖形性能的基準(zhǔn)測(cè)試軟件。本次測(cè)試選取了兩個(gè)高復(fù)雜度場(chǎng)景進(jìn)行壓力測(cè)試,同時(shí)涵蓋 DirectX 與 Vulkan API 的性能表現(xiàn),并通過(guò) Port Royal 模塊專項(xiàng)評(píng)估光線追蹤性能。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從 3DMark Steel Nomad 的測(cè)試結(jié)果看,基于 DX 的性能和 Port Royal 光追的性能測(cè)試,RTX PRO 4000 的性能是 RTX 4000 Ada 的1.5倍。在 Steel Nomad Vulkan 的測(cè)試中 RTX PRO 4000 是 RTX 4000 Ada 的1.4倍。RTX PRO 4000 的渲染性能和光追性能都有了很大的提高。
3.3 NVIDIA Omniverse 工作流實(shí)時(shí)渲染
NVIDIA Omniverse 是一個(gè)包含 API、SDK 和服務(wù)的平臺(tái),使得開(kāi)發(fā)者能夠?qū)?OpenUSD、NVIDIA RTX 渲染技術(shù)和生成式物理 AI 集成到工業(yè)和機(jī)器人用例的現(xiàn)有軟件工具和仿真工作流中??梢灾С侄嗳送瑫r(shí)在線進(jìn)行 3D 立體場(chǎng)景的協(xié)同搭建,支持豐富的 DCC 生態(tài)融合,可以支持光線追蹤極具真實(shí)感的實(shí)時(shí)渲染。
▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
▲實(shí)時(shí)渲染性能對(duì)比視頻
在 Omniverse 實(shí)時(shí)渲染中,分別測(cè)試了開(kāi)啟 NVIDIA DLSS 和關(guān)閉 DLSS 的性能。針對(duì)相同場(chǎng)景的 4K 實(shí)時(shí)渲染,在啟用 DLSS 時(shí) RTX PRO 4000 的性能是 RTX 4000 Ada 的3.2倍性能,在不啟用 DLSS 時(shí),RTX PRO 4000 的性能是 RTX 4000 Ada 的1.9倍。由于 RTX PRO 4000 具備第 5 代的 Tensor Core,并且支持最新一代的 NVIDIA DLSS 4,因此在開(kāi)啟 DLSS 功能后增幀效果顯著。
4. 離線渲染軟件
渲染技術(shù)作為媒體娛樂(lè)、工業(yè)設(shè)計(jì)及建筑可視化等領(lǐng)域的核心工具,已廣泛應(yīng)用于影視特效、產(chǎn)品建模、虛擬建筑等場(chǎng)景。當(dāng)前主流渲染器均支持GPU加速渲染,其執(zhí)行效率直接取決于顯卡的計(jì)算性能。
4.1 V-Ray Benchmark
V-Ray Benchmark 是一款免費(fèi)的獨(dú)立渲染速度測(cè)試軟件,用于測(cè)試您計(jì)算機(jī)的渲染速度。它可以簡(jiǎn)單快速的測(cè)試兩種渲染引擎:
> V-Ray GPU CUDA — GPU 渲染模式測(cè)試
> V-Ray GPU RTX — RTX GPU 渲染模式測(cè)試
本次測(cè)試不同 GPU 在不同 V-Ray 5 渲染引擎下的離線渲染性能,并記錄最終得分。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
在使用 RTX 渲染測(cè)試中,RTX PRO 4000 的性能都是 RTX 4000 Ada 的1.7倍。在使用 CUDA 測(cè)試中,RTX PRO 4000 的性能是 RTX 4000 Ada 的1.9倍。
4.2 Blender Benchmark
在Blender Benchmark測(cè)試中,我們選取了Monster、Junkshop和Classroom三個(gè)標(biāo)準(zhǔn)場(chǎng)景進(jìn)行渲染性能評(píng)估。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
其中在 Monster 場(chǎng)景的測(cè)試中,RTX PRO 4000 是 RTX 4000 Ada 的1.44倍。在 Junkshop 的測(cè)試中 RTX PRO 4000 是RTX 4000 Ada 的1.52倍。在 Classroom 的測(cè)試中 RTX PRO 4000 是 RTX 4000 Ada 的1.43倍。
4.3 Keyshot View Benchmark
KeyShot 作為工業(yè)制造領(lǐng)域廣泛應(yīng)用的實(shí)時(shí)渲染引擎,其官方配套提供了 KeyShot View 性能測(cè)試工具,專門用于評(píng)估 GPU 在 KeyShot 渲染場(chǎng)景中的圖形處理能力。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
在 KeyShot View 測(cè)試中,RTX PRO 4000 的性能是 RTX 4000 Ada 的1.4倍。
4.4 Octanebench
Octane渲染器作為業(yè)界主流的GPU渲染引擎,率先支持基于光線追蹤技術(shù)的實(shí)時(shí)渲染。我們采用其官方提供的基準(zhǔn)測(cè)試工具(Benchmark)對(duì)GPU渲染性能進(jìn)行量化評(píng)估。

▲ 測(cè)試結(jié)果圖表
從測(cè)試結(jié)果來(lái)看,在 Octane 渲染器上的性能 RTX PRO 4000 是 RTX 4000 Ada 的1.3倍。
5. AI 性能測(cè)試
在 AI 性能測(cè)試環(huán)節(jié),我們聚焦當(dāng)前主流應(yīng)用場(chǎng)景,分別針對(duì)文生圖(Text-to-Image)與大模型文本生成(LLM)展開(kāi)專項(xiàng)評(píng)估。
?文生圖測(cè)試?:采用業(yè)界廣泛應(yīng)用的 ComfyUI 工具,使用其默認(rèn)工作流參數(shù)及預(yù)設(shè)提示詞,通過(guò)統(tǒng)計(jì)單次圖像生成耗時(shí)進(jìn)行性能對(duì)比。
?LLM 性能測(cè)試?:基于 MLPerf Client v1.5 基準(zhǔn)測(cè)試套件,重點(diǎn)測(cè)量首 Token 生成時(shí)間(TTFT)和每秒處理 Token 數(shù)(TPS)兩大核心指標(biāo)。
5.1 Picture Generation Benchmark
▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從測(cè)試結(jié)果來(lái)看使用 ComfyUI 中常用的 Flux1-dev-fp8 模型進(jìn)行推理性能測(cè)試,RTX PRO 4000 是 RTX 4000 Ada 性能的1.9倍。
5.2 MLPerf Client v1.5 Benchmark
在軟件測(cè)試環(huán)節(jié),我們采用了多款主流語(yǔ)言模型(LLM)進(jìn)行性能評(píng)估。大型語(yǔ)言模型作為當(dāng)前最具影響力的生成式人工智能形態(tài)之一,能夠通過(guò)自然語(yǔ)言交互實(shí)現(xiàn)多任務(wù)處理。選擇聚焦 LLM 測(cè)試,源于其在客戶端本地部署場(chǎng)景中展現(xiàn)出廣闊應(yīng)用前景,涵蓋智能聊天交互、AI 代理服務(wù)及個(gè)性化信息管理等領(lǐng)域。因此,我們選用 MLPerf 這一權(quán)威基準(zhǔn)測(cè)試平臺(tái),重點(diǎn)評(píng)估 GPU 加速大模型的首 Token 生成時(shí)間(TTFT)及每秒處理 Token 數(shù)(TPS)兩大核心指標(biāo)。

▲ RTX PRO 4000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表

▲ 測(cè)試結(jié)果圖表
從測(cè)試結(jié)果來(lái)看在大模型推理性能上,無(wú)論是響應(yīng)時(shí)間,還是每秒處理的 Tokens 數(shù)量,RTX PRO 4000 都是 RTX 4000 Ada 的1.4~1.5倍性能,性能提升幅度很大。
總結(jié)

▲ NVIDIA RTX PRO 4000 Blackwell 官方渲染圖
作為高端專業(yè)圖形卡產(chǎn)品線的最新力作,NVIDIA RTX PRO 4000 Blackwell 延續(xù)了標(biāo)志性的單槽設(shè)計(jì),在功耗小幅提升的基礎(chǔ)上,實(shí)現(xiàn)了跨應(yīng)用場(chǎng)景的顯著性能躍升。
單精度浮點(diǎn)運(yùn)算性能提升了近 60%,在實(shí)時(shí)渲染上 DirectX12、OpenGL、Vulkan 都有 50% 左右的性能提升。如果使用 DLSS 渲染,由于 GPU 支持第 5 代 Tensor Coe 所以可以支持 4 倍的增幀效果,渲染幀數(shù)提高更多。
在離線渲染方面也有了 40%~90% 的性能提升,渲染出圖或者視頻的性能會(huì)更快。
在 AI 性能方面,第 5 代 Tensor Core 增加了對(duì) FP4 精度的支持,在測(cè)試文生圖的業(yè)務(wù)流程中有 90% 的性能提升。在大模型推理的應(yīng)用場(chǎng)景中,首次響應(yīng)時(shí)間和每秒處理的 Tokens 數(shù)量,都有 40%~50% 的提升。
在專業(yè) CAD 和 DCC 的交互性能方面普遍有了提升,根據(jù)軟件的不同,從 20%~100% 提升幅度不一。
綜上所述,NVIDIA RTX PRO 4000 Blackwell 基于 NVIDIA Blackwell 架構(gòu)構(gòu)建,提供突破性的 AI 性能和無(wú)與倫比的圖形處理效率,從而釋放新體驗(yàn),并加速要求嚴(yán)苛的工作流。配備 24GB 超高速顯存、第五代 Tensor Core 和第四代 RT Core,可處理大型數(shù)據(jù)集,加速生成式 AI 工作流程,并以極快的速度渲染出逼真的場(chǎng)景。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5682瀏覽量
110086 -
gpu
+關(guān)注
關(guān)注
28文章
5258瀏覽量
136032 -
顯卡
+關(guān)注
關(guān)注
17文章
2523瀏覽量
71708
原文標(biāo)題:NVIDIA RTX PRO 4000 Blackwell 評(píng)測(cè):性能暴漲,專業(yè)工作流全面提速!
文章出處:【微信號(hào):Leadtek,微信公眾號(hào):麗臺(tái)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片
NVIDIA火熱招聘GPU高性能計(jì)算架構(gòu)師
NVIDIA發(fā)布 GeForce RTX 40 系列 GPU
全新 NVIDIA RTX Enterprise 驅(qū)動(dòng)程序支持最新的 RTX 6000 Ada 架構(gòu) GPU,助力改進(jìn)圖形工作流
NVIDIA和GeForce RTX GPU專為AI時(shí)代打造
NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對(duì)比
NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析
NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)
NVIDIA Blackwell推動(dòng)流式傳輸和數(shù)據(jù)分析的未來(lái)發(fā)展
NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品
NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試
評(píng)論