十幾年前,還不曾有加速應(yīng)用程序。而如今已有近600個(gè)應(yīng)用程序通過(guò)NVIDIA GPU實(shí)現(xiàn)了提速。
這些應(yīng)用程序涵蓋了物理、生物科學(xué)、分子動(dòng)力學(xué)、化學(xué)和天氣預(yù)報(bào)等各個(gè)領(lǐng)域。其中包括全球最熱門的15個(gè)高性能計(jì)算應(yīng)用程序,也都是通過(guò)GPU實(shí)現(xiàn)加速的。去年,NVIDIA GPU應(yīng)用程序目錄收錄了100多個(gè)應(yīng)用程序,接下來(lái)還會(huì)有更多的程序?qū)⒈魂懤m(xù)添加到目錄中。

Intersect 360研究所的一份報(bào)告中收錄了數(shù)據(jù)中心運(yùn)行的各個(gè)關(guān)鍵應(yīng)用程序。其中,排名前15的應(yīng)用程序均由GPU加速,這些都是一系列殺手級(jí)的核心科學(xué)應(yīng)用程序。其中包括:
GROMACS(化學(xué))– 分子動(dòng)力學(xué)應(yīng)用程序,旨在模擬包含了數(shù)百到數(shù)百萬(wàn)個(gè)粒子的系統(tǒng)的牛頓運(yùn)動(dòng)方程。
ANSYS(流體動(dòng)力學(xué)分析)– 模擬液體和氣體與表面的相互作用。
Gaussian(化學(xué))– 預(yù)測(cè)分子系統(tǒng)的能量、分子結(jié)構(gòu)和振動(dòng)頻率。
VASP(化學(xué))– 用于從頭計(jì)算法量子力學(xué)分子動(dòng)力學(xué)模擬。
NAMD(化學(xué))– 大型生物分子系統(tǒng)的高性能模擬。
Simulia Abaqus(結(jié)構(gòu)分析)– 用于結(jié)構(gòu)力學(xué)的模擬和分析。
WRF(天氣/環(huán)境建模)– 數(shù)值天氣預(yù)報(bào)系統(tǒng),專為大氣研究和操作預(yù)測(cè)應(yīng)用程序而設(shè)計(jì)。
OpenFOAM(流體動(dòng)力學(xué)分析)– 通用型 CFD 軟件的求解器庫(kù)。
ANSYS(結(jié)構(gòu)分析)– 對(duì)高頻和高速電子元件中的 3D 全波電磁場(chǎng)進(jìn)行建模。
LS-DYNA(結(jié)構(gòu)分析)– 結(jié)構(gòu)力學(xué)的模擬和分析工具。
BLAST(生物科學(xué))– 應(yīng)用最為廣泛的生物信息學(xué)工具之一。
LAMMPS(化學(xué))– 經(jīng)典分子動(dòng)力學(xué)程序包。
Amber(化學(xué))– 專門針對(duì)生物分子系統(tǒng)模擬而開(kāi)發(fā)的分子動(dòng)力學(xué)應(yīng)用程序。
Quantum Espresso(化學(xué))– 一套集成的計(jì)算機(jī)代碼,用于電子結(jié)構(gòu)計(jì)算和納米級(jí)材料建模。
GAMESS(化學(xué))– 用于模擬原子和分子電子結(jié)構(gòu)的計(jì)算化學(xué)套件。
這些工具本身無(wú)法實(shí)現(xiàn)性能的遞增性提升。但通過(guò)采用NVIDIA GPU的服務(wù)器,其性能通??商岣?0 倍或更多。并且,GPU加速可以改善數(shù)據(jù)中心的經(jīng)濟(jì)效益。
預(yù)測(cè)天氣
天氣預(yù)報(bào)是一項(xiàng)遠(yuǎn)比其看起來(lái)更加困難的工作。天氣預(yù)報(bào)是高性能計(jì)算領(lǐng)域的一個(gè)重要分支。準(zhǔn)確可靠的天氣預(yù)報(bào)不僅可以拯救生命,還有助于航空、能源和公用事業(yè)、保險(xiǎn)、零售和其他行業(yè)做出經(jīng)濟(jì)決策。
天氣預(yù)報(bào)需要大量的計(jì)算資源,包括幾何尺度(尤其是全球天氣預(yù)報(bào)),和大量描述大氣狀態(tài)的變量。
但是,受限于可用的計(jì)算量和應(yīng)用程序的性能,當(dāng)前的天氣預(yù)報(bào)模型僅限于低分辨率的模擬,例如12公里的分辨率。
這些模型忽略了一些重要的細(xì)節(jié),例如云層的影響(云層可以反射太陽(yáng)輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預(yù)測(cè)效果,但這需要 應(yīng)用程序的性能提升1700倍。
GPU加速可以彌補(bǔ)此差距,提高天氣預(yù)報(bào)的準(zhǔn)確性。
加速空氣動(dòng)力學(xué)模擬
使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場(chǎng)。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。
火箭能夠以超高的速度飛行,然而利用大規(guī)??諝鈩?dòng)力學(xué)模擬,我們可以對(duì)其進(jìn)行改進(jìn),讓火箭可以飛得更快、更高效。
NASA蘭利研究中心開(kāi)發(fā)的FUN3D計(jì)算流體動(dòng)力學(xué)軟件,可用于模擬各種空氣動(dòng)力學(xué)應(yīng)用程序中的流體流動(dòng)。該應(yīng)用程序在NASA Pleiades超級(jí)計(jì)算機(jī)上消耗的周期比其他任何應(yīng)用程序都要多。借助于GPU加速,采用了6個(gè)NVIDIA V100 Tensor Core GPU的服務(wù)器能夠以高出雙插槽CPU服務(wù)器30倍的性能運(yùn)行這些模擬。
總結(jié):GPU具備非常好的性能,從而高效地計(jì)算規(guī)模更大、更復(fù)雜的模擬。NASA已經(jīng)證明,在Summit超級(jí)計(jì)算機(jī)上,僅需運(yùn)行1000臺(tái)GPU服務(wù)器就可以完成100多萬(wàn)個(gè)CPU核心的工作。而且,其能源成本遠(yuǎn)低于CPU。
性能持續(xù)提升
我們?cè)诟鱾€(gè)加速計(jì)算領(lǐng)域都擁有深厚的儲(chǔ)備。結(jié)合由100多萬(wàn)名開(kāi)發(fā)人員組成的生態(tài)系統(tǒng),我們將共同形成一個(gè)不斷改進(jìn)的平臺(tái)。該平臺(tái)可以在相同的 GPU加速服務(wù)器上提供更高的應(yīng)用程序性能。
例如,在包含 11 個(gè)高性能計(jì)算應(yīng)用程序的組合中,對(duì)于采用4個(gè)NVIDIA Tesla P100 GPU的服務(wù)器,其當(dāng)前的運(yùn)行速度比兩年前提高了2倍。如果同時(shí)改進(jìn)軟件堆棧和GPU架構(gòu),您可以獲得更大的性能提升。
現(xiàn)在,通過(guò)單一平臺(tái),您可以加速各種高性能計(jì)算領(lǐng)域的應(yīng)用程序:科學(xué)計(jì)算、工業(yè)模擬、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5581瀏覽量
109609 -
gpu
+關(guān)注
關(guān)注
28文章
5177瀏覽量
135255
原文標(biāo)題:GPU已加速的近600個(gè)高性能計(jì)算應(yīng)用程序都有哪些?
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程
NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)
NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試
在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南
DeepSeek R1 MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化
NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析
NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品
NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄
近600個(gè)應(yīng)用程序通過(guò)NVIDIA GPU實(shí)現(xiàn)了提速
評(píng)論