我們生活在一個(gè)每天都會(huì)產(chǎn)生大量數(shù)據(jù)的數(shù)字信息時(shí)代。隨著物聯(lián)網(wǎng)設(shè)備、自動(dòng)駕駛汽車(chē)、聯(lián)網(wǎng)家庭和聯(lián)網(wǎng)工作場(chǎng)所數(shù)量的不斷增加,數(shù)據(jù)中心的數(shù)據(jù)愈加趨向飽和。因此,需要一種解決方案,使數(shù)據(jù)中心能夠處理不斷增加的進(jìn)出和通過(guò)數(shù)據(jù)中心傳輸?shù)臄?shù)據(jù)量。
數(shù)據(jù)處理單元,通常稱(chēng)為DPU,是一種新型可編程的高性能處理器,優(yōu)化執(zhí)行和加速由數(shù)據(jù)中心服務(wù)器執(zhí)行的網(wǎng)絡(luò)和存儲(chǔ)功能。DPU 就像 GPU 一樣插在服務(wù)器的 PCIe 插槽上,它們?cè)试S服務(wù)器將網(wǎng)絡(luò)和存儲(chǔ)功能從 CPU 卸載到DPU上 ,從而使 CPU 專(zhuān)注于運(yùn)行操作系統(tǒng)和系統(tǒng)應(yīng)用程序。DPU 通常使用可重新編程的 FPGA 與網(wǎng)卡相結(jié)合來(lái)加速網(wǎng)絡(luò)流量。
DPU是由三個(gè)主要元件組成的片上系統(tǒng)。首先,數(shù)據(jù)處理單元通常有一個(gè)軟件可編程的多核 CPU 。第二個(gè)元件是高性能網(wǎng)絡(luò)接口,它使 DPU 能夠解析、處理并在網(wǎng)絡(luò)中有效地傳輸數(shù)據(jù)。第三個(gè)元件是一組豐富的靈活、可編程的加速引擎,它將網(wǎng)絡(luò)和存儲(chǔ)功能從 CPU 卸載到 DPU。
此外,DPU 可用于處理包括網(wǎng)絡(luò)安全、防火墻任務(wù)、加密和基礎(chǔ)設(shè)施管理在內(nèi)的功能。
DPU 最常見(jiàn)的特性是什么?
DPU 具有很多功能,以下是最常見(jiàn)的功能:
1)通過(guò)一個(gè)或多個(gè) 100 Gigabit 到 200 Gigabit 接口的高速連接
2)高速數(shù)據(jù)包處理
3)基于 ARM 或 MIPS 的 CPU多核處理處理器(8個(gè)64位Arm CPU內(nèi)核)
5)加速器
6)PCI Express Gen 4 支持
7)安全功能
8)自定義操作系統(tǒng)與主機(jī)系統(tǒng)的操作系統(tǒng)分離
常見(jiàn)的 DPU 解決方案有哪些?
2021年4月,英偉達(dá)發(fā)布了新一代數(shù)據(jù)處理器BlueField-3 DPU。BlueField-3是首款為AI和加速計(jì)算而設(shè)計(jì)的DPU,相比上一代產(chǎn)品,它具有10倍加速計(jì)算能力、16個(gè)Arm A78 CPU核,和4倍的加密速度。BlueField-3利用英偉達(dá) DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開(kāi)發(fā)包的優(yōu)勢(shì),為開(kāi)發(fā)者提供一個(gè)完整、開(kāi)放的軟件平臺(tái),開(kāi)發(fā)在BlueField DPU上開(kāi)發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理等應(yīng)用。BlueField-3預(yù)計(jì)將于2022年第一季度發(fā)布樣品。

賽靈思和英特爾的一些產(chǎn)品被稱(chēng)為SmartNIC ,利用FPGA 來(lái)加速網(wǎng)絡(luò)和存儲(chǔ)功能。智能網(wǎng)卡的工作原理與數(shù)據(jù)處理單元相同,它們將網(wǎng)絡(luò)功能從CPU 卸載到 SmartNIC,通過(guò)將網(wǎng)絡(luò)和存儲(chǔ)功能智能地委托給 SmartNIC ,從而釋放處理能力。FPGA 的可重新編程特性,為數(shù)據(jù)路徑帶來(lái)了并行性和定制化。
例如,賽靈思提供帶各種產(chǎn)品的 ALVEO 系列SmartNIC,英特爾及其合作伙伴提供了多種基于 FPGA 的 SmartNIC 解決方案,以加速大型數(shù)據(jù)中心的數(shù)據(jù)處理工作負(fù)載。英特爾稱(chēng)其 SmartNIC“通過(guò)將交換、存儲(chǔ)和安全功能卸載到集成了英特爾 FPGA 和英特爾至強(qiáng)處理器的單一 PCIe 平臺(tái)上來(lái)提高數(shù)據(jù)中心的性能水平。” 英特爾提供了第二個(gè)更新的 SmartNIC解決方案,稱(chēng)為 Silicom FPGA SmartNIC N5010,它結(jié)合了英特爾 Stratix 10 FPGA 和英特爾以太網(wǎng) 800 系列適配器,為組織提供 4個(gè)100 Gigabit 以太網(wǎng)端口,為數(shù)據(jù)中心提供充足的帶寬。
Fungible是一家位于加利福尼亞的組合式系統(tǒng)初創(chuàng)公司。該公司聲稱(chēng)其技術(shù)能為每100美元的數(shù)據(jù)中心網(wǎng)絡(luò)中的網(wǎng)絡(luò)、計(jì)算和存儲(chǔ)資源節(jié)省67美元。針對(duì)以數(shù)據(jù)為中心(data-centric)應(yīng)用的處理,F(xiàn)ungible研發(fā)了F1 DPU處理器和TrueFabric互聯(lián)技術(shù)。TrueFabric是由Fungible首先提出的新型大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)標(biāo)準(zhǔn),這種Fabric互聯(lián)協(xié)議基于標(biāo)準(zhǔn)的UDP/IP/Ethernet協(xié)議棧構(gòu)建。

Fungible F1 DPU 外殼
RoCEv2是一種當(dāng)前數(shù)據(jù)中心網(wǎng)絡(luò)中主流的互聯(lián)網(wǎng)絡(luò)協(xié)議,該協(xié)議同樣基于UDP/IP/Ethernet搭建,對(duì)終端提供高性能的RDMA Read/Write服務(wù),而TrueFabric對(duì)接入點(diǎn)提供高性能的Send/Receive服務(wù)。Fungible F1 DPU原生支持TrueFabric,因此F1 DPU可以用于大規(guī)模TrueFabric數(shù)據(jù)中心網(wǎng)絡(luò),不同類(lèi)型的服務(wù)器都可以將Fungible DPU作為網(wǎng)絡(luò)接入點(diǎn)。
還有哪些其他性能加速器?
下面是數(shù)據(jù)中心中經(jīng)常使用的一些性能加速器,包括 GPU、CSD和 FPGA。
1. GPU
GPU通常部署在數(shù)據(jù)中心的高性能服務(wù)器上,以加速工作負(fù)載。服務(wù)器通常會(huì)將復(fù)雜的數(shù)學(xué)計(jì)算卸載到 GPU。因?yàn)镚PU 采用了一種并行架構(gòu),該架構(gòu)由許多比 CPU 更小的內(nèi)核組成,使它們能夠并行處理許多任務(wù),從而使組織能夠從服務(wù)器中提取更多性能。

來(lái)源:英偉達(dá)
例如,CPU平均有四到十個(gè)核心,而 GPU 有數(shù)百或數(shù)千個(gè)較小的核心,它們一起運(yùn)行以并行處理復(fù)雜的計(jì)算。CPU更適合順序數(shù)據(jù)處理。
安裝在數(shù)據(jù)中心服務(wù)器上的 GPU 非常適合加速深度學(xué)習(xí)訓(xùn)練和機(jī)器學(xué)習(xí)訓(xùn)練,這些訓(xùn)練需要大量的計(jì)算能力,而CPU無(wú)法提供。組織使用 GPU 來(lái)訓(xùn)練深度學(xué)習(xí)和機(jī)器學(xué)習(xí)模型,數(shù)據(jù)集越大,神經(jīng)網(wǎng)絡(luò)越大,復(fù)雜的計(jì)算需要很長(zhǎng)時(shí)間。在某些情況下,深度學(xué)習(xí)訓(xùn)練需要幾個(gè)小時(shí),但若使用 CPU 執(zhí)行相同的任務(wù)可能需要幾天到幾周的時(shí)間。
此外,將GPU 添加到數(shù)據(jù)中心服務(wù)器可顯著提高數(shù)據(jù)吞吐量,并提供以盡可能低的延遲處理和分析數(shù)據(jù)的能力。(延遲是指完成給定任務(wù)所需的時(shí)間量,數(shù)據(jù)吞吐量是指單位時(shí)間內(nèi)完成的任務(wù)數(shù)。)
2.計(jì)算存儲(chǔ)驅(qū)動(dòng)器(CSD)
計(jì)算存儲(chǔ)已經(jīng)作為性能加速器進(jìn)入數(shù)據(jù)中心,在存儲(chǔ)設(shè)備級(jí)別處理數(shù)據(jù),減少了CPU 和存儲(chǔ)設(shè)備之間的數(shù)據(jù)傳輸。計(jì)算存儲(chǔ)支持實(shí)時(shí)數(shù)據(jù)分析,并通過(guò)減少輸入/輸出瓶頸來(lái)提高系統(tǒng)性能。CSD看起來(lái)與常規(guī)存儲(chǔ)驅(qū)動(dòng)器相同,但它們包含一個(gè)多核處理器,用于執(zhí)行一些功能,例如在數(shù)據(jù)進(jìn)入存儲(chǔ)設(shè)備時(shí)對(duì)數(shù)據(jù)進(jìn)行索引,并在存儲(chǔ)設(shè)備中搜索特定條目。

來(lái)源:AnandTech
由于實(shí)時(shí)處理和分析數(shù)據(jù)的需求不斷增長(zhǎng),CSD越來(lái)越受歡迎。數(shù)據(jù)不再需要在存儲(chǔ)設(shè)備和 CPU 之間傳輸。相反,數(shù)據(jù)在存儲(chǔ)設(shè)備本身上進(jìn)行處理,在數(shù)據(jù)所在的確切位置為存儲(chǔ)介質(zhì)提供計(jì)算能力,從而實(shí)現(xiàn)實(shí)時(shí)分析和決策。
3. FPGA
FPGA是一種集成電路,由邏輯塊、I/O單元和其他資源組成,允許用戶(hù)根據(jù)需要執(zhí)行的工作負(fù)載的特定要求以不同的方式重新編程和重新配置芯片。FPGA在執(zhí)行深度學(xué)習(xí)推理處理和機(jī)器學(xué)習(xí)推理方面也越來(lái)越受歡迎。

來(lái)源:Xilinx
在英偉達(dá)的帶領(lǐng)下,DPU的概念非?;鸨???傮w而言,由于數(shù)據(jù)中心中存儲(chǔ)的數(shù)據(jù)量不斷增加,需要一種能夠加速高性能數(shù)據(jù)中心服務(wù)器執(zhí)行的存儲(chǔ)和網(wǎng)絡(luò)功能的解決方案,而DPU 可以為現(xiàn)有服務(wù)器注入新的活力,發(fā)展市場(chǎng)非常巨大,預(yù)測(cè)到2025年僅中國(guó)市場(chǎng)就能達(dá)到每年40億美元的規(guī)模,估計(jì)全球?qū)⒊^(guò)120億美元。
審核編輯 :李倩
-
cpu
+關(guān)注
關(guān)注
68文章
11224瀏覽量
223120 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5541瀏覽量
74695 -
DPU
+關(guān)注
關(guān)注
0文章
408瀏覽量
26272
原文標(biāo)題:淺談DPU產(chǎn)業(yè)發(fā)展現(xiàn)狀
文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
慧爾視亮相2025交通毫米波雷達(dá)產(chǎn)業(yè)發(fā)展大會(huì)
MEMS加速度計(jì)與石英加速度計(jì)的發(fā)展現(xiàn)狀與水平對(duì)比
利用NVIDIA DPU重塑網(wǎng)絡(luò)安全格局
中國(guó)芯片發(fā)展現(xiàn)狀和趨勢(shì)2025
鋁電解電容的行業(yè)發(fā)展現(xiàn)狀與未來(lái)趨勢(shì)展望
RISC-V 發(fā)展現(xiàn)狀及未來(lái)發(fā)展重點(diǎn)
光刻膠產(chǎn)業(yè)國(guó)內(nèi)發(fā)展現(xiàn)狀
淺談虛擬電廠技術(shù)現(xiàn)狀及展望
AI在醫(yī)療健康和生命科學(xué)中的發(fā)展現(xiàn)狀
中關(guān)村泛聯(lián)院一行來(lái)訪中科馭數(shù)
工業(yè)電機(jī)行業(yè)現(xiàn)狀及未來(lái)發(fā)展趨勢(shì)分析
2025年紅外傳感器發(fā)展現(xiàn)狀:科技創(chuàng)新與市場(chǎng)擴(kuò)展的交匯點(diǎn)
先進(jìn)陶瓷產(chǎn)業(yè)發(fā)展現(xiàn)狀剖析與發(fā)展建議

淺談DPU產(chǎn)業(yè)發(fā)展現(xiàn)狀
評(píng)論