Av希崎杰西卡初次剃毛体验,国内精品久久久久久蜜芽,影音先锋国产三区

我們生活在一個(gè)每天都會(huì)產(chǎn)生大量數(shù)據(jù)的數(shù)字信息時(shí)代。隨著物聯(lián)網(wǎng)設(shè)備、自動(dòng)駕駛汽車(chē)、聯(lián)網(wǎng)家庭和聯(lián)網(wǎng)工作場(chǎng)所數(shù)量的不斷增加，數(shù)據(jù)中心的數(shù)據(jù)愈加趨向飽和。因此，需要一種解決方案，使數(shù)據(jù)中心能夠處理不斷增加的進(jìn)出和通過(guò)數(shù)據(jù)中心傳輸?shù)臄?shù)據(jù)量。

數(shù)據(jù)處理單元，通常稱(chēng)為DPU，是一種新型可編程的高性能處理器，優(yōu)化執(zhí)行和加速由數(shù)據(jù)中心服務(wù)器執(zhí)行的網(wǎng)絡(luò)和存儲(chǔ)功能。DPU 就像 GPU 一樣插在服務(wù)器的 PCIe 插槽上，它們?cè)试S服務(wù)器將網(wǎng)絡(luò)和存儲(chǔ)功能從 CPU 卸載到DPU上，從而使 CPU 專(zhuān)注于運(yùn)行操作系統(tǒng)和系統(tǒng)應(yīng)用程序。DPU 通常使用可重新編程的 FPGA 與網(wǎng)卡相結(jié)合來(lái)加速網(wǎng)絡(luò)流量。

DPU是由三個(gè)主要元件組成的片上系統(tǒng)。首先，數(shù)據(jù)處理單元通常有一個(gè)軟件可編程的多核 CPU 。第二個(gè)元件是高性能網(wǎng)絡(luò)接口，它使 DPU 能夠解析、處理并在網(wǎng)絡(luò)中有效地傳輸數(shù)據(jù)。第三個(gè)元件是一組豐富的靈活、可編程的加速引擎，它將網(wǎng)絡(luò)和存儲(chǔ)功能從 CPU 卸載到 DPU。

此外，DPU 可用于處理包括網(wǎng)絡(luò)安全、防火墻任務(wù)、加密和基礎(chǔ)設(shè)施管理在內(nèi)的功能。

DPU 最常見(jiàn)的特性是什么？

DPU 具有很多功能，以下是最常見(jiàn)的功能：

1）通過(guò)一個(gè)或多個(gè) 100 Gigabit 到 200 Gigabit 接口的高速連接

2）高速數(shù)據(jù)包處理

3）基于 ARM 或 MIPS 的 CPU多核處理處理器（8個(gè)64位Arm CPU內(nèi)核）

4）支持 DDR4和DDR5 RAM的內(nèi)存控制器

5）加速器

6）PCI Express Gen 4 支持

7）安全功能

8）自定義操作系統(tǒng)與主機(jī)系統(tǒng)的操作系統(tǒng)分離

常見(jiàn)的 DPU 解決方案有哪些？

2021年4月，英偉達(dá)發(fā)布了新一代數(shù)據(jù)處理器BlueField-3 DPU。BlueField-3是首款為AI和加速計(jì)算而設(shè)計(jì)的DPU，相比上一代產(chǎn)品，它具有10倍加速計(jì)算能力、16個(gè)Arm A78 CPU核，和4倍的加密速度。BlueField-3利用英偉達(dá) DOCA（集數(shù)據(jù)中心于芯片的架構(gòu)）軟件開(kāi)發(fā)包的優(yōu)勢(shì)，為開(kāi)發(fā)者提供一個(gè)完整、開(kāi)放的軟件平臺(tái)，開(kāi)發(fā)在BlueField DPU上開(kāi)發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理等應(yīng)用。BlueField-3預(yù)計(jì)將于2022年第一季度發(fā)布樣品。

賽靈思和英特爾的一些產(chǎn)品被稱(chēng)為SmartNIC ，利用FPGA 來(lái)加速網(wǎng)絡(luò)和存儲(chǔ)功能。智能網(wǎng)卡的工作原理與數(shù)據(jù)處理單元相同，它們將網(wǎng)絡(luò)功能從CPU 卸載到 SmartNIC，通過(guò)將網(wǎng)絡(luò)和存儲(chǔ)功能智能地委托給 SmartNIC ，從而釋放處理能力。FPGA 的可重新編程特性，為數(shù)據(jù)路徑帶來(lái)了并行性和定制化。

例如，賽靈思提供帶各種產(chǎn)品的 ALVEO 系列SmartNIC，英特爾及其合作伙伴提供了多種基于 FPGA 的 SmartNIC 解決方案，以加速大型數(shù)據(jù)中心的數(shù)據(jù)處理工作負(fù)載。英特爾稱(chēng)其 SmartNIC“通過(guò)將交換、存儲(chǔ)和安全功能卸載到集成了英特爾 FPGA 和英特爾至強(qiáng)處理器的單一 PCIe 平臺(tái)上來(lái)提高數(shù)據(jù)中心的性能水平。” 英特爾提供了第二個(gè)更新的 SmartNIC解決方案，稱(chēng)為 Silicom FPGA SmartNIC N5010，它結(jié)合了英特爾 Stratix 10 FPGA 和英特爾以太網(wǎng) 800 系列適配器，為組織提供 4個(gè)100 Gigabit 以太網(wǎng)端口，為數(shù)據(jù)中心提供充足的帶寬。

Fungible是一家位于加利福尼亞的組合式系統(tǒng)初創(chuàng)公司。該公司聲稱(chēng)其技術(shù)能為每100美元的數(shù)據(jù)中心網(wǎng)絡(luò)中的網(wǎng)絡(luò)、計(jì)算和存儲(chǔ)資源節(jié)省67美元。針對(duì)以數(shù)據(jù)為中心（data-centric）應(yīng)用的處理，F(xiàn)ungible研發(fā)了F1 DPU處理器和TrueFabric互聯(lián)技術(shù)。TrueFabric是由Fungible首先提出的新型大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)標(biāo)準(zhǔn)，這種Fabric互聯(lián)協(xié)議基于標(biāo)準(zhǔn)的UDP/IP/Ethernet協(xié)議棧構(gòu)建。

Fungible F1 DPU 外殼

RoCEv2是一種當(dāng)前數(shù)據(jù)中心網(wǎng)絡(luò)中主流的互聯(lián)網(wǎng)絡(luò)協(xié)議，該協(xié)議同樣基于UDP/IP/Ethernet搭建，對(duì)終端提供高性能的RDMA Read/Write服務(wù)，而TrueFabric對(duì)接入點(diǎn)提供高性能的Send/Receive服務(wù)。Fungible F1 DPU原生支持TrueFabric，因此F1 DPU可以用于大規(guī)模TrueFabric數(shù)據(jù)中心網(wǎng)絡(luò)，不同類(lèi)型的服務(wù)器都可以將Fungible DPU作為網(wǎng)絡(luò)接入點(diǎn)。

還有哪些其他性能加速器？

下面是數(shù)據(jù)中心中經(jīng)常使用的一些性能加速器，包括 GPU、CSD和 FPGA。

1. GPU

GPU通常部署在數(shù)據(jù)中心的高性能服務(wù)器上，以加速工作負(fù)載。服務(wù)器通常會(huì)將復(fù)雜的數(shù)學(xué)計(jì)算卸載到 GPU。因?yàn)镚PU 采用了一種并行架構(gòu)，該架構(gòu)由許多比 CPU 更小的內(nèi)核組成，使它們能夠并行處理許多任務(wù)，從而使組織能夠從服務(wù)器中提取更多性能。

來(lái)源：英偉達(dá)

例如，CPU平均有四到十個(gè)核心，而 GPU 有數(shù)百或數(shù)千個(gè)較小的核心，它們一起運(yùn)行以并行處理復(fù)雜的計(jì)算。CPU更適合順序數(shù)據(jù)處理。

安裝在數(shù)據(jù)中心服務(wù)器上的 GPU 非常適合加速深度學(xué)習(xí)訓(xùn)練和機(jī)器學(xué)習(xí)訓(xùn)練，這些訓(xùn)練需要大量的計(jì)算能力，而CPU無(wú)法提供。組織使用 GPU 來(lái)訓(xùn)練深度學(xué)習(xí)和機(jī)器學(xué)習(xí)模型，數(shù)據(jù)集越大，神經(jīng)網(wǎng)絡(luò)越大，復(fù)雜的計(jì)算需要很長(zhǎng)時(shí)間。在某些情況下，深度學(xué)習(xí)訓(xùn)練需要幾個(gè)小時(shí)，但若使用 CPU 執(zhí)行相同的任務(wù)可能需要幾天到幾周的時(shí)間。

此外，將GPU 添加到數(shù)據(jù)中心服務(wù)器可顯著提高數(shù)據(jù)吞吐量，并提供以盡可能低的延遲處理和分析數(shù)據(jù)的能力。（延遲是指完成給定任務(wù)所需的時(shí)間量，數(shù)據(jù)吞吐量是指單位時(shí)間內(nèi)完成的任務(wù)數(shù)。）

2.計(jì)算存儲(chǔ)驅(qū)動(dòng)器（CSD）

計(jì)算存儲(chǔ)已經(jīng)作為性能加速器進(jìn)入數(shù)據(jù)中心，在存儲(chǔ)設(shè)備級(jí)別處理數(shù)據(jù)，減少了CPU 和存儲(chǔ)設(shè)備之間的數(shù)據(jù)傳輸。計(jì)算存儲(chǔ)支持實(shí)時(shí)數(shù)據(jù)分析，并通過(guò)減少輸入/輸出瓶頸來(lái)提高系統(tǒng)性能。CSD看起來(lái)與常規(guī)存儲(chǔ)驅(qū)動(dòng)器相同，但它們包含一個(gè)多核處理器，用于執(zhí)行一些功能，例如在數(shù)據(jù)進(jìn)入存儲(chǔ)設(shè)備時(shí)對(duì)數(shù)據(jù)進(jìn)行索引，并在存儲(chǔ)設(shè)備中搜索特定條目。

來(lái)源：AnandTech

由于實(shí)時(shí)處理和分析數(shù)據(jù)的需求不斷增長(zhǎng)，CSD越來(lái)越受歡迎。數(shù)據(jù)不再需要在存儲(chǔ)設(shè)備和 CPU 之間傳輸。相反，數(shù)據(jù)在存儲(chǔ)設(shè)備本身上進(jìn)行處理，在數(shù)據(jù)所在的確切位置為存儲(chǔ)介質(zhì)提供計(jì)算能力，從而實(shí)現(xiàn)實(shí)時(shí)分析和決策。

3. FPGA

FPGA是一種集成電路，由邏輯塊、I/O單元和其他資源組成，允許用戶(hù)根據(jù)需要執(zhí)行的工作負(fù)載的特定要求以不同的方式重新編程和重新配置芯片。FPGA在執(zhí)行深度學(xué)習(xí)推理處理和機(jī)器學(xué)習(xí)推理方面也越來(lái)越受歡迎。

來(lái)源：Xilinx

在英偉達(dá)的帶領(lǐng)下，DPU的概念非?；鸨??？傮w而言，由于數(shù)據(jù)中心中存儲(chǔ)的數(shù)據(jù)量不斷增加，需要一種能夠加速高性能數(shù)據(jù)中心服務(wù)器執(zhí)行的存儲(chǔ)和網(wǎng)絡(luò)功能的解決方案，而DPU 可以為現(xiàn)有服務(wù)器注入新的活力，發(fā)展市場(chǎng)非常巨大，預(yù)測(cè)到2025年僅中國(guó)市場(chǎng)就能達(dá)到每年40億美元的規(guī)模，估計(jì)全球?qū)⒊^(guò)120億美元。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴