亚洲综合无码40p,中文字幕人妻av一区二区,十八女下面流水不遮免费视频

主頻只是影響計算速度的一個因素，并不是全部。在執(zhí)行一些計算密集型的任務(wù)場景中，FPGA的計算速度是更快的，目前FPGA作為CPU的協(xié)處理器已經(jīng)廣泛應(yīng)用在Intel、AMD等公司的產(chǎn)品中。

CPU、GPU、和FPGA的比較

桌面端的CPU為馮諾依曼結(jié)構(gòu)，從上圖可以看出，其基本組成為控制器，Cache，和ALU。而計算單元ALU在CPU中的占比不大，所以它的并行計算能力有限。

中間的為GPU，綠色的計算單元占了絕大部分，所以并行計算能力很強。

弱點是控制能力很弱，Cache小，為了保證計算能力，就需要大量的高速DDR保證數(shù)據(jù)吞吐率。

右側(cè)為FPGA，包含可編程的I/O、DSP、memory、PCIE等，因為大量存儲單元的存在，F(xiàn)PGA在做計算的時候可以直接從內(nèi)部存儲單元讀取數(shù)據(jù)。

推薦一個國外的FPGA學(xué)習(xí)網(wǎng)站 -- fpga4fun，里邊有FPGA的介紹及26個實戰(zhàn)項目及實現(xiàn)代碼，非常適合入門學(xué)習(xí)！

https://www.fpga4fun.com/

正因為CPU、GPU、和FPGA在結(jié)構(gòu)上的不同，也讓他們在實際應(yīng)用層面有所側(cè)重。

目前主流的方案是把CPU、GPU和FPGA都集成在一個SoC中，通過片內(nèi)總線互聯(lián)。在執(zhí)行并行計算的時候，比如進(jìn)行圖像處理，F(xiàn)PGA的優(yōu)勢就體現(xiàn)出來了，通過協(xié)作分工，使芯片的工作效率最大化。

目前的3D封裝以及chiplet等技術(shù)為這樣的組合提供了可實現(xiàn)性。

為什么FPGA計算速度會比CPU更快？

在執(zhí)行大量的運算場景中，F(xiàn)PGA相比GPU的核心優(yōu)勢在于低延遲。FPGA比CPU延遲低，在本質(zhì)上是體系結(jié)構(gòu)的區(qū)別。FPGA同時擁有流水線并行和數(shù)據(jù)并行，而CPU幾乎只有數(shù)據(jù)并行，雖然也會才有流水線設(shè)計，但深度受限。因此，F(xiàn)PGA 更適合做需要低延遲的流式處理，GPU 更適合做大批量同構(gòu)數(shù)據(jù)的處理。

舉個例子：

我們有四個全加器，每一個的進(jìn)為輸出連接到下一個的進(jìn)位輸入，這樣實現(xiàn)的加法器被稱作行波進(jìn)位加法器（Ripple-Carry Adder， RCA）。其特點為：

結(jié)構(gòu)特點：低位全加器的Cout連接到高一位全加器Cin

優(yōu)點：電路布局簡單，設(shè)計方便

缺點：高位的運算必須等待低位的運算完成

我們來看一下其關(guān)鍵路徑的延遲：

總延遲時間：（T + T）*4 + T = 9T，推廣到n位，總時間為（2n + 1）*T。

每一個全加器計算的時候必須等待它的進(jìn)位輸入產(chǎn)生后才能計算，所以四個全加器并不是同時進(jìn)行計算的，而是一個一個的串行計算。這樣會造成較大的延遲。

我們把這個電路改進(jìn)一下：提前計算出“進(jìn)位信號”，對進(jìn)位信號進(jìn)行分析。

這樣我們就得到了一個：超前進(jìn)位加法器（Carry-Lookahead Adder， CLA）

其中，C1、C2、C3、C4都由下面的電路計算好，需要3級門延遲，然后在全加器中關(guān)鍵路徑上還有1級延遲

所以，總共有4級門延遲。

如果采用這種完全的超前進(jìn)位，理論上的門延遲都是4級門延遲。

實際電路過于復(fù)雜，難以實現(xiàn)（C31需要32位的與門和或門?。?/p>

通常的方法：采用多個小規(guī)模的超前進(jìn)位加法器拼接而成，例如，用4個8-bit的超前進(jìn)位加法器連接成32-bit加法器。

所以我們需要更多的計算位寬或者更大的數(shù)組，或者矩陣的運算的時候，我們使用FPGA的優(yōu)勢就體現(xiàn)出來。再多的計算，也就是放置更多的硬件邏輯資源。

FPGA對CPU加速場景

在一些特定的應(yīng)用場景下，單獨使用CPU和CPU+FPGA兩種方案所需處理時間的對比，可見FPGA對CPU的加速效果非常明顯，甚至比單獨使用CPU高出1~2個數(shù)量級！

FPGA的缺點

FPGA也是有缺點的，其中之一便是開發(fā)周期長。其需要對特定的應(yīng)用編寫特定的FPGA。只要干的事情稍有不同，一般來說FPGA代碼就要重新寫一遍或者是至少要修改很多東西。如果要做的事情復(fù)雜、重復(fù)性不強，就會占用大量的邏輯資源，其中的大部分處于閑置狀態(tài)。

不過，Chiplet的應(yīng)用對對FPGA的開發(fā)周期有一定的優(yōu)化，以下是傳統(tǒng)FPGA開發(fā)的周期和應(yīng)用chiplet的開發(fā)周期對比：

未來的方向

在現(xiàn)在的SoC設(shè)計中，要充分考慮不同模塊的特點，F(xiàn)PGA 和 CPU 協(xié)同工作，充分發(fā)揮各自的長處，局部性和重復(fù)性強的歸 FPGA，復(fù)雜的歸 CPU。從而達(dá)到整個系統(tǒng)算力的最優(yōu)化。

在未來，F(xiàn)PGA會作為協(xié)處理器和CPU、GPU共存一段時間，其主要提供以下三方面的能力：

能夠提供專門的硬件加速，實現(xiàn)各種應(yīng)用中需要的關(guān)鍵處理功能。

FPGA設(shè)計在性能上非常靈活，使用流水線和并行結(jié)構(gòu)，適應(yīng)對性能的需求變化。

協(xié)處理器能為主處理器和系統(tǒng)存儲器提供寬帶，低延遲接口。

目前，英特爾，AMD，賽靈思等公司都把FPGA作為協(xié)處理器集成在SoC中作為實際應(yīng)用的硬件加速解決方案，這樣的設(shè)計也使得CPU和FPGA在未來的一段時間內(nèi)會共存，互相配合，賦能各種計算場景。

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴