chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么研究浮點加法運算,對FPGA實現(xiàn)方法很有必要?

FPGA設(shè)計論壇 ? 來源:未知 ? 2023-09-22 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

e743e902-58f0-11ee-939d-92fbcf53809c.pnge754f292-58f0-11ee-939d-92fbcf53809c.png

點擊上方藍(lán)字關(guān)注我們

e75f6cc2-58f0-11ee-939d-92fbcf53809c.png

現(xiàn)代信號處理技術(shù)通常都需要進(jìn)行大量高速浮點運算。由于浮點數(shù)系統(tǒng)操作比較復(fù)雜,需要專用硬件來完成相關(guān)的操作(在浮點運算中的浮點加法運算幾乎占到全部運算操作的一半以上),所以,浮點加法器是現(xiàn)代信號處理系統(tǒng)中最重要的部件之一。FPGA是當(dāng)前數(shù)字電路研究開發(fā)的一種重要實現(xiàn)形式,它與全定制ASIC電路相比,具有開發(fā)周期短、成本低等優(yōu)點。

但多數(shù)FPGA不支持浮點運算,這使FPGA在數(shù)值計算、數(shù)據(jù)分析和信號處理等方面受到了限制,由于FPGA中關(guān)于浮點數(shù)的運算只能自行設(shè)計,因此,研究浮點加法運算的FPGA實現(xiàn)方法很有必要。

1 IEEE 754單精度浮點數(shù)標(biāo)準(zhǔn)

浮點數(shù)可以在更大的動態(tài)范圍內(nèi)提供更高的精度,通常,當(dāng)定點數(shù)受其精度和動態(tài)范圍所限不能勝任時,浮點數(shù)標(biāo)準(zhǔn)則能夠提供良好的解決方案。

IEEE協(xié)會制定的二進(jìn)制浮點數(shù)標(biāo)準(zhǔn)的基本格式是32位寬(單精度)和64位寬(雙精度),本文采用單精度格式。圖1所示是IEEE754單精度浮點數(shù)格式。圖中,用于單精度的32位二進(jìn)制數(shù)可分為三個獨立的部分,其中第0位到22位構(gòu)成尾數(shù),第23位到第30位構(gòu)成指數(shù),第31位是符號位。

e7665398-58f0-11ee-939d-92fbcf53809c.jpg

實際上,上述格式的單精度浮點數(shù)的數(shù)值可表示為:

e773d4e6-58f0-11ee-939d-92fbcf53809c.jpg

上式中,當(dāng)其為正數(shù)時,S為0;當(dāng)其為負(fù)數(shù)時,S為1;(-1)s表示符號。指數(shù)E是ON255的變量,E減127可使指數(shù)在2-127到2128變化。尾數(shù)采用科學(xué)計算法表示:M=1.m22m21m20……m0。m22,m21,…,m0,mi為Mp的各位,設(shè)計時應(yīng)注意尾數(shù)中隱含的整數(shù)部分1。0是一個特殊的數(shù),0的指數(shù)位和尾數(shù)位均為0,符號位可以是1,也可以是0。

2電路的流水線結(jié)構(gòu)

一般情況下,結(jié)構(gòu)化設(shè)計是電路設(shè)計中最重要的設(shè)計方法之一,采用結(jié)構(gòu)化設(shè)計方法可以將一個復(fù)雜的電路分割為獨立的功能子模塊,然后按一定的原則將各子模塊組合成完整的電路,這幾乎是電路設(shè)計的通用模式。這種設(shè)計方法便于設(shè)計人員分工合作、實現(xiàn)設(shè)計和功能測試,縮短上市時間、升級和二次開發(fā),因而具有其它方法無法比擬的優(yōu)勢。

結(jié)構(gòu)化設(shè)計基本上可歸結(jié)為兩種方法:流水線(pipeline)和握手原則。其中握手原則適用于各功能子模塊內(nèi)部運算比較復(fù)雜、數(shù)據(jù)運算時延(latency)不確定的設(shè)計。由于數(shù)據(jù)運算時延不確定,所以,各子模塊間的時序配合必須通過握手信號的交互才能完成。握手原則設(shè)計的電路一般采用復(fù)雜的有限狀態(tài)機(jī)(FSM)作為控制單元,工程設(shè)計難度大,故在設(shè)計時應(yīng)慎重使用。流水線法適用于各功能子模塊內(nèi)部運算簡單整齊、數(shù)據(jù)運算時延確定的設(shè)計。由于數(shù)據(jù)運算時延比較確定,各前后級功能子模塊不需要任何交互信號就能完成時序配合,故可方便地實現(xiàn)數(shù)據(jù)的串行流水運算。流水線控制比較簡單,一般不需要設(shè)計專門的有限狀態(tài)機(jī),而且工程設(shè)計容易,設(shè)計時可優(yōu)先選用。

3工程的FPGA實現(xiàn)

3.1開發(fā)環(huán)境和器件選擇

本工程開發(fā)可在FPGA集成開發(fā)環(huán)境QuartusII 8.0 spl中完成。OuartusⅡ是世界著名PLD設(shè)計生產(chǎn)廠商——Altera公司的綜合性PLD開發(fā)軟件,內(nèi)嵌綜合器和仿真器,并有可與第三方工具協(xié)作的靈活接口,可以完成從設(shè)計輸入到硬件配置的完整PLD設(shè)計流程,而且運行速度快,界面統(tǒng)一,功能集中,易學(xué)易用。

本設(shè)計中的器件選用Stratix IIEP2S15F484C3。Stratix II是Altera公司的高性能FPGA Stratix系列的第二代產(chǎn)品,具有非常高的內(nèi)核性能,在存儲能力、架構(gòu)效率、低功耗和面市及時等方面均有優(yōu)勢。

本系統(tǒng)的頂層框圖如圖2所示。為了顯示清楚,圖2被分成兩個部分顯示。本工程采用異步置位的同步電路設(shè)計方法,其中clk、reset、enab分別為系統(tǒng)時鐘、系統(tǒng)異步置位、系統(tǒng)使能信號。din_a、din_b分別為兩個輸入的單精度浮點數(shù),data_out則是符合IEEE 754標(biāo)準(zhǔn)的兩輸入浮點數(shù)之和。

e78160fc-58f0-11ee-939d-92fbcf53809c.jpg

3.2浮點加法運算的實現(xiàn)

浮點加法運算可總結(jié)為比較、移位、相加、規(guī)范化等四個步驟,分別對應(yīng)于compare、shift、sum、normalize四個模塊。

(1)compare模塊

本模塊主要完成兩輸入浮點數(shù)的比較,若din_a、din_b為兩個輸入單精度浮點數(shù),則在一個時鐘周期內(nèi)完成的運算結(jié)果如下:

◇大數(shù)指數(shù)b_exp這里的大數(shù)指絕對值的比較;

◇兩浮點數(shù)的指數(shù)差sube,正數(shù);

◇大數(shù)尾數(shù)b_ma;

◇小數(shù)尾數(shù)s_ma,該尾數(shù)已加入隱含1;

◇和符號c_sgn,為確定輸出結(jié)果的符號;

◇加減選擇add_sub,兩輸入同符號時為0(相加)、異符號時為1(相減),sum模塊中使用實現(xiàn)加減選擇。

(2)shift模塊

shift模塊的作用主要是根據(jù)兩個輸入浮點數(shù)的指數(shù)差來執(zhí)行小數(shù)尾數(shù)(已加入隱含1)向右移動相應(yīng)的位數(shù),以將輸入的兩個浮點數(shù)指數(shù)調(diào)整為相同的數(shù)(同大數(shù)),若b_exp、sube、b_ma、s_ma、c_sgn、add_sub為輸入信號(其含義見compare模塊),則可輸出如下運算結(jié)果(在一個時鐘周期內(nèi)完成):

◇大數(shù)指數(shù)(sft_bexp),將b_exp信號用寄存器延遲一個周期,以實現(xiàn)時序同步;

◇小數(shù)尾數(shù)(sft_sma),已完成向右移動相應(yīng)的sube位;

◇大數(shù)尾數(shù)(sft_bma),將b_ma信號用寄存器延遲一個周期,以實現(xiàn)時序同步;

◇和符號(sft_csgn),將c_sgn信號用寄存器延遲一個周期,以實現(xiàn)時序同步;

◇加減選擇(sft_addsub),將add_sub信號用寄存器延遲一個周期,以實現(xiàn)時序同步;

(3)sum模塊

本模塊可根據(jù)加減選擇(sft_addsub(信號完成兩輸入浮點數(shù)尾數(shù)(已加入隱含1)的加減,若sft_bexp、sft_sma、sft_bma、sft_csgn、sft_addsub為輸入信號(其含義見shift模塊),則可輸出如下運算結(jié)果(在一個時鐘周期內(nèi)完成):

◇大數(shù)指數(shù)(sum_bexp),將sft_bexp信號用寄存器延遲一個周期,以實現(xiàn)時序同步;

◇尾數(shù)和(sum_ma),為大數(shù)尾數(shù)與移位后小數(shù)尾數(shù)的和,差(兩尾數(shù)已加入隱含1);

◇和符號(sum_csgn),將sft_csgn信號用寄存器延遲一個周期,以實現(xiàn)時序同步;

(4)normalize模塊

normalize模塊的作用主要是將前三個模塊的運算結(jié)果規(guī)范為IEEE 754單精度浮點數(shù)標(biāo)準(zhǔn),若sum_bexp、sum_ma、sum_csgn為輸入信號(其含義見sum模塊),則其輸出的運算結(jié)果(在一個時鐘周期內(nèi)完成)只有一個和輸出(data_out),也就是符合IEEE754浮點數(shù)標(biāo)準(zhǔn)的兩個輸入浮點數(shù)的和。

4系統(tǒng)綜合與仿真

由于本工程是由compare、shift、sum、normalize四個模塊組成的,而這四個模塊通過串行方式進(jìn)行連接,每個模塊的操作都在一個時鐘周期內(nèi)完成,因此,整個浮點數(shù)加法運算可在四個時鐘周期內(nèi)完成。這使得工程不僅有確定的數(shù)據(jù)運算時延(latency),便于流水線實現(xiàn),而且方便占用的時鐘周期盡可能減少,從而極大地提高了運算的實時性。

4.1工程綜合結(jié)果

經(jīng)過Quartus II綜合可知,本設(shè)計使用的StratixⅡEP2S15F484C3芯片共使用了641個ALUT(高級查找表)、188個寄存器、0位內(nèi)存和可達(dá)到80 MHz的時鐘頻率,因此可證明,本系統(tǒng)利用合理的資源實現(xiàn)了高速浮點數(shù)加法運算。

4.2工程仿真結(jié)果

本工程仿真可使用Quartus II 8.0內(nèi)嵌式仿真工具來編寫Matlab程序,以生成大量隨機(jī)單精度浮點數(shù)(以便于提高仿真代碼覆蓋率,提高仿真的精確度),然后計算它們相加的結(jié)果,并以文本形式存放在磁盤文件中。編寫Matlab程序可產(chǎn)生作為仿真輸入的*.vec文件,然后通過時序仿真后生成*.tbl文件,再編寫Matlab程序提取其中有用的結(jié)果數(shù)據(jù),并與先前磁盤文件中的結(jié)果相比較,以驗證設(shè)計的正確性。

圖3所示是其仿真的波形圖。

從圖3可以看出表1所列的各種運算關(guān)系。表2所列為其實際的測試數(shù)據(jù)。

e7a0208c-58f0-11ee-939d-92fbcf53809c.jpg

表中“A+B實數(shù)表示(M)”指Matlab計算的結(jié)果;“誤差”指浮點處理器計算結(jié)果與Matlab計算結(jié)果之差。

綜上所述,本工程設(shè)計的浮點加法器所得到的運算結(jié)果與Matlab結(jié)果的誤差在10-7左右,可見其精度完全能夠符合要求。

本工程設(shè)計完全符合IP核設(shè)計的規(guī)范流程,而且完成了Verilog HDL建模、功能仿真、綜合、時序仿真等IP核設(shè)計的整個過程,電路功能正確。實際上,本系統(tǒng)在布局布線后,其系統(tǒng)的最高時鐘頻率可達(dá)80MHz。雖然使用浮點數(shù)會導(dǎo)致舍入誤差,但這種誤差很小,可以忽略。實踐證明,本工程利用流水線結(jié)構(gòu),方便地實現(xiàn)了高速、連續(xù)、大數(shù)據(jù)量浮點數(shù)的加法運算,而且設(shè)計結(jié)構(gòu)合理,性能優(yōu)異,可以應(yīng)用在高速信號處理系統(tǒng)中。

e7b4f340-58f0-11ee-939d-92fbcf53809c.png

有你想看的精彩 至芯科技FPGA就業(yè)培訓(xùn)班——助你步入成功之路、9月23號北京中心開課、歡迎咨詢! CMOS圖像傳感器的FPGA邏輯設(shè)計解析 如何使用FPGA器件和USB通訊實現(xiàn)高速數(shù)據(jù)傳輸顯示系統(tǒng)的設(shè)計

e7c58d68-58f0-11ee-939d-92fbcf53809c.jpg

掃碼加微信邀請您加入FPGA學(xué)習(xí)交流群

e7d11ee4-58f0-11ee-939d-92fbcf53809c.jpge7dc7906-58f0-11ee-939d-92fbcf53809c.png

歡迎加入至芯科技FPGA微信學(xué)習(xí)交流群,這里有一群優(yōu)秀的FPGA工程師、學(xué)生、老師、這里FPGA技術(shù)交流學(xué)習(xí)氛圍濃厚、相互分享、相互幫助、叫上小伙伴一起加入吧!

點個在看你最好看e7f0906c-58f0-11ee-939d-92fbcf53809c.png


原文標(biāo)題:為什么研究浮點加法運算,對FPGA實現(xiàn)方法很有必要?

文章出處:【微信公眾號:FPGA設(shè)計論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1656

    文章

    22308

    瀏覽量

    630939

原文標(biāo)題:為什么研究浮點加法運算,對FPGA實現(xiàn)方法很有必要?

文章出處:【微信號:gh_9d70b445f494,微信公眾號:FPGA設(shè)計論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    定點數(shù)表示實數(shù)的方法以及定點數(shù)在硬件上的運算驗證

    本篇主要介紹定點數(shù)表示實數(shù)的方法以及定點數(shù)在硬件上的運算驗證 為什么選定點數(shù) 32位單精度浮點數(shù): 32位的單精度浮點數(shù)為例,IEE754標(biāo)準(zhǔn)規(guī)定,一個flaot類型的
    發(fā)表于 10-28 08:13

    蜂鳥內(nèi)核模塊浮點指令運算數(shù)據(jù)的獲取

    核中是如何獲取所需的兩個操作數(shù)。 我們以浮點加法運算為例。 首先,經(jīng)過分析我們發(fā)現(xiàn)整型指令寄存器的例化是通過循環(huán)完成的,所以我們可以用相同的方式例化32個32位浮點寄存器,相關(guān)代碼如下
    發(fā)表于 10-24 13:39

    E203添加浮點數(shù)方法:FPU控制邏輯

    。 2. FPU 設(shè)計 要實現(xiàn)整一個 FPU 及其控制單元,首先要確定指令周期,以及浮點運算的方式。 由于筆者首次使用 Verilog 設(shè)計修改 CPU,因此為了減少錯誤、方便后續(xù)修改,筆者將單精度
    發(fā)表于 10-24 13:28

    FPNew開源浮點運算單元工程建立

    在添加浮點運算單元時,可以引用開源的浮點運算器以簡化所需工作任務(wù)壓力。在此我們采用了FPnew這個開源工程,再次介紹一些如何將其導(dǎo)成vivado工程。 首先在github上下載fpn
    發(fā)表于 10-24 11:08

    蜂鳥E203的浮點指令集F的一些實現(xiàn)細(xì)節(jié)

    蜂鳥E203的浮點指令集F的一些實現(xiàn)細(xì)節(jié) 既然E203不是多發(fā)射,且為了節(jié)省面積,一些指令使用FPU內(nèi)的同一個子模塊來執(zhí)行,即FPU同時只能進(jìn)行一種計算,我們只在FPU內(nèi)部署了11個子模塊,每種
    發(fā)表于 10-24 08:57

    浮點數(shù)是如何實現(xiàn)開平方運算

    摘要: 本文主要描述浮點數(shù)是如何實現(xiàn)開平方運算的。 簡介 事實上,浮點數(shù)的開平方運算結(jié)構(gòu)與定點數(shù)甚至整數(shù)的開平方
    發(fā)表于 10-24 08:42

    浮點指令擴(kuò)展中部分問題的解決與分享

    經(jīng)過數(shù)周的前期準(zhǔn)備與研讀代碼,我們組終于正式開始對浮點指令進(jìn)行擴(kuò)展并不出意外地遇到了一些小問題,本篇文章針對這些問題作出解決方法的分享。 一. 在e203_exu_decode中,發(fā)現(xiàn)變量
    發(fā)表于 10-24 08:14

    (九)浮點乘法指令設(shè)計

    ⊕ sb,得到結(jié)果的符號位 階碼相加減 按照定點整數(shù)的加減法運算方法對兩個浮點數(shù)的階碼進(jìn)行加減運算,因為規(guī)格化數(shù)的價碼e滿足1≤e≤254,而ec有可能超出1~254范圍,所以當(dāng)1
    發(fā)表于 10-24 07:11

    如何獲取蜂鳥內(nèi)核執(zhí)行模塊浮點指令的運算數(shù)據(jù)

    核中是如何獲取所需的兩個操作數(shù)。 我們以浮點加法運算為例。 首先,經(jīng)過分析我們發(fā)現(xiàn)整型指令寄存器的例化是通過循環(huán)完成的,所以我們可以用相同的方式例化32個32位浮點寄存器,相關(guān)代碼如下
    發(fā)表于 10-24 07:10

    浮點運算單元的設(shè)計和優(yōu)化

    浮點運算單元的設(shè)計和優(yōu)化可以從以下幾個方面入手: 1.浮點寄存器設(shè)計:為了實現(xiàn)浮點運算指令子集(
    發(fā)表于 10-22 07:04

    使用Simulink自動生成浮點運算HDL代碼(Part 1)

    引言 想要實現(xiàn)浮點運算功能,如果自己寫Verilog代碼,需要花費較多的時間和精力。好在Simulink HDL Coder工具箱提供了自動代碼生成技術(shù)。下圖展示了HDL Coder如何生成
    發(fā)表于 10-22 06:48

    risc-v中浮點運算單元的使用及其設(shè)計考慮

    的應(yīng)用。 在RISC-V中,浮點運算單元分為單精度浮點數(shù)(32位)和雙精度浮點數(shù)(64位),通常包括以下幾種基本功能: 加法器/減法器:用于
    發(fā)表于 10-21 14:46

    利用e203中NICE協(xié)處理器加速濾波運算

    加法器的方法來加速濾波運算。 使用NICE協(xié)處理器加速的程序為一個長循環(huán),計算較長(100到1000量級)的兩個浮點數(shù)組乘累加的結(jié)果,分別命名為ifm (Input Feature
    發(fā)表于 10-21 13:40

    基于e203中NICE協(xié)處理器加速濾波運算

    加法器的方法來加速濾波運算。 使用NICE協(xié)處理器加速的程序為一個長循環(huán),計算較長(100到1000量級)的兩個浮點數(shù)組乘累加的結(jié)果,分別命名為ifm (Input Feature
    發(fā)表于 10-21 09:54

    【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】RA4E2的DSP浮點性能的軟件浮點測試和硬件浮點測試對比

    , atan,等等基本操作。 當(dāng)然為了測試出硬件浮點運算性能,這里很有必要在測試一下軟件浮點運算
    發(fā)表于 12-30 17:55