chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于STM32浮點運算單元FPU的應用示例

茶話MCU ? 來源:ST MCU 信息交流 ? 作者:ST MCU 信息交流 ? 2021-01-02 18:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有人利用STM32芯片做些DSP處理,在啟用FPU單元進行調試、驗證過程中可能會遇到些小問題、小困惑,這里通過STM32F4芯片一個具體的應用示例簡單分享下,希望順便能給同仁提供些幫助或提醒。

我這里通過調用DSP庫里的FFT相關函數(shù)實現(xiàn)1024點的FFT運算,樣點數(shù)據(jù)及運算結果均為浮點數(shù)。

cf4aaab0-445e-11eb-8b86-12bb97331649.png

上圖中A區(qū)代碼是做樣點數(shù)據(jù)準備,B區(qū)代碼完成FFT運算。我們來一起看看基本的配置以及不啟用硬件浮點單元和啟用硬件浮點單元執(zhí)行B區(qū)代碼的時間上的差別。

程序里要調用一些數(shù)學函數(shù),而這些數(shù)學函數(shù)往往集成在相應的數(shù)學函數(shù)庫里。我們選用ARM公司的DSP數(shù)學庫,該庫系專門針對AMR核芯片及指令系統(tǒng)而組織的代碼,相比IDE自帶的通用數(shù)學函數(shù)庫會更優(yōu)化、高效。

目前該DSP數(shù)學庫包括基本數(shù)學函數(shù)、復數(shù)數(shù)學函數(shù)、濾波函數(shù)、矩陣函數(shù)等幾大塊,詳細內容可以去ARM網(wǎng)站閱讀比較方便?!究牲c擊左下方原文鏈接前往】

cfc025ce-445e-11eb-8b86-12bb97331649.png

我們開發(fā)時,這些文件具體在哪里呢?在各個編譯環(huán)境的安裝目錄下都不難找到。不妨看看ARM keil MDK環(huán)境下它們所在位置。

d00fcdb8-445e-11eb-8b86-12bb97331649.png

上面我們看到的是DSP庫源文件所在目錄,在另一個目錄存放著基于不同內核、不同存儲端格式以及是否支持硬件浮點單元而編譯出來的庫文件。我們在開發(fā)時,直接添加合適的庫文件進工程即可,不必逐個查找源文件來添加。下圖就是可以用于ARM MDK環(huán)境的庫文件。【對于不同IDE,庫文件名后綴略有差異】

d0591e1e-445e-11eb-8b86-12bb97331649.png

這里以用于M4內核的DSP數(shù)學函數(shù)庫稍作解釋,詳見下面表格。

d0c45cc4-445e-11eb-8b86-12bb97331649.png

從上表可以看出,基于Cortex M4內核芯片進行DSP運算可以能用到的庫有四個,但具體到STM32 基于M4內核的芯片可以選用的只有兩個,即xxxM4l_math.lib或xxxM4lf_math.lib,因為STM32芯片的存儲設計都是小端模式。所謂小端模式,簡單點說就是指多字節(jié)數(shù)據(jù)在內存中存儲時,按照低位字節(jié)對應地址低位來存放,反之則為大端模式。

在上面截圖中,我還截取了對應M0內核可用的DSP數(shù)學庫,它為什么只有兩個?這是因為M0內核沒有FPU硬件單元,不存在FPU是否啟用的可選情況。

現(xiàn)在就利用STM32F429開發(fā)板,基于開篇的截圖代碼進行測試,并用定時器測量下面執(zhí)行代碼在不使用FPU和使用FPU分別所花費的時間,并計算二者的時間比?!咀ⅲ篠TM32F429芯片自身是帶硬件FPU的】

d10e74ee-445e-11eb-8b86-12bb97331649.png

必要的配置和文件包含及添加,如下表所示:

d149fb18-445e-11eb-8b86-12bb97331649.png

基于上面條件執(zhí)行FFT運算代碼,不使用FPU和使用FPU的時間比為16。

采用相似的條件,基于IAR環(huán)境對相同功能代碼段進行測試,不使用FPU和使用FPU的時間比為11。

關于這個時間比,除了跟是否使用微庫、優(yōu)化等級、浮點精度等有關外,跟你所選取的測試代碼也有很大關系,因為有些代碼只能靠CPU執(zhí)行的話,開不開FPU硬件單元對這部分時間是沒有影響的。不難理解,被測試代碼里只能靠CPU運行的代碼占比越多,上面的這個比值就會越小。一般來說,我們不必太過糾結這個值的大小,知道有這個硬件浮點單元,既減輕了CPU負荷,又可以提升計算速度就好。

另外,我們在做DSP相關應用時,注意添加的DSP庫既要跟所用芯片匹配,還要跟IDE里的配置匹配。還是以上面測試代碼為例,本意是想啟用FPU,結果添加的DSP庫卻是基于不使用FPU硬件的數(shù)學庫,那會怎么樣呢?

d199418c-445e-11eb-8b86-12bb97331649.png

本應該添加arm_cortexM4lf_math.h的,結果弄錯了。如果按照上面條件構建ARM MDK工程,一路編譯下來沒有任何警告或錯誤提示。程序也能流暢運行,F(xiàn)FT運算結果似乎也出來了。

d1fd51ae-445e-11eb-8b86-12bb97331649.png

但仔細查看結果,跟之前正確配置的運行結果明顯不一樣。經(jīng)驗證核對,這次運算結果是錯的。為此我特意添加一行計算90°的正弦值代碼,它算出來結果竟然是1.5!逆天了。

d236a81e-445e-11eb-8b86-12bb97331649.png

如果說在不知情的情況下這一路下來,估計要被摧殘一頓了。畢竟很多數(shù)學函數(shù)結果常人是無法一眼能看出對錯的,即使看出錯了若沒未及時想到庫問題的話,恐怕還得折騰折騰。

針對這種情形,基于同樣代碼于IAR環(huán)境下測試,情況相比ARM MDK貌似要好點。至少編譯時有警告提示,提示引用沖突之類的。計算結果沒有MDK的那么具有隱蔽性【至少對于本次測試是這樣】,基本是清一色的0,頗有沖擊效果!當然,此時讓它計算90°的正弦值結果也是明顯錯的。

d2617c24-445e-11eb-8b86-12bb97331649.png

感覺上,這種情形下,使用IAR時挖的坑似乎稍微淺些,更容易讓人警醒懷疑哪里出問題了。

好,就分享到這里,祝君好運!

原文標題:關于STM32浮點運算單元FPU的小話題

文章出處:【微信公眾號:ST MCU 信息交流】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    462

    文章

    53608

    瀏覽量

    460007
  • STM32
    +關注

    關注

    2307

    文章

    11128

    瀏覽量

    371427
  • FPU
    FPU
    +關注

    關注

    0

    文章

    46

    瀏覽量

    22746

原文標題:關于STM32浮點運算單元FPU的小話題

文章出處:【微信號:stmcu832,微信公眾號:茶話MCU】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    請問cw32f0有浮點計算單元嗎?

    cw32f0有浮點計算單元嗎?
    發(fā)表于 12-09 06:09

    如何使用 ARM FPU 加速浮點計算?

    FPU的魅力FPU(Floating Point Unit,浮點單元)是ARM內核中的硬件外設,用于硬件計算浮點數(shù),要想使用
    發(fā)表于 11-19 06:51

    為什么FPU在MCU中很重要呢?

    性能飛躍: 這是最主要的原因。與軟件模擬相比,FPU 執(zhí)行浮點運算的速度可以快幾十倍甚至上百倍。 單周期操作: 許多基本的浮點運算(如加、乘
    發(fā)表于 11-18 07:05

    請問如何在E203開發(fā)板上下載運行帶有浮點操作的程序?

    了解到E203沒有配備FPU單元,想問下能不能把有浮點操作的程序下載到板子上運行呢,比如使用軟浮點?
    發(fā)表于 11-07 06:43

    E203添加浮點數(shù)方法:譯碼和派遣模塊設計

    單元給出的寫寄存器相關信息后,就能判斷出是否需要寫寄存器,需要的話是寫整數(shù)通用寄存器還是浮點數(shù)通用寄存器; (3)dispatch 模塊通過disp_i_fpu,disp_i_fpu
    發(fā)表于 10-24 13:54

    E203添加浮點數(shù)方法:FPU控制邏輯

    。 2. FPU 設計 要實現(xiàn)整一個 FPU 及其控制單元,首先要確定指令周期,以及浮點運算的方式。 由于筆者首次使用 Verilog 設計
    發(fā)表于 10-24 13:28

    蜂鳥E203的浮點指令集拓展(F拓展)

    關于蜂鳥E203的浮點指令集拓展(F拓展) Whetstone中有很多浮點數(shù)運算,而蜂鳥e203中沒有硬件支持,是通過將浮點數(shù)轉化成整型數(shù)
    發(fā)表于 10-24 11:51

    FPNew開源浮點運算單元工程建立

    在添加浮點運算單元時,可以引用開源的浮點運算器以簡化所需工作任務壓力。在此我們采用了FPnew這個開源工程,再次介紹一些如何將其導成viva
    發(fā)表于 10-24 11:08

    用于RISCV的F指令集實現(xiàn)的浮點計算單元FPU)設計方案

    實現(xiàn)功能 為了完成F拓展,我們計劃在ALU內添加一個專用于計算單精度浮點數(shù)的FPU單元。 2.1 實現(xiàn)riscv的F指令集拓展 即需要實現(xiàn)26條F指令: 以下部分指令返回地址是給整數(shù)寄存器,紅色
    發(fā)表于 10-24 07:43

    浮點運算單元的實現(xiàn)——浮點指令內聯(lián)匯編(一)

    代碼實現(xiàn) 在硬件實現(xiàn)FPU后,可通過內聯(lián)匯編的方式,指定浮點指令對其進行測試,以下羅列出相關測試代碼。 //fmadds_test __STATIC_FORCEINLINE float
    發(fā)表于 10-23 06:51

    浮點運算單元的實現(xiàn)——浮點指令內聯(lián)匯編(二)

    代碼實現(xiàn) 在硬件實現(xiàn)FPU后,可通過內聯(lián)匯編的方式,指定浮點指令對其進行測試,以下羅列出相關測試代碼。如有錯誤,歡迎大家評論指出。 //feqs_test
    發(fā)表于 10-23 06:17

    浮點運算單元的設計和優(yōu)化

    浮點運算單元的設計和優(yōu)化可以從以下幾個方面入手: 1.浮點寄存器設計:為了實現(xiàn)浮點運算指令子集(
    發(fā)表于 10-22 07:04

    使用Simulink自動生成浮點運算HDL代碼(Part 1)

    單元。 Unpack和Pack模塊塊將浮點類型轉換為符號、指數(shù)和尾數(shù)。圖中S、E、M分別代表符號、指數(shù)、尾數(shù)。這是基于IEEE-754浮點運算標準。
    發(fā)表于 10-22 06:48

    risc-v中浮點運算單元的使用及其設計考慮

    RISC-V浮點運算單元(floating-point unit,簡稱FPU)是一種專門用于執(zhí)行浮點運算
    發(fā)表于 10-21 14:46

    FCP32C335——對標TI TMS320F28335的高性能DSP芯片,賦能工業(yè)控制與智能設備!

    FCP32C335以TMS320F28335為標桿,搭載150MHz主頻的32位浮點處理單元FPU),支持單周期32×32位乘法運算,單精度浮點
    的頭像 發(fā)表于 03-07 10:45 ?1326次閱讀
    FCP32C335——對標TI TMS320F28335的高性能DSP芯片,賦能工業(yè)控制與智能設備!