chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何解放你的內(nèi)核?硬件加速器“使用指南”奉上

analog_devices ? 來(lái)源:亞德諾半導(dǎo)體 ? 2020-07-06 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有限脈沖響應(yīng)(FIR)和無(wú)限脈沖響應(yīng)(IIR)濾波器都是常用的數(shù)字信號(hào)處理算法——尤其適用于音頻處理應(yīng)用。因此,在典型的音頻系統(tǒng)中,處理器內(nèi)核的很大一部分時(shí)間用于FIR和IIR濾波。數(shù)字信號(hào)處理器上的片內(nèi)FIR和IIR硬件加速器也分別稱為FIRA和IIRA,我們可以利用這些硬件加速器來(lái)分擔(dān)FIR和IIR處理任務(wù),讓內(nèi)核去執(zhí)行其他處理任務(wù)。在本文中,我們將借助不同的使用模型以及實(shí)時(shí)測(cè)試示例來(lái)探討如何在實(shí)踐中利用這些加速器。

圖1.FIRA和IIRA系統(tǒng)方框圖。

圖1顯示了FIRA和IIRA的簡(jiǎn)化方框圖,以及它們與其余處理器系統(tǒng)和資源的交互方式。

FIRA和IIRA模塊均主要包含一個(gè)計(jì)算引擎(乘累加(MAC)單元)以及一個(gè)小的本地?cái)?shù)據(jù)和系數(shù)RAM。

為開(kāi)始進(jìn)行FIRA/IIRA處理,內(nèi)核使用通道特定信息初始化處理器存儲(chǔ)器中的DMA傳輸控制塊(TCB)鏈。然后將該TCB鏈的起始地址寫入FIRA/IIRA鏈指針寄存器,隨后配置FIRA/IIRA控制寄存器以啟動(dòng)加速器處理。一旦所有通道的配置完成,就會(huì)向內(nèi)核發(fā)送一個(gè)中斷,以便內(nèi)核將處理后的輸出用于后續(xù)操作。

從理論上講,最好的方法是將所有FIR和/或IIR任務(wù)從內(nèi)核轉(zhuǎn)移給加速器,并允許內(nèi)核同時(shí)執(zhí)行其他操作。但在實(shí)踐中,這并非始終可行,特別是當(dāng)內(nèi)核需要使用加速器輸出進(jìn)一步處理,并且沒(méi)有其他獨(dú)立的任務(wù)需要同時(shí)完成時(shí)。在這種情況下,我們需要選擇合適的加速器使用模型來(lái)達(dá)到最佳效果。.

在本文中,我們將討論針對(duì)不同應(yīng)用場(chǎng)景充分利用這些加速器的各種模型。

實(shí)時(shí)使用FIRA和IIRA

圖2.典型實(shí)時(shí)音頻數(shù)據(jù)流。

圖2顯示了典型實(shí)時(shí)PCM音頻數(shù)據(jù)流圖。一幀數(shù)字化PCM音頻數(shù)據(jù)通過(guò)同步串行端口(SPORT)接收,并通過(guò)直接存儲(chǔ)器訪問(wèn)(DMA)發(fā)送至存儲(chǔ)器。在繼續(xù)接收幀N+1時(shí),幀N由內(nèi)核和/或加速器處理,之前處理的幀(N-1)的輸出通過(guò)SPORT發(fā)送至DAC進(jìn)行數(shù)模轉(zhuǎn)換。

加速器使用模型

如前所述,根據(jù)應(yīng)用的不同,可能需要以不同的方式使用加速器,以最大限度分擔(dān)FIR和/或IIR處理任務(wù),并盡可能節(jié)省內(nèi)核周期以用于其他操作。從高層次角度來(lái)看,加速器使用模型可分為三類:直接替代、拆分任務(wù)和數(shù)據(jù)流水線。

直接替代

內(nèi)核FIR和/或IIR處理直接被加速器替代,內(nèi)核只需等待加速器完成此任務(wù)。

此模型僅在加速器的處理速度比內(nèi)核快時(shí)才有效;即,使用FIRA模塊。

拆分任務(wù)

FIR和/或IIR處理任務(wù)在內(nèi)核和加速器之間分配。

當(dāng)多個(gè)通道可并行處理時(shí),此模型特別有用。

根據(jù)粗略的時(shí)序估算,在內(nèi)核和加速器之間分配通道總數(shù),使二者大致能夠同時(shí)完成任務(wù)。

如圖3所示,與直接替代模型相比,此使用模型可節(jié)省更多的內(nèi)核周期。

數(shù)據(jù)流水線

內(nèi)核和加速器之間的數(shù)據(jù)流可進(jìn)行流水線處理,使二者能夠在不同數(shù)據(jù)幀上并行處理。

如圖3所示,內(nèi)核處理第N個(gè)幀,然后啟動(dòng)加速器對(duì)該幀進(jìn)行處理。內(nèi)核隨后繼續(xù)進(jìn)一步并行處理加速器在上一迭代中產(chǎn)生的第N-1幀的輸出。該序列允許將FIR和/或IIR處理任務(wù)完全轉(zhuǎn)移給加速器,但輸出會(huì)有一些延遲。

流水線級(jí)以及輸出延遲都可能會(huì)增加,具體取決于完整處理鏈中此類FIR和/或IIR處理級(jí)的數(shù)量。

圖3說(shuō)明了音頻數(shù)據(jù)幀如何在不同加速器使用模型的三個(gè)階段之間傳輸---DMA IN、內(nèi)核/加速器處理和DMA OUT。它還顯示了通過(guò)采用不同的加速器使用模型將FIR/IIR全部或部分處理轉(zhuǎn)移到加速器上,與僅使用內(nèi)核模型相比,內(nèi)核空閑周期如何增加。

圖3.加速器使用模型比較。

SHARC處理器上的FIRA和IIRA

以下ADI SHARC處理器系列支持片內(nèi)FIRA和IIRA(從舊到新)。

ADSP-214xx(例如,ADSP-21489)

ADSP-SC58x

ADSP-SC57x/ADSP-2157x

ADSP-2156x

這些處理器系列:

計(jì)算速度不同

基本編程模型保持不變,ADSP-2156x處理器上的自動(dòng)配置模式(ACM)除外。

FIRA有四個(gè)MAC單元,而IIRA只有一個(gè)MAC單元。

ADSP-2156x的FIRA/IIRA改進(jìn)

ADSP-2156x是SHARC處理器系列中的最新的產(chǎn)品。它是第一款單核1 GHz SHARC處理器,其FIRA和IIRA也可在1 GHz下運(yùn)行。ADSP-2156x處理器上的FIRA和IIRA與其前代ADSP-SC58x/ADSP-SC57x處理器相比,具有多項(xiàng)改進(jìn)。

性能改進(jìn)

計(jì)算速度提高了8倍(從SCLK-125 MHz至CCLK-1 GHz)。

由于內(nèi)核和加速器借助專用內(nèi)核結(jié)構(gòu)實(shí)現(xiàn)了更緊密的集成,因此減少了內(nèi)核和加速器之間的數(shù)據(jù)和MMR訪問(wèn)延遲。

功能改進(jìn)

添加了ACM支持,以盡量減少進(jìn)行加速器處理所需的內(nèi)核干預(yù)。此模式主要具有以下新特性:

允許加速器暫停以進(jìn)行動(dòng)態(tài)任務(wù)排隊(duì)。

無(wú)通道數(shù)限制。

支持觸發(fā)生成(主器件)和觸發(fā)等待(從器件)。

為每個(gè)通道生成選擇性中斷。

實(shí)驗(yàn)結(jié)果

在本節(jié)中,我們將討論在ADSP-2156x評(píng)估板上,借助不同的加速器使用模型實(shí)施兩個(gè)實(shí)時(shí)多通道FIR/IIR用例的結(jié)果

用例1

圖4顯示用例1的方框圖。采樣率為48 kHz,模塊大小為256個(gè)采樣點(diǎn),拆分任務(wù)模型中使用的內(nèi)核與加速器通道比為5:7。

表1顯示測(cè)得的內(nèi)核和FIRA MIPS數(shù)量,以及與僅使用內(nèi)核模型相比獲得的節(jié)約內(nèi)核MIPS結(jié)果。表中還顯示了相應(yīng)使用模型增加的額外輸出延遲。正如我們所看到的,使用加速器配合數(shù)據(jù)流水線使用模型,可節(jié)約高達(dá)335內(nèi)核MIPS,但導(dǎo)致1塊(5.33 ms)的輸出延遲。直接替代和拆分任務(wù)使用模型也分別可節(jié)約98 MIPS和189 MIPS,而且未導(dǎo)致任何額外的輸出延遲。

圖4.用例1方框圖。

表1.用例1的內(nèi)核和FIR/IIRA MIPS總結(jié)

用例2

圖5顯示用例2的方框圖。采樣率為48 kHz,模塊大小為128個(gè)采樣點(diǎn),拆分任務(wù)模型中使用的內(nèi)核與加速器通道比為1:1。

與表1一樣,表2也顯示了此用例的結(jié)果。正如我們所看到的,使用加速器配合數(shù)據(jù)流水線使用模型,可節(jié)約高達(dá)490內(nèi)核MIPS,但導(dǎo)致1模塊(2.67 ms)的輸出延遲。拆分任務(wù)使用模型可節(jié)約234內(nèi)核MIPS,而沒(méi)有導(dǎo)致任何額外輸出延遲。請(qǐng)注意,與用例1中不同,在用例2中內(nèi)核使用頻域(快速卷積)處理,而非時(shí)域處理。這就是為何處理一個(gè)通道所需的內(nèi)核MIPS比FIRA MIPS少的原因,這可導(dǎo)致直接替代使用模型實(shí)現(xiàn)負(fù)的內(nèi)核MIPS節(jié)約。

圖5.用例2方框圖。

表2.用例2的內(nèi)核和FIR/IIRA MIPS總結(jié)

結(jié)論

在本文中,我們看到如何利用不同的加速器使用模型實(shí)現(xiàn)所需的MIPS和處理目標(biāo),從而將大量?jī)?nèi)核MIPS轉(zhuǎn)移到ADSP-2156x處理器上的FIRA和IIRA加速器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)字信號(hào)
    +關(guān)注

    關(guān)注

    2

    文章

    1056

    瀏覽量

    49240
  • 音頻處理
    +關(guān)注

    關(guān)注

    0

    文章

    161

    瀏覽量

    18282

原文標(biāo)題:如何解放你的內(nèi)核?硬件加速器“使用指南”奉上

文章出處:【微信號(hào):analog_devices,微信公眾號(hào):analog_devices】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高卡, XCKU115, 光纖采集卡, 信號(hào)計(jì)算板, 硬件加速
    的頭像 發(fā)表于 02-12 09:52 ?338次閱讀
    FPGA<b class='flag-5'>硬件加速</b>卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    TDK SmartMotion Platform Ver. G硬件使用指南:開(kāi)啟高效傳感開(kāi)發(fā)之旅

    TDK SmartMotion Platform Ver. G硬件使用指南:開(kāi)啟高效傳感開(kāi)發(fā)之旅 在當(dāng)今的電子技術(shù)領(lǐng)域,傳感的應(yīng)用越來(lái)越廣泛,而如何高效地對(duì)傳感
    的頭像 發(fā)表于 12-26 10:30 ?366次閱讀

    工業(yè)級(jí)-專業(yè)液晶圖形顯示加速器RA8889ML3N簡(jiǎn)介+顯示方案選型參考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 編輯 專業(yè)液晶圖形顯示加速器能夠有效減少對(duì)MCU運(yùn)算資源的占用,對(duì)于只需普通單片機(jī)運(yùn)算資源的儀器儀表來(lái)說(shuō),專業(yè)圖形顯示加速器
    發(fā)表于 11-14 16:03

    邊緣計(jì)算中的AI加速器類型與應(yīng)用

    人工智能正在推動(dòng)對(duì)更快速、更智能、更高效計(jì)算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實(shí)際。這正是邊緣計(jì)算中AI加速器變得不可或缺的原因。這種專用硬件能夠直接在邊緣設(shè)備上
    的頭像 發(fā)表于 11-06 13:42 ?782次閱讀
    邊緣計(jì)算中的AI<b class='flag-5'>加速器</b>類型與應(yīng)用

    常用硬件加速的方法

    之前總結(jié)了一些常用硬件加速方法 1)面積換速度:也就是串轉(zhuǎn)并運(yùn)算,可以多個(gè)模塊同時(shí)計(jì)算; 2)時(shí)間換空間:時(shí)序收斂下通過(guò)頻率提高性能,雖然面積可能稍微加大點(diǎn); 3)流水線操作:流水線以面積換性能,以
    發(fā)表于 10-29 06:20

    硬件協(xié)同技術(shù)分享 - 任務(wù)劃分 + 自定義指令集

    開(kāi)發(fā)技術(shù)。分文將分享介紹硬件加速器與軟件結(jié)合的協(xié)同開(kāi)發(fā)方式 軟硬件任務(wù)劃分 我們的硬件設(shè)計(jì)涉及到MFCC模塊。直接交由CPU的一次指令的五級(jí)流水線處理在麥克風(fēng)數(shù)據(jù)取入上的資源耗費(fèi)可以說(shuō)是
    發(fā)表于 10-28 08:03

    硬件加速模塊的時(shí)鐘設(shè)計(jì)

    硬件加速模塊需要四個(gè)時(shí)鐘,分別為clk_l , clk_r , clk_c , clk_n 。 clk_l : 整個(gè)硬件加速模塊為了最大化的節(jié)約時(shí)間成本而采用了類似處理的流水線設(shè)計(jì),具體上將每一層
    發(fā)表于 10-23 07:28

    航裕電源以大電流技術(shù)為國(guó)內(nèi)外超導(dǎo)加速器項(xiàng)目提供優(yōu)質(zhì)方案

    航裕電源:以大電流技術(shù),護(hù)航尖端科技 大科學(xué)裝置建設(shè)熱潮中,超導(dǎo)加速器作為探索微觀世界、推動(dòng)前沿科研的 “國(guó)之重”,對(duì)供電系統(tǒng)的穩(wěn)定性、精度及功率提出極致要求。航裕電源以31.5kA、80kA萬(wàn)安
    的頭像 發(fā)表于 10-12 15:02 ?1534次閱讀

    大彩講堂:VisualHMI-LUA教程-on_update回調(diào)函數(shù)使用指南

    回調(diào)函數(shù)使用指南
    的頭像 發(fā)表于 08-31 16:25 ?852次閱讀
    大彩講堂:VisualHMI-LUA教程-on_update回調(diào)函數(shù)<b class='flag-5'>使用指南</b>

    如何驗(yàn)證硬件加速是否真正提升了通信協(xié)議的安全性?

    驗(yàn)證硬件加速是否真正提升通信協(xié)議的安全性,需從 安全功能正確性、抗攻擊能力增強(qiáng)、安全性能適配、合規(guī)一致性 等核心維度展開(kāi),結(jié)合實(shí)驗(yàn)室測(cè)試與真實(shí)場(chǎng)景驗(yàn)證,避免 “硬件參與即安全提升” 的表面判斷。以下
    的頭像 發(fā)表于 08-27 10:16 ?1108次閱讀
    如何驗(yàn)證<b class='flag-5'>硬件加速</b>是否真正提升了通信協(xié)議的安全性?

    有哪些方法可以確保硬件加速與通信協(xié)議的兼容性?

    ? 確保硬件加速與通信協(xié)議的兼容性,核心是從 硬件選型、協(xié)議標(biāo)準(zhǔn)匹配、軟硬件接口適配、全場(chǎng)景測(cè)試驗(yàn)證 四個(gè)維度建立閉環(huán),避免因硬件功能缺失、接口不兼容或協(xié)議特性支持不全導(dǎo)致的性能損耗、
    的頭像 發(fā)表于 08-27 10:07 ?1033次閱讀

    如何利用硬件加速提升通信協(xié)議的安全性?

    產(chǎn)品實(shí)拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過(guò) 專用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認(rèn)證、密鑰管理等),在提升性能的同時(shí),通過(guò)硬件級(jí)
    的頭像 發(fā)表于 08-27 09:59 ?949次閱讀
    如何利用<b class='flag-5'>硬件加速</b>提升通信協(xié)議的安全性?

    Quartus工具使用指南

    電子發(fā)燒友網(wǎng)站提供《Quartus工具使用指南.pdf》資料免費(fèi)下載
    發(fā)表于 07-15 16:34 ?1次下載

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場(chǎng)在高真空環(huán)境中對(duì)帶電粒子(如電子、質(zhì)子、離子)進(jìn)行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?3511次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    小型加速器中子源監(jiān)測(cè)系統(tǒng)解決方案

    小型加速器中子源是一種基于先進(jìn)加速器技術(shù)的中子產(chǎn)生裝置,憑借體積小、成本低、安全性高的優(yōu)勢(shì),在醫(yī)學(xué)、工業(yè)、科研、安全、能源等多個(gè)領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價(jià)值。無(wú)論是用于醫(yī)學(xué)領(lǐng)域的精準(zhǔn)放療,還是工業(yè)
    的頭像 發(fā)表于 03-13 11:19 ?1362次閱讀
    小型<b class='flag-5'>加速器</b>中子源監(jiān)測(cè)系統(tǒng)解決方案