chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能效比達(dá)2TOPS/W!解密邊緣AI芯片低功耗設(shè)計(jì)之法

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-05-17 00:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)邊緣AI芯片低功耗設(shè)計(jì)是其在移動(dòng)設(shè)備、物聯(lián)網(wǎng)終端等資源受限場景中落地的關(guān)鍵。在物聯(lián)網(wǎng)、可穿戴設(shè)備、智能家居等對功耗敏感的應(yīng)用場景中,低功耗設(shè)計(jì)直接決定了設(shè)備的續(xù)航能力、部署成本及用戶體驗(yàn)。

為什么邊緣AI芯片需要低功耗設(shè)計(jì)?

從應(yīng)用場景層面來看,首先是設(shè)備供電受限,如智能手表、無線傳感器、可穿戴設(shè)備等依賴電池供電,低功耗設(shè)計(jì)直接決定續(xù)航時(shí)間。在太陽能、射頻能量收集等自供電系統(tǒng)中,芯片功耗需低于能量收集速率,否則設(shè)備無法持續(xù)運(yùn)行。

其二是部署環(huán)境苛刻,在工業(yè)監(jiān)測、農(nóng)業(yè)物聯(lián)網(wǎng)等場景中,設(shè)備可能部署在難以更換電池或無法接線的區(qū)域。例如,橋梁結(jié)構(gòu)監(jiān)測傳感器需連續(xù)工作數(shù)年,功耗需低于1mW。功耗過高會(huì)導(dǎo)致芯片發(fā)熱,影響穩(wěn)定性與壽命。例如,在汽車電子中,芯片需滿足AEC-Q100標(biāo)準(zhǔn),低功耗設(shè)計(jì)可減少熱應(yīng)力導(dǎo)致的失效風(fēng)險(xiǎn)。

從技術(shù)發(fā)展層面來看,首先,能效比(TOPS/W)是核心指標(biāo),邊緣AI芯片需在有限功耗下提供高算力。例如,特斯拉FSD芯片以72W功耗實(shí)現(xiàn)144TOPS算力,能效比達(dá)2TOPS/W,滿足自動(dòng)駕駛實(shí)時(shí)性需求。低功耗設(shè)計(jì)可突破“功耗墻”限制。例如,傳統(tǒng)GPU在移動(dòng)端因功耗過高(>20W)難以應(yīng)用,而專用邊緣AI芯片可將功耗壓縮至數(shù)百mW級(jí)。

其次,散熱與封裝成本約束,高功耗芯片需配備散熱片或風(fēng)扇,增加體積與成本。例如,桌面GPU功耗可達(dá)300W,需主動(dòng)散熱;而邊緣設(shè)備芯片功耗需控制在5W以內(nèi),可采用被動(dòng)散熱。低功耗設(shè)計(jì)可簡化封裝要求。例如,采用Chiplet技術(shù)的邊緣AI芯片通過2.5D封裝降低互連功耗,同時(shí)減少對散熱材料的需求。

邊緣AI芯片低功耗設(shè)計(jì)方法

從硬件架構(gòu)優(yōu)化角度來看,如專用加速器NPU、DPU等,設(shè)計(jì)針對AI運(yùn)算(如矩陣乘加)的專用電路,提升能效比。例如,Google TPU通過脈動(dòng)陣列減少通用計(jì)算單元的冗余操作。如異構(gòu)計(jì)算架構(gòu),結(jié)合CPU(控制)、GPU(并行計(jì)算)、NPU(AI推理)等模塊,按任務(wù)類型動(dòng)態(tài)分配計(jì)算負(fù)載。輕量級(jí)任務(wù)由CPU處理,復(fù)雜模型交由NPU,避免資源浪費(fèi)。

還有一些創(chuàng)新架構(gòu)設(shè)計(jì)方向,如存算一體化,減少數(shù)據(jù)搬運(yùn),在存儲(chǔ)單元附近直接完成計(jì)算,降低I/O功耗。技術(shù)路徑實(shí)現(xiàn)方面有存內(nèi)計(jì)算、近內(nèi)存計(jì)算。再如事件驅(qū)動(dòng)架構(gòu),采用脈沖神經(jīng)網(wǎng)絡(luò)(SNN)或事件相機(jī)傳感器,僅在數(shù)據(jù)變化時(shí)觸發(fā)計(jì)算,減少靜態(tài)功耗。

算法與模型優(yōu)化角度來看,如模型壓縮技術(shù),剪枝,移除冗余神經(jīng)元或權(quán)重(稀疏化),降低計(jì)算量;量化,將32位浮點(diǎn)模型轉(zhuǎn)為8位整數(shù),減少乘法器和內(nèi)存訪問能耗;知識(shí)蒸餾,用大模型訓(xùn)練輕量級(jí)學(xué)生模型,保持精度同時(shí)降低計(jì)算需求。
??
如輕量級(jí)網(wǎng)絡(luò)設(shè)計(jì),使用MobileNet(深度可分離卷積)、EfficientNet(復(fù)合縮放)等結(jié)構(gòu),平衡精度與計(jì)算量。再如動(dòng)態(tài)推理,在推理過程中設(shè)置檢查點(diǎn),若低層已足夠準(zhǔn)確,則提前終止計(jì)算。近似計(jì)算,允許非關(guān)鍵計(jì)算結(jié)果存在誤差,簡化運(yùn)算(如低精度浮點(diǎn)、舍入策略)。

從動(dòng)態(tài)電源管理角度,DVFS(動(dòng)態(tài)電壓頻率調(diào)節(jié)),根據(jù)負(fù)載實(shí)時(shí)調(diào)整電壓和頻率,例如在空閑時(shí)進(jìn)入低功耗模式(如C6睡眠狀態(tài))。多電源域劃分,將芯片劃分為多個(gè)電源域,按需開啟或關(guān)閉(如攝像頭模塊僅在檢測到運(yùn)動(dòng)時(shí)供電)。自適應(yīng)功耗策略,結(jié)合負(fù)載預(yù)測(如LSTM預(yù)測任務(wù)周期),動(dòng)態(tài)調(diào)整電源狀態(tài)。

還有軟件與系統(tǒng)協(xié)同方面,編譯器優(yōu)化,通過指令級(jí)并行(ILP)優(yōu)化、內(nèi)存訪問合并,減少計(jì)算周期和能耗。操作系統(tǒng)調(diào)度,任務(wù)級(jí)功耗管理,優(yōu)先調(diào)度低功耗核心處理簡單任務(wù),高負(fù)載時(shí)喚醒高性能核心。應(yīng)用層策略,喚醒詞檢測(如Alexa的Always-On模式),僅運(yùn)行輕量級(jí)模型,待檢測到關(guān)鍵詞后喚醒主模型。

小結(jié):邊緣AI芯片低功耗設(shè)計(jì)是其在真實(shí)場景中落地的必要條件,直接決定了設(shè)備的可用性、經(jīng)濟(jì)性和可持續(xù)性。通過硬件架構(gòu)、算法優(yōu)化、制程工藝等多維度協(xié)同,邊緣AI芯片得以在毫瓦級(jí)甚至微瓦級(jí)功耗下運(yùn)行,滿足電池供電、實(shí)時(shí)響應(yīng)、低成本部署等核心需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 邊緣AI
    +關(guān)注

    關(guān)注

    1

    文章

    260

    瀏覽量

    6215
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    5W功耗實(shí)現(xiàn)25TOPS算力,LM2-100-V0算力模組破解AI安防核心難題

    。針對行業(yè)核心痛點(diǎn),杰和科技推出LM2-100-V0AI算力模組,以高算力、小尺寸、低功耗、易集成的設(shè)計(jì)方式,為智能安防、工業(yè)檢測、零售分析等邊緣AI場景提供一站
    的頭像 發(fā)表于 04-03 11:34 ?363次閱讀
    5<b class='flag-5'>W</b><b class='flag-5'>功耗</b>實(shí)現(xiàn)25<b class='flag-5'>TOPS</b>算力,LM<b class='flag-5'>2</b>-100-V0算力模組破解<b class='flag-5'>AI</b>安防核心難題

    邊緣AI算力臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    310P芯片的底層架構(gòu),深度剖析這款產(chǎn)品的技術(shù)細(xì)節(jié)、算力門檻及其在實(shí)際產(chǎn)業(yè)落地中的真實(shí)價(jià)值。 一、176TOPS的產(chǎn)業(yè)門檻:為何這是邊緣算力的新起點(diǎn)? AI硬件的核心指標(biāo)始終是算力,但
    發(fā)表于 03-10 14:19

    如何確保CAT.1模組的高性能與低功耗

    環(huán)境惡劣,要求零丟包 抗干擾分集技術(shù)保障指令必達(dá),避免因重傳導(dǎo)致的生產(chǎn)中斷或控制延遲。 總結(jié): 我們不僅僅是在售賣一個(gè)通信模組,而是提供了一套基于華為海思頂尖芯片技術(shù)的最優(yōu)解。通過
    發(fā)表于 03-05 11:41

    OrangePi RV2 深度技術(shù)評(píng)測:RISC-V AI融合架構(gòu)的先行者

    OrangePi RV2是香橙派推出的一款基于RISC-V架構(gòu)的AI開發(fā)板,搭載KY X1八核處理器。該板以“CPU 融合AI”為核心理念,內(nèi)置2TOPS算力,并支持雙M.
    發(fā)表于 03-03 20:19

    如何在邊緣AI應(yīng)用場景中實(shí)現(xiàn)高性能、低功耗推理(上)

    。這種方法需要巨大的帶寬才能將海量數(shù)據(jù)傳輸?shù)皆贫恕?邊緣設(shè)備越來越多地使用AI推理技術(shù),以實(shí)現(xiàn)快速實(shí)時(shí)響應(yīng)并提高數(shù)據(jù)隱私和安全性,同時(shí)避免與云連接產(chǎn)生的延遲和成本。這也降低了功耗,使其適用于電池供電的IoT應(yīng)用。因此,
    的頭像 發(fā)表于 02-27 07:48 ?1w次閱讀
    如何在<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>應(yīng)用場景中實(shí)現(xiàn)高性能、<b class='flag-5'>低功耗</b>推理(上)

    高通X85的本地48 TOPS邊緣AI加上云端大模型,到底能干啥?

    酷”,而是一次網(wǎng)絡(luò)設(shè)備的升級(jí)。 X85想做的,是讓CPE從“被動(dòng)連接設(shè)備”變成“思考、能做決定的網(wǎng)絡(luò)節(jié)點(diǎn)”。 ? 一、本地 48 TOPS 邊緣 AI:讓設(shè)備“會(huì)思考” ? 以前的C
    的頭像 發(fā)表于 01-13 14:53 ?526次閱讀

    瑞芯微SOC智能視覺AI處理器

    。B2版本通常在功耗、穩(wěn)定性和部分外圍接口支持上有所優(yōu)化。NPU: 集成0.8 TOPS的NPU,支持INT8/INT16混合運(yùn)算,滿足大多數(shù)邊緣
    發(fā)表于 12-19 13:44

    專為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致

    昆侖芯K100邊緣AI加速卡以75W低功耗實(shí)現(xiàn)128 TOPS的INT8算力,重新定義邊緣推理
    的頭像 發(fā)表于 12-14 11:12 ?3145次閱讀
    專為<b class='flag-5'>邊緣</b>而生:深度解析昆侖芯K100 <b class='flag-5'>AI</b>加速卡,釋放128 <b class='flag-5'>TOPS</b>極致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    工業(yè)視覺網(wǎng)關(guān):RK3576賦多路檢測與邊緣AI

    ~150ms6TOPS NPU 邊緣AI推理易對接 MES / 追溯系統(tǒng) 一、產(chǎn)線痛點(diǎn):從“人看”到“機(jī)判”的轉(zhuǎn)變· 多工位/多角度同步:單機(jī)位覆蓋不足,典型項(xiàng)目需 8~12 路并發(fā),且畫面時(shí)序一致性要求高
    發(fā)表于 10-16 17:56

    酷芯ARS45:12nm制程+10TOPS/w解鎖AI眼鏡新可能

    數(shù)據(jù)實(shí)時(shí)傳輸帶來的延遲、帶寬壓力以及隱私風(fēng)險(xiǎn)等問題日益凸顯,同時(shí)終端設(shè)備智能化升級(jí)的剛性需求愈發(fā)迫切。 ? 在此背景下,“云-邊-端”協(xié)同計(jì)算架構(gòu)應(yīng)運(yùn)而生,而邊緣/終端AI芯片作為“端側(cè)智能”的核心載體,其重要性不言而喻。它既
    的頭像 發(fā)表于 07-21 09:10 ?9044次閱讀

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    與 Nordic 的 nRF54 系列超低功耗無線 SoC 結(jié)合,使得即使是資源極為有限的設(shè)備也高效運(yùn)行邊緣 AI。Nordic 目前正在將 Neuton 深度集成到自身開發(fā)生態(tài)中,
    發(fā)表于 06-28 14:18

    RK3576 vs RK3588:為何越來越多的開發(fā)者轉(zhuǎn)向RK3576?

    電子RK3576低功耗、低成本、墨水平板優(yōu)化 IoT/嵌入式設(shè)備RK3576比高,長期運(yùn)行穩(wěn)定 高端工控/邊緣計(jì)算RK3588四通道內(nèi)存,高帶寬需求 RK3576 的核心優(yōu)勢:?
    發(fā)表于 05-30 08:46

    輕松上手邊緣AI:MemryX MX3+結(jié)合Orange Pi 5 Plus的C/C++實(shí)戰(zhàn)指南

    AI邊緣計(jì)算快速發(fā)展的時(shí)代,MemryX MX3+ 加速卡憑借其 20 TOPS 的強(qiáng)大性能和低功耗(5 TFLOPS/W),成為
    的頭像 發(fā)表于 05-28 08:01 ?1014次閱讀
    輕松上手<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>:MemryX MX3+結(jié)合Orange Pi 5 Plus的C/C++實(shí)戰(zhàn)指南

    低功耗Wi-Fi 6模塊物聯(lián)網(wǎng):NRF7002

    高能特性為邊緣計(jì)算設(shè)備提供了理想的無線連接方案。 核心亮點(diǎn)與參數(shù)解析1. ?極致設(shè)計(jì)? PTR7002采用Nordic nRF7002芯片
    發(fā)表于 05-21 17:10

    和算力提升的衡量方法

    一、的衡量方法 定義與計(jì)算公式? (EER)定義為制冷量與輸入功率的比值,計(jì)算公式為
    的頭像 發(fā)表于 04-28 07:47 ?3499次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>比</b>和算力提升的衡量方法