chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

<bdo id="xke2b"><span id="xke2b"><meter id="xke2b"></meter></span></bdo>

<i id="xke2b"></i>

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫(yī)療電子

人工智能

可穿戴設備

軍用/航空電子

工業(yè)控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統(tǒng)

移動通信

便攜設備

物聯網

區(qū)塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區(qū)

論壇

問答

小組

技術專欄

社區(qū)之星

試用中心

HarmonyOS技術社區(qū)

2023電子工程師大會
研究院
活動

設計大賽

硬創(chuàng)大賽

社區(qū)活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業(yè)號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

Yolo系列模型的部署、精度對齊與int8量化加速

Yolo系列模型的部署、精度對齊與int8量化加速

大家好，我是海濱。寫這篇文章的目的是為宣傳我在23年初到現在完成的一項工作---Yolo系列模型在TensorRT上的部署與量化加速，目前以通過視頻的形式在B站發(fā)布（不收費，只圖一個一劍三連）。

麻雀雖小但五臟俱全，本項目系統(tǒng)介紹了YOLO系列模型在TensorRT上的量化方案，工程型較強，我們給出的工具可以實現不同量化方案在Yolo系列模型的量化部署，無論是工程實踐還是學術實驗，相信都會對你帶來一定的幫助。

B站地址（求關注和三連）：https://www.bilibili.com/video/BV1Ds4y1k7yr/

Github開源地址（求star）：https://github.com/thb1314/mmyolo_tensorrt/

當時想做這個的目的是是為了總結一下目標檢測模型的量化加速到底會遇到什么坑，只是沒想到不量化坑都會很多。

比如即使是以FP32形式推理，由于TensorRT算子參數的一些限制和TRT和torch內部實現的不同，導致torch推理結果會和TensorRT推理結果天然的不統(tǒng)一，至于為什么不統(tǒng)一這里賣個關子大家感興趣可以看下視頻。

下面說一下我們這個項目做了哪些事情

YOLO系列模型在tensorrt上的部署與精度對齊

該項目詳細介紹了Yolo系列模型在TensorRT上的FP32的精度部署，基于mmyolo框架導出各種yolo模型的onnx，在coco val數據集上對齊torch版本與TensorRT版本的精度。

在此過程中我們發(fā)現，由于TopK算子限制和NMS算子實現上的不同，我們無法完全對齊torch和yolo模型的精度，不過這種風險是可解釋且可控的。

詳解TensorRT量化的三種實現方式

TensorRT量化的三種實現方式包括trt7自帶量化、dynamic range api，trt8引入的QDQ算子。

Dynamic range api會在采用基于MQbench框架做PTQ時講解。

TensorRT引入的QDQ算子方式在針對Yolo模型的PTQ和QAT方式時都有詳細的闡述，當然這個過程也沒有那么順利。

在基于PytorchQuantization導出的含有QDQ節(jié)點的onnx時，我們發(fā)現盡管量化版本的torch模型精度很高，但是在TensorRT部署時精度卻很低，TRT部署收精度損失很嚴重，通過可視化其他量化形式的engine和問題engine進行對比，我們發(fā)現是一些層的int8量化會出問題，由此找出問題量化節(jié)點解決。

詳解MQbench量化工具包在TensorRT上的應用

我們研究了基于MQbench框架的普通PTQ算法和包括Adaround高階PTQ算法，且啟發(fā)于Adaround高階PTQ算法。

我們將torch版本中的HistogramObserver引入到MQBench中，activation采用HistogramObserverweight采用MinMaxObserver，在PTQ過程中，weight的校準前向傳播一次，activation的校準需要多次因此我們將weight的PTQ過程和activation的PTQ過程分開進行，加速PTQ量化。實踐證明，我們采用上述配置的分離PTQ量化在yolov8上可以取得基本不掉點的int8量化精度。

針對YoloV6這種難量化模型，分別采用部分量化和QAT來彌補量化精度損失

在部分量化階段，我們采用量化敏感層分析技術來判斷哪些層最需要恢復原始精度，給出各種metric的量化敏感層實現。

在QAT階段，不同于原始Yolov6論文中蒸餾+RepOPT的方式，我們直接采用上述部分量化后的模型做出初始模型進行finetune，結果發(fā)現finetune后的模型依然取得不錯效果。

針對旋轉目標檢測，我們同樣給出一種端到端方案，最后的輸出就是NMS后的結果。通過將TensorRT中的EfficientNMS Plugin和mmcv中旋轉框iou計算的cuda實現相結合，給出EfficientNMS for rotated box版本，經過簡單驗證我們的TRT版本與Torch版本模型輸出基本對齊。

以上就是我們這個項目做的事情，歡迎各位看官關注b站和一劍三連。同時，如果各位有更好的想法也歡迎給我們的git倉庫提PR。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4800

瀏覽量
98505
模型

模型

+關注

關注
1

文章
3810

瀏覽量
52253
精度

精度

+關注

關注
0

文章
274

瀏覽量
20831

原文標題：Yolo系列模型的部署、精度對齊與int8量化加速

文章出處：【微信號：GiantPandaCV，微信公眾號：GiantPandaCV】歡迎添加關注！文章轉載請注明出處。

評論

精選推薦
更多

文章

資料

帖子

芯自主?板可靠：視美泰國產化主板，ARM 架構 + 瑞芯微芯片+國產操作系統(tǒng)領跑信創(chuàng)落地

視美泰
3小時前

334 閱讀

精準觸控+壓感“芯”體驗！匯頂發(fā)布全新Newton Touchpad壓力觸控板方案

章鷹觀察
3小時前

696 閱讀

瑞芯微(EASY EAI)RV1126B 應用依賴庫安裝

廣州靈眸科技有限公司
5小時前

297 閱讀

MPS MP9566芯片式固態(tài)繼電器與機械繼電器的技術比較

MPS芯源系統(tǒng)
4小時前

340 閱讀

瑞薩RA系列FSP庫開發(fā)實戰(zhàn)指南之使用GPT基本定時功能實驗

瑞薩嵌入式小百科
4小時前

373 閱讀

SS-7802A,SS-7804示波器中文操作指南

小組店小二
1485

10積分

206下載

DGS framework Netflix開發(fā)的GraphQL服務器框架

張旭
1.30 MB

2積分

3下載

dbVisitor全功能數據庫訪問工具

石正厚
0.82 MB

2積分

1下載

JJSwiftLog高性能日志組件

djfldsthtr
0.82 MB

2積分

1下載

AESCrypt-ObjC簡單有效的AES加密/解密

胖子的逆襲
0.01 MB

免費

0下載

《電子發(fā)燒友電子設計周報》聚焦硬科技領域核心價值 26年第7期：2026.3.30--2025.4.15

電子人steve
3天前

504 閱讀

從零開始學硬件 <3>demo源碼1.OceanOS-CM0-B1解讀

jf_28912132
5天前

1745 閱讀

從零開始學硬件 <4>demo源碼2.OceanOS-CM0-B2解讀

jf_28912132
5天前

1740 閱讀

【飛凌嵌入式T153開發(fā)板+初體驗】

jf_12220034
6天前

2327 閱讀

【FH8626V300L試用】+開箱測試

574246365
18天前

7317 閱讀

推薦專欄
更多

企業(yè)產品

資料

方案
更多

電子發(fā)燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業(yè)應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫(yī)療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設備

觸控感測

物聯網

智能電網

區(qū)塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務

產品

資料

文章

方案

企業(yè)

供應鏈服務

硬件開發(fā)

媒體服務

網站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設計大賽

電子發(fā)燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發(fā)燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發(fā)燒友APP

機器人發(fā)燒友

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 電信與信息服務業(yè)務經營許可證：湘B2-20260003 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费