chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于Kirin 970的NPU的性能分析

lC49_半導體 ? 來源:djl ? 作者:anandtech ? 2019-09-03 16:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

去年,華為推出了業(yè)界首款集成NPU的移動芯片Kirin 970。作為新一代的旗艦,這個SoC上面的CPU集成了8個核心,其中 4 個為高性能的 ARM 公版 A73 架構,最高主頻 2.4GHz(麒麟 960 是 2.36GHz),4 個為低功耗的 ARM 公版 A53 架構,最高主頻 1.8GHz(麒麟 960 是 1.84GHz);GPU則是集成了ARM最新的Mali-G72 架構。

另外,除了傳統(tǒng)移動手機SoC必備的通信基帶、ISP、DSP、Codec和協(xié)處理器外,Kirin 970還首次集成了專門為深度學習而定制的NPU,F(xiàn)P16 性能達到了 1.92 TFLOP。具體來看, NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。這是華為面向現(xiàn)在火熱的人工智能市場扔出的一個殺手锏。

以上都是華為的一家之言,下面我們就來探討一下華為這顆芯片NPU的真正實力。首先,我們先來了解一下NPU的概念。

什么是NPU?

準確來說,當我們談到人工智能在計算領域的用途的時候,更多強調的是機器學習。

而當我們討論人工智能在硬件層面的深入研究的時候,談論的則更多是針對專門的硬件模塊所進行的卷積神經網絡的優(yōu)化和執(zhí)行工作。

在解釋卷積神經網絡如何工作的時候,我們從上世紀八十年代開始的工作已經遠遠超出了研究工作,其根本目的是試圖模擬人腦神經元的行為。

注意,這里的一個關鍵詞是“模擬”,雖然到目前為止并沒有任何神經網絡能夠從硬件層面模仿人腦的結構。

不過在學術領域,尤其是在神經網絡領域已經存在了很多理論。在過去的十年中,已經開發(fā)出了一套軟件能夠在GPU的硬件層面模擬整個過程。

比如說,研究人員通過不斷的迭代和發(fā)展美國有線電視新聞網的模型,極大的提升了新聞的準確性和效率。

當然,GPU并不是最適合運行人工智能的硬件,也不是唯一一個能夠進行高度的并行運算的處理器。

隨著人工智能的不斷發(fā)展,越來越多的公司希望在實際應用當中將人工智能實現(xiàn)商業(yè)化,這就要求硬件能夠提供更高的性能,更高的效率。

因此,我們也看到了更加專業(yè)的處理器的出現(xiàn),其架構就是針對機器學習等應用。

谷歌是第一家宣布推出此類硬件的公司,該公司在2016年推出了TPU。但是,雖然這類專業(yè)的硬件能夠在處理人工智能等工作方面在硬件和功率方面獲得更高的效率,但是也失去了靈活性。

谷歌TPU芯片和主板

在這類專門的人工智能處理器當中,影響其工作效率的主要有兩個方面:要存在一個經過訓練的模型,其中主要包括模型在今后的運行中可能涉及到的相關的數(shù)據。一般情況下,模型的訓練是大密度的,需要經過大批量的訓練才能實現(xiàn)更高的精度。也就是說,在實際運行中,有效的神經網絡要比實際用到的神經網絡要龐大的多。

因此,普遍存在這樣一個思路,就是模型的主體訓練工作由更加龐大的GPU服務器或者是TPU云服務器來完成。

其次,神經網絡的運行需要一個執(zhí)行模型,通過不斷注入新的數(shù)據,完成模型的演算來實現(xiàn)整個過程。一般情況下,我們將輸入數(shù)據,然后通過神經網絡模型得到輸出結果的模式稱之為推理。

不過實際的推理過程與模型當中的訓練過程對于計算的要求也存在著很大的不同。

雖然推理和訓練都需要用到高密度的并行計算,但是推理能夠以較低精度的計算來完成,同時執(zhí)行模型部分所需要的計算性能也較低,這也就意味著推理過程能夠在更加便宜的硬件上來進行。

關于Kirin 970的NPU的性能分析

這一功能反過來引導整個行業(yè)走向更加注重邊緣設備(用戶設備)的方向,因為這些設備能夠提供更高的性能效率和需求更低的功耗。

也就是說,如果本地設備當中存在一個已經經過訓練的模型,就可以使用該設備來進行推理過程,而不需要將數(shù)據上傳到云端服務器當中來進行數(shù)據的處理。

這一過程將會減輕可能存在的延遲,功耗和帶寬等問題,同時也避免了隱私問題,因為輸出端數(shù)據永遠不會離開用戶設備。

隨著神經網絡推理功能在終端設備上運行的不斷實現(xiàn),對于不同處理器能夠實現(xiàn)何種功能的研究以及選擇工作也在不斷深入。

CPU、GPU甚至DSP都能夠在終端設備上實現(xiàn)推理功能,但是這些處理器之間存在著巨大的效率差距。通用處理器適合絕大多數(shù)的工作,但是他們天生就不是被設計用來進行大規(guī)模的并行計算的。GPU和DSP甚至表現(xiàn)的更好,也有巨大的提升空間。

但是,此外,我們也見到了一種新的處理加速器的出現(xiàn),比如麒麟970里面使用的NPU。

由于這類處理加速器是新近出現(xiàn)的設備,所以到目前為止,業(yè)界并沒有更出一個統(tǒng)一的命名方式。華為海思命名的是一種方式,而蘋果則是以另外一個名字命名。

不過從普世意義上來看,我們能夠將這些處理器統(tǒng)一稱之為神經網絡IP。

為麒麟970 NPU提供IP的是一家名為寒武紀的中國IP供應商,據了解,NPU采用的IP是經過優(yōu)化之后的產物,而不是直接采用現(xiàn)有IP。同時,華為還要求Cambricon能夠與之共同發(fā)展改進該IP,因為在實際的應用當中,實際情況與計算情況,有時候還是會存在著一些差距。

但是,我們需要明白的是,我們應當避免對神經網絡的理論性能數(shù)據過多關注,因為這些數(shù)據并不一定與實際性能有關,同時由于對神經網絡IP了解有限,最終結果如何也未可知。

關于Kirin 970的NPU的性能分析

當使用CPU以外的其他硬件設備來運行神經網絡的時候,第一個障礙就是利用適當?shù)腁PI來訪問模塊。

傳統(tǒng)的SOC和IP供應商已經能夠提供專用的API和SDK來進行使用該類硬件的神經網絡的應用開發(fā)。而海思提供的API不僅僅能夠管理CPU,也能夠用來管理GPU和NPU。雖然目前海思還沒有對外公開該API,但是據了解,海思將會在今年晚些時候與開發(fā)商一起進行開發(fā)。

其他的廠商,諸如高通也提供了SDK來幫助程序開發(fā)人員在GPU和DSP等硬件的基礎上進行神經網絡的開發(fā)工作,當然還有其他一些IP供應商也有提供自己專門的軟件開發(fā)工具來進行相關的開發(fā)。

但是,針對特定供應商的API同樣存在著局限性,未來我們需要不同的供應商能夠提供統(tǒng)一的API來進行更加快速,便捷的開發(fā)工作。

谷歌目前正在開展這項工作,該公司計劃在安卓系統(tǒng)8.1當中引入相關的名為NN API的模塊。

另外一個需要注意的問題是,目前很多的類似于NN API的只能夠支持一部分功能,比如只能夠支持NPU的一部分功能,如果開發(fā)人員想要在NPU的基礎上,充分開發(fā)和利用硬件的性能,開發(fā)者就需要有專門的API來開發(fā)這類硬件。

Kirin 970的NPU性能測試

為了完成這類開發(fā)工作,我們還需要一個基準測試,來測試不同的供應商提供的API能夠利用到NPU多少性能。

不幸的是,在現(xiàn)階段,我們還缺少類似的實現(xiàn)該基準測試的方法,目前只有中國的一個廠商推出了相關的軟件:在中國比較流行的魯大師基準測試軟件在最近推出了一個基于人工智能測試的框架,用來測試NPU和高通SNPE框架。

據了解,目前該基準測試能夠測試三種不同的神經網絡,VGG16, InceptionV3和ResNet34。

這類軟件不僅能夠測試相關的處理器的性能,并給出相關的結果。同時也能夠以圖形化的方式,從平均功率,效率以及絕對性能等三個維度展示處理器的處理能力。

從這類軟件呈現(xiàn)的圖形數(shù)據我們能夠觀察到處理器的性能差異,CPU和NPU在進行相關運算時到底有多大的差距。

關于Kirin 970的NPU的性能分析

當使用CPU來進行運算的時候,通常情況下CPU只能以1-2fps的速率進行計算,而所需要的功耗也異常的高。比如驍龍835和麒麟960的CPU在運算的時候,都需要以超過平均負載的工作負載進行運算。

相比較而言,高通的Hexagon DSP能夠實現(xiàn)相對于CPU5到8倍的性能。

而華為的NPU的性能則更加明顯,相對于ResNet34,NPU能夠實現(xiàn)4倍的性能提升。

不難發(fā)現(xiàn),不同的處理器之所以在性能方面表現(xiàn)出如此巨大的差異,是因為這些處理器的設計不同,所針對的處理器應用場景也不同。

由于卷積神經網絡在運算的過程中需要進行大量的并行計算,因此,像麒麟NPU這樣的專門的處理器在執(zhí)行的過程中往往能夠實現(xiàn)更高的性能。

而在功耗方面,我們則發(fā)現(xiàn),相對于其他的處理器,NPU能夠實現(xiàn)50倍的改進,尤其是在卷積神經網絡實際的運用當中,這種能耗的提升更加明顯。

同時,我們也發(fā)現(xiàn),高通的DSP也能夠實現(xiàn)類似于華為NPU同等級的功耗水平。這似乎表明,高通推出的驍龍845處理器中應用的Hexagon 685能夠在性能方面提升3倍。

在此,我想抱怨一下谷歌的Pixel 2:由于Pixel 2缺乏對于SNPE框架的支持,因此很難從真正意義上進行驍龍835的CPU基準測試。

不過從某種意義上來說,這也是理所當然的事情,畢竟谷歌在安卓8.1中才會引入NN API,未來谷歌將會推動安卓標準API在相關處理器方面的加速也是自然而然的。

但是,從另一方面來說,這也會限制傳統(tǒng)的手機OEM廠商開發(fā)的能力。

這一決定往往會限制今后生態(tài)系統(tǒng)的發(fā)展,這也是為什么我們沒有看到更多的手機GPU來進行相關的卷積神經網絡加速工作。

關于Kirin 970的NPU的性能分析

此外,雖然目前iPhone并不支持相關的基準測試,但是我們也能夠從海思發(fā)布的相關數(shù)據中看到一些端倪。

從一些數(shù)字上我們能夠看到,蘋果所提供的神經網絡IP雖然在性能方面超越了驍龍835處理器,但是仍然遠遠落后于海思的NPU。但是,我們無法單獨核實這些數(shù)字是否真的適合相關的基準。

當然,最重要的問題在于,這類處理器能夠帶來什么好處?

海思表示,一個比較明顯的例子是,美國有線電視新聞網通過應用處理器來進行降噪處理,能夠在交通繁忙的情況下,將語音識別的準確度從80%提高到92%。

此外,還有在攝像頭應用方面,Mate 10的攝像頭能夠在NPU的幫助下,通過推理,來識別不同場景,再基于場景對相機的設置進行智能的優(yōu)化。

同時,Mate 10中所應用的微軟翻譯程序也能夠使用NPU的離線加速翻譯功能,這些都是令我印象深刻的應用。

而在手機內置的圖片應用中,也能夠智能識別圖片來進行分類。

關于Kirin 970的NPU的性能分析

除了NPU能夠對卷積神經網絡進行相應的視覺處理之外,CadenceTensilica Vision P6 DSP 和高通的Hexagon 680 DSP也能夠實現(xiàn)相同的功能,只是目前并沒有對終端用戶開放而已。

但是,這并不表明,采用NPU的Mate 10就能夠為終端用戶帶來決定性的差異化體驗。同樣,手機中這類神經網絡的應用并沒有在汽車,安全攝像頭領域出現(xiàn)相同的殺手級應用。另外,由于生態(tài)系統(tǒng)的限制性問題,我們只能夠在Mate 10見到相關的應用,我們能否在更多的場景中見到,華為是否愿意開發(fā),與開發(fā)商一起共同開發(fā),都是值得商榷的事情,不過華為在這方面的創(chuàng)新還是值得肯定的。

正如之前所說,華為和微軟共同開發(fā)的應用似乎是Mate 10上最吸引人的應用,因此我們可以在此基礎之上進行更多的探索。

目前來看,該應用能夠智能識別傳統(tǒng)的外文文本,并進行翻譯,那么在未來是否可以AR方面的應用呢?

聯(lián)發(fā)科在CES上為我們展示了一個相關的識別的例子:使用神經網絡的視頻會議編碼器能夠對美國有線電視新聞網的圖像和視頻進行識別,并反饋給編碼器,從而提升視頻的質量。

在未來,可以想見,越來越多的設備將會采用這類IP,開發(fā)人員也能夠更容易的開發(fā)相關應用。

最后的思考

我在這篇文章里,并不是想強調麒麟970到底有多么的先進,只是希望借此機會表明,未來高端安卓智能手機處理器的競爭和發(fā)展格局將會出現(xiàn)很多令人振奮的變化。

隨著iPhone智能手機生態(tài)系統(tǒng)進入10周年,我們也看到越來越多的垂直整合設備的出現(xiàn)。

并不是說蘋果就一定是規(guī)則的制定者,只是在未來,一個更加成熟的生態(tài)系統(tǒng)當中,公司都需要能夠自主的把控發(fā)展路線。否則,手機廠商將很難與其他廠商區(qū)分開來,更不用說為用戶提供差異化的功能,或者與其他廠商競爭。

蘋果很早就意識到了這一點。而華為也是目前為止唯一一家能夠獨自設立目前的OEM廠商。

同時,還有很多準獨立廠商也在努力設計自己的芯片,他們憑借從IP供應商那里獲得的CPU和GPU等關鍵零部件來進行設計。

根本上來說,麒麟970在CPU的性能與功率上面并沒有與驍龍835有太大的差距,其誤差只是體現(xiàn)在cortex-a73在實際應用中的體現(xiàn)而已。

考慮到驍龍820所采用的CPU雖然與三星自主開發(fā)的CPU略有差距,但是在實際應用中并不明顯,而且三星到目前未知也沒有計劃去全力發(fā)展和整合自主CPU,考慮到這些,華為采用ARM CPU還是很有道理的。

而高通本身在自主設計CPU和GPU方面都具有一定的自主掌控能力,并與其它廠商有著很大的差距。

想象一下,在桌面GPU上領先的英偉達,與競爭對手相比,擁有33%的效率競爭優(yōu)勢,當這一優(yōu)勢擴大到75-90%的時候,這種選擇就不言而喻了。

這種情況之下,廠商可以通過使用更大的GPU來補償效率和性能方面的缺陷,而這些體驗,終端用戶幾乎很難感覺到。

但是,這是一種不可持續(xù)的方案,因為這種方式正在不斷蠶食廠商的毛利率。

除了CPU和GPU以及調制解調器IP之外,手機還需要更多的組件,這里就不深入探討。

比如說,在麒麟970中使用的 Cadence Tensilica Vision P6 DSP確實能夠提升相機的性能,但是也需要從軟件方面來進行支持才可以。

NPU是一種尚處于起步階段的新興IP,麒麟970有很多競爭對手嗎?并沒有。這一功能為產品增加了競爭力嗎?確實有,但可能沒有想象中那么大。

軟件生態(tài)系統(tǒng)的發(fā)展確實會拖慢手機產業(yè)的發(fā)展,但是沒有相關硬件的支持,很多應用只有軟件也是沒有辦法實現(xiàn)的。

華為的這一策略將來在全行業(yè)采用將是不可避免的。

海思的NPU芯片證明海思作為一家芯片設計公司也能夠設計出與高通,三星匹敵的處理器。但是,海思的發(fā)布時間并不遵循傳統(tǒng)安卓手機廠商的發(fā)布規(guī)律,因此我們預計會有新的處理出現(xiàn),在性能方面超過麒麟970。

現(xiàn)實是,華為是能夠將芯片設計和終端產品整合在一起的唯一兩家OEM供應商之一(編者按:其實三星也算一家,但是三星似乎采用高通的方案更多),也是唯一一家安卓廠商。在過去的幾年里,這家廠商已經走過了漫長的道路,經歷了太多的改進。最重要的是,華為始終能夠把目標和執(zhí)行目標放在一起,堅定不移的朝著移動業(yè)務這一正確方向發(fā)展,這是他們成功的關鍵原因。

但對這家中國廠商來說,未來的路還是很長。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20325

    瀏覽量

    254705
  • 神經網絡
    +關注

    關注

    42

    文章

    4840

    瀏覽量

    108145
  • 云服務器
    +關注

    關注

    0

    文章

    840

    瀏覽量

    14743
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    在Zephyr OS上啟用NPU的實用方案

    今天,我們將正式在 Zephyr中加入NPU軟件支持,讓模型不僅能“跑起來”,還能“跑得飛快”。是的,本期開始就是實戰(zhàn)環(huán)節(jié)!
    的頭像 發(fā)表于 03-09 10:37 ?1004次閱讀
    在Zephyr OS上啟用<b class='flag-5'>NPU</b>的實用方案

    IMX95 - NPU 不工作的原因?怎么解決?

    作為標題,我查了很多相關的帖子,似乎 IMX95 NPU 還存在不少問題。這是我迄今為止嘗試過的: 使用TFLite label_image演示程序: CPU A1 與內核 6.6.3 SDK
    發(fā)表于 02-26 11:21

    PGA970 LVDT傳感器信號調理器:技術剖析與應用指南

    PGA970 LVDT傳感器信號調理器:技術剖析與應用指南 引言 在電子工程師的日常工作中,傳感器信號調理是一個關鍵環(huán)節(jié),它直接影響到整個系統(tǒng)的性能和穩(wěn)定性。今天,我們要深入探討的是德州儀器(TI
    的頭像 發(fā)表于 02-12 14:20 ?360次閱讀

    探索MAX965 - MAX970系列比較器:低功耗與高性能的完美結合

    探索MAX965 - MAX970系列比較器:低功耗與高性能的完美結合 在電子設計領域,對于低功耗、高性能的追求從未停止。今天,我們就來深入了解一下Maxim Integrated推出的MAX965
    的頭像 發(fā)表于 01-08 16:20 ?447次閱讀

    探索MAX965 - MAX970:超低電壓微功耗比較器的卓越性能

    探索MAX965 - MAX970:超低電壓微功耗比較器的卓越性能 在電子設計領域,對于低電壓、微功耗且性能卓越的比較器需求日益增長。MAX965 - MAX970系列單/雙/四通道微
    的頭像 發(fā)表于 01-08 16:20 ?359次閱讀

    【新品發(fā)布】艾為重磅發(fā)布端側AI高性能NPU語音芯片,打造智能語音體驗新標桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經網絡智能語音處理芯片:AWA89601,集成音頻專用NPU(神經網絡處理器),通過聲音模型訓練與NPU硬件結合,該芯片在AI降噪、AI人聲增強、
    的頭像 發(fā)表于 01-07 18:33 ?510次閱讀
    【新品發(fā)布】艾為重磅發(fā)布端側AI高<b class='flag-5'>性能</b><b class='flag-5'>NPU</b>語音芯片,打造智能語音體驗新標桿

    別再用舊款了!RV1126B NPU實測2.6倍提速,YOLO算法絲滑運行

    AI視覺芯片的核心競爭力,NPU性能尤為關鍵。瑞芯微RV1126B作為RV1126迭代款,性能提升有多少?繼上集CPU性能實測,今天為您帶來NPU
    的頭像 發(fā)表于 12-22 12:11 ?1157次閱讀
    別再用舊款了!RV1126B <b class='flag-5'>NPU</b>實測2.6倍提速,YOLO算法絲滑運行

    【迅為RK3568開發(fā)板NPU實戰(zhàn)】別再閑置你的NPU!手把手教你玩轉RKNN-Toolkit2 的使用

    【迅為RK3568開發(fā)板NPU實戰(zhàn)】別再閑置你的NPU!手把手教你玩轉RKNN-Toolkit2 的使用
    的頭像 發(fā)表于 11-11 14:21 ?1486次閱讀
    【迅為RK3568開發(fā)板<b class='flag-5'>NPU</b>實戰(zhàn)】別再閑置你的<b class='flag-5'>NPU</b>!手把手教你玩轉RKNN-Toolkit2 的使用

    【RK3568 NPU實戰(zhàn)】別再閑置你的NPU!手把手帶你用迅為資料跑通Android AI檢測Demo,附完整流程與效果

    【RK3568 NPU實戰(zhàn)】別再閑置你的NPU!手把手帶你用迅為資料跑通Android AI檢測Demo,附完整流程與效果
    的頭像 發(fā)表于 11-10 15:58 ?1236次閱讀
    【RK3568 <b class='flag-5'>NPU</b>實戰(zhàn)】別再閑置你的<b class='flag-5'>NPU</b>!手把手帶你用迅為資料跑通Android AI檢測Demo,附完整流程與效果

    如何利用NPU與模型壓縮技術優(yōu)化邊緣AI

    隨著人工智能模型從設計階段走向實際部署,工程師面臨著雙重挑戰(zhàn):在計算能力和內存受限的嵌入式設備上實現(xiàn)實時性能。神經處理單元(NPU)作為強大的硬件解決方案,擅長處理 AI 模型密集的計算需求。然而
    的頭像 發(fā)表于 11-07 15:26 ?1401次閱讀
    如何利用<b class='flag-5'>NPU</b>與模型壓縮技術優(yōu)化邊緣AI

    實戰(zhàn)RK3568性能調優(yōu):如何利用迅為資料壓榨NPU潛能-在Android系統(tǒng)中使用NPU

    《實戰(zhàn)RK3568性能調優(yōu):如何利用迅為資料壓榨NPU潛能-在Android系統(tǒng)中使用NPU
    的頭像 發(fā)表于 11-07 13:42 ?989次閱讀
    實戰(zhàn)RK3568<b class='flag-5'>性能</b>調優(yōu):如何利用迅為資料壓榨<b class='flag-5'>NPU</b>潛能-在Android系統(tǒng)中使用<b class='flag-5'>NPU</b>

    AI體驗躍遷,天璣9500用雙NPU開創(chuàng)端側AI新時代

    AI 正從“嘗鮮”邁向“常用”,下一代體驗該由誰定義?聯(lián)發(fā)科天璣9500給出答案:行業(yè)首發(fā)將端側 AI 4K 文生圖帶到手機,引領移動影像與創(chuàng)造力的范式躍遷。 全新“超性能 + 超能效”雙 NPU
    的頭像 發(fā)表于 09-24 14:47 ?888次閱讀
    AI體驗躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)端側AI新時代

    請問如何在C++中使用NPU上的模型緩存?

    無法確定如何在 C++ 中的 NPU 上使用模型緩存
    發(fā)表于 06-24 07:25

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構的基礎知識,但該部分知識比較晦澀難懂,或許是由于我一直從事的事芯片
    發(fā)表于 06-18 19:31

    瑞芯微NPU使用攻略

    核心要點:定義與功能硬件加速單元:RKNPU是集成在瑞芯微芯片中的專用NPU,專注于加速深度學習算法,如圖像識別、目標檢測、語音處理等,同時優(yōu)化功耗與性能平衡。支
    的頭像 發(fā)表于 05-21 15:50 ?3018次閱讀
    瑞芯微<b class='flag-5'>NPU</b>使用攻略