資料介紹
在過去幾年里,許多計算機視覺相關的深度學習的發(fā)展,都可以歸結于少數幾個神經網絡架構。拋開所有關于數學、代碼和實現的細節(jié),來探索一個簡單的問題:這些模型如何工作以及為什么工作?
在撰寫這篇文章時,Keras 庫(http://suo.im/4aLGEd)中已經涵蓋了6種預訓練模型,分別是:
VGG16
VGG19
ResNet50
Inception v3
Xception
MobileNet
▍VGG
VGG網絡和從2012年早期的 AlexNet 網絡一樣,遵循著現有卷積網絡的典型布局:在最終的全連接分類層(fully-connected classification layers)之前,由一系列的卷積層(convolutional layers),最大池化層(max-pooling layers)和激活層(activation layers)構成。
MobileNet 本質上是 Xception 架構,針對移動應用而優(yōu)化的線性版本。剩下的三種架構則真正重新定義了我們看待深度網絡的方式。
這篇文章接下來的部分將側重于ResNet,Inception和Xception三種架構的直觀理解,以及為什么它們成為計算機視覺中許多后續(xù)工作的基石。
▍ResNet
為什么深度網絡在不斷增加層的時候,表現反而變的更差?
直觀來想, 更深層次的網絡,應該不比較淺的網絡表現的差,至少在訓練的時候應該這樣(這時沒有過擬合over-fitting的風險)。
讓我們作一個思維實驗,假設我們已經建立了一個n層的網絡,達到了一定的準確性。 如果僅通過復制相同的前n個層并對最后一層執(zhí)行單位映射,則n + 1層的網絡至少應該能夠獲得完全相同的精度。
類似地,n + 2,n + 3和n + 4層的網絡都可以繼續(xù)執(zhí)行單位映射并獲得相同的準確性。 然而,實際上,這些更深層的網絡在性能上幾乎都會有所下降。
ResNet的作者將這些問題歸結為一個假設:直接映射難以學習。
他們提出了一個解決辦法:用學習 x到 H(x) 兩者之間的差異,或者“殘差”的方式,替代嘗試學習從x到 H(x) 的底層映射。這樣,我們就可以可以通過輸入殘差來計算 H(x) 。
假設我們用 F(x)=H(x)-x 來表示殘差。 ResNet 網絡現在不是試圖直接學習 H(x) , 而是學習 F(x)+x。
這引出了你可能知道的著名的ResNet(或“殘差網絡”)模塊:

ResNet中的每個“模塊”都由一系列層和一個“捷徑”連接,捷徑連接將模塊的輸入值直接添加到其輸出值。 “添加”操作以元素對應方式執(zhí)行,如果輸入和輸出的大小不同,可以使用補零法(zero-padding)或投影(通過1x1卷積)匹配尺寸。
回到我們的思維實驗,捷徑連接大大簡化了我們對單位層的構建。 直觀的看,學習將 F(x) 推到0并將輸出值保留為x比從頭開始學習單位交換(identity transformation)要容易得多。 一般情況下,ResNet為層提供了一個“參考”點—x—來開始學習。
這個想法在實踐中效果驚人。在此之前,深度神經網絡經常遇到梯度消失(vanishing gradients)的問題,來自誤差函數的梯度信號隨著它們向較早層反向傳播而呈指數下降。
從本質上說,當誤差信號一直傳到到早期層時,它們已經小到網絡無法進行學習了。然而,由于ResNet中的梯度信號可以通過捷徑連接直接返回到早期層,突然間我們就可以建立 50層,101層,152層,甚至(想當然)1000+層的網絡,而它們仍然表現良好。用22層的網絡贏得了2014年ILSVRC挑戰(zhàn),這在當時是一個巨大的技術飛躍。
- 網絡架構的時鐘系統(tǒng)——設計與驗證
- 改進的多尺度深度網絡手勢識別模型 8次下載
- 基于深度級聯孿生網絡的通信信號調制識別算法 33次下載
- 深度:嵌入式系統(tǒng)的軟件架構設計!資料下載
- 基于預訓練模型和長短期記憶網絡的深度學習模型 19次下載
- 3小時學習神經網絡與深度學習課件下載 0次下載
- 結合注意力機制的改進深度學習光流網絡 4次下載
- 基于編碼-解碼卷積架構的聯合策略網絡 13次下載
- 基于深度神經網絡的圖像語義分割方法 11次下載
- 基于深度信念網絡的實體識別算法 16次下載
- 綜述深度神經網絡的解釋方法及發(fā)展趨勢 19次下載
- 一種基于多視圖架構的深度卷積神經網絡模型 5次下載
- 一種多層級特征融合就的深度卷積網絡 7次下載
- 基于深度神經網絡的文本分類分析 37次下載
- deepid3:非常深的神經網絡的人臉識別深度算法的網絡架構 25次下載
- GPU架構深度解析 1.7k次閱讀
- 殘差網絡是深度神經網絡嗎 2.1k次閱讀
- 深度神經網絡(DNN)架構解析與優(yōu)化策略 5.1k次閱讀
- 神經網絡架構有哪些 2.3k次閱讀
- 詳解深度學習、神經網絡與卷積神經網絡的應用 3.5k次閱讀
- 開源網絡引導固件iPXE正式支持龍架構 1.3k次閱讀
- 深度ReLU網絡的對應淺層網絡 1k次閱讀
- 神經網絡的DBN與GAN及RNN等形象的詳細資料講解 6.1k次閱讀
- 深度神經網絡的實現機理與決策邏輯難以理解 3.6k次閱讀
- 數據集,網絡架構和剪枝方法 6.3k次閱讀
- 如何理解深度學習?深度學習的理論探索分析 4.2k次閱讀
- 基于Unrolling的深度方法及應用 5.6k次閱讀
- 百度發(fā)布Visual DL 使得深度學習任務變得生動形象,實現可視分析 5.4k次閱讀
- 斯坦福探索深度神經網絡可解釋性 決策樹是關鍵 6.4k次閱讀
- 詳細剖析神經網絡和深度神經網絡的區(qū)別 3.3w次閱讀
下載排行
本周
- 1MDD品牌三極管BC807數據手冊
- 3.00 MB | 次下載 | 免費
- 2MDD品牌三極管BC817數據手冊
- 2.51 MB | 次下載 | 免費
- 3MDD品牌三極管D882數據手冊
- 3.49 MB | 次下載 | 免費
- 4MDD品牌三極管MMBT2222A數據手冊
- 3.26 MB | 次下載 | 免費
- 5MDD品牌三極管MMBTA56數據手冊
- 3.09 MB | 次下載 | 免費
- 6MDD品牌三極管MMBTA92數據手冊
- 2.32 MB | 次下載 | 免費
- 7STM32G474 HRTIME PWM 丟波問題分析與解決
- 1.00 MB | 次下載 | 3 積分
- 8新能源電動汽車高壓線束的銅鋁連接解決方案
- 2.71 MB | 次下載 | 2 積分
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費
- 2PC5502負載均流控制電路數據手冊
- 1.63 MB | 23次下載 | 免費
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
- 0.08 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191439次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論