chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于超大感受野注意力的超分辨率模型

CVer ? 來源:AIWalker ? 作者:AIWalker ? 2022-10-27 13:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

注意力機制是深度學習領(lǐng)域非常重要的一個研究方向,在圖像超分領(lǐng)域也有不少典型的應(yīng)用案例,比如基于通道注意力構(gòu)建的RCAN,基于二階注意力機制構(gòu)建的SAN,基于像素注意力機制構(gòu)建的PAN,基于Transformer自注意力機制構(gòu)建的SwinIR,基于多尺度大核注意力的MAN等。

本文則以PAN為藍本,對其進行逐步改進以期達到更少的參數(shù)量、更高的超分性能。該方案具體包含以下幾個關(guān)鍵點:

  • 提升注意力分割的感受野,類似大核卷積注意力VAN;
  • 將稠密卷積核替換為深度分離卷積,進一步降低參數(shù)量;
  • 引入像素規(guī)范化(Pixel Normalization)技術(shù),其實就是Layer Normalization,但出發(fā)點不同。

上述關(guān)鍵技術(shù)點為注意力機制的設(shè)計提供了一個清晰的演變路線,最終得到了本文的VapSR,即大感受像素注意力網(wǎng)絡(luò)(VAst-receptive-field Pixel attention Network)。

實驗結(jié)果表明:相比其他輕量超分網(wǎng)絡(luò),VapSR具有更少的參數(shù)量。比如,項目IMDB與RFDN,VapSR僅需21.68%、28.18%的參數(shù)即可取得與之相當?shù)男阅堋?/p>

本文動機

通過引入像素注意力,PAN在大幅降低參數(shù)量的同時取得了非常優(yōu)秀的性能。相比通道注意力與空域注意力,像素注意力是一種更廣義的注意力形式,為進一步的探索提供了一個非常好的基線。

受啟發(fā)于自注意力的發(fā)展,我們認為:基于卷積操作的注意力仍有進一步改進的空間。因此,作者通過以下三個像素注意力中的設(shè)計原則展示了改善超分注意力的過程:

  • 首先,在注意力分支引入大核卷積具有明顯的優(yōu)勢;
  • 其次,深度分離卷積可以降低大核卷積導致的巨大計算復(fù)雜度問題;
  • 最后,引入像素規(guī)范化操作讓訓練更高效、更穩(wěn)定。
367cec1e-55b7-11ed-a3b6-dac502259ad0.jpg

**Large Kernel **以上圖i中的baseline為基礎(chǔ),作者首先對注意力分支進行感受野擴增:將提升到(將圖示ii),性能提升0.15dB,但參數(shù)量從846K提升到了4123K。

Parameter Reduction 為降低參數(shù)量,我們嘗試盡可能移除相對不重要的部分。作者提出了三個方案:(1) 將非注意力分支的卷積尺寸從下調(diào)到;(2) 將大核卷積注意力分支替換為深度深度分離卷積;(3) 將深度分離卷積中的深度卷積進行分解為深度卷積+帶擴張因子的深度卷積(該機制可參考下圖,將卷積拆分為+,其中后者的擴張因子為3)。此時,模型性能變?yōu)?8.48dB,但參數(shù)量降到了240K,參數(shù)量基本被壓縮到了極限。

368720e4-55b7-11ed-a3b6-dac502259ad0.jpg

Pixel Normalization(PN) 注意力機制的元素乘操作會導致訓練不穩(wěn)定問題:小學習率收斂不夠好,大學習率又會出現(xiàn)梯度異常。前面的注意力改進導致所得方案存在性能下降問題。為解決該問題,作者經(jīng)深入分析后提出了像素規(guī)范化技術(shù)(可參考下圖不同規(guī)范化技術(shù)的可視化對比)。

36997258-55b7-11ed-a3b6-dac502259ad0.jpg

假設(shè)輸入特征為,第i個像素的特征均值與方差可以描述如下:

那么,像素規(guī)范化可以表示為:

當引入PN后,模型的性能取得了顯著的提升,達到了28.92dB,參數(shù)量僅為241K。

Switch Attention to Middle 在上述基礎(chǔ)上,作者進一步將注意力的位置進行了調(diào)整,放到了兩個卷積中間。此時,模型性能得到了0.03dB提升,達到了28.95dB,參數(shù)量仍為241K。

本文方案

前面的探索主要聚焦在微觀層面,基于此,作者進一步在宏觀層面進行了更多設(shè)計與提煉,進而構(gòu)建了VapSR,取得了更佳的性能,同時具有更少的參數(shù)量。

36c0b368-55b7-11ed-a3b6-dac502259ad0.jpg

上圖給出了所提VapSR架構(gòu)示意圖,延續(xù)了常規(guī)輕量方案的設(shè)計思路:

  • 淺層特征:;
  • 非線性映射: ;
  • 圖像重建:

VAB模塊在前面探索得到的模塊上進行了微調(diào):(1) 主要是將模塊輸入與輸出通道數(shù)從64減少到了48,保持中間注意力部分的通道數(shù)仍為64;(2) 將注意力分支深度擴張卷積(有時也稱之為空洞卷積)調(diào)整為深度擴張卷積,此時感受野為;(3) 調(diào)整了注意力分支三個卷積的順序,將卷積移到最前面。對于VapSR-S,作者進一步將部分從卷積調(diào)整為組卷積(group=2),該操作可以進一步降低參數(shù)量。

classAttention(nn.Module):
def__init__(self,dim):
super().__init__()
self.pointwise=nn.Conv2d(dim,dim,1)
self.depthwise=nn.Conv2d(dim,dim,5,padding=2,groups=dim)
self.depthwise_dilated=nn.Conv2d(dim,dim,5,1,padding=6,groups=dim,dilation=3)

defforward(self,x):
u=x.clone()
attn=self.pointwise(x)
attn=self.depthwise(attn)
attn=self.depthwise_dilated(attn)
returnu*attn

classVAB(nn.Module):
def__init__(self,d_model,d_atten):
super().__init__()
self.proj_1=nn.Conv2d(d_model,d_atten,1)
self.activation=nn.GELU()
self.atten_branch=Attention(d_atten)
self.proj_2=nn.Conv2d(d_atten,d_model,1)
self.pixel_norm=nn.LayerNorm(d_model)
default_init_weights([self.pixel_norm],0.1)

defforward(self,x):
shorcut=x.clone()
x=self.proj_1(x)
x=self.activation(x)
x=self.atten_branch(x)
x=self.proj_2(x)
x=x+shorcut

x=x.permute(0,2,3,1)#(B,H,W,C)
x=self.pixel_norm(x)
x=x.permute(0,3,1,2).contiguous()#(B,C,H,W)

returnx

本文實驗

在實驗部分,作者構(gòu)建了VapSR與VapSR-S兩個版本的輕量型超分方案:

  • VapSR:包含21個VAB模塊,主干通道數(shù)為48;
  • VapSR-S:包含11個VAB模塊,主干通道數(shù)為32。

此外,需要注意的是:對于X4模型,重建模塊并未采用常規(guī)的輕量方案(Conv+PS),而是采用了類EDSR的重方案(Conv+PS+Conv+PS)。

36e349a0-55b7-11ed-a3b6-dac502259ad0.jpg37744252-55b7-11ed-a3b6-dac502259ad0.jpg378c5568-55b7-11ed-a3b6-dac502259ad0.jpg

上表&圖給出了不同方案的性能與可視化效果對比,從中可以看到:

  • 所提VapSR取得了SOTA性能,同時具有非常少的參數(shù)量。
  • 在X4任務(wù)上,相比RFDN與IMDN,VapSR僅需21.68%/28.18%的參數(shù)量,即可取得平均0.187dB指標提升;
  • VapSR-S取得了與BSRN-S相當?shù)男阅埽笳呤荖TIRE2022-ESR模型復(fù)雜度賽道冠軍。
  • 在線條重建方面,VapSR具有比其他方案更精確的重建效果。

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 分辨率
    +關(guān)注

    關(guān)注

    2

    文章

    1127

    瀏覽量

    43332
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3735

    瀏覽量

    52066
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5597

    瀏覽量

    124342

原文標題:董超團隊提出VapSR:基于超大感受野注意力的超分辨率模型

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    分辨率圖像采集卡:清畫質(zhì)采集,滿足高精度視覺需求

    在機器視覺、工業(yè)檢測、醫(yī)療影像等對圖像精度要求嚴苛的領(lǐng)域,每一個像素細節(jié)都可能決定檢測結(jié)果的準確性、診斷結(jié)論的可靠性,而高分辨率圖像采集卡作為連接前端圖像設(shè)備與后端計算系統(tǒng)的核心樞紐,正是實現(xiàn)
    的頭像 發(fā)表于 02-04 15:54 ?335次閱讀
    高<b class='flag-5'>分辨率</b>圖像采集卡:<b class='flag-5'>超</b>清畫質(zhì)采集,滿足高精度視覺需求

    淺談掃描電鏡的分辨率概念

    掃描電鏡(SEM)的分辨率是指其能夠分辨樣品表面兩點之間的最小距離,是衡量其成像能力的關(guān)鍵指標。
    的頭像 發(fā)表于 01-14 16:55 ?1220次閱讀
    淺談掃描電鏡的<b class='flag-5'>分辨率</b>概念

    紅外焦平面探測器的分辨率有哪些?高分辨率有哪些優(yōu)勢?

    分辨率是我們選購紅外探測器時的一個關(guān)鍵參數(shù),它代表了熱成像像素點的數(shù)量。分辨率越高,像素點就越多,圖像就越清晰,觀測的距離也越遠。紅外熱成像常見的分辨率有120x90、256x192、384x288
    的頭像 發(fā)表于 12-10 16:12 ?1126次閱讀
    紅外焦平面探測器的<b class='flag-5'>分辨率</b>有哪些?高<b class='flag-5'>分辨率</b>有哪些優(yōu)勢?

    自然場景下注意力如何耳周腦電可靠監(jiān)測

    HUIYING自然聽覺注意力概述聽覺注意力是大腦在復(fù)雜聽覺場景中選擇相關(guān)信息、抑制無關(guān)信息的重要認知功能。傳統(tǒng)研究多在實驗室內(nèi)使用笨重設(shè)備與人工刺激進行,限制了其生態(tài)效度。本研究采用語音包絡(luò)跟蹤、被
    的頭像 發(fā)表于 12-05 18:03 ?3808次閱讀
    自然場景下<b class='flag-5'>注意力</b>如何耳周腦電可靠監(jiān)測

    ADC分辨率與精度的區(qū)別是什么

    簡單點說,“精度”是用來描述物理量的準確程度的,而“分辨率”是 用來描述刻度劃分的。從定義上看,這兩個量應(yīng)該是風馬牛不相及的。(是不是有朋友感到愕然^_^)。 很多賣傳感器的JS就是利用這一點
    發(fā)表于 12-05 06:24

    鏡頭分辨率如何匹配工業(yè)相機的分辨率

    能被分辨開來的兩個物點之間的最小距離,就是鏡頭的物方分辨率。單位為μm。這只是單純鏡頭本身的參數(shù),只反映鏡頭的解析能力,而和工業(yè)相機多少像素無關(guān)!它直接反映了,一個理想物點經(jīng)過鏡頭成像后,會模糊
    的頭像 發(fā)表于 11-21 15:43 ?358次閱讀
    鏡頭<b class='flag-5'>分辨率</b>如何匹配工業(yè)相機的<b class='flag-5'>分辨率</b>

    電能質(zhì)量在線監(jiān)測裝置的暫態(tài)記錄分辨率如何影響故障類型識別?

    暫態(tài)記錄分辨率是故障類型識別的 “細節(jié)放大鏡”—— 核心通過 采樣、幅值分辨率、時間分辨率 決定故障波形 “特征細節(jié)的完整性”,高分辨率
    的頭像 發(fā)表于 11-14 16:10 ?1873次閱讀
    電能質(zhì)量在線監(jiān)測裝置的暫態(tài)記錄<b class='flag-5'>分辨率</b>如何影響故障類型識別?

    電致發(fā)光(EL)成像中日光與分辨率的變量,對光伏電池裂紋功率損失仿真模型基準測試

    電致發(fā)光(EL)成像技術(shù)作為光伏電池缺陷檢測與性能評估的重要手段,目前主要基于實驗室暗室環(huán)境下獲取的高分辨率CMOS圖像進行模型開發(fā)與驗證。然而,隨著該技術(shù)在現(xiàn)場檢測中的推廣應(yīng)用,實際應(yīng)用中面臨著
    的頭像 發(fā)表于 11-05 09:03 ?1184次閱讀
    電致發(fā)光(EL)成像中日光與<b class='flag-5'>分辨率</b>的變量,對光伏電池裂紋功率損失仿真<b class='flag-5'>模型</b>基準測試

    索尼FCB-CR8530分辨率變焦:無人機光電吊艙的“視覺增強引擎”

    在無人機技術(shù)快速發(fā)展的當下,光電吊艙作為無人機的核心觀測設(shè)備,其性能直接決定了任務(wù)執(zhí)行的效率與精度。SONY FCB-CR8530模組憑借分辨率變焦技術(shù)與緊湊型設(shè)計,成為無人機光電吊艙領(lǐng)域的關(guān)鍵
    的頭像 發(fā)表于 10-21 14:05 ?388次閱讀

    精度,重復(fù)精度和分辨率有什么關(guān)聯(lián)

    精度,重復(fù)精度和分辨率,這三個令人疑惑的術(shù)語有很多種定義方法。
    的頭像 發(fā)表于 07-26 17:13 ?887次閱讀
    精度,重復(fù)精度和<b class='flag-5'>分辨率</b>有什么關(guān)聯(lián)

    分辨率 vs 噪聲 —— ADC的挑戰(zhàn)

    設(shè)計者常用高分辨率 ADC 以降低最低可量測單位(LSB),提高檢測精度。 比如一個 16 位 ADC 在 5V 范圍內(nèi), LSB ≈ 76 μV ;理想情況下可以檢測到微弱電信號。 問題是: 若
    的頭像 發(fā)表于 06-23 07:38 ?1833次閱讀
    <b class='flag-5'>分辨率</b> vs 噪聲 —— ADC的挑戰(zhàn)

    如何計算存儲示波器的垂直分辨率

    的示波器,其垂直分辨率有了顯著提高。影響因素及注意事項 噪聲干擾:在實際測量中,示波器內(nèi)部的噪聲和外部干擾會影響垂直分辨率的實際效果。即使示波器的理論垂直分辨率很高,但如果噪聲水平也
    發(fā)表于 05-30 14:03

    高光譜相機的空間分辨率,光譜范圍等參數(shù)我們要如何理解

    高光譜相機作為一種強大的成像工具,其性能由多個關(guān)鍵參數(shù)決定,其中 空間分辨率 和 光譜范圍 尤為重要。理解這些參數(shù)的含義及其影響,對于選擇合適的高光譜相機至關(guān)重要。我們可以綜合下圖的參數(shù)來做對
    的頭像 發(fā)表于 03-14 10:35 ?1340次閱讀

    NVIDIA Earth-2平臺實現(xiàn)分辨率天氣預(yù)測

    相比傳統(tǒng)的高分辨率天氣預(yù)測,Earth-2 的 CorrDiff 模型在能效上提升了 10000 倍,實現(xiàn)了 AI 驅(qū)動的公里尺度精準天氣預(yù)報,從而有助于提升災(zāi)害應(yīng)對能力和拯救生命。
    的頭像 發(fā)表于 03-06 10:06 ?883次閱讀

    是否可以在16位或32位圖像上推斷單映像-超級分辨率1032的模型?

    無法確定是 單圖像超級分辨率 - 1032 模型可以推斷為 16 位還是 32 位圖像
    發(fā)表于 03-06 07:16