赤裸裸少妇A级毛片,Japanese爆乳巨大,超碰97人人潮

今天為大家推薦一篇 CVPR2019 關(guān)于語(yǔ)義分割的文章 Decoders Matter for Semantic Segmentation: Data-Dependent Decoding Enables Flexible Feature Aggregation，該文章提出了一種不同于雙線性插值的上采樣方法，能夠更好的建立每個(gè)像素之間預(yù)測(cè)的相關(guān)性。得益于這個(gè)強(qiáng)大的上采樣方法，模型能夠減少對(duì)特征圖分辨率的依賴，能極大的減少運(yùn)算量。該工作在 PASCAL VOC 數(shù)據(jù)集上達(dá)到了 88.1% 的 mIOU，超過(guò)了 DeeplabV3 + 的同時(shí)只有其 30% 的計(jì)算量。

論文傳送門：https://arxiv.org/abs/1903.02120

1. Introduction

在之前的語(yǔ)義分割方法中，雙線性插值通常作為其最后一步來(lái)還原特征圖的分辨率，由于非線性差值不能建立起每個(gè)像素的預(yù)測(cè)之間的關(guān)系，因此為了得到精細(xì)的結(jié)果，對(duì)特征圖的分辨率要求較高，同時(shí)帶來(lái)了巨額的計(jì)算量。

為了解決這個(gè)問(wèn)題，本工作提出了Data-dependent Up-sampling (DUpsample)，能夠減少上采樣操作對(duì)特征圖分辨率的依賴，大量的減少計(jì)算量。同時(shí)得益于 DUpsample， Encoder 中的 low-level feature 能夠以更小的運(yùn)算量與 Decoder 中的 high-level feature 進(jìn)行融合，模型結(jié)構(gòu)如下所示：

我們可以看到，該網(wǎng)絡(luò)將傳統(tǒng)的非線性插值替換成 DUpsample，同時(shí)在 feature fuse 方面，不同于之前方法將 Decoder 中的特征上采樣與 Encoder 特征融合，本工作將 Encoder 中的特征下采樣與 Decoder 融合，大大減少了計(jì)算量，這都得益于 DUpsample。

2. Our Approach

之前的語(yǔ)義分割方法使用下列公式來(lái)得到最終的損失：

其中 Loss 通常為交叉熵?fù)p失，F(xiàn) 為特征圖，Y 為 ground truth，由于雙線性插值過(guò)于簡(jiǎn)單，對(duì)特征圖 F 的分辨率較高，因此引入了大量的計(jì)算。一個(gè)重要的發(fā)現(xiàn)是語(yǔ)義分割輸入圖像的 label Y 并不是 i.i.d 的，所以 Y 可以被壓縮成 Y′，我們令, 并將 Y 劃分成的子窗口，每個(gè)子窗口的大小為 r×r，接著我們將每個(gè)子窗口拉伸成向量，其中，隨即我們將向量 v 壓縮成低維向量 x，我們使用線性投影來(lái)完成，最后，我們有：其中，用來(lái)將 v 壓縮成 x，為 reconstruction matrix, v′為重建后的 v，我們可以用壓縮后的向量 x 組合成 Y′.

矩陣 P 和矩陣 W 可以通過(guò)最小化下列式子得到：

我們可以使用梯度下降，或者在正交約束的條件下使用 PCA 求解。

使用壓縮后的 Y′為目標(biāo)，我們可以使用下列損失函數(shù)來(lái)預(yù)訓(xùn)練網(wǎng)絡(luò)：

另一種直接的方法是在 Y 空間計(jì)算 loss，也就是并非將 Y 壓縮到 Y′, 我們可以將 F 使用 W（上面預(yù)訓(xùn)練得到的）上采樣然后計(jì)算損失，公式如下：

其中以兩倍為例，DUpsample 的操作如下圖所示：

我們可以用 1X1 卷積來(lái)完成上述的權(quán)重與特征相乘的過(guò)程。但是當(dāng)我們將這個(gè)模塊嵌入到網(wǎng)絡(luò)時(shí)會(huì)遇到優(yōu)化問(wèn)題。因此我們使用 softmax with temperature 函數(shù)來(lái)解決這個(gè)問(wèn)題：

。

我們發(fā)現(xiàn) T 可以使用梯度下降學(xué)習(xí)得到，這樣減少了調(diào)試的麻煩。

有大量的工作說(shuō)明，與 low-level features 結(jié)合可以顯著的提升分割的精度，其做法如下：

f 是在上采樣之后的卷積操作，其計(jì)算量依賴于特征圖的空間大小，這樣做會(huì)顯著增加計(jì)算量。得益于 DUpsample，我們可以使用下列操作來(lái)減少計(jì)算量：

這樣做不僅保證了在低分辨率下的有效性，而且減少了計(jì)算量，同時(shí)允許任意 level feature 的融合。

只有使用了 DUpsample，上述操作才變得可行，否則語(yǔ)義分割的精度會(huì)被雙線性插值限制。

3. Experiments

本次實(shí)驗(yàn)使用以下兩種數(shù)據(jù)集：PASCAL VOC 2012 和 PASCAL Context benchmark。我們使用 ResNet-50 或 Xception-50 作為我們的 backbone，具體訓(xùn)練細(xì)節(jié)詳見(jiàn)論文。

首先我們?cè)O(shè)計(jì)實(shí)驗(yàn)說(shuō)明雙線性插值的上限遠(yuǎn)遠(yuǎn)低于 DUpsample。首先我們搭建一個(gè)簡(jiǎn)易網(wǎng)絡(luò)實(shí)現(xiàn) auto-encoder，其中上采樣方式分別使用雙線性插值與 DUpsample, 輸入分別為 ground_truth，得到下表中的 mIOU*，這個(gè)指標(biāo)代表上采樣方法的上限。同時(shí)我們使用 ResNet50 作為主干網(wǎng)絡(luò)，輸入為 raw image 去實(shí)現(xiàn)語(yǔ)義分割，得到下表中的 mIOU：

通過(guò)上表我們可以發(fā)現(xiàn):

1) 在相同條件下，DUpsampling 效果優(yōu)于 bilinear。

2）DUpsampling 在 output_stride=32 的情況下效果與 bilinear 在 output_stride=16 的情況下結(jié)果相當(dāng)。

接下來(lái)我們?cè)O(shè)計(jì)實(shí)驗(yàn)說(shuō)明融合不同的 low-level 特征對(duì)結(jié)果的影響，如下表所示：

值得說(shuō)明的是，并不是所有與 low-level feature 的融合都會(huì)提升結(jié)果，例如 conv1_3，因?yàn)槠浣Y(jié)果不夠魯棒。因此和什么 low-level feature 相結(jié)合對(duì)語(yǔ)義分割的結(jié)果有很大的影響。

接下來(lái)我們?cè)O(shè)計(jì)實(shí)驗(yàn)與雙線性插值進(jìn)行比較：

可以看到我們的方法優(yōu)于傳統(tǒng)的雙線性插值上采樣方法。同時(shí)我們驗(yàn)證了不同的 softmax 對(duì)結(jié)果的影響，在沒(méi)有使用 softmax with tenperature 的情況下只有 69.81 的 mIOU（這里沒(méi)設(shè)置消融實(shí)驗(yàn)有些疑惑，感覺(jué)不同的 softmax 對(duì)實(shí)驗(yàn)結(jié)果影響挺大的）。

最后將我們的方法與最新的模型進(jìn)行比較，結(jié)果如下（分別為 PASCAL VOC 與 PASCAL context）：

我們的方法在只用 deeplabv3+ 30% 的計(jì)算量的情況下，超越了當(dāng)前所有的方法。

總的來(lái)說(shuō)，我覺(jué)得這個(gè)論文提出的想法很有趣，是一篇很有 insight 的論文。

由于論文現(xiàn)在還沒(méi)有開(kāi)源，筆者嘗試實(shí)現(xiàn)了一下 DUpsample 的操作和網(wǎng)絡(luò)：

https://github.com/LinZhuoChen/DUpsampling。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4416

瀏覽量
67421
梯度

梯度

+關(guān)注

關(guān)注
0

文章
30

瀏覽量
10561
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1236

瀏覽量
26166

原文標(biāo)題：Decoders對(duì)于語(yǔ)義分割的重要性 | CVPR 2019

文章出處：【微信號(hào)：rgznai100，微信公眾號(hào)：rgznai100】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

一種不同于雙線性插值的上采樣方法

評(píng)論