計算機視覺：DIoU 和 IoU/GIoU 損失比較

代碼倉庫地址：https://github.com/Oneflow-Inc/one-yolov5歡迎star one-yolov5項目獲取最新的動態(tài)。?

摘要

邊界框回歸是目標檢測的關(guān)鍵步驟，在現(xiàn)有方法中，雖然-norm loss 被廣泛用于邊界框回歸，但它不是針對評估指標量身定制的，即 Intersection over Union (IoU)。最近，已經(jīng)提出了 IoU 損失和generalized IoU (GIoU) Loss作為評估IoU的指標，但仍然存在收斂速度慢和回歸不準確的問題。在本文中，我們通過結(jié)合預(yù)測框和目標框之間的歸一化距離來提出距離-IoU (DIoU) Loss，它在訓練中的收斂速度比 IoU 和 GIoU Loss快得多。

此外，本文總結(jié)了邊界框回歸中的三個幾何因素，即

重疊面積（overlap area）、中心點距離（central pointdistance）和高寬比（aspect ratio），在此基礎(chǔ)上提出了完全損失，從而促進了更快的收斂和更優(yōu)的性能。通過將結(jié)合到最先進的目標檢測算法中，例如 YOLO v3、SSD 和 Faster RCNN，我們不僅在 IoU 指標方面而且在 GIoU 指標方面都獲得了顯著的性能提升。此外，DIoU 可以很容易地用于非最大抑制（NMS）作為標準，進一步促進性能提升。注釋:這里IoU指標方面和GIoU指標方面指的是在：目標檢測精度測量(mAP值),IoU損失計算穩(wěn)定性等一些方面。

目標檢測是計算機視覺任務(wù)中的關(guān)鍵問題之一，幾十年來一直受到了廣泛的研究關(guān)注 (Redmon et al. 2016;Redmon and Farhadi 2018; Ren et al. 2015; He et al. 2017;Yang et al. 2018; Wang et al. 2019; 2018).通常，現(xiàn)有的目標檢測方法可以分為：

單階段-檢測，如YOLO系列(Redmon et al. 2016; Red- mon and Farhadi 2017; 2018)和SSD (Liu et al. 2016; Fu et al. 2017),

兩階段檢測，如R-CNN系列檢測 (Girshick et al. 2014; Girshick 2015; Renet al. 2015; He et al. 2017),

甚至是多階段的檢測, 像CascadeR-CNN (Cai and Vasconcelos 2018). 盡管存在這些不同的檢測框架，但邊界框回歸預(yù)測一個矩形框來定位目標對象仍然是其中關(guān)鍵步驟。

前言

本文主要是結(jié)合論文Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression(https://arxiv.org/pdf/1911.08287.pdf) 對 IoU 的解析學習。

IoU

IoU介紹

Intersection over Union (IoU)

在指標評估概述的小節(jié)有介紹過IoU,已經(jīng)對IoU有了初步的認識(其實在yolov5項目中并不是簡單的使用，而是用的后面介紹的CIoU )
計算公式：

(1)

是真實回歸框(gt:ground-truth),

是預(yù)測回歸框。

IoU loss

計算公式:

(2)

IoU Loss 優(yōu)缺點分析

有明顯的缺陷 IoU loss只在邊界框有重疊時才能工作, 對于不重疊的情況不會提供任何移動梯度 (移動代表預(yù)測框朝著目標框重疊的方向移動) 。移動梯度表示無法衡量完全不相交的兩個框所產(chǎn)生的的損失（iou固定為0），和兩個不同形狀的預(yù)測框可能產(chǎn)生相同的loss（相同的iou）分別如下圖的左邊和右邊所示。

GIoU

GIoU介紹

GIoU的設(shè)計初衷就是想解決IoU Loss存在的問題（預(yù)測框與真實框不相交時iou恒定為0），設(shè)計了一套Generalized Intersection over Union Loss。在IoU的基礎(chǔ)上，GIoU還需要找到預(yù)測框和真實框的最小外接矩形，然后求出最小外接矩形減去兩個預(yù)測框union的面積，具體算法流程如下：

GIoU loss

計算公式 :

(3)

其中 ?是覆蓋 ?和的最小方框,由于引入了，在不重疊的情況下，預(yù)測框也會向目標框移動。

GIoU 優(yōu)缺點分析

GIoU Loss解決了IoU Loss在不相交情況的問題，在所有性能指標中都可以作為IoU的適當替代品，在目標檢測任務(wù)中能夠得到更高的準確率。

缺點：雖然GIoU可以緩解重疊情況下的梯度消失問題,但它仍有一些局限性。即無法衡量有包含關(guān)系時的框回歸損失，如下圖，三個回歸框具有相同的GIoU Loss，但是顯然第三個框的回歸效果更好。

IoU & GIoU 分析

首先，在本文上部分我們分析了關(guān)于原始的IoU損失和GIoU 損失的局限性。下面將通過模擬實驗結(jié)果對邊界框回歸的過程進行進一步的解析。(補充說明: 為什么要進行模型實驗? ?因為僅僅從檢測結(jié)果來分析邊界框回歸的過程很難，因為在不受控制的基準中的回歸情況往往不全面比如：不同的距離(distances),不同的尺度(scales)和不同的長寬比(aspect ratios)。相反，進行模擬實驗，在實驗中綜合考慮回歸情況，然后就可以很容易地分析給定損失函數(shù)的問題。)

模擬實驗

在模擬實驗中, 我們試圖通過距離(distances), 尺度 (scales)和長寬比(aspect ratios)來覆蓋邊界框之間的大部分關(guān)系，如圖3(a).所示。特別是, 我們選擇7個單位框 (即每個框的面積為 1) ，具有不同的長寬比 (即 ) ?作為目標框。在不失一般性的情況下，7個目標框的中心點被固定在。錨框均勻地分散在5000個點上。

距離: 在以半徑為 3 的為中心的圓形區(qū)域內(nèi), 均勻選擇5000個點, 放置7個尺度、7個長寬比的錨框。在這些情況下，重疊和不重疊的方框都被包括。

尺度:對于每個點, 錨框的面積分別設(shè)置為。

長寬比: 對于給定的點和尺度, 采用 7 個長寬比, 即與目標框遵循相同的設(shè)置 (即 ) 。所有 ?錨箱都對應(yīng)在每個目標框。綜上所述，總共有 ? ?個回歸案例。

圖3: 仿真實驗: (a) 通過考慮不同的距離、尺度和長寬比, 采用了171.5萬個回歸案例。(b)回歸誤差和（即: ? ?) 迭代次數(shù)為 ? ?時不同損失函數(shù)的曲線。

然后通過給定損失函數(shù) , 我們可以用梯度下降算法來模擬每種情況下的邊界框回歸過程。對于預(yù)測框 ? , 當前的預(yù)測可以通過:

(4)

其中 ? ?是迭代 ? ?時的預(yù)測框, ?表示損失的梯度。感覺可以理解為學習率。值得注意的是，在我們的實現(xiàn)中，梯度乘以 ?去加速收斂。邊界框回歸的性能評估通過使用 ? 對于每個損失函數(shù), 仿真模擬實驗當達到迭代 ? ?時, 誤差曲線如所示。

IoU 和 GIoU 損失的限制

在圖4中，我們可視化迭代T時對5000個分散點的最終回歸誤差。

從圖4(a)中很容易看出，IoU損失只適用于與目標框重疊的情況。由于?B總是0，沒有重疊的錨框?qū)⒉粫苿?。通過添加一個懲罰項見公式(3),

GIoU 損失能夠更好的緩解非重疊案例的問題，如圖所示4(b), 但GIoU的損失顯著擴大了盆地，即GIoU的工作面積。但是，在水平方向和垂直方向的情況下，仍然很可能有很大的誤差。這是因為GIoU損失中的懲罰項是用來最小化|C?A∪B|，但是C?A∪B的面積通常很小或為0（當兩個盒子有包含關(guān)系時），然后GIoU幾乎退化為IoU損失。只要以適當?shù)膶W習速率運行足夠的迭代GIoU 損失能收斂到很好的解決方案，但收斂速度卻是非常慢。從幾何上來說，從如圖1所示的回歸步驟來看，GIoU實際上增大了預(yù)測的框大小，用來和目標框重疊，然后IoU項用于預(yù)測框與目標框匹配，產(chǎn)生非常緩慢的收斂。

綜上所述，在非重疊情況下，IoU損失收斂是糟糕的解決方式，而GIoU損失收斂速度較慢，特別是對于水平和垂直方向的框。在目標檢測流程中，IoU和GIoU的損失都不能保證回歸的準確性。

DIoU & CIoU

通過前面的IoU和GIoU的分析我們很自然會問以下問題：

第一，是否可以直接最小化預(yù)測框和目標框之間的歸一化距離，以實現(xiàn)更快的收斂？

第二，當與目標框有重疊甚至包含時，如何使回歸更準確、更快？

DIoU loss

Distance-IoU 損失：更快更好的邊界框回歸損失,一般來說, 損失可以定義為

(5)

其中 ? ?是預(yù)測框 ?B ?和目標框 ? ?的懲罰項。通過設(shè)計適當?shù)膽土P項, 在本節(jié)中, 我們提出了 DIoU 損失和CIoU損失來解答上述兩個問題。

為了回答第一個問題, 我們提出將兩個邊界框的中心點之間的標準化距離最小化，懲罰項可以定義為

(6)

其中 ? ?和 ? ?分別代表 ?B ?和 ? ?的中心點。 ?為歐氏距離, ? ?是覆蓋兩個盒框的最小封閉框的對角線長度。損失函數(shù)可以定義為:

(7)

如圖5所示, 損失的懲罰項直接使兩個中心點之間的距離最小化, 而 ? ?損失的目的是減少 ? 的面積。

imgs

DIoU 和 IoU/GIoU 損失比較

新提出的DIoU損失繼承IoU和GIoU損失的一些屬性

DIoU損失對回歸問題的尺度仍然是不變的

與GIoU損失類似, DIoU損失可以在與目標框不重疊時為邊界框提供移動方向。

當兩個邊界框完美匹配時, 當兩個框都很遠時, ?

DIoU損失比IoU損失和GIoU損失有幾個優(yōu)點, 可以通過仿真實驗進行評估。

如圖1和圖3所示, 可以直接最小化兩個框的距離, 因此收斂速度比要快得多。

對于兩個框是包含關(guān)系的情況(圖2), 或在水平和垂直方向的情況(圖6)下, 可以回歸非常快, 而 ?損失幾乎退化為 ?, 即

Complete IoU Loss

接著我們回答了第二個問題，提出了邊界框回歸的良好損失應(yīng)該要考慮三個重要的幾何因素, 即重疊面積、中心點距離和長寬比。通過統(tǒng)一坐標, 考慮了重疊區(qū)域, 而嚴重依賴于。我們提出的旨在同時考慮邊界框的重疊面積和中心點距離。然而, 邊界框的長寬比的一致性也是一個重要的幾何因素。因此，基于，通過添加長寬比的一致性來提出:

(8)

其中 ? ?是一個正的權(quán)衡參數(shù), 衡量長寬比的一致性。

(9)

則損失函數(shù)可以定義為:

(10)

(11)

通過重疊面積因子給予更高的優(yōu)先回歸, 特別是對于非重疊情況。最終, 的優(yōu)化與的優(yōu)化相同, 除了 ? ?的梯度應(yīng)該指定 ? ?和。

(12)

主導器通常是一個很小的值對于 ? ?和 ? ?的范圍在 ?[0,1] , 這很可能會產(chǎn)生梯度爆炸。因此在我們的實現(xiàn), 主導器被移除, 將步長 ?替換為 , 梯度方向仍然與公式(12)一致。

NMS(Non-Maximum Suppression)

介紹

NMS是大多數(shù)目標檢測算法的最后一步，其中刪除了冗余的檢測框當它與最高分框的重疊超過一個閾值。Soft-NMS (Bodla et al. 2017) 用連續(xù)函數(shù)w.r.t.懲罰相鄰框的檢測分數(shù)IoU，產(chǎn)生比原始NMS產(chǎn)生更柔和大和更強大的抑制。IoU-Net (Jiang et al. 2018) 提出了一個新的網(wǎng)絡(luò)分支來預(yù)測定位置信度來指導NMS。最近，自適應(yīng)NMS（Liu，Huang，和Wang 2019）和Softer-NMS（He et al. 2019）被提出分別研究適當?shù)拈撝挡呗院图訖?quán)平均策略。在本工作中，簡單將DIoU作為原始NMS的標準, 在抑制冗余框時，同時考慮邊界框的重疊面積和兩個中心點之間的距離。

DioU-NMS

Non-Maximum Suppression using DIoU

在原始的NMS中, IoU指標用于抑制呂余的檢測框, 其中重疊區(qū)域是唯一的因素, 對于有遮擋的情況，往往會產(chǎn)生錯誤的抑制。我們在這項工作中建議是的更好標準，因為在抑制標準中不僅應(yīng)考慮重疊被正式定義為:

(13)

其中框 ? ?被去除通過同時到考慮和兩個框中心點的距離。? ?是分類得分和 ? ?是閾值。我們認為兩個中心點較遠的框可能會定位不同的物體, 而不應(yīng)該被刪除。此外是非常靈活, 僅僅是幾行的代碼就可以集成到任何目標檢測管道中。

小結(jié)

在本文中，主要的介紹用于邊界框回歸的和和用于抑制冗余檢測框的通過直接最小化兩個中心點的歸一化的距離，可以比實現(xiàn)更快的收斂。此外考慮了三個幾何屬性(即重疊區(qū)域、中心點距離和長寬比),促進了更快的收斂和更優(yōu)的性能。

參考文章

https://github.com/Zzh-tju/DIoU/blob/master/README.md#introduction

IoU: https://arxiv.org/pdf/1608.01471.pdf

GIoU: https://giou.stanford.edu/GIoU.pdf

DIoU: https://arxiv.org/pdf/1911.08287.pdf

編輯：黃飛

閱讀全文

計算機視覺(45543) 計算機視覺(45543)

計算機視覺技術(shù)面臨的挑戰(zhàn)

電子發(fā)燒友網(wǎng)報道（文/李彎彎）計算機視覺技術(shù)最早開始于20世紀60年代，其主要是模仿人類視覺，讓計算機或機器人看到物體，到如今計算機視覺已經(jīng)取得很大進展，不過就研究和開發(fā)來說，它還有很大的探索空間

2022-07-07 07:55:00

6278

驍龍820搶先看：計算機視覺體驗

聽到“計算機視覺”（computer vision）這個詞，你可能會想到經(jīng)典電影《2001：太空漫游》中HAL 9000那只一動不動、銳利警覺的紅色眼睛，可能覺得計算機視覺只是出現(xiàn)在科幻小說當中

2015-11-03 15:50:56

641

一文讀懂計算機視覺和機器人視覺

計算機視覺與機器人視覺有很多的相似之處，兩者的基本理論框架、底層理論、算法等是相似的，但計算機視覺與機器人視覺研究的最終目的不同：前者主要研究視覺檢驗，精度要求高，速度不是主要考慮的問題；而機器人視覺主要研究在視覺引導下機器人對環(huán)境的作用，有實時性的要求。

2016-11-16 15:44:05

7055

什么是計算機視覺？計算機視覺的三種方法

計算機視覺是指通過為計算機賦予人類視覺這一技術(shù)目標，從而賦能裝配線檢查到駕駛輔助和機器人等應(yīng)用。計算機缺乏像人類一樣憑直覺產(chǎn)生視覺和畫面的能力，所以我們必須給予計算機一些算法，以便處理特殊任務(wù)。

2023-11-16 16:38:13

1677

最適合 AI 應(yīng)用的計算機視覺類型是什么？

著眼于使計算機能夠像人類一樣通過“看”來感知世界，從這一視角對人工智能 (AI) 進行了探討。我將簡要比較每一類計算機視覺，尤其關(guān)注在本地而不是依賴基于云的資源收集和處理數(shù)據(jù)，并根據(jù)數(shù)據(jù)采取行動的嵌入式系統(tǒng)。什么

2023-12-18 13:09:59

5059

計算機視覺基礎(chǔ)知識

計算機視覺基礎(chǔ)題目

2020-06-05 16:33:34

計算機視覺目標檢測的主要步驟

【計算機視覺】目標檢測方法匯總

2019-06-14 14:49:26

計算機視覺神經(jīng)網(wǎng)絡(luò)資料全集

CV之YOLOv3：深度學習之計算機視覺神經(jīng)網(wǎng)絡(luò)Yolov3-5clessses訓練自己的數(shù)據(jù)集全程記錄(第二次)——Jason niu

2018-12-24 11:52:25

計算機視覺論文速覽

AI視野·今日CS.CV 計算機視覺論文速覽transformer、新模型、視覺語言模型、多模態(tài)、clip、視角合成

2021-08-31 08:46:46

計算機圖形學定義

圖形圖形及圖形的表示方法圖形：計算機圖形學的研究對象能在人的視覺系統(tǒng)中產(chǎn)生視覺印象的客觀對象包括自然景物、拍攝到的圖片、用數(shù)學方法描述的圖形等等構(gòu)成圖形的要素幾何要素：刻畫對象的輪廓、形狀等非幾何要素：刻...

2021-08-31 07:07:59

計算機安全使用常識

老化或燒毀，使用時還應(yīng)注意保持計算機的平穩(wěn)，以免損壞硬盤。（4）經(jīng)常備份數(shù)據(jù)。重要的數(shù)據(jù)和文件要經(jīng)常進行備份，防止由于硬盤損壞或病毒破壞而造成的損失。（5）定期清查病毒，不使用盜版軟件。  （6）設(shè)置安全權(quán)限和密碼，并定期更改密碼，對于來歷不名的軟件不要運行，防止黑客的入侵。

2009-03-10 12:10:04

計算機由哪幾部分組成？計算機系統(tǒng)的層次結(jié)構(gòu)是怎樣的？

計算機由哪幾部分組成？計算機系統(tǒng)的層次結(jié)構(gòu)是怎樣的？計算機的性能指標有哪些？

2021-09-18 07:09:02

計算機組成原理是什么？

計算機組成原理是什么？

2021-11-09 07:25:59

Taurus & Pegasus AI 計算機視覺基礎(chǔ)開發(fā)套件的軟件包在哪里下載？

Taurus & Pegasus AI 計算機視覺基礎(chǔ)開發(fā)套件的軟件包在哪里下載？build_package、VM_package 等

2021-12-04 14:48:22

【我是電子發(fā)燒友】七步帶你認識計算機視覺（Computer Vision）

的是計算機視覺幾乎全部與計算機編程有關(guān)。你也可以在Coursera上選修《概率繪圖模型》一課，這門課程相對較難（講得比較深入），你也可以在學習一段時間之后再對其進行了解。第二步——數(shù)字圖像處理觀看

2017-06-14 21:06:15

什么是計算機視覺看了就知道

什么是計算機視覺

2021-01-11 07:47:46

什么是計算機系統(tǒng)、計算機硬件和計算機軟件？

第一章 計算機系統(tǒng)概論1. 什么是計算機系統(tǒng)、計算機硬件和計算機軟件？硬件和軟件哪個更重要？解：P3計算機系統(tǒng)：由計算機硬件系統(tǒng)和軟件系統(tǒng)組成的綜合體。計算機硬件：指計算機中的電子線路和物理裝置

2021-07-22 09:06:57

什么是微型計算機？微型計算機有什么用處？

匯編語言是什么？什么是微型計算機？微型計算機有什么用處？

2021-07-16 09:59:10

圖像處理與計算機視覺相關(guān)的書籍有哪些

圖像處理與計算機視覺相關(guān)的書籍

2020-05-20 13:58:28

基于YOLOX目標檢測算法的改進

：提出 DecIoU，通過對面積進行解耦來優(yōu)化預(yù)測框的形狀，提高預(yù)測框和真實框的形狀一致性，并與 IoU、GIoU、DIoU 等其他損失函數(shù)對比，證明了 DecIoU 的有效性；采用 Push Loss

2023-03-06 13:55:27

如何在FPGA上實現(xiàn)許多計算機視覺算法？

我打算在FPGA上實現(xiàn)許多計算機視覺算法。 Digilent Atlys是這類應(yīng)用的良好平臺嗎？我是初學者，不能自己解決這個問題。Digilent Atlys：http

2019-10-28 07:10:38

如何在RK3288上去安裝Opencv開源計算機視覺庫呢

Opencv是什么呢？如何在RK3288上去安裝Opencv開源計算機視覺庫呢？

2022-02-16 07:06:40

如何讓計算機視覺更進一步接近人類視覺？

如何讓計算機視覺更進一步接近人類視覺？

2021-06-01 06:27:08

學習計算機視覺的建議有哪些

初學計算機視覺的切身建議

2020-06-18 10:12:53

工業(yè)計算機的應(yīng)用

工業(yè)計算機在半導體設(shè)備上的應(yīng)用，具體在哪一方面。比如說圖像處理使用什么樣的計算機，工業(yè)控制使用哪一方面的計算機？

2023-09-12 14:19:59

有關(guān)虛擬儀器的計算機視覺系統(tǒng)有哪些研究？

請問有關(guān)虛擬儀器的計算機視覺系統(tǒng)有哪些研究？基于虛擬儀器的視覺系統(tǒng)對PC性能有什么要求？

2021-04-13 06:43:49

機器視覺與計算機視覺的關(guān)系簡述

。計算機視覺是一門獨立的學科，有著30年左右的歷史，集圖像處理、模式識別、人工智能技術(shù)為一體，著重服務(wù)于一幅或多幅圖像的計算機分析。機器視覺相對于計算機視覺來說，則是一項比較新的新型技術(shù)，旨在為制造工業(yè)等

2014-05-13 14:57:44

深度學習與傳統(tǒng)計算機視覺簡介

文章目錄1 簡介1.1 深度學習與傳統(tǒng)計算機視覺1.2 性能考量1.3 社區(qū)支持2 結(jié)論3 參考在計算機視覺領(lǐng)域中，不同的場景不同的應(yīng)用程序需要不同的解決方案。在本文中，我們將快速回顧可用于在

2021-12-23 06:17:19

用于計算機視覺訓練的圖像數(shù)據(jù)集介紹

用于計算機視覺訓練的圖像數(shù)據(jù)集

2021-02-26 07:35:08

結(jié)合預(yù)測框和目標框之間的歸一化距離來提出距離-IoU （DIoU） Loss

之間的歸一化距離來提出距離-IoU （DIoU） Loss，它在訓練中的收斂速度比 IoU 和 GIoU Loss快得多?！　∧繕藱z測是計算機視覺任務(wù)中的關(guān)鍵問題之一，幾十年來一直受到了廣泛的研究

2022-11-14 15:46:01

自動駕駛系統(tǒng)要完成哪些計算機視覺任務(wù)？

Geiger 的研究主要集中在用于自動駕駛系統(tǒng)的三維視覺理解、分割、重建、材質(zhì)與動作估計等方面。他主導了自動駕駛領(lǐng)域著名數(shù)據(jù)集 KITTI 及多項自動駕駛計算機視覺任務(wù)的基準體系建設(shè)，KITTI 是目前最大的用于自動駕駛的計算機視覺公開數(shù)據(jù)集。

2020-07-30 06:49:20

讓機器“看見”—計算機視覺入門及實戰(zhàn) 第二期基礎(chǔ)技術(shù)篇

`點擊報名直播觀看：http://t.elecfans.com/live/556.html專家簡介：鄧亞峰現(xiàn)任格靈深瞳信息技術(shù)有限公司首席技術(shù)官，畢業(yè)于清華大學，具有16年的計算機視覺和人工智能方向

2018-09-04 17:56:31

請問計算機視覺與深度學習要看什么書？

計算機視覺與深度學習，看這本書就夠了

2020-05-21 12:43:42

請問計算機的組成原理是什么？

請問計算機的組成原理是什么？

2021-10-27 07:46:59

CPCI計算機

Compacc 是基于PICMG 標準的工業(yè)用嵌入式計算機總線標準。蘇州惠普聯(lián)電子有限公司的CompactPCI 產(chǎn)品群是基于CPCI標準的嵌入式計算機的產(chǎn)品系列，它的商業(yè)化應(yīng)用及發(fā)展取決于國際插件式計算機，設(shè)備及其他硬件軟件的廣泛應(yīng)用。

2022-04-22 09:47:55

計算機視覺及其在焊接中的應(yīng)用

簡要闡述了計算機視覺的基本原理、系統(tǒng)結(jié)構(gòu)和計算機視覺的基本處理方法，并著重講解了在焊接自動化領(lǐng)域的應(yīng)用情況。關(guān)鍵詞：計算機視覺.焊縫跟蹤.視覺傳感器.圖像處理

2009-07-18 10:19:56

基于OpenCV的計算機視覺技術(shù)實現(xiàn)

基于OpenCV的計算機視覺技術(shù)實現(xiàn)OpencV是用來實現(xiàn)計算機視覺相關(guān)技術(shù)的開放源碼工作庫，是計算機視覺、圖像處理、模式識別、計算機圖形學、信號處理、視頻監(jiān)控、科學可視化等

2009-11-23 21:06:28

計算機視覺講義

計算機視覺講義:機器視覺是研究用計算機來模擬生物外顯或宏觀視覺功能的科學和技術(shù)．機器視覺系統(tǒng)的首要目標是用圖像創(chuàng)建或恢復現(xiàn)實世界模型，然后認知現(xiàn)實世界．機器視覺

2010-03-19 08:08:23

計算機視覺課件

Marr的視覺計算理論[Marr1982]立足于計算機科學，系統(tǒng)地概括了心理生理學、神經(jīng)生理學等方面業(yè)已取得的所有重要成果，是視覺研究中迄今為止最為完善的視覺理論．Marr建立的視

2010-03-19 08:09:22

超級計算機和特種計算機的比較和價值

超級計算機和特種計算機的比較和價值在最新公布的全球高性能計算機TOP500強排行榜中，由中科院計算所國家智能計算機研究開發(fā)中心、曙光信息產(chǎn)業(yè)（北京）有限公司、

2008-12-01 08:02:06

993

Lecture 2.2計算機視覺的多視幾何

計算機視覺類資料

2017-05-02 10:16:07

計算機視覺賈云德pdf版

計算機視覺

2017-05-09 11:00:42

計算機視覺應(yīng)用之OpenCV基礎(chǔ)教程

從工業(yè)檢測系統(tǒng)到自動駕駛系統(tǒng)，計算機視覺是一個包括許多有趣應(yīng)用的廣泛領(lǐng)域。許多這樣的系統(tǒng)在原型和實現(xiàn)階段都要用到開源計算機視覺 (Open Source Computer Vision

2017-11-18 04:45:02

8950

計算機與人類視覺有什么差異？如何提高計算機視覺？

據(jù)報道，UCSB研究發(fā)現(xiàn)計算機與人類視覺具有很大的差異，即使機器視覺方面取得了巨大的進步，仍然無法比得上動物在復雜場景的視覺搜索方面的能力，如何用人眼搜索策略提升計算機視覺至關(guān)重要。因此，當目標物體

2018-01-15 14:29:16

2756

計算機視覺零基礎(chǔ)入門

那么這個爆款應(yīng)用的背后用到了哪些計算機視覺技術(shù)？掌握這些技術(shù)需要通過哪些學習路徑？

2018-05-31 10:44:25

8734

一文詳解計算機視覺技術(shù)

正像其它學科一樣，一個大量人員研究了多年的學科，卻很難給出一個嚴格的定義，模式識別如此，目前火熱的人工智能如此，計算機視覺亦如此。與計算機視覺密切相關(guān)的概念有視覺感知（visual

2018-07-28 10:15:54

6047

淺析計算機視覺研發(fā)和應(yīng)用

計算機視覺作為人工智能的核心技術(shù)之一，近幾年的發(fā)展現(xiàn)狀如何？

2018-09-19 17:57:46

4542

基于Vivado HLS的計算機視覺開發(fā)

OPENCV（Open Source Computer Vision）被廣泛的使用在計算機視覺開發(fā)上。使用Vivado HLS視頻庫在zynq-7000全可編程soc上加速OPENCV 應(yīng)用的開發(fā)，將大大提升我們的計算機視覺開發(fā)。

2018-11-10 10:47:49

1324

計算機視覺是什么

計算機視覺是一門研究如何使機器“看”的科學，更進一步的說，就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺，并進一步做圖形處理，使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像

2018-12-08 09:24:13

19852

計算機視覺與機器視覺區(qū)別

　“計算機視覺”，是指用計算機實現(xiàn)人的視覺功能，對客觀世界的三維場景的感知、識別和理解。計算機視覺是一個處于指示前沿的領(lǐng)域。我們認為計算機視覺，或簡稱為“視覺”，是一項事業(yè)，它與研究人類或動物的視覺是不同的。

2018-12-08 09:27:29

12006

計算機視覺的興起與發(fā)展趨勢

近年來，為了使計算機更像人類，識別物體、深度學習等計算機視覺技術(shù)方法和應(yīng)用迅速發(fā)展，全球計算機視覺市場正在迅速崛起。隨著人工智能產(chǎn)業(yè)的升溫，計算機視覺行業(yè)也在加速擴張。

2019-01-24 16:11:30

12846

計算機視覺的應(yīng)用

計算機視覺的應(yīng)用領(lǐng)域主要包括對照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、精確制導、移動機器人視覺導航、醫(yī)學輔助診斷、工業(yè)機器人的手眼系統(tǒng)、地圖繪制、物體三維形狀分析與識別及智能人機接口等。

2019-04-04 16:01:05

8082

計算機視覺就業(yè)怎么樣

計算機視覺是指用機器模擬“視覺器官”，對目標進行識別、跟蹤和測量等，并由計算機代替大腦完成進一步的圖像處理和解釋。目前我們手機常用的人臉識別解鎖，銀行業(yè)務(wù)遠程辦理等都是用的該類技術(shù)。計算機視覺方向目前的就業(yè)環(huán)境具體如何呢？

2019-04-04 16:06:24

14685

你真的了解什么是計算機視覺嗎?

計算機視覺和機器視覺有何區(qū)別?

2019-07-10 14:35:09

10442

計算機視覺與機器視覺之間有什么差異

計算機視覺和機器視覺都使用圖像捕獲和分析來執(zhí)行人眼無法比擬的速度和準確度的任務(wù)。

2019-09-11 11:14:58

998

計算機視覺技術(shù)簡介

由于“計算機視覺”反映了對視覺環(huán)境及其上下文的相對理解，因此，一些科學家認為，該領(lǐng)域為人工智能領(lǐng)域鋪平了道路。那么什么是計算機視覺呢？

2020-07-11 11:24:42

4079

計算機視覺原理分析及其應(yīng)用

2020-07-30 16:50:56

7957

計算機視覺的發(fā)展歷史_計算機視覺的應(yīng)用方向

計算機視覺40多年的發(fā)展中，盡管人們提出了大量的理論和方法，但總體上說，計算機視覺經(jīng)歷了4個主要歷程。即：馬爾計算視覺、主動和目的視覺、多視幾何與分層三維重建和基于學習的視覺。下面將對這4項主要內(nèi)容進行簡要介紹。

2020-07-30 17:21:44

6145

計算機視覺常用算法_計算機視覺有哪些分類

本文主要介紹了計算機視覺常用算法及計算機視覺的分類。

2020-07-30 17:34:53

13013

基于計算機視覺的多維圖像智能

利用攝像機和其他數(shù)據(jù)源，計算機視覺可以收集有關(guān)公司運營最重要方面的重要信息，這些信息包括構(gòu)成流程主干的人員、產(chǎn)品、資產(chǎn)和文檔的組合。當企業(yè)收集數(shù)字圖像并應(yīng)用深度學習算法，通過對機器眼睛“所見”的反應(yīng)來準確識別和分類對象時，計算機視覺起作用。

2020-08-04 10:39:42

2753

深度學習在計算機視覺上的四大應(yīng)用

計算機視覺中比較成功的深度學習的應(yīng)用，包括人臉識別，圖像問答，物體檢測，物體跟蹤。

2020-08-24 16:16:19

3971

DL和傳統(tǒng)計算機視覺的比較

來自《Deep Learning vs. Traditional Computer Vision》摘要：深度學習推動了數(shù)字圖像處理領(lǐng)域的極限。但是，這并不是說傳統(tǒng)計算機視覺技術(shù)已經(jīng)過時了。本文

2020-10-31 11:06:16

4781

計算機視覺中的重要研究方向

計算機視覺是一門研究如何讓計算機達到人類那樣看的技術(shù)。使用攝像頭和電腦來代替人類完成一些復雜的工作，例如對目標進行分類、識別、分割、跟蹤等，計算機視覺技術(shù)已經(jīng)在很多行業(yè)的應(yīng)用場景中大放異彩。本文

2020-11-19 14:32:22

10631

計算機視覺入門指南

這是一篇計算機視覺入門指南，從概念、原理、用例等角度介紹了計算機視覺。「機器能夠模擬人類視覺系統(tǒng)」的幻想已經(jīng)過時了。自 1960 年代第一批學術(shù)論文出現(xiàn)以來，計算機視覺已經(jīng)走了很遠，現(xiàn)代系統(tǒng)已經(jīng)

2020-11-27 09:52:20

2546

CVChain：一個較完善的計算機視覺工具鏈

我們這一年來做的一些工作（總結(jié)見文章最下方）現(xiàn)在差不多形成了一個較完善的計算機視覺工具鏈CVChain。我們這一年來做的一些工作（總結(jié)見文章最下方）現(xiàn)在差不多形成了一個較完善的計算機視覺工具

2020-11-27 09:56:53

1604

計算機視覺的工作流程

引言 計算機視覺（Computer Vision）自興起以來就非常迅速且廣泛應(yīng)用于各個領(lǐng)域，比如我們熟悉的且每天都會使用的基于手機攝像頭的人臉識別，除此之外，它還可以在自動駕駛領(lǐng)域輔助汽車識別

2020-12-26 11:00:32

5845

用于計算機視覺訓練的圖像數(shù)據(jù)集

? 計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺的目標是使人類視覺系統(tǒng)可以實現(xiàn)任務(wù)自動化。 計算機視覺任務(wù)包括圖像采集、圖像處理和圖像分析。圖像數(shù)據(jù)可以采用不同的形式，例如視頻序列，從多個

2020-12-31 09:33:53

2025

計算機視覺的工作流程與主要應(yīng)用

計算機視覺的主要目的是讓計算機能像人類一樣甚至比人類更好地看見和識別世界。計算機視覺通常使用C++、Python和MATLAB等編程語言，是增強現(xiàn)實（AR）的一項重要技術(shù)。

2021-01-08 14:06:01

4810

用于計算機視覺訓練的圖像數(shù)據(jù)集

計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺的目標是使人類視覺系統(tǒng)可以實現(xiàn)任務(wù)自動化。計算機視覺任務(wù)包括圖像采集、圖像處理和圖像分析。圖像數(shù)據(jù)可以采用不同的形式，例如視頻序列，從多個角度的不同的攝像機查看圖像或來自醫(yī)療掃描儀的多維數(shù)據(jù)。

2022-02-12 16:13:33

1132

機器學習和計算機視覺的前20個圖像數(shù)據(jù)集

2021-01-28 07:40:41

計算機視覺技術(shù)的概念

2021-03-10 14:19:59

4027

機器視覺與計算機視覺的區(qū)別的講解

機器視覺與計算機視覺的區(qū)別的講解。

2021-04-27 10:34:54

詳談機器視覺與計算機視覺的異同

詳談機器視覺與計算機視覺的異同

2021-05-28 09:55:42

計算機視覺主要應(yīng)用領(lǐng)域有哪些

電子發(fā)燒友網(wǎng)報道(文/李彎彎)在人工智能技術(shù)中，計算機視覺較早發(fā)展并取得突破，目前應(yīng)用場景也較為明確。計算機視覺在人工智能中占據(jù)重要市場地位，未來市場空間廣闊。

2022-03-31 10:02:33

14401

計算機視覺的重要性及如何幫助解決問題

　　機器學習計算機視覺是一種基于人工智能的計算機視覺。基于人工智能的基于機器學習的計算機視覺具有人工神經(jīng)網(wǎng)絡(luò)或?qū)?，類似于人腦中的神經(jīng)網(wǎng)絡(luò)或?qū)?，用于連接和傳輸有關(guān)攝取的視覺數(shù)據(jù)的信號。在機器學習中，計算機視覺神經(jīng)網(wǎng)絡(luò)具有獨立且不同的層，明確定義層之間的連接，以及視覺數(shù)據(jù)傳輸?shù)念A(yù)定義方向。

2022-04-06 16:49:42

3188

計算機視覺為何重要？

計算機視覺是一個研究領(lǐng)域，旨在助力計算機使用復雜算法（可以是傳統(tǒng)算法，也可以是基于深度學習的算法）來理解數(shù)字圖像和視頻并提取有用的信息。

2022-04-29 14:21:32

2886

神經(jīng)形態(tài)傳感改變計算機視覺焦點

這項技術(shù)的創(chuàng)始人之一表示，基于攝像機的計算機視覺技術(shù)效率極低，促使人們需要替代解決方案。 計算機視覺是否會再次自我改造？匹茲堡大學眼科教授、CMU 機器人研究所兼職教授 Ryad Benosman

2022-07-20 18:12:30

1001

計算機視覺助力醫(yī)療應(yīng)用

計算機視覺是醫(yī)療保健行業(yè)的一個相當新的趨勢，其中圖像用于幫助識別和預(yù)測患者的診斷，提高準確性，利用計算機圖像來做到這一點。圖像被拍攝并上傳到系統(tǒng)中，然后通過計算機算法進行分析，以優(yōu)化醫(yī)療診斷，例如

2022-07-21 16:25:16

1476

計算機視覺的基礎(chǔ)概念和現(xiàn)實應(yīng)用

本文將介紹計算機視覺的基礎(chǔ)概念和現(xiàn)實應(yīng)用，對任何聽說過計算機視覺但不確定它是什么以及如何應(yīng)用的人，本文是了解計算機視覺這一復雜問題的便捷途徑。

2022-11-08 10:10:35

1098

如何區(qū)分計算機視覺與其相關(guān)領(lǐng)域計算機視覺運行原理

計算機視覺算法并非魔法。它們需要數(shù)據(jù)才能運作，輸入數(shù)據(jù)的質(zhì)量決定其性能。有多種不同方法和來源可供收集合適數(shù)據(jù)，這取決于你的目標。無論如何，擁有的輸入數(shù)據(jù)越多，計算機視覺模型性能優(yōu)秀的可能性越大。

2022-11-08 10:12:01

414