chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用NVIDIA中的單視角3D追蹤功能減輕視覺(jué)感知中的遮擋現(xiàn)象?

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-05-17 10:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說(shuō)到智能視頻分析(IVA)應(yīng)用(如交通監(jiān)控、倉(cāng)庫(kù)安全和零售消費(fèi)者分析)的感知,最大的挑戰(zhàn)之一就是遮擋。例如,人們可能會(huì)移動(dòng)到結(jié)構(gòu)性障礙物后面,零售消費(fèi)者可能由于貨架而無(wú)法被完全看到,汽車可能會(huì)被隱藏在大型卡車后面。

本文將介紹如何利用NVIDIA DeepStream SDK中全新的單視角 3D 追蹤功能,來(lái)解決現(xiàn)實(shí)生活中 IVA 部署常見(jiàn)的視覺(jué)感知遮擋問(wèn)題。

視覺(jué)感知中的視角和投影

在我們的物理世界中,通過(guò)相機(jī)鏡頭觀察到的一些物體的運(yùn)動(dòng)可能看起來(lái)并不穩(wěn)定,這是由于相機(jī)對(duì) 3D 世界的 2D 呈現(xiàn)所造成的。

水星和火星等行星的逆行就是一個(gè)例子,這讓古希臘天文學(xué)家感到困惑。他們無(wú)法解釋為什么行星有時(shí)看起來(lái)會(huì)向后移動(dòng)(圖 1)。

之所以會(huì)出現(xiàn)明顯退行,是由于恒星和行星在夜空中的軌跡所造成的。這些是宇宙 3D 空間中軌道運(yùn)動(dòng)在夜空2D畫布上的投影,如果古代天文學(xué)家知道3D空間的運(yùn)動(dòng)模式,他們就可以預(yù)測(cè)這些行星在2D夜空中的出現(xiàn)。

8712583e-1380-11ef-b74b-92fbcf53809c.png

圖 1. 2014 年(左)和 2016 年(右)

火星在夜空中的逆行運(yùn)動(dòng)軌跡(圖片來(lái)源:NASA)

交通監(jiān)控?cái)z像頭提供了類似的例子。這些攝像頭通常用于監(jiān)測(cè)一個(gè)大面積的區(qū)域,在這個(gè)區(qū)域里,車輛在近場(chǎng)和遠(yuǎn)場(chǎng)的運(yùn)動(dòng)動(dòng)態(tài)可能截然不同。

在視頻 1 中,遠(yuǎn)處的車輛看起來(lái)較小且移動(dòng)緩慢。當(dāng)車輛靠近攝像頭并轉(zhuǎn)彎時(shí),可以觀察到物體運(yùn)動(dòng)的突然變化。這些變化使得我們?cè)?2D 攝像機(jī)視圖中很難找到常見(jiàn)的模式,因此也很難預(yù)測(cè)車輛未來(lái)可能移動(dòng)的位置。

視頻 1. 近場(chǎng)車輛似乎移動(dòng)得很快,

而遠(yuǎn)場(chǎng)車輛則移動(dòng)得較慢

物體跟蹤本質(zhì)上是對(duì)物體物理狀態(tài)的連續(xù)估計(jì),同時(shí)隨著時(shí)間的推移來(lái)識(shí)別其獨(dú)特身份。該過(guò)程通常包括對(duì)物體運(yùn)動(dòng)動(dòng)態(tài)進(jìn)行建模和預(yù)測(cè),以抑制測(cè)量(檢測(cè))中的固有干擾。從所提供的示例來(lái)看,直接在原生3D空間中對(duì)物體狀態(tài)進(jìn)行估計(jì)和預(yù)測(cè)顯然比在投影的2D 攝像頭圖像平面中效果更好,這是因?yàn)槲矬w存在于3D空間中。

使用 NVIDIA DeepStream進(jìn)行單視角 3D 跟蹤

NVIDIA DeepStream SDK 是一個(gè)基于 GStreamer 的完整流媒體分析工具包,可用于基于 AI 的多傳感器處理,視頻、音頻和圖像理解。DeepStream 6.4 版本引入了一種名為單視角 3D 跟蹤(SV3DT)的新功能,該功能能夠在單攝像頭視圖內(nèi)估計(jì) 3D 物理世界中的物體狀態(tài)。

這一過(guò)程包括使用每個(gè)攝像頭的 3×4 投影矩陣或攝像頭矩陣,將 2D 攝像頭圖像平面上的觀測(cè)測(cè)量轉(zhuǎn)換為 3D 世界坐標(biāo)系。物體在3D世界地平面中的位置表示為物體底部的中心,因此,行人被建模為一個(gè)立在世界地面平面上的圓柱體(具有高度和半徑),圓柱體模型底部的中心是行人的腳部位置(圖 2)。

87335f5c-1380-11ef-b74b-92fbcf53809c.png

圖 2. 每個(gè)圓柱形模型的底部中心表示

每個(gè)行人在 3D 世界地平面上的位置(用綠點(diǎn)標(biāo)記)

使用 3×4 投影矩陣和圓柱形人體模型,可以估算出針對(duì)檢測(cè)到物體的 3D 人體模型在 3D 世界地平面上的位置,從而使投影在 2D 攝像頭圖像平面上的 3D 人體模型,與檢測(cè)到的物體的邊界框相吻合。

例如,在圖 3(左)中,灰色邊界框表示對(duì)象檢測(cè)器使用NVIDIA TAO PeopleNet模型檢測(cè)到的物體,紫色和黃色圓柱體代表從 3D 世界地平面上的估計(jì)位置投影到 2D 攝像頭圖像平面的相應(yīng)的 3D 人體模型,投影的 3D 人體模型底部的綠點(diǎn)代表預(yù)估的腳部位置。盡管攝像頭視圖有透視和旋轉(zhuǎn),但這些位置與實(shí)際腳部位置非常吻合。

8897f42a-1380-11ef-b74b-92fbcf53809c.png

圖 3. SV3DT 有助于跟蹤零售消費(fèi)者準(zhǔn)確的腳部位置,

即使存在遮擋也不影響

新推出的 DeepStream SV3DT 功能的一個(gè)重要優(yōu)勢(shì)是,即使存在明顯的局部遮擋,也可以準(zhǔn)確地找到物體的 2D 和 3D 腳部位置,而這是現(xiàn)實(shí)世界 IVA 應(yīng)用中最具挑戰(zhàn)性的問(wèn)題之一。

例如,圖 3(右)顯示了一個(gè)人在狹窄的過(guò)道里購(gòu)物,攝像頭只能看到其上半身的一小部分,這將導(dǎo)致物體邊界框較小,只能捕獲頭部和肩部區(qū)域。在這種情況下,要在全局商店地圖上對(duì)此人進(jìn)行定位就變得極具挑戰(zhàn)性,至少可以說(shuō),估計(jì)腳部位置是一項(xiàng)非同小可的任務(wù)。

使用邊界框的底部中心作為對(duì)象位置的代表會(huì)為軌跡估計(jì)帶來(lái)很大的誤差。即使使用攝像頭校準(zhǔn)信息將 2D 點(diǎn)轉(zhuǎn)換為 3D 點(diǎn)情況也是如此,尤其是當(dāng)攝像頭透視和旋轉(zhuǎn)較大時(shí)。

DeepStream SDK 中的多目標(biāo)跟蹤器模塊中的 SV3DT 算法,在假設(shè)攝像頭安裝在頭部上方的情況下,通過(guò)利用 3D 人體建模信息來(lái)解決這個(gè)問(wèn)題。大多數(shù)部署在智能空間中的大型攝像頭網(wǎng)絡(luò)系統(tǒng)通常都是這種情況。有了這個(gè)假設(shè),在估算相應(yīng)的 3D 人體模型位置時(shí),就可以使用頭部作為錨點(diǎn)。如圖 3 顯示,即使在人被嚴(yán)重遮擋的情況下,SV3DT 算法也可以成功地找到匹配的 3D 人體模型位置。

視頻 2 顯示了在一家便利店中對(duì)消費(fèi)者進(jìn)行跟蹤的情況。需要注意的是,所使用的 3×4 投影矩陣沒(méi)有考慮鏡頭失真,盡管特定的攝像頭有一定的鏡頭失真,正如您所看到的,水平線有點(diǎn)彎曲而不是直線。這會(huì)導(dǎo)致 3D 人體模型位置估計(jì)更加不準(zhǔn)確,尤其是當(dāng)人位于視頻幀的邊緣時(shí)。

盡管如此,人們?cè)诒憷甑?2D 和 3D 腳部位置(用綠點(diǎn)表示)還是被準(zhǔn)確而穩(wěn)健地追蹤到了,這也提高了隊(duì)列長(zhǎng)度監(jiān)控和占用率地圖等其他分析的準(zhǔn)確性。

圖 4 顯示了如何在合成數(shù)據(jù)集中穩(wěn)健地追蹤每個(gè)行人的腳部位置,即使下半身的大部分被貨架等大型物體遮擋。

88ba9430-1380-11ef-b74b-92fbcf53809c.gif

圖 4. 基于合成數(shù)據(jù)集的嚴(yán)重顆粒遮擋情況下的SV3DT 行人位置跟蹤

我們相信,解決部分遮擋問(wèn)題將為現(xiàn)實(shí)應(yīng)用帶來(lái)許多可能性。SV3DT 目前處于 Alpha 模式,因?yàn)槠鋵?duì)象類型支持有限(僅限站立的人),其他情況(如人們坐著和躺著)或其他對(duì)象類型可能會(huì)在未來(lái)的版本中得到支持。

DeepStream SV3DT 用例

該 DeepStream SV3DT 用例演示了如何在本文介紹的零售商店視頻上啟用單視角 3D 跟蹤,并從管道中保存 3D 元數(shù)據(jù)。如圖 4 和視頻 2 所示,用戶可以從數(shù)據(jù)中可視化凸起的船體和腳部位置。README 還介紹了如何在定制視頻上運(yùn)行該算法。

總結(jié)

NVIDIA DeepStream SDK 中的單視角 3D 跟蹤有助于緩解現(xiàn)實(shí)生活中 IVA 應(yīng)用程序和部署的部分遮擋問(wèn)題。該功能在 6.4 版本中首次推出,并在 7.0 版本中進(jìn)行了增強(qiáng)。具體而言,SV3DT 能夠在局部遮擋的情況下估計(jì)腳部位置,并能夠進(jìn)行更穩(wěn)健和準(zhǔn)確的對(duì)象追蹤,從而實(shí)現(xiàn) 3D 地平面中的準(zhǔn)確定位。依賴或利用地理空間分析的企業(yè)有望從這項(xiàng)技術(shù)中受益。

審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2576

    文章

    54964

    瀏覽量

    790798
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5582

    瀏覽量

    109637
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    5086

    瀏覽量

    103058

原文標(biāo)題:利用 NVIDIA DeepStream 中的單視角 3D 跟蹤技術(shù)減輕視覺(jué)感知中的遮擋現(xiàn)象

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人形機(jī)器人 3D 視覺(jué)路線之爭(zhēng):激光雷達(dá)、雙目和 3D - ToF 誰(shuí)更勝一籌?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)在人形機(jī)器人的設(shè)計(jì)方案3D 視覺(jué)技術(shù)是實(shí)現(xiàn)環(huán)境感知與智能化決策的核心支撐之一。它能夠助力人形機(jī)器人完成環(huán)境感知
    的頭像 發(fā)表于 04-15 00:14 ?4047次閱讀

    奧比光Gemini 330系列雙目3D相機(jī)完成NVIDIA Jetson Thor平臺(tái)全面適配

    在CES 2026展會(huì)期間,奧比光發(fā)布專為機(jī)械臂腕部設(shè)計(jì)超小型雙目3D相機(jī)Gemini 305 立即購(gòu)買,并正式宣布其面向機(jī)器人的標(biāo)志性產(chǎn)品Gemini 330系列相機(jī)已完成與先進(jìn)算力平臺(tái)
    的頭像 發(fā)表于 01-12 10:22 ?274次閱讀

    奧比3D視覺(jué)方案加速落地歐美市場(chǎng)

    經(jīng)過(guò)多年在技術(shù)研發(fā)與應(yīng)用落地方面的持續(xù)投入,奧比光的3D視覺(jué)方案正受到越來(lái)越多歐美企業(yè)的青睞。在原有技術(shù)方案的基礎(chǔ)上,不少企業(yè)在新產(chǎn)品與新項(xiàng)目中引入奧比光相機(jī),替代原本合作的國(guó)際品
    的頭像 發(fā)表于 12-17 14:23 ?469次閱讀

    2025 3D機(jī)器視覺(jué)的發(fā)展趨勢(shì)

    迭代與應(yīng)用拓展成為市場(chǎng)的主要推動(dòng)力:·技術(shù)升級(jí):視覺(jué)系統(tǒng)從單一任務(wù)的2D相機(jī)向多功能3D相機(jī)進(jìn)化。過(guò)去用2D相機(jī)完成單一任務(wù),如今用戶更愿意
    的頭像 發(fā)表于 12-10 17:25 ?1248次閱讀
    2025 <b class='flag-5'>3D</b>機(jī)器<b class='flag-5'>視覺(jué)</b>的發(fā)展趨勢(shì)

    奧比3D視覺(jué)技術(shù)賦能IROS 2025研究成果

    全球機(jī)器人領(lǐng)域最具影響力的學(xué)術(shù)會(huì)議IROS 2025于10月19日至25日在杭州國(guó)際博覽中心舉行。大會(huì)收錄的多篇論文的研究成果采用了奧比光的3D視覺(jué)技術(shù),涵蓋自動(dòng)化掃描、空間建模、人機(jī)交互等前沿方向,彰顯了奧比
    的頭像 發(fā)表于 10-23 16:29 ?767次閱讀

    奧比光領(lǐng)跑韓國(guó)機(jī)器人3D視覺(jué)市場(chǎng)

    近日,國(guó)際權(quán)威行業(yè)研究機(jī)構(gòu)Interact Analysis發(fā)布《韓國(guó)商用及工業(yè)移動(dòng)機(jī)器人3D視覺(jué)市場(chǎng)分析》報(bào)告(以下簡(jiǎn)稱“報(bào)告”)。數(shù)據(jù)顯示,奧比光在韓國(guó)商用和工業(yè)移動(dòng)機(jī)器人3D
    的頭像 發(fā)表于 10-23 16:27 ?707次閱讀

    使用NVIDIA AI Blueprint打造3D世界

    在傳統(tǒng)工作流,建模師必須構(gòu)建占位模型、低精度資產(chǎn)來(lái)填充 3D 場(chǎng)景,優(yōu)化核心資產(chǎn)以完成場(chǎng)景。之后,可以優(yōu)化、細(xì)化并最終完成視覺(jué)效果。
    的頭像 發(fā)表于 09-23 14:35 ?930次閱讀

    玩轉(zhuǎn) KiCad 3D模型的使用

    “ ?本文將帶您學(xué)習(xí)如何將 3D 模型與封裝關(guān)聯(lián)、文件嵌入,講解 3D 查看器的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    季豐電子邀您相約2025國(guó)際3D視覺(jué)感知與應(yīng)用大會(huì)

    9月20日 - 21日,國(guó)際3D視覺(jué)感知與應(yīng)用大會(huì)將在蘇州太湖國(guó)際會(huì)議中心盛大啟幕,大會(huì)議題涵蓋3D成像與測(cè)量、3D
    的頭像 發(fā)表于 09-08 15:03 ?1030次閱讀

    iTOF技術(shù),多樣化的3D視覺(jué)應(yīng)用

    視覺(jué)傳感器對(duì)于機(jī)器信息獲取至關(guān)重要,正在從二維(2D)發(fā)展到三維(3D),在某些方面模仿并超越人類的視覺(jué)能力,從而推動(dòng)創(chuàng)新應(yīng)用。3D
    發(fā)表于 09-05 07:24

    奧比3D相機(jī)矩陣接入NVIDIA Jetson Thor平臺(tái)

    8月28日,奧比光宣布其Gemini 330系列3D深度相機(jī)正全面兼容NVIDIA Jetson Thor(物理AI 與機(jī)器人應(yīng)用終極平臺(tái))。未來(lái)完成適配后,奧比光雙目
    的頭像 發(fā)表于 08-30 09:42 ?2609次閱讀

    NVIDIA Omniverse Extension開(kāi)發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來(lái)構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的
    的頭像 發(fā)表于 08-22 15:52 ?3697次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension開(kāi)發(fā)秘籍

    基于NVIDIA AI的3D機(jī)器人感知與地圖構(gòu)建系統(tǒng)設(shè)計(jì)

    機(jī)器人必須感知和理解其 3D 環(huán)境,才能安全高效地行動(dòng)。這一點(diǎn)在非結(jié)構(gòu)化或陌生空間中的自主導(dǎo)航、對(duì)象操作和遠(yuǎn)程操作等任務(wù)尤為重要。當(dāng)前機(jī)器人感知技術(shù)的進(jìn)展,越來(lái)越多地體現(xiàn)在通過(guò)統(tǒng)一的實(shí)時(shí)工作流與強(qiáng)大的
    的頭像 發(fā)表于 07-04 14:31 ?1124次閱讀
    基于<b class='flag-5'>NVIDIA</b> AI的<b class='flag-5'>3D</b>機(jī)器人<b class='flag-5'>感知</b>與地圖構(gòu)建系統(tǒng)設(shè)計(jì)

    NVIDIA Omniverse Kit 107的安裝部署步驟

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來(lái)構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的
    的頭像 發(fā)表于 03-28 10:37 ?1443次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Kit 107的安裝部署步驟

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng),3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來(lái)輔助生成3D場(chǎng)景和3D標(biāo)簽,具備重要的研
    的頭像 發(fā)表于 03-17 13:44 ?1205次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b><b class='flag-5'>感知</b>模型BIP<b class='flag-5'>3D</b>