chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全新輕量級ViSTA-SLAM系統(tǒng)介紹

INDEMIND ? 來源:INDEMIND ? 2025-09-22 15:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無需相機(jī)內(nèi)參、極致輕量的前端(前端模型大小僅為同類35%),實(shí)時(shí)單目視覺SLAM,ViSTA-SLAM。與現(xiàn)有方法相比,ViSTA-SLAM不僅更輕、更快,在相機(jī)跟蹤和密集3D重建質(zhì)量方面也均表現(xiàn)出色。

? 文章:

ViSTA-SLAM: Visual SLAM with Symmetric Two-view Association

? 作者:

Ganlin Zhang, Shenhan Qian, Xi Wang, Daniel Cremers

? 論文鏈接:

https://arxiv.org/abs/2509.01584

? 編譯:

INDEMIND

Github倉庫:

https://github.com/zhangganlin/vista-slam

01本文核心內(nèi)容

經(jīng)典視覺SLAM方法大致可分為兩類,第一類是基于特征的SLAM;第二類稱為直接法。這兩類方法通常都采用前端(基于特征或直接法)和后端進(jìn)行優(yōu)化,最常見的是聯(lián)合優(yōu)化位姿和結(jié)構(gòu)的光束平差法。然而,它們都嚴(yán)重依賴于精確的相機(jī)內(nèi)參。

基于深度學(xué)習(xí)的SLAM方法雖然強(qiáng)大,但大多數(shù)方法仍然需要精確的相機(jī)內(nèi)參,并且由于計(jì)算量大,很多方法難以實(shí)現(xiàn)真正的實(shí)時(shí)性能。

而隨著3D基礎(chǔ)模型的出現(xiàn),出現(xiàn)了幾種無需內(nèi)參的SLAM框架,旨在無需校準(zhǔn)即可生成密集輸出。例如,Spann3R以及其他一些方法將兩視圖的DUSt3R模型擴(kuò)展到序列輸入,直接在統(tǒng)一的全局坐標(biāo)系中回歸點(diǎn)云。然而,盡管這些方法解決了某些經(jīng)典限制,但它們?nèi)源嬖陲@著的缺陷:

當(dāng)前的雙視圖模型采用不對稱架構(gòu),將兩個(gè)視圖的點(diǎn)圖回歸到第一個(gè)視圖的坐標(biāo),這使得在后端優(yōu)化(例如閉環(huán)檢測)中難以解耦視圖。

純回歸方法利用先前的記憶來預(yù)測即將到來的幀,但存在漂移問題,并且一旦軌跡變長就會(huì)開始遺忘。

SLAM3R等方法基于當(dāng)前的雙視圖模型,繼承了具有兩個(gè)獨(dú)立解碼器的不對稱架構(gòu),導(dǎo)致模型規(guī)模較大?;谧拥貓D的方法則采用規(guī)模更大的多視圖模型來構(gòu)建子地圖,這進(jìn)一步增大了前端模型的規(guī)模。

為了解決這些問題,我們提出了ViSTA-SLAM,這是一種基于對稱雙視圖關(guān)聯(lián)的新型實(shí)時(shí)單目視覺SLAM管道。其核心是一個(gè)輕量級的對稱雙視圖關(guān)聯(lián)(STA)模型前端,它以兩張RGB圖像作為輸入,同時(shí)回歸出它們各自局部坐標(biāo)系中的兩個(gè)點(diǎn)圖,以及它們之間的相對相機(jī)姿態(tài)。在訓(xùn)練過程中,我們對相對姿態(tài)施加循環(huán)一致性約束,并對點(diǎn)圖施加幾何一致性約束,以提高準(zhǔn)確性和穩(wěn)定性。與之前的3D模型不同,STA對其輸入完全對稱:不指定任何視圖為參考,對兩個(gè)視圖應(yīng)用相同的編碼器-解碼器架構(gòu)。在后端,我們執(zhí)行Sim(3)姿態(tài)圖優(yōu)化,并結(jié)合閉環(huán)來減少漂移并確保全局一致性。為了進(jìn)一步增強(qiáng)魯棒性,每個(gè)視圖都由多個(gè)節(jié)點(diǎn)而非單個(gè)節(jié)點(diǎn)表示,這些節(jié)點(diǎn)通過僅含尺度的邊連接,以處理不同前向傳遞中的尺度不一致。

這種對稱設(shè)計(jì)使得我們的前端比現(xiàn)有方法輕量得多,STA是我們的模型大小僅為MASt3R的64%,VGGT的35%。與先前將多個(gè)視圖組合到單個(gè)子圖節(jié)點(diǎn)的方法不同,我們的方法為每個(gè)視圖在位姿圖中分配單獨(dú)的節(jié)點(diǎn)。利用STA前端生成的局部點(diǎn)圖,每個(gè)節(jié)點(diǎn)都可以獨(dú)立表示,僅通過相對變換與其他節(jié)點(diǎn)相連。與基于子圖的方法相比,這種設(shè)計(jì)產(chǎn)生了更靈活的圖結(jié)構(gòu)和更強(qiáng)的魯棒性。這種靈活性和輕量級架構(gòu)的結(jié)合是我們選擇對稱雙視圖模型作為前端的原因。

主要貢獻(xiàn)如下:

? 我們設(shè)計(jì)并訓(xùn)練了一個(gè)輕量級、對稱的雙視圖關(guān)聯(lián)網(wǎng)絡(luò)作為前端,僅以兩張RGB圖像作為輸入,并回歸它們在局部坐標(biāo)系中的點(diǎn)圖以及相對相機(jī)位姿。

? 我們構(gòu)建了一個(gè)具有閉環(huán)的Sim(3)位姿圖,并使用Levenberg-Marquardt算法對其進(jìn)行優(yōu)化,以實(shí)現(xiàn)快速且穩(wěn)定的收斂。

? 通過整合這些組件,我們提出了一種實(shí)時(shí)的單目密集視覺SLAM框架,無需任何相機(jī)內(nèi)參即可運(yùn)行。我們的方法在真實(shí)世界的7-Scenes和TUM-RGBD數(shù)據(jù)集上實(shí)現(xiàn)了最先進(jìn)的性能,無論是相機(jī)軌跡估計(jì)還是密集的3D重建。

02方法架構(gòu)

作為一個(gè)單目密集SLAM(圖2),我們的目標(biāo)是使用密集點(diǎn)云同時(shí)在線跟蹤相機(jī)姿態(tài)并重建記錄的場景。為了實(shí)現(xiàn)這一目標(biāo),我們提出了一種輕量級且新穎的對稱兩視圖關(guān)聯(lián)模型作為我們管道的前端,該模型提取兩個(gè)相鄰輸入幀的相對姿態(tài)和局部點(diǎn)圖,通過優(yōu)化結(jié)合回環(huán)閉合來減少漂移累積。

wKgZPGjRAJCAa1IxAALA2kd9BEQ980.png

對稱雙視圖關(guān)聯(lián)模型

在經(jīng)典的單目SLAM管道中,雙視圖估計(jì)是最重要的組成部分之一,因?yàn)樗⒘藥缀渭s束,從而允許進(jìn)一步優(yōu)化。在本工作中,我們遵循相同的原則;然而,我們沒有依賴傳統(tǒng)方法,而是提出了一種基于深度學(xué)習(xí)的對稱雙視圖關(guān)聯(lián)(STA)模型,該模型在SLAM過程中無需相機(jī)內(nèi)參。

STA是一個(gè)深度神經(jīng)網(wǎng)絡(luò),輸入是任意兩張RGB圖像,輸出是這兩張圖之間的相對相機(jī)位姿,以及一個(gè)局部的點(diǎn)云地圖。

wKgZO2jRAJCAFEeXAAEwjfRzvyY742.png

如圖3所示,以往的非對稱(Asymmetric)架構(gòu),通常需要兩個(gè)獨(dú)立的解碼器來分別預(yù)測兩張視圖在同一個(gè)共享坐標(biāo)系下的點(diǎn)云。而ViSTA-SLAM的對稱(Symmetric)架構(gòu),則 僅用一個(gè)解碼器 來回歸局部點(diǎn)云圖,同時(shí)預(yù)測出相對位姿。這種設(shè)計(jì)有兩大好處:

極致輕量:由于共享了大部分網(wǎng)絡(luò)結(jié)構(gòu),并且減少了一個(gè)解碼器,其模型參數(shù)量大幅降低。作者指出,其前端模型大小僅為0.4B參數(shù),相比之前SOTA方法的0.7B,減少了超過65%。

約束更優(yōu):對稱的設(shè)計(jì)使得從(圖A, 圖B)預(yù)測的位姿,與從(圖B, 圖A)預(yù)測的位姿天然地互為逆矩陣,這為后端的位姿圖優(yōu)化提供了更規(guī)整、更優(yōu)質(zhì)的約束。

后端位姿圖優(yōu)化

前端提供了大量的、兩兩視圖間的局部運(yùn)動(dòng)估計(jì)。后端的目標(biāo)就是將這些“碎片化”的信息拼成一幅完整的“拼圖”。

ViSTA-SLAM的后端構(gòu)建了一個(gè) Sim(3)位姿圖。在圖中,每個(gè)相機(jī)視圖是一個(gè)節(jié)點(diǎn),而由前端STA模型估計(jì)出的相對位姿則構(gòu)成了連接節(jié)點(diǎn)的邊。構(gòu)建這樣一個(gè)圖的好處是,可以通過圖優(yōu)化算法(如Levenberg–Marquardt)來調(diào)整所有節(jié)點(diǎn)的位姿,使其全局誤差最小,從而有效抑制單步估計(jì)誤差累積而產(chǎn)生的“漂移”。

wKgZO2jRAJCAdXS6AAD25-yqTTQ840.png

后端還集成了回環(huán)閉合(Loop Closures)檢測。當(dāng)系統(tǒng)檢測到相機(jī)回到了一個(gè)曾經(jīng)到過的地方時(shí),就會(huì)在位姿圖中當(dāng)前節(jié)點(diǎn)與歷史節(jié)點(diǎn)之間增加一條強(qiáng)力的“回環(huán)邊”(上圖中的橙色邊)。這條邊會(huì)像一個(gè)“錨”一樣,將整個(gè)軌跡拉回到正確的位置上,極大地消除累積誤差。

03實(shí)驗(yàn)評估

相機(jī)軌跡評估

在表1和表2中,我們報(bào)告了ATE均方根誤差。ViSTA-SLAM在兩個(gè)數(shù)據(jù)集上均取得了最佳的平均性能,分別比當(dāng)前的最先進(jìn)方法MASt3R-SLAM高出17%(0.055對比0.066)和13%(0.052對比0.060),并且超越了一些校準(zhǔn)方法,如Deep patch visual SLAM。在TUM-RGBD360場景中,ViSTA-SLAM的表現(xiàn)稍遜,這是由于主要的相機(jī)旋轉(zhuǎn)運(yùn)動(dòng)導(dǎo)致前端模糊和性能下降。其他方法如VGGT-SLAM要么采用更復(fù)雜的多視角前端,要么采用更密集的優(yōu)化來減少這種影響。純回歸方法由于存在遺忘效應(yīng),在相機(jī)運(yùn)動(dòng)幅度大且序列長的情況下難以保持一致的配準(zhǔn)。

在圖5中,我們展示了在7-Scenes辦公室和TUMRGBD房間上不同方法估計(jì)的軌跡。CUT3R在長序列上存在嚴(yán)重的遺忘問題;SLAM3R在具有挑戰(zhàn)性的TUM-RGBD房間場景中點(diǎn)配準(zhǔn)效果不佳,因此無法生成正確的相機(jī)位姿。與純回歸方法相比,MASt3R-SLAM和VGGT-SLAM表現(xiàn)良好,而ViSTA-SLAM則實(shí)現(xiàn)了更高的軌跡精度。

wKgZO2jRAJCAPnBMAADrfuoMZuU844.png

wKgZPGjRAJCAfE04AAEpe1Abwng573.png

密集重建評估

在表3中,我們對各種方法的重建質(zhì)量進(jìn)行了評估。

憑借精確的相機(jī)位姿和一致的局部點(diǎn)云,ViSTA-SLAM在所有方法中實(shí)現(xiàn)了最佳的切比雪夫距離。盡管采用了輕量級的兩視圖前端,但ViSTA-SLAM結(jié)合定制的Sim(3)位姿圖優(yōu)化,在精度(0.45對比0.52)方面顯著優(yōu)于多視圖前端方法,同時(shí)在完整性方面達(dá)到或超過了它們。

wKgZO2jRAJCATOf0AAGY4aj4AuE814.png

為了證明我們輕量級前端的有效性,我們添加了另一個(gè)強(qiáng)大的基準(zhǔn),用兩視圖的VGGT替換我們的STA模型作為前端,并進(jìn)行相同的姿態(tài)圖優(yōu)化。ViSTA-SLAM在切比雪夫距離、完整性和絕對軌跡誤差方面仍表現(xiàn)出色,突顯了我們的輕量級對稱前端在SLAM任務(wù)中優(yōu)于像VGGT這樣的大型多視圖模型。

在圖6中,我們展示了在7-Scenes的redkitchen、TUM-RGBD房間和BundleFusion的apt1場景中的定性重建結(jié)果。CUT3R由于遺忘問題無法正確重建,而SLAM3R在相機(jī)視角變化較大的場景中表現(xiàn)不佳。MASt3R-SLAM和VGGT-SLAM在物體邊界處產(chǎn)生偽影,無法清晰區(qū)分前景和背景,并且在不同視圖之間出現(xiàn)錯(cuò)位。相比之下,ViSTA-SLAM通過訓(xùn)練期間的幾何一致性約束克服了這些挑戰(zhàn)。值得注意的是,VGGT-SLAM在apt1場景中途失敗,因?yàn)楹蠖藘?yōu)化發(fā)散,這源于基于RANSAC的3D單應(yīng)性估計(jì)不穩(wěn)定,可能會(huì)采樣平面區(qū)域并造成歧義。在他們提出的SL(4)姿態(tài)圖優(yōu)化中。

模型大小與速度

我們在表4中比較了各方法的前端模型大小和處理速度。由于我們的對稱設(shè)計(jì),解碼器和回歸頭僅使用現(xiàn)有前饋模型參數(shù)的一半。因此,我們的模型更加緊湊:僅為MASt3R(用于MASt3R-SLAM)的64%,VGGT(用于VGGT-SLAM)的35%。

速度評估進(jìn)一步證實(shí)了ViSTA-SLAM實(shí)現(xiàn)了實(shí)時(shí)性能。得益于緊湊的前端和稀疏的位姿圖,我們的方法在運(yùn)行時(shí)間方面極具競爭力——比純回歸方法CUT3R和SLAM3R更快,與VGGT-SLAM相當(dāng)。值得注意的是,VGGT-SLAM每32個(gè)關(guān)鍵幀才進(jìn)行一次推理,減少了總的推理步驟。當(dāng)用兩視圖的VGGT替換我們的STA模型,每次輸入兩視圖信息時(shí),運(yùn)行速度顯著變慢,這進(jìn)一步證明了我們輕量級前端的有效性。表5展示了主要流水線組件所花費(fèi)的運(yùn)行時(shí)間百分比。解碼兩視圖信息和位姿圖優(yōu)化占據(jù)了處理時(shí)間的主導(dǎo)地位。

wKgZPGjRAJCAZqziAADgtDu9xlo874.png

wKgZPGjRAJCAfBxHAABulmz0tHo896.png

04總結(jié)

我們提出了一種新穎的單目無內(nèi)參SLAM,即ViSTA-SLAM,其前端采用輕量級的對稱兩視圖關(guān)聯(lián)模型,后端則采用具有閉環(huán)的Sim(3)位姿圖優(yōu)化。實(shí)驗(yàn)結(jié)果表明,ViSTA-SLAM在相機(jī)跟蹤精度和3D重建質(zhì)量方面表現(xiàn)出色。同時(shí),與當(dāng)前最先進(jìn)的方法相比,它更輕量,運(yùn)行速度更快或相當(dāng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 相機(jī)
    +關(guān)注

    關(guān)注

    5

    文章

    1540

    瀏覽量

    55442
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3656

    瀏覽量

    51754
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    456

    瀏覽量

    33194

原文標(biāo)題:更輕、更快!無需相機(jī)參數(shù),前端模型縮小65%,全新輕量級SLAM,ViSTA-SLAM

文章出處:【微信號(hào):gh_c87a2bc99401,微信公眾號(hào):INDEMIND】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    創(chuàng)建51輕量級操作系統(tǒng)

    創(chuàng)建51輕量級操作系統(tǒng)
    發(fā)表于 09-29 09:58

    10個(gè)輕量級框架

    這些輕量級框架使用HTML5和CSS3標(biāo)準(zhǔn)來幫助您快速開發(fā)跨平臺(tái)的Web移動(dòng)應(yīng)用和網(wǎng)站。
    發(fā)表于 07-17 08:25

    輕量級Agent平臺(tái)怎么測試?

    跨平臺(tái)的語言成功應(yīng)用于嵌入式設(shè)備中,同時(shí)也方便了嵌入式環(huán)境下的輕量Agent(Lightweight Agent)的實(shí)現(xiàn)。本文在ARM嵌入式環(huán)境下測試輕量級Agent平臺(tái)。
    發(fā)表于 09-27 06:26

    輕量級深度學(xué)習(xí)網(wǎng)絡(luò)是什么

    輕量級深度學(xué)習(xí)網(wǎng)絡(luò)概覽
    發(fā)表于 04-23 14:53

    輕量級的ui框架如何去制作

    原創(chuàng)分享:自制輕量級單片機(jī)UI框架框架元素用戶接口代碼開源平時(shí)??碿sdn,但是從來沒有自己寫過。正好這幾天需要用單片機(jī)做一個(gè)簡易的ui界面,于是自己寫了一個(gè)輕量級的ui框架。發(fā)個(gè)csdn分享給大家
    發(fā)表于 07-14 07:39

    一種嵌入式Linux輕量級GUI系統(tǒng)設(shè)計(jì)

    介紹了一種基于嵌入式Linux 的輕量級GUI 系統(tǒng)———SimGUI 的設(shè)計(jì)和實(shí)現(xiàn)過程,系統(tǒng)獨(dú)有的事件響應(yīng)引擎和事件過濾器機(jī)制,使SimGUI
    發(fā)表于 04-20 09:20 ?38次下載

    一種嵌入式Linux輕量級GUI系統(tǒng)設(shè)計(jì)

    介紹了一種基于嵌入式Linux 的輕量級GUI 系統(tǒng)———SimGUI 的設(shè)計(jì)和實(shí)現(xiàn)過程,系統(tǒng)獨(dú)有的事件響應(yīng)引擎和事件過濾器機(jī)制,使SimGUI
    發(fā)表于 04-24 10:26 ?14次下載

    基于Linux的輕量級嵌入式GUI系統(tǒng)及實(shí)現(xiàn)

    本文介紹了嵌入式圖形用戶界面(GUI)的特點(diǎn)、發(fā)展概況以及嵌入式圖形用戶界的實(shí)現(xiàn)方法。針對開發(fā)自主、輕型、占用資源少可配置的GUI系統(tǒng),提出了輕量級GUI系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)
    發(fā)表于 08-31 11:52 ?23次下載

    輕量級工作流引擎架構(gòu)設(shè)計(jì)

    為了克服傳統(tǒng)工作流管理系統(tǒng)的不足,設(shè)計(jì)了工作流管理型系統(tǒng)的原型體系結(jié)構(gòu),搭建了輕量級工作流引擎的核心架構(gòu),詳細(xì)地介紹輕量級工作流引擎各個(gè)組
    發(fā)表于 04-12 16:15 ?0次下載
    <b class='flag-5'>輕量級</b>工作流引擎架構(gòu)設(shè)計(jì)

    輕量級Kubernetes-K3S工具介紹

    K3s 是一個(gè)輕量級的 Kubernetes 發(fā)行版,它針對邊緣計(jì)算、物聯(lián)網(wǎng)等場景進(jìn)行了高度優(yōu)化。
    的頭像 發(fā)表于 06-21 16:50 ?3475次閱讀

    PSoC NeoPixel Easy輕量級

    電子發(fā)燒友網(wǎng)站提供《PSoC NeoPixel Easy輕量級庫.zip》資料免費(fèi)下載
    發(fā)表于 11-17 09:48 ?0次下載
    PSoC NeoPixel Easy<b class='flag-5'>輕量級</b>庫

    輕量級”的電源系統(tǒng),該如何設(shè)計(jì)?

    AC-DC及DC-DC轉(zhuǎn)換器和穩(wěn)壓器等電源管理器件,以及電路保護(hù)、連接器、線纜等電子元件組成。衡量一個(gè)PDN系統(tǒng)設(shè)計(jì)好壞有諸多指標(biāo),比如電能轉(zhuǎn)化效率,而今天有一個(gè)指標(biāo)被越來越多地提及和關(guān)注,這就是PDN的“輕量級”設(shè)計(jì)。 輕量級
    的頭像 發(fā)表于 04-05 17:05 ?1207次閱讀

    輕量級”的電源系統(tǒng),該如何設(shè)計(jì)

    PDN的作用,就是將來自主電源的電能通過轉(zhuǎn)換和傳輸,配送到各個(gè)負(fù)載點(diǎn)。PDN由AC-DC及DC-DC轉(zhuǎn)換器和穩(wěn)壓器等電源管理器件,以及電路保護(hù)、連接器、線纜等電子元件組成。衡量一個(gè)PDN系統(tǒng)設(shè)計(jì)好壞有諸多指標(biāo),比如電能轉(zhuǎn)化效率,而今天有一個(gè)指標(biāo)被越來越多地提及和關(guān)注,這就是PDN的“
    的頭像 發(fā)表于 05-20 14:50 ?1279次閱讀
    <b class='flag-5'>輕量級</b>”的電源<b class='flag-5'>系統(tǒng)</b>,該如何設(shè)計(jì)

    輕量級數(shù)據(jù)庫有哪些

    由于其小巧、快速、易用等優(yōu)勢,越來越受到人們的青睞。那么,輕量級數(shù)據(jù)庫有哪些?本文將為大家介紹幾種常見的輕量級數(shù)據(jù)庫系統(tǒng)。 1. SQLite SQLite被廣泛應(yīng)用于各種移動(dòng)應(yīng)用程序、Web應(yīng)用程序和嵌入式
    的頭像 發(fā)表于 08-28 16:41 ?7314次閱讀

    百度智能云推出全新輕量級大模型

    在近日舉辦的百度智能云千帆產(chǎn)品發(fā)布會(huì)上,三款全新輕量級大模型——ERNIE Speed、ERNIE Lite以及ERNIE Tiny,引起了業(yè)界的廣泛關(guān)注。相較于傳統(tǒng)的千億級別參數(shù)大模型,這些輕量級大模型在參數(shù)量上有了顯著減少
    的頭像 發(fā)表于 03-22 10:28 ?1207次閱讀