chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于多次觀測融合的可交互三維高斯場景重建框架

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 2025-09-29 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

IGFuse基于多次觀測融合的可交互三維高斯場景重建

計算機視覺機器人領(lǐng)域,如何完整、真實地重建一個可交互的三維場景,一直是一個難題。傳統(tǒng)方法往往依賴復(fù)雜的多階段流程,比如先做分割,再進(jìn)行背景補全或修復(fù),或者需要對每個物體進(jìn)行密集掃描。這些方式不僅成本高、容易出錯,而且很難擴展到大規(guī)模的應(yīng)用場景。

我們提出的IGFuse提供了一種新的思路:通過多次場景掃描的融合來重建三維高斯場景。在不同掃描中,物體布局的自然移動能夠“揭示”那些在單次掃描里被遮擋的區(qū)域,從而幫助恢復(fù)完整的場景。為了保證重建的質(zhì)量,我們構(gòu)建了具有語義信息的高斯場,并在不同掃描之間保持光度和語義上的一致。同時,我們設(shè)計了一種偽中間場景狀態(tài)來解決多次掃描之間的對齊問題,并通過協(xié)同剪枝策略不斷優(yōu)化幾何結(jié)構(gòu)。

概述

可交互三維場景重建是推動計算機視覺與機器人智能發(fā)展的關(guān)鍵。然而,真實世界的頻繁遮擋使單次掃描無法完整捕捉場景信息,也因此限制了后續(xù)的全面交互。傳統(tǒng)方法往往依賴復(fù)雜流程或逐物體掃描,難以兼顧效率與完整性。為此,我們提出IGFuse,一個基于多次觀測融合的可交互三維高斯場景重建框架。它能夠利用多次掃描不同物體布局下的場景揭示被遮擋區(qū)域,并通過分割感知的高斯場和一致性約束實現(xiàn)高保真重建。用戶無需繁瑣步驟,即可獲得完整、可交互的三維場景。目前,IGFuse網(wǎng)站已上線,代碼也將于近期開源,歡迎大家關(guān)注與體驗。

? 項目主頁:

https://whhu7.github.io/IGFuse/

? 文章鏈接:

https://arxiv.org/pdf/2508.13153

?GitHub代碼

https://github.com/whhu7/IGFuse-code

輸入(左):同一個場景的多次掃描 (Multi-Scans) ,每次掃描中的物體布局都不同。

融合與分解(中):IGFuse通過一個多狀態(tài)聯(lián)合優(yōu)化過程,將所有掃描的信息融合成一個統(tǒng)一的、一致的場景表示,并將其分解為獨立的可動物體 (Optimized Objects) 和完整背景 (Optimized Background) 。

交互式生成(右):最終,用戶可以隨意地重新排列 (Object Rearrangement) 這些物體,生成全新的、高保真的場景狀態(tài)。

背景方法

996ef592-97c2-11f0-8c8f-92fbcf53809c.png

在構(gòu)建可交互的三維高斯場景時,不同范式有著明顯差異:

(a) 傳統(tǒng)單次掃描方法:依賴繁瑣的多階段后處理與修復(fù)操作,但往往會引入累積誤差與偽影;

(b) 基于物體的重建方法:需要對場景中每個物體進(jìn)行密集多視角掃描,再進(jìn)行顯式組合,過程復(fù)雜且成本高;

(c) 我們提出的IGFuse:則通過端到端的多次觀測融合,在跨狀態(tài)監(jiān)督下聯(lián)合優(yōu)化多狀態(tài)高斯場,不僅能有效補償不同掃描視角下的遮擋,還能實現(xiàn)高質(zhì)量的可交互三維高斯重建。

總體框架

對于N個掃描場景,我們每次從中選取兩個場景掃描i和j,進(jìn)行一次對齊優(yōu)化。

雙向?qū)R

IGFuse通過物體級變換矩陣99d0acb0-97c2-11f0-8c8f-92fbcf53809c.png來實現(xiàn)高斯?fàn)顟B(tài)遷移9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png。隨后,利用對齊損失9a875d70-97c2-11f0-8c8f-92fbcf53809c.png將遷移后的高斯9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png的渲染圖像與掃描j下的真實觀測對齊,反之亦然。

偽狀態(tài)引導(dǎo)對齊

雙向?qū)R雖能有效約束,但僅在兩個已知狀態(tài)間提供監(jiān)督,難以保證模型泛化到任意的、未見的中間狀態(tài)。為此,IGFuse引入一個虛擬的“偽狀態(tài)”,相當(dāng)于一個公共的中轉(zhuǎn)空間,把兩個狀態(tài)都分別變換到這一共享偽狀態(tài),再加上額外約束9b35545c-97c2-11f0-8c8f-92fbcf53809c.png,確保渲染結(jié)果完全一致,迫使模型學(xué)習(xí)更本質(zhì)、更一致的場景表示,并提升對任意新狀態(tài)的泛化能力。

協(xié)同互斥剪枝

為了消除因分割不準(zhǔn)或狀態(tài)變換不精確而產(chǎn)生的“偽影”和懸浮高斯,IGFuse設(shè)計了一種協(xié)同剪枝機制。當(dāng)將9b8d94b4-97c2-11f0-8c8f-92fbcf53809c.png變換到9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png的狀態(tài)時,對于中的每一個高斯,如果它在中9c3d3ea0-97c2-11f0-8c8f-92fbcf53809c.png找不到一個足夠近的“對應(yīng)點”,那么它就被認(rèn)為是移動操作遺留下來的“浮動點”,需要被剪枝。這個剪枝過程是雙向的,能夠共同提升兩個高斯場景的幾何純凈度。

通過這種“成對對齊+公共空間”的方式,N個掃描場景之間的差異能被逐步消除,從而得到完整、可靠的三維場景重建。

9c9bc18c-97c2-11f0-8c8f-92fbcf53809c.gif

新狀態(tài)合成結(jié)果

在新狀態(tài)合成任務(wù)中,我們的方法取得了最優(yōu)表現(xiàn)。相比之下,基于分割的算法如Gaussian Grouping容易在物體邊界處產(chǎn)生明顯的瑕疵,而DecoupledGaussian采用分割加修補的思路,但在復(fù)雜場景中修補區(qū)域與真實背景之間依然會出現(xiàn)不協(xié)調(diào)感。

在定量實驗上,我們在訓(xùn)練場景掃描之外拍攝了物體隨機排布的一個測試場景掃描,用作衡量高斯場在新狀態(tài)合成的真實性。在虛擬數(shù)據(jù)(上)和真實數(shù)據(jù)(下)的新狀態(tài)任務(wù)上,我們跟Ground Truth相比的PSNR和SSIM都顯著高于對比算法。

9dfb665e-97c2-11f0-8c8f-92fbcf53809c.png

9e611d32-97c2-11f0-8c8f-92fbcf53809c.png

前背景信息融合

我們的方法融合了不同場景掃描下的前景信息,從而在小車翻滾的不同狀態(tài)下實現(xiàn)更加逼真的模擬效果。

僅考慮背景時,我們的方法能夠融合多次掃描的信息,從而重建出完整的背景。

分割與深度結(jié)果

與基線方法Gaussian Grouping在新狀態(tài)下的表現(xiàn)相比,我們的方法能夠生成更加干凈的分割結(jié)果。Gaussian Grouping在二維分割中往往會在物體邊界處產(chǎn)生空洞或多余區(qū)域;在深度層面,其基于特征的分割無法覆蓋所有三維點,導(dǎo)致物體移動后遺留大量殘余點,并在物體移出的位置留下深度空洞。

總結(jié)與展望

IGFuse通過融合多次場景掃描信息,有效提升了新狀態(tài)合成的質(zhì)量,打通了從場景重建到多狀態(tài)真實模擬的完整流程。雙向?qū)R設(shè)計與偽狀態(tài)監(jiān)督相結(jié)合,有效解決了遮擋處理和邊界分割中的難題,進(jìn)一步保證了新狀態(tài)合成的準(zhǔn)確性與完整性。未來,該方法將作為一種融合式重建的范式持續(xù)演進(jìn),重點拓展到更加復(fù)雜和多樣的場景中,特別是面向長序列觀測下的高質(zhì)量融合重建。這不僅為真實環(huán)境中的持續(xù)感知與狀態(tài)合成提供了堅實基礎(chǔ),也為具身智能體在長期交互和復(fù)雜任務(wù)中的應(yīng)用開辟了新的可能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    30665

    瀏覽量

    220042
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7770

    瀏覽量

    92835

原文標(biāo)題:“補全”被遮擋的世界:IGFuse利用場景變化照片重建可交互3D空間

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    怎樣去設(shè)計一種基于RGB-D相機的三維重建無序抓取系統(tǒng)?

    為什么要開發(fā)一種三維重建無序抓取系統(tǒng)?三維重建無序抓取系統(tǒng)是由哪些部分組成的?三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新點?
    發(fā)表于 07-02 06:29

    基于紋理映射的醫(yī)學(xué)圖像三維重建

    提出了一種基于紋理映射的體繪制算法,提高了圖像的重建效率,增強了圖像的重建效果。算法實現(xiàn)了對二醫(yī)學(xué)圖像序列的三維重建,在目前通用的個人計算
    發(fā)表于 12-14 11:10 ?19次下載

    三維表面粗糙度高斯濾波快速算法

    三維表面粗糙度高斯濾波快速算法:研究了三維表面粗糙度評定基準(zhǔn)的數(shù)學(xué)模型及采用高斯濾波器得到三維表面評定基準(zhǔn)的數(shù)字算法,提出
    發(fā)表于 09-25 15:47 ?24次下載

    一種新穎實用的基于視覺導(dǎo)航的三維重建算法

    一種新穎實用的基于視覺導(dǎo)航的三維重建算法 根據(jù)立體視覺在視覺導(dǎo)航應(yīng)用中的特點,提出了由視差圖重建三維場景的整套算法。首先,推導(dǎo)視差圖里各點
    發(fā)表于 02-27 09:24 ?18次下載

    基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計與實現(xiàn)

    目前大部分的醫(yī)學(xué)圖像三維重建過程都是在PC機上完成的,由于PC機本身性能的限制和重建算法的復(fù)雜性,使得重建效率不高。針對這個問題,設(shè)計與實現(xiàn)了個基于FPGA(Field Progra
    發(fā)表于 03-15 13:52 ?45次下載

    一種簡化的三維模糊制器_沈勇

    一種簡化的三維模糊制器_沈勇
    發(fā)表于 03-19 11:46 ?0次下載

    基于雙目立體視覺的三維拼接和融合方法

    目前,在計算機視覺領(lǐng)域,越來越多的高精度三維重建方法以及實時定位和地圖構(gòu)建(SLAM)算法正在被提出用來對三維世界進(jìn)行描述和分析。在計算機圖形領(lǐng)域,快速和精細(xì)的三維建模與逼真的人機交互
    發(fā)表于 11-03 16:46 ?5次下載
    基于雙目立體視覺的<b class='flag-5'>三維</b>拼接和<b class='flag-5'>融合</b>方法

    如何使用單目視覺進(jìn)行高精度三維場景重建技術(shù)研究

    近年來,隨著計算機硬件的不斷快速更新,計算機的處理能力也不斷變強。同時場景三維模型的獲取技術(shù)越來越成熟,我們獲得場景三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于單目和雙目的
    發(fā)表于 12-24 15:55 ?7次下載
    如何使用單目視覺進(jìn)行高精度<b class='flag-5'>三維</b><b class='flag-5'>場景</b><b class='flag-5'>重建</b>技術(shù)研究

    基于圖像的三維物體重建:在深度學(xué)習(xí)時代的最新技術(shù)和趨勢綜述之訓(xùn)練

    前面幾節(jié)討論了直接從二觀測重建三維對象的方法。本節(jié)展示了如何使用附加提示,如中間表示和時間相關(guān)性來促進(jìn)三維重建。
    發(fā)表于 01-26 19:55 ?5次下載
    基于圖像的<b class='flag-5'>三維</b>物體<b class='flag-5'>重建</b>:在深度學(xué)習(xí)時代的最新技術(shù)和趨勢綜述之訓(xùn)練

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點云的三維重建和基于網(wǎng)格的三維重建,其中基于網(wǎng)格的
    的頭像 發(fā)表于 01-09 14:26 ?3688次閱讀

    NerfingMVS:引導(dǎo)優(yōu)化神經(jīng)輻射場實現(xiàn)室內(nèi)多視角三維重建

    既然Nerf可以表示場景三維信息,個自然的想法是能不能將NeRF應(yīng)用到室內(nèi)場景三維重建任務(wù)中呢。NeRF有著
    的頭像 發(fā)表于 02-13 11:20 ?4129次閱讀

    介紹一種基于圖像的三維重建方法

    當(dāng)前,對于場景的快速重建是重要的,目標(biāo)是實現(xiàn)個快速的、全面的三維重建模型。可以應(yīng)用于野外的林業(yè)資源保護(hù)、火災(zāi)和地震的災(zāi)后搶救、邊境安防
    的頭像 發(fā)表于 04-12 18:21 ?2184次閱讀

    三維場景點云理解與重建技術(shù)

    三維場景理解與重建技術(shù)主要包含場景點云特征提取、掃描點云配準(zhǔn)與融合場景理解與語義分割、掃描物體
    的頭像 發(fā)表于 08-08 16:58 ?2333次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>場景</b>點云理解與<b class='flag-5'>重建</b>技術(shù)

    如何實現(xiàn)整個三維重建過程

    在計算機視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。由于單視頻的信息不完全,因此三維重建需要利用經(jīng)驗知識,而多視圖的三維重建
    發(fā)表于 09-01 11:06 ?2557次閱讀
    如何實現(xiàn)整個<b class='flag-5'>三維重建</b>過程

    基于光學(xué)成像的物體三維重建技術(shù)研究

    隨著計算機科學(xué)和數(shù)字成像技術(shù)的飛速發(fā)展,光學(xué)成像技術(shù)在許多領(lǐng)域中得到了廣泛應(yīng)用,其中之便是物體三維重建。物體三維重建技術(shù)是一種通過計算機處理圖像數(shù)據(jù),獲得物體
    的頭像 發(fā)表于 09-15 09:29 ?1602次閱讀
    基于光學(xué)成像的物體<b class='flag-5'>三維重建</b>技術(shù)研究