男女裸性视频免费观看网站,亚洲男人的天堂精品

讓機器擁有像人類一樣感知 3D 物體和環(huán)境的能力，是人工智能領(lǐng)域的一項重要課題。牛津大學(xué)計算機科學(xué)系博士生 Bo Yang 在其畢業(yè)論文中詳細解讀了如何重建和分割 3D 物體，進而賦予機器感知 3D 環(huán)境的能力，突破了人工智能和機器理解的界限。

賦予機器像人類一樣感知三維真實世界的能力，這是人工智能領(lǐng)域的一個根本且長期存在的主題?？紤]到視覺輸入具有不同類型，如二維或三維傳感器獲取的圖像或點云，該領(lǐng)域研究中一個重要的目標是理解三維環(huán)境的幾何結(jié)構(gòu)和語義。

傳統(tǒng)方法通常利用手工構(gòu)建的特征來估計物體或場景的形狀和語義。但是，這些方法難以泛化至新物體和新場景，也很難克服視覺遮擋的關(guān)鍵問題。

今年九月畢業(yè)于牛津大學(xué)計算機科學(xué)系的博士生 Bo Yang 在其畢業(yè)論文《Learning to Reconstruct and Segment 3D Objects》中對這一主題展開了研究。與傳統(tǒng)方法不同，作者通過在大規(guī)模真實世界的三維數(shù)據(jù)上訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)來學(xué)習通用和魯棒表示，進而理解場景以及場景中的物體。

總體而言，本文開發(fā)了一系列新型數(shù)據(jù)驅(qū)動算法，以實現(xiàn)機器感知到真實世界三維環(huán)境的目的。作者表示：「本文可以說是突破了人工智能和機器理解的界限?！?/p>

這篇博士論文有 143 頁，共六章。機器之心對該論文的核心內(nèi)容進行了簡要介紹，感興趣的讀者可以閱讀論文原文。

論文地址：https://arxiv.org/pdf/2010.09582.pdf

論文概述

作者在第 2 章首先回顧了以往 3D 物體重建和分割方面的研究工作，包括單視圖和多視圖 3D 物體重建、3D 點云分割、對抗生成網(wǎng)絡(luò)（GAN）、注意力機制以及集合上的深度學(xué)習。此外，本章最后還介紹了在單視圖 / 多視圖 3D 重建和 3D 點云分割方面，該研究相較于 SOTA 方法的新穎之處。

基于單視圖的 3D 物體重建

在第 3 章，作者提出以一種基于 GAN 的深度神經(jīng)架構(gòu)來從單一的深度視圖學(xué)習物體的密集 3D 形狀。作者將這種簡單但有效的模型稱為 3D-RecGAN++，它將殘差連接（skip-connected）的 3D 編碼器 - 解碼器和對抗學(xué)習結(jié)合，以生成單一 2.5D 視圖條件下的完整細粒度 3D 結(jié)構(gòu)。該模型網(wǎng)絡(luò)架構(gòu)的訓(xùn)練和測試流程如下圖所示：

接著，作者利用條件對抗訓(xùn)練來細化編碼器 - 解碼器估計的 3D 形狀，其中用于 3D 形狀細化的判別器結(jié)構(gòu)示意圖如下：

最后，作者將提出的 3D-RecGAN++ 與 SOTA 方法做了對比，并進行了控制變量研究。在合成和真實數(shù)據(jù)集上的大量實驗結(jié)果表明，該模型性能良好。

基于多視圖的 3D 物體重建

在第 4 章，作者提出以一種新的基于注意力機制的神經(jīng)模塊來從多視圖中推理出更好的 3D 物體形狀。這種簡單但高效的注意力聚合模塊被稱為 AttSets，其結(jié)構(gòu)如下圖所示。與現(xiàn)有方法相比，這種方法可以學(xué)習從不同圖像中聚合有用信息。

此外，研究者還引入了兩階段訓(xùn)練算法，以確保在給出一定數(shù)量輸入圖像的情況下，預(yù)估的 3D 形狀具有魯棒性。研究者在多個數(shù)據(jù)集上進行了實驗，證明該方法能夠精確地恢復(fù)物體的 3D 形狀。

從點云中學(xué)習分割 3D 物體

在第五章中，研究者提出了一個新的框架來識別大規(guī)模 3D 場景中的所有單個 3D 物體。與現(xiàn)有的研究相比，該研究的框架能夠直接并且同時進行檢測、分割和識別所有的目標實例，而無需任何繁瑣的前 / 后處理步驟。研究者在多個大型實際數(shù)據(jù)集上展現(xiàn)了該方法相對于基線的性能提升。

作者介紹

本文作者 Bo Yang 現(xiàn)為香港理工大學(xué)計算機系助理教授。他本科和碩士分別畢業(yè)于北京郵電大學(xué)和香港大學(xué)，然后進入牛津大學(xué)計算機科學(xué)系攻讀博士學(xué)位，其導(dǎo)師為 Niki Trigoni 和 Andrew Markham 教授。

Bo Yang 作為一作以及合著的論文曾被《計算機視覺國際期刊》（IJCV）以及 NeurIPS 和 CVPR 等學(xué)術(shù)會議接收，谷歌學(xué)術(shù)主頁上顯示他共著有 22 篇論文，被引用數(shù)超過 400。

論文目錄如下：

責任編輯：PSY

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴