chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌開發(fā)pipeline,在移動(dòng)設(shè)備上可實(shí)時(shí)計(jì)算3D目標(biāo)檢測

牽手一起夢 ? 來源:機(jī)器之心 ? 作者:佚名 ? 2020-03-13 15:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3月13日消息,谷歌宣布推出 MediaPipe Objectron,這是一種適用于日常物體的移動(dòng)端實(shí)時(shí)3D目標(biāo)檢測 pipeline,它能夠檢測 2D 圖像中的目標(biāo),并通過新創(chuàng)建 3D 數(shù)據(jù)集上訓(xùn)練的機(jī)器學(xué)習(xí)模型來估計(jì)這些目標(biāo)的姿態(tài)和大小。它在安卓、IOS 網(wǎng)頁等各種平臺上都能應(yīng)用機(jī)器學(xué)習(xí)媒體模型,并加入了移動(dòng)端試試 3D 檢測模型。目前 MediaPipe包含人臉檢測、手部檢測、頭發(fā)分割和視頻自動(dòng)橫豎屏轉(zhuǎn)換等功能。

MediaPipe 是一個(gè)用于構(gòu)建 pipeline 進(jìn)而處理不同模態(tài)感知數(shù)據(jù)的跨平臺開源框架,Objectron 則在 MediaPipe 中實(shí)現(xiàn),其能夠在移動(dòng)設(shè)備上實(shí)時(shí)計(jì)算目標(biāo)的定向 3D 邊界框。從單個(gè)圖像進(jìn)行 3D 目標(biāo)檢測。MediaPipe 可以在移動(dòng)端上實(shí)時(shí)確認(rèn)目標(biāo)對象的位置、方向以及大小。整個(gè)模型非常精簡,速度也非???,研究者將整套方案都開源了出來。

獲取真實(shí)的3D訓(xùn)練數(shù)據(jù)

隨著依賴于 3D 傳感器(如 LIDAR)的自動(dòng)駕駛行業(yè)發(fā)展普及,現(xiàn)在已有大量街道場景的 3D 數(shù)據(jù),但對于日常生活中擁有更細(xì)顆粒度的目標(biāo)來說,有標(biāo)注的 3D 數(shù)據(jù)集就非常有限了。所以,為了解決此問題,谷歌團(tuán)隊(duì)使用了 AR 會(huì)話(Session)數(shù)據(jù)開發(fā)了一種全新的數(shù)據(jù) Pipeline。

此外,隨著 ARCore 以及 ARkit 的出現(xiàn),數(shù)億體量的智能手機(jī)擁有了 AR 功能,并且能夠通過 AR 會(huì)話取獲取更多的信息,包括相機(jī)姿態(tài)、稀疏 3D 點(diǎn)云、光照估計(jì)以及平面區(qū)域估計(jì)。為了標(biāo)記真實(shí)數(shù)據(jù),團(tuán)隊(duì)構(gòu)建了一個(gè)全新的標(biāo)注工具,并且與 AR 會(huì)話數(shù)據(jù)一起使用,該標(biāo)注工具使標(biāo)注者得以快速標(biāo)記目標(biāo)的 3D 邊界框。

該工具使用了分屏視圖來顯示 2D 的視頻幀,同時(shí)在其左側(cè)疊加 3D 邊界框,并在右側(cè)顯示 3D 點(diǎn)云,攝像機(jī)方位以及所檢測到的水平面。標(biāo)注器在 3D 視圖中繪制 3D 邊界框,并通過查看 2D 視頻幀中的投影來驗(yàn)證其位置。

左:帶標(biāo)注的 3D 邊界框所形成的投影展示在邊界框頂部,更易于驗(yàn)證標(biāo)注;右:通過檢測到的目標(biāo)表面以及稀疏點(diǎn)云數(shù)據(jù),可以為不同的相機(jī)姿態(tài)標(biāo)注真實(shí)世界中的 3D 邊界框。

AR 合成數(shù)據(jù)

之前常用的方法會(huì)根據(jù)合成數(shù)據(jù)補(bǔ)充真實(shí)數(shù)據(jù),以提高預(yù)測的準(zhǔn)確性。然而這樣的做法通常會(huì)導(dǎo)致質(zhì)量低下、不真實(shí)的數(shù)據(jù),且如果要執(zhí)行圖像的真實(shí)感渲染,又需要更多的計(jì)算力。

研究者采用了另一種稱之為 AR 合成數(shù)據(jù)(AR Synthetic Data Generation)的方法,只要將對象放到 AR 系統(tǒng)的工作場景中,我們就能利用相機(jī)姿態(tài)估計(jì)、水平面檢測、光照估計(jì)生成物理上可能存在的位置及場景。這種方法能生成高質(zhì)量合成數(shù)據(jù),并無縫匹配實(shí)際背景。通過結(jié)合真實(shí)數(shù)據(jù)與 AR 合成數(shù)據(jù),研究者能將模型的準(zhǔn)確性提高約 10%。

3D 目標(biāo)檢測的流程是什么樣的

對于 3D 目標(biāo)檢測,研究者先構(gòu)建了一個(gè)單階段模型 MobilePose,以預(yù)測單張 RGB 圖像中某個(gè)目標(biāo)的姿態(tài)和物理大小。該模型的主干是一個(gè)編碼器-解碼器架構(gòu),其構(gòu)建在 MobileNet V2 的基礎(chǔ)上。研究者應(yīng)用了多任務(wù)學(xué)習(xí)方法,來從檢測與回歸的角度聯(lián)合預(yù)測目標(biāo)的形狀,且在預(yù)測形狀的過程中,其只依賴于標(biāo)注的分割圖像。

MobilePose-Shape 網(wǎng)絡(luò)在中間層會(huì)帶有形狀預(yù)測模塊。

在模型的訓(xùn)練中,如果數(shù)據(jù)沒有標(biāo)注形狀,那也是可行的。只不過借助檢測邊界框,研究者可以預(yù)測形狀中心與分布。

為了獲得邊界框的最終 3D 坐標(biāo),研究者利用了一種完善的姿態(tài)估計(jì)算法(EPnP),它可以恢復(fù)對象的 3D 邊界框,而無需知道對象維度這一先驗(yàn)知識。給定 3D 邊界框,我們可以輕松計(jì)算對象的姿態(tài)和大小。

下圖顯示了網(wǎng)絡(luò)架構(gòu)和后處理過程,該模型輕巧到可以在移動(dòng)設(shè)備上實(shí)時(shí)運(yùn)行(在 Adreno 650 mobile GPU 上以 26 FPS 的速度運(yùn)行)。

3D 目標(biāo)檢測的神經(jīng)網(wǎng)絡(luò)架構(gòu)與后處理過程。

模型的示例結(jié)果,其中左圖為估計(jì)邊界框的原始 2D 圖像,中間為帶高斯分布的目標(biāo)檢測,最右邊為預(yù)測的分割 Mask。

在 MediaPipe 中進(jìn)行檢測和追蹤

當(dāng)模型對移動(dòng)設(shè)備獲得的每一幀圖像進(jìn)行計(jì)算的時(shí)候,它可能會(huì)遇到晃動(dòng)的情況,這是因?yàn)槊恳粠瑢δ繕?biāo)邊界框預(yù)測本身的模糊性造成的。為了緩解這個(gè)問題,研究者采用了檢測+追蹤的框架,這一框架近期被用于 2D 檢測和追蹤中。這個(gè)框架減少了需要在每一幀上運(yùn)行網(wǎng)絡(luò)的要求,因此可以讓模型的檢測更為精確,同時(shí)保證在移動(dòng)端上的實(shí)時(shí)性。它同時(shí)還能保持識別幀與幀之間的目標(biāo),確保預(yù)測的連貫性,減少晃動(dòng)。

為了進(jìn)一步提升這一 pipeline 的效率,研究者設(shè)置模型在每幾幀后再進(jìn)行一次模型推理。之后,他們使用名為快速動(dòng)作追蹤(instant motion tracking)和 Motion Stills 技術(shù)進(jìn)行預(yù)測和追蹤。當(dāng)模型提出一個(gè)新的預(yù)測時(shí),他們會(huì)根據(jù)重疊區(qū)域?qū)z測結(jié)果進(jìn)行合并。

為了鼓勵(lì)研究者和開發(fā)者基于這一 pipeline 進(jìn)行試驗(yàn),谷歌目前已經(jīng)將研究成果開源到了 MediaPipe 項(xiàng)目中,包括端到端的移動(dòng)設(shè)備應(yīng)用 demo,以及在鞋、椅子兩個(gè)分類中訓(xùn)練好的模型。研究者希望這一解決方案能夠更好地幫助到社區(qū),并產(chǎn)生新的方法、應(yīng)用和研究成果。團(tuán)隊(duì)也希望能夠擴(kuò)大模型到更多類別中,進(jìn)一步提升在移動(dòng)端設(shè)備的性能表現(xiàn)。

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    114819
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6252

    瀏覽量

    111228
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    中國移動(dòng)咪咕客廳大屏2D轉(zhuǎn)3D沉浸先鋒體驗(yàn)官北京招募啟幕

    月10日開啟,有意向的用戶掃描招募二維碼,填寫個(gè)人及家中智能電視相關(guān)信息完成報(bào)名,后續(xù)工作人員將對報(bào)名用戶進(jìn)行篩選,并及時(shí)通知符合條件的用戶結(jié)果。成功入選后,用戶可免費(fèi)享受3D智慧盒上門安裝服務(wù),
    發(fā)表于 02-14 10:02

    Vitrox的v510i系列的3D AOI光學(xué)檢測設(shè)備

    V510i部署SMT生產(chǎn)線的 貼片機(jī)之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務(wù)是: 3D與2D復(fù)合檢測
    的頭像 發(fā)表于 12-04 09:27 ?606次閱讀

    英倫科技裸眼3D顯示產(chǎn)品與其它廠家有什么差異化?

    懸浮感、地形演變縱深感)。利用AI眼球追蹤(0.02秒響應(yīng))和神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)計(jì)算視線落點(diǎn),解決了行業(yè)長期存在的“大尺寸與寬視角不可兼得”矛盾——傳統(tǒng)技術(shù)偏離中心視角
    的頭像 發(fā)表于 12-03 10:36 ?820次閱讀
    英倫科技裸眼<b class='flag-5'>3D</b>顯示產(chǎn)品與其它廠家有什么差異化?

    Vitrox 3D在線X-RAY檢測技術(shù)

    中國的核心代理商,致力于將前沿的自動(dòng)光學(xué)檢測技術(shù)帶給國內(nèi)電子制造業(yè)。今天,我們將深入剖析Vitrox核心技術(shù)之一——3D在線X-RAY自動(dòng)檢測系統(tǒng)?的工作原理 一、技術(shù)背景:為何需要3D
    的頭像 發(fā)表于 12-03 10:05 ?632次閱讀

    使用OpenUSD實(shí)現(xiàn)互操作3D工作流(

    通用場景描述簡稱 OpenUSD,是一個(gè)開放且擴(kuò)展的生態(tài)系統(tǒng),用于 3D 世界內(nèi)描述內(nèi)容、合成數(shù)據(jù)、進(jìn)行仿真和開展協(xié)作。
    的頭像 發(fā)表于 09-23 15:37 ?892次閱讀

    玩轉(zhuǎn) KiCad 3D模型的使用

    “ ?本文將帶您學(xué)習(xí)如何將 3D 模型與封裝關(guān)聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型。? ” ? 日常的 PCB 設(shè)計(jì)中,
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    。 ◆ 應(yīng)用2—機(jī)艙內(nèi)的 3D 傳感 應(yīng)用3—自主移動(dòng)機(jī)器人 (AMR) 室外(~150,000 勒克斯)和黑暗環(huán)境中進(jìn)行障礙物檢測
    發(fā)表于 09-05 07:24

    3D激光輪廓儀實(shí)現(xiàn)在線3D測量和檢測

    Z-Trak? Express 1K5 系列專為實(shí)現(xiàn)經(jīng)濟(jì)高效的在線3D測量和檢測而設(shè)計(jì),具有高速檢測能力和實(shí)時(shí)處理性能。
    的頭像 發(fā)表于 08-08 17:17 ?959次閱讀
    <b class='flag-5'>3D</b>激光輪廓儀<b class='flag-5'>可</b>實(shí)現(xiàn)在線<b class='flag-5'>3D</b>測量和<b class='flag-5'>檢測</b>

    如何提高3D成像設(shè)備的部署和設(shè)計(jì)優(yōu)勢

    設(shè)計(jì)時(shí)需平衡性能、成本與集成需求。標(biāo)準(zhǔn)化協(xié)議(如GigEVision)和軟件方案(如eBUSEdge)解決了設(shè)備兼容性問題,通過即插即用功能簡化系統(tǒng)集成,降低開發(fā)復(fù)雜度,推動(dòng)3D視覺從專業(yè)領(lǐng)域向主流應(yīng)用轉(zhuǎn)型。
    的頭像 發(fā)表于 08-06 15:49 ?735次閱讀
    如何提高<b class='flag-5'>3D</b>成像<b class='flag-5'>設(shè)備</b>的部署和設(shè)計(jì)優(yōu)勢

    基于DSP的SPWM混合查表實(shí)時(shí)計(jì)算

    ,內(nèi)部還集成了三相 PWM 波形發(fā)生器。兩者的結(jié)合,使我們完全能通過實(shí)時(shí)計(jì)算來產(chǎn)生任意頻率的 SPWM 波。TMS320F241的波形發(fā)生器屬于 DSP 芯片的外部事件管理模塊,占用CPU 的時(shí)間很少
    發(fā)表于 07-28 14:36

    基于樹莓派的工業(yè)級 3D 打印機(jī)!

    可靠、高性能的解決方案。解決方案樹莓派計(jì)算模塊4企業(yè)規(guī)模大型組織所屬行業(yè)制造業(yè)Formlabs是一家美國公司,專注于3D打印機(jī)以及相關(guān)軟件和材料的開發(fā)與制造。該公司
    的頭像 發(fā)表于 06-29 08:22 ?1133次閱讀
    基于樹莓派的工業(yè)級 <b class='flag-5'>3D</b> 打印機(jī)!

    海伯森3D閃測傳感器,工業(yè)檢測領(lǐng)域的高精度利器

    優(yōu)勢,解決了接觸式測量效率、精度、適應(yīng)性的瓶頸,尤其適合大批量生產(chǎn)、復(fù)雜結(jié)構(gòu)檢測、高附加值產(chǎn)品場景。工業(yè)檢測領(lǐng)域,
    的頭像 發(fā)表于 06-20 17:46 ?1451次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業(yè)<b class='flag-5'>檢測</b>領(lǐng)域的高精度利器

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區(qū)域(自定義區(qū)域)進(jìn)行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設(shè)置局部摩擦
    發(fā)表于 06-16 08:46

    告別漫長等待! 3D測量竟然可以如此的絲滑

    據(jù)進(jìn)行實(shí)時(shí)處理,快速得到全視角的彩色高精度2D圖像和3D點(diǎn)云。產(chǎn)品優(yōu)勢01高精度的在線3D檢測采用業(yè)界頂級的CMOS感光元件和超低畸變遠(yuǎn)心光
    的頭像 發(fā)表于 05-12 18:01 ?666次閱讀
    告別漫長等待! <b class='flag-5'>3D</b>測量竟然可以如此的絲滑

    ?超景深3D檢測顯微鏡技術(shù)解析

    發(fā)現(xiàn)潛在問題。此外,其高效的成像速度也大大提升了檢測效率,為工業(yè)生產(chǎn)帶來了顯著的經(jīng)濟(jì)效益。 上海桐爾的超景深3D檢測顯微鏡不僅在技術(shù)處于領(lǐng)先地位,其設(shè)計(jì)也充分考慮了用戶的實(shí)際需求。
    發(fā)表于 02-25 10:51