chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

<bdo id="yrflq"><span id="yrflq"></span></bdo>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

MoDem解決了視覺強化學(xué)習(xí)領(lǐng)域的三個挑戰(zhàn)

【導(dǎo)讀】MetaAI這次發(fā)布的MoDem解決了視覺強化學(xué)習(xí)領(lǐng)域的三個挑戰(zhàn)，無需解碼器，效率最高提升250%，一起看看它有多牛。

12月27日，MetaAI 負(fù)責(zé)視覺和強化學(xué)習(xí)領(lǐng)域的A

截止27日晚間，這篇推文的閱讀量已經(jīng)達(dá)到73.9k。

他表示，僅給出5個演示，MoDem就能在100K交互步驟中解決具有稀疏獎勵和高維動作空間的具有挑戰(zhàn)性的視覺運動控制任務(wù)，大大優(yōu)于現(xiàn)有的最先進(jìn)方法。

有多優(yōu)秀呢？

他們發(fā)現(xiàn)MoDem在完成稀疏獎勵任務(wù)方面的成功率比低數(shù)據(jù)機制中的先前方法高出150%-250%。

Lecun也轉(zhuǎn)發(fā)了這一研究，表示MoDem的模型架構(gòu)類似于JEPA，可在表征空間做出預(yù)測且無需解碼器。

鏈接小編就放在下面啦，有興趣的小伙伴可以看看~

論文鏈接：https://arxiv.org/abs/2212.05698

Github鏈接：https://github.com/facebookresearch/modem

研究創(chuàng)新和模型架構(gòu)

樣本效率低下是實際應(yīng)用部署深度強化學(xué)習(xí) (RL) 算法的主要挑戰(zhàn)，尤其是視覺運動控制。

基于模型的RL有可能通過同時學(xué)習(xí)世界模型并使用合成部署來進(jìn)行規(guī)劃和政策改進(jìn)，從而實現(xiàn)高樣本效率。

然而在實踐中，基于模型的RL的樣本高效學(xué)習(xí)受到探索挑戰(zhàn)的瓶頸，這次研究恰恰解決了這些主要挑戰(zhàn)。

首先，MoDem分別通過使用世界模型、模仿+RL和自監(jiān)督視覺預(yù)訓(xùn)練，解決了視覺強化學(xué)習(xí)/控制領(lǐng)域的三個主要挑戰(zhàn)：

大樣本復(fù)雜性（Large sample complexity）

高維狀態(tài)和動作空間探索（Exploration in high-dimensional state and action space）

同步視覺表征和行為學(xué)習(xí)（Simultaneous learning of visual representations and behaviors）

這次的模型架構(gòu)類似于Yann LeCun的JEPA，并且無需解碼器。

作者Aravind Rajeswaran表示，相比Dreamer需要像素級預(yù)測的解碼器，架構(gòu)繁重，無解碼器架構(gòu)可支持直接插入使用SSL預(yù)訓(xùn)練的視覺表示。

此外基于IL+RL，他們提出了一個三階段算法：

BC預(yù)訓(xùn)練策略

使用包含演示和探索的種子數(shù)據(jù)集預(yù)訓(xùn)練世界模型，此階段對于整體穩(wěn)定性和效率很重要

通過在線互動微調(diào)世界模型

結(jié)果顯示，生成的算法在21個硬視覺運動控制任務(wù)中取得了SOTA結(jié)果（State-Of-The-Art result），包括Adroit靈巧操作、MetaWorld和DeepMind控制套件。

從數(shù)據(jù)上來看，MoDem在各項任務(wù)中的表現(xiàn)遠(yuǎn)遠(yuǎn)優(yōu)于其他模型，結(jié)果比之前的SOTA方法提升了150%到250%。

紅色線條為MoDem在各項任務(wù)中的表現(xiàn)

在此過程中，他們還闡明了MoDem中不同階段的重要性、數(shù)據(jù)增強對視覺MBRL的重要性以及預(yù)訓(xùn)練視覺表示的實用性。

最后，使用凍結(jié)的 R3M 功能遠(yuǎn)遠(yuǎn)優(yōu)于直接的 E2E 方法。這很令人興奮，表明視頻中的視覺預(yù)訓(xùn)練可以支持世界模型。

但8月數(shù)據(jù)強勁的E2E與凍結(jié)的R3M競爭，我們可以通過預(yù)訓(xùn)練做得更好。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

解碼器

解碼器

+關(guān)注

關(guān)注
9

文章
1225

瀏覽量
43746
Meta

Meta

+關(guān)注

關(guān)注
0

文章
325

瀏覽量
12496
強化學(xué)習(xí)

強化學(xué)習(xí)

+關(guān)注

關(guān)注
4

文章
273

瀏覽量
11996

原文標(biāo)題：Meta推出MoDem世界模型：解決視覺領(lǐng)域三大挑戰(zhàn)，LeCun轉(zhuǎn)發(fā)

文章出處：【微信號：CVSCHOOL，微信公眾號：OpenCV學(xué)堂】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

機器人發(fā)燒友

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證：湘B2-20260003 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费