chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開辟新篇章!谷歌機(jī)器學(xué)習(xí)又有新進(jìn)展!

DR2b_Aiobservat ? 來源:YXQ ? 2019-06-22 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在谷歌最新的論文中,研究人員提出了“非政策強(qiáng)化學(xué)習(xí)”算法OPC,它是強(qiáng)化學(xué)習(xí)的一種變體,它能夠評(píng)估哪種機(jī)器學(xué)習(xí)模型將產(chǎn)生最好的結(jié)果。數(shù)據(jù)顯示,OPC比基線機(jī)器學(xué)習(xí)算法有著顯著的提高,更加穩(wěn)健可靠。

在谷歌AI研究團(tuán)隊(duì)一篇新發(fā)表的論文《通過非政策分類進(jìn)行非政策評(píng)估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他們提出了所稱的“非政策分類”,即OPC(off-policy classification)。它能夠評(píng)估AI的表現(xiàn),通過將評(píng)估視為一個(gè)分類問題來驅(qū)動(dòng)代理性能。

研究人員認(rèn)為他們的方法是強(qiáng)化學(xué)習(xí)的一種變體,它利用獎(jiǎng)勵(lì)來推動(dòng)軟件政策實(shí)現(xiàn)與圖像輸入?yún)f(xié)同工作這個(gè)目標(biāo),并擴(kuò)展到包括基于視覺的機(jī)器人抓取在內(nèi)的任務(wù)。

“完全脫離政策強(qiáng)化學(xué)習(xí)是一種變體。代理完全從舊數(shù)據(jù)中學(xué)習(xí),對(duì)于工程師來說這是很有吸引力的,因?yàn)樗梢栽诓恍枰锢頇C(jī)器人的情況下進(jìn)行模型迭代。”

Robotics at Google(專注機(jī)器學(xué)的的谷歌新團(tuán)隊(duì))的軟件工程師Alexa Irpan寫道,“完全脫離政策的RL,可以在先前代理收集的同一固定數(shù)據(jù)集上訓(xùn)練多個(gè)模型,然后選擇出最佳的那個(gè)模型。”

但是OPC并不像聽起來那么容易,正如Irpan在論文中所描述的,非政策性強(qiáng)化學(xué)習(xí)可以通過機(jī)器人進(jìn)行人工智能模型培訓(xùn),但不能進(jìn)行評(píng)估。并且在需要評(píng)估大量模型的方法中,地面實(shí)況評(píng)估通常效率太低。

OPC在假設(shè)任務(wù)狀態(tài)變化方面幾乎沒有隨機(jī)性,同時(shí)假設(shè)代理在實(shí)驗(yàn)結(jié)束時(shí)用“成功或失敗”來解決這個(gè)問題。兩個(gè)假設(shè)中第二個(gè)假設(shè)的二元性質(zhì),允許為每個(gè)操作分配兩個(gè)分類標(biāo)簽(“有效”表示成功或“災(zāi)難性”表示失?。?/p>

另外,OPC還依賴Q函數(shù)(通過Q學(xué)習(xí)算法學(xué)習(xí))來估計(jì)行為的未來總回報(bào)。代理商選擇具有最大預(yù)期回報(bào)的行動(dòng),其績(jī)效通過所選行動(dòng)的有效頻率來衡量(這取決于Q函數(shù)如何正確地將行動(dòng)分類為有效與災(zāi)難性),并以分類準(zhǔn)確性作為非政策評(píng)估分?jǐn)?shù)。

(左圖為基線,右圖為建議的方法之一,SoftOpC)

谷歌AI團(tuán)隊(duì)使用完全非策略強(qiáng)化學(xué)習(xí)對(duì)機(jī)器學(xué)習(xí)策略進(jìn)行了模擬培訓(xùn),然后使用從以前的實(shí)際數(shù)據(jù)中列出的非策略分?jǐn)?shù)對(duì)其進(jìn)行評(píng)估。

在機(jī)器人抓取任務(wù)時(shí),他們報(bào)告OPC的一種變體SoftOPC在預(yù)測(cè)最終成功率方面表現(xiàn)最佳。假設(shè)有15種模型(其中7種純粹在模擬中訓(xùn)練)具有不同的穩(wěn)健性,SoftOPC產(chǎn)生的分?jǐn)?shù)與與真正的抓取成功密切相關(guān),并且相比于基線方法更加穩(wěn)定可靠。

在未來的研究中,研究人員打算用“噪聲”(noisier)和非二進(jìn)制動(dòng)力學(xué)來探索機(jī)器學(xué)習(xí)任務(wù)。“我們認(rèn)為這個(gè)結(jié)果有希望應(yīng)用于許多現(xiàn)實(shí)世界的RL問題,”Irpan在論文結(jié)尾寫道。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6257

    瀏覽量

    111939
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8560

    瀏覽量

    137201
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    神州數(shù)碼旗下神州鯤泰攜手江蘇紡知云開啟家紡產(chǎn)業(yè)數(shù)智化新篇章

     神州鯤泰攜手江蘇紡知云,以國(guó)產(chǎn)化算力底座融合家紡行業(yè)數(shù)據(jù),破解家紡企業(yè)研發(fā)與品控關(guān)鍵環(huán)節(jié)痛點(diǎn),單品開發(fā)效率提升10倍、驗(yàn)布效率提升3倍,開啟家紡產(chǎn)業(yè)數(shù)智化新篇章。
    的頭像 發(fā)表于 04-15 17:05 ?497次閱讀

    國(guó)資入主聯(lián)創(chuàng)電子開啟企業(yè)發(fā)展嶄新篇章

    冬日暖陽(yáng)耀贛江,聯(lián)創(chuàng)電子譜新章。2025年12月25日,聯(lián)創(chuàng)電子科技股份有限公司(證券簡(jiǎn)稱:聯(lián)創(chuàng)電子,股票代碼:002036)股票復(fù)牌,正式書寫企業(yè)發(fā)展歷程中的嶄新篇章。
    的頭像 發(fā)表于 01-09 14:47 ?715次閱讀

    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最新進(jìn)展

    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最新進(jìn)展
    的頭像 發(fā)表于 12-19 15:26 ?1681次閱讀
    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最<b class='flag-5'>新進(jìn)展</b>

    迅為Hi3403開發(fā)板驅(qū)動(dòng)教程全面上線,開啟嵌入式Linux開發(fā)新篇章!

    迅為iTOP-Hi3403開發(fā)板linux驅(qū)動(dòng)教程全面上線,開啟嵌入式Linux開發(fā)新篇章!
    的頭像 發(fā)表于 12-18 14:23 ?855次閱讀
    迅為Hi3403開發(fā)板驅(qū)動(dòng)教程全面上線,開啟嵌入式Linux開發(fā)<b class='flag-5'>新篇章</b>!

    廣汽集團(tuán)與華為數(shù)字能源開啟深度協(xié)同新篇章

    和充電表現(xiàn)、整車駕乘體驗(yàn)提升,圍繞動(dòng)力域相關(guān)系統(tǒng)和整車產(chǎn)品的設(shè)計(jì)、制造、銷售服務(wù)展開深入合作,開啟深度協(xié)同新篇章。
    的頭像 發(fā)表于 11-11 15:22 ?687次閱讀

    西班牙工程與技術(shù)公司攜手FLIR開啟高溫檢測(cè)新篇章

    在鋼鐵制造這一傳統(tǒng)而充滿挑戰(zhàn)的領(lǐng)域,高溫與惡劣環(huán)境如同兩道難以逾越的鴻溝,橫亙?cè)谔嵘a(chǎn)效率與質(zhì)量的道路上。然而,西班牙工程與技術(shù)先鋒BcB Informatica y Control攜手Flir公司,構(gòu)建了創(chuàng)新的技術(shù)解決方案,正為這一行業(yè)注入智能化升級(jí)的新動(dòng)力,開啟高溫檢測(cè)的新篇章。
    的頭像 發(fā)表于 11-02 11:37 ?1037次閱讀

    華為網(wǎng)絡(luò)技術(shù)賦能上海院開啟智慧建筑新篇章

    智慧建筑的實(shí)踐者和推動(dòng)者,也正在通過網(wǎng)絡(luò)技術(shù)的創(chuàng)新應(yīng)用,打造智慧、綠色的高品質(zhì)萬(wàn)兆園區(qū)新標(biāo)桿,以數(shù)智力量共拓“城市更新”嶄新篇章。
    的頭像 發(fā)表于 10-30 10:17 ?778次閱讀

    成都華微與具身科技開啟四川具身智能產(chǎn)業(yè)新篇章

    人形機(jī)器人整機(jī)平臺(tái)“天行者2號(hào)”,更迎來產(chǎn)業(yè)鏈多方戰(zhàn)略合作的重大突破,成都華微電子科技股份有限公司(以下簡(jiǎn)稱成都華微)作為核心硬件合作伙伴參與簽約,共同開啟四川具身智能產(chǎn)業(yè)新篇章。
    的頭像 發(fā)表于 09-30 11:48 ?1403次閱讀

    NVIDIA通過全新 Omniverse庫(kù)、Cosmos物理AI模型及AI計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章

    NVIDIA 通過全新 Omniverse 庫(kù)、Cosmos 物理 AI 模型及 AI 計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章 ? ·?全新 NVIDIA Omniverse NuRec 3D
    的頭像 發(fā)表于 08-12 11:29 ?1963次閱讀
    NVIDIA通過全新 Omniverse庫(kù)、Cosmos物理AI模型及AI計(jì)算基礎(chǔ)設(shè)施,為<b class='flag-5'>機(jī)器</b>人領(lǐng)域開啟<b class='flag-5'>新篇章</b>

    云臺(tái)電機(jī)驅(qū)動(dòng):開啟智能化時(shí)代的新篇章

    在科技飛速發(fā)展的今天,智能化已經(jīng)滲透到我們生活的方方面面。而在眾多科技領(lǐng)域中,云臺(tái)電機(jī)驅(qū)動(dòng)技術(shù)正以其獨(dú)特的魅力,開啟著智能化時(shí)代的新篇章。
    的頭像 發(fā)表于 07-23 18:16 ?1117次閱讀

    東風(fēng)汽車轉(zhuǎn)型突破取得新進(jìn)展

    上半年,東風(fēng)汽車堅(jiān)定高質(zhì)量發(fā)展步伐,整體銷量逐月回升,經(jīng)營(yíng)質(zhì)量持續(xù)改善,自主品牌和新能源滲透率和收益性進(jìn)一步提升,半年累計(jì)終端銷售汽車111.6萬(wàn)輛,轉(zhuǎn)型突破取得新進(jìn)展。
    的頭像 發(fā)表于 07-10 15:29 ?1023次閱讀

    編碼器線:精準(zhǔn)連接,高效傳動(dòng),引領(lǐng)科技新篇章

    在日新月異的科技時(shí)代,每一個(gè)微小的進(jìn)步都可能成為推動(dòng)行業(yè)變革的關(guān)鍵。編碼器線,這一看似不起眼的組件,卻在自動(dòng)化、智能制造、機(jī)器人技術(shù)等眾多高科技領(lǐng)域中扮演著至關(guān)重要的角色。今天,就讓我們一起走進(jìn)編碼器線的世界,探索它如何以精準(zhǔn)連接和高效傳動(dòng),引領(lǐng)科技新篇章。
    的頭像 發(fā)表于 06-27 16:57 ?1107次閱讀

    恭賀全球購(gòu)檢測(cè)榮獲CBTL資質(zhì),邁向國(guó)際檢測(cè)認(rèn)證新篇章

    恭賀全球通檢測(cè)榮獲CBTL資質(zhì)!邁向國(guó)際檢測(cè)認(rèn)證新篇章賦能中國(guó)企業(yè)全球化近日,中國(guó)檢測(cè)認(rèn)證領(lǐng)域迎來里程碑時(shí)刻——全球通檢測(cè)(GlobalTestingServices)正式通過國(guó)際電工
    的頭像 發(fā)表于 05-27 10:41 ?405次閱讀
    恭賀全球購(gòu)檢測(cè)榮獲CBTL資質(zhì),邁向國(guó)際檢測(cè)認(rèn)證<b class='flag-5'>新篇章</b>!

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們?cè)谖錆h舉辦了Create2025百度AI開發(fā)者大會(huì),與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展
    的頭像 發(fā)表于 04-30 10:14 ?1452次閱讀

    自動(dòng)巡檢環(huán)網(wǎng)柜局放監(jiān)測(cè)方案:智能守護(hù)電網(wǎng)安全的新篇章

    、保障電網(wǎng)安全具有重要意義。為此,自動(dòng)巡檢環(huán)網(wǎng)柜局放監(jiān)測(cè)方案應(yīng)運(yùn)而生,為電網(wǎng)安全守護(hù)開啟了新篇章。自動(dòng)巡檢,高效全面自動(dòng)巡檢環(huán)網(wǎng)柜局放監(jiān)測(cè)方案的核心在于其自動(dòng)化、智
    的頭像 發(fā)表于 04-24 09:39 ?849次閱讀
    自動(dòng)巡檢環(huán)網(wǎng)柜局放監(jiān)測(cè)方案:智能守護(hù)電網(wǎng)安全的<b class='flag-5'>新篇章</b>