chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高明!OpenAI提出HER算法,人工智能可像人類一樣認(rèn)識(shí)錯(cuò)誤汲取教訓(xùn)

DPVg_AI_era ? 來(lái)源:未知 ? 作者:伍文輝 ? 2018-05-01 16:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

失敗是成功之母:HER有自我審視能力。

OpenAI的研究人員集中精力于構(gòu)建具有更強(qiáng)的學(xué)習(xí)能力的人工智能。得益于他們的增強(qiáng)學(xué)習(xí)系統(tǒng)OpenAI baselines,機(jī)器學(xué)習(xí)算法可以進(jìn)行自主學(xué)習(xí)。目前,這個(gè)新的算法保證人工智能可以像人類一樣從自己的錯(cuò)誤中汲取教訓(xùn)。

這個(gè)進(jìn)步源于OpenAI的研究人員在近期公布的名為“后見之明經(jīng)驗(yàn)復(fù)現(xiàn)(Hindsight Experience Reply, HER)”的開源算法。正如名字所示,HER幫助人工智能系統(tǒng)在完成一項(xiàng)任務(wù)后,具有自我審視的能力。OpenAI的博客中提到,人工智能認(rèn)為失敗乃成功之母。

研究人員寫到:“構(gòu)建HER的關(guān)鍵在于利用人類的直覺(jué):在實(shí)現(xiàn)某個(gè)任務(wù)時(shí),雖然我們沒(méi)有成功,但是在這個(gè)過(guò)程中我們學(xué)到一些不一樣的東西,既然如此,為何不能將我們最終學(xué)到的知識(shí)作為我們最初的目標(biāo)呢?“

簡(jiǎn)而言之,這意味著每一次失敗的嘗試都是為了實(shí)現(xiàn)一個(gè)意想不到的“虛擬”目標(biāo),而非既定目標(biāo)。

回想一下你學(xué)騎單車的經(jīng)歷,在最開始的幾次嘗試中,你無(wú)法掌握平衡。但是這些經(jīng)驗(yàn)告訴了你怎么騎車是不正確的,怎么做不能保持平衡。就像在人類的學(xué)習(xí)過(guò)程中,每一次的失敗讓我們距離成功更進(jìn)一步。

獎(jiǎng)勵(lì)每一次失敗,并且失敗也不沮喪

通過(guò)使用HER,OpenAI希望他們的人工智能系統(tǒng)可以利用上述的方法來(lái)學(xué)習(xí)。與此同時(shí),這種算法也被作為增強(qiáng)學(xué)習(xí)模型中的獎(jiǎng)勵(lì)機(jī)制的替代算法。為了訓(xùn)練人工智能,使其具有獨(dú)立的學(xué)習(xí)能力,它需要包含一個(gè)獎(jiǎng)勵(lì)機(jī)制:如果人工智能算法達(dá)到了預(yù)期目標(biāo),就可以得到一個(gè)小獎(jiǎng)勵(lì),就像獎(jiǎng)勵(lì)給小孩子一塊奶油餅干一樣,否則就什么都得不到。另外一個(gè)系統(tǒng)根據(jù)人工智能距離預(yù)期目標(biāo)的距離來(lái)給出獎(jiǎng)勵(lì)。

但是這兩種算法并不是完美的。第一個(gè)算法會(huì)阻礙學(xué)習(xí),因?yàn)橐粋€(gè)人工智能算法在訓(xùn)練過(guò)程中要么得到獎(jiǎng)勵(lì),要么沒(méi)得到。另一方面,根據(jù)IEEE Spectrum報(bào)道的內(nèi)容顯示,第二系統(tǒng)在實(shí)現(xiàn)時(shí),需要衡量與目標(biāo)的距離并給出獎(jiǎng)勵(lì),這個(gè)過(guò)程是很需要技巧的。如果把每一個(gè)任務(wù)都當(dāng)作是后見之明的目標(biāo),即使人工智能系統(tǒng)沒(méi)有完成指定的任務(wù),HER也會(huì)提供一個(gè)獎(jiǎng)勵(lì)。這樣幫助人工智能更快更好地學(xué)習(xí)。

OpenAI 在他的的博客中提到:“通過(guò)進(jìn)行這種獎(jiǎng)勵(lì)機(jī)制的替換,強(qiáng)化學(xué)習(xí)算法在實(shí)現(xiàn)某些目標(biāo)后會(huì)獲得一個(gè)學(xué)習(xí)信號(hào),即使這個(gè)學(xué)習(xí)任務(wù)不是它最初希望實(shí)現(xiàn)的。如果重復(fù)這個(gè)過(guò)程,系統(tǒng)最終可以實(shí)現(xiàn)任意的目標(biāo),包括最初的既定目標(biāo)。

這種方法并不意味著使用HER方法可以完全簡(jiǎn)化人工智能系統(tǒng)學(xué)習(xí)某個(gè)任務(wù)的過(guò)程。研究者表示:“在機(jī)器人上使用HER進(jìn)行學(xué)習(xí)仍然很難實(shí)現(xiàn),因?yàn)檫@個(gè)過(guò)程需要大量的數(shù)據(jù)“。

無(wú)論如何,正如OpenAI的模型所顯示的,HER有助于鼓勵(lì)人工智能系統(tǒng)像人類一樣從錯(cuò)誤中學(xué)習(xí),兩者的主要區(qū)別在于人工智能在面對(duì)失敗的時(shí)候不會(huì)像一些脆弱的人類那樣傷心沮喪。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50284

    瀏覽量

    266801
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8560

    瀏覽量

    137198

原文標(biāo)題:高明!OpenAI提出HER算法,AI系統(tǒng)學(xué)會(huì)從錯(cuò)誤中學(xué)習(xí)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    未來(lái)五年,人工智能給你的生活帶來(lái)哪些改變

    未來(lái)五年,人工智能電力一樣,無(wú)聲無(wú)息地融入你生活的每個(gè)角落。它不是科幻電影里的機(jī)器人,而是系列能看、能聽、能分析、能預(yù)測(cè)的智能服務(wù)。
    的頭像 發(fā)表于 04-17 16:17 ?63次閱讀

    人工智能五大核心:芯片、算力、數(shù)據(jù)、算法、能源 !

    在全球科技革命的浩蕩浪潮中,人工智能已成為重塑人類文明形態(tài)的核心驅(qū)動(dòng)力。那么,人工智能究竟由何構(gòu)成?支撐其持續(xù)迭代進(jìn)化的內(nèi)在技術(shù)體系又是什么?本文聚焦人工智能發(fā)展的五大核心支柱:芯片、
    的頭像 發(fā)表于 04-16 12:47 ?385次閱讀
    <b class='flag-5'>人工智能</b>五大核心:芯片、算力、數(shù)據(jù)、<b class='flag-5'>算法</b>、能源 !

    淺談人工智能(2)

    。 強(qiáng)人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的
    的頭像 發(fā)表于 02-22 08:24 ?310次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問(wèn)題。相比之下,人工智能擅長(zhǎng)快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能人工智能融合的結(jié)果,就是芯片設(shè)計(jì)領(lǐng)域正
    的頭像 發(fā)表于 01-15 13:58 ?656次閱讀

    連載|開發(fā)工具,易安卓讓系統(tǒng)功能調(diào)用寫應(yīng)用邏輯一樣簡(jiǎn)單

    通過(guò)自研系統(tǒng)封裝庫(kù),易安卓將復(fù)雜的系統(tǒng)控制能力以接口形式開放給開發(fā)者,讓系統(tǒng)功能調(diào)用寫應(yīng)用邏輯一樣簡(jiǎn)單。
    的頭像 發(fā)表于 11-27 11:40 ?87次閱讀
    連載|開發(fā)工具,易安卓讓系統(tǒng)功能調(diào)用<b class='flag-5'>像</b>寫應(yīng)用邏輯<b class='flag-5'>一樣</b>簡(jiǎn)單

    怎么kell一樣設(shè)置rom下載起始地址?

    如題,怎么kell一樣設(shè)置rom下載起始地址?
    發(fā)表于 10-10 07:21

    AI看點(diǎn):OpenAI口氣建5個(gè)算力中心 去年中國(guó)人工智能產(chǎn)業(yè)規(guī)模超9千億元

    給大家?guī)?lái)一些人工智能資訊消息: OpenAI口氣建5個(gè)算力中心 日前,OpenAI公司正式宣布將與甲骨文、軟銀在美國(guó)新建五個(gè)大型人工智能
    的頭像 發(fā)表于 09-25 18:13 ?2183次閱讀

    現(xiàn)場(chǎng)解決EMC電磁輻射干擾:“望聞問(wèn)切”,中醫(yī)一樣

    南柯電子|現(xiàn)場(chǎng)解決EMC電磁輻射干擾:“望聞問(wèn)切”,中醫(yī)一樣
    的頭像 發(fā)表于 09-04 09:47 ?1019次閱讀

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!?(壹捌伍 柒零零玖 壹壹捌陸)
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!?(壹捌伍 柒零零玖 壹壹捌陸)
    發(fā)表于 08-07 14:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    天吃透條產(chǎn)業(yè)鏈:具身智能(AI+機(jī)器人)

    01 產(chǎn)業(yè)鏈全景圖 02 具身智能簡(jiǎn)介 簡(jiǎn)單來(lái)說(shuō),具身智能就是給人工智能賦予個(gè)實(shí)體,讓它能夠人類
    的頭像 發(fā)表于 06-19 09:21 ?2660次閱讀
    <b class='flag-5'>一</b>天吃透<b class='flag-5'>一</b>條產(chǎn)業(yè)鏈:具身<b class='flag-5'>智能</b>(AI+機(jī)器人)

    維智科技為什么提出時(shí)空人工智能

    世界的關(guān)鍵轉(zhuǎn)折點(diǎn)。為此,陶闖博士提出“時(shí)空人工智能”(Spatio-Temporal AI)概念,試圖系統(tǒng)性地回答個(gè)問(wèn)題:如何讓AI看得懂空間、學(xué)得會(huì)語(yǔ)義、做得了決策?
    的頭像 發(fā)表于 06-12 14:30 ?1024次閱讀

    如何構(gòu)建邊緣人工智能基礎(chǔ)設(shè)施

    隨著人工智能的不斷發(fā)展,其爭(zhēng)議性也越來(lái)越大;而在企業(yè)和消費(fèi)者的眼中,人工智能價(jià)值顯著。如同許多新興科技一樣,目前人工智能的應(yīng)用主要聚焦于大規(guī)模、基礎(chǔ)設(shè)施密集且高功耗的領(lǐng)域。然而,隨著
    的頭像 發(fā)表于 06-09 09:48 ?1181次閱讀

    這個(gè)超強(qiáng)AI模型!開始不聽人類指令,拒絕關(guān)閉!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 OpenAI現(xiàn)今最強(qiáng)大的人工智能推理模型“o3”被指在收到明確的人類指令時(shí),拒絕執(zhí)行關(guān)機(jī)操作。近日,人工智能安全研究公司Palisade Research在社交媒
    的頭像 發(fā)表于 05-28 00:06 ?7383次閱讀