chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>傳感與控制>圍棋人工智能基本原理及其意義

圍棋人工智能基本原理及其意義

2017-09-13 | rar | 2.78 MB | 次下載 | 免費(fèi)

資料介紹

  人工智能(Artificial Intelligence,AI)主要研究人類思

  維、行動(dòng)中那些尚未算法化的功能行為, 使機(jī)器像人的大

  腦一樣思考、行動(dòng)。長(zhǎng)期以來(lái), 圍棋作為一種智力博弈游

  戲, 以其變化莫測(cè)的博弈局面, 高度體現(xiàn)了人類的智慧, 為

  人工智能研究提供了一個(gè)很好的測(cè)試平臺(tái), 圍棋人工智能

  也是人工智能領(lǐng)域的一個(gè)重要挑戰(zhàn)。

  傳統(tǒng)的計(jì)算機(jī)下棋程序的基本原理, 是通過(guò)有限步數(shù)

  的搜索樹(shù), 即采用數(shù)學(xué)和邏輯推理方法, 把每一種可能的

  路徑都走一遍, 從中選舉出最優(yōu)路徑, 使得棋局勝算最大。

  這種下棋思路是充分發(fā)揮計(jì)算機(jī)運(yùn)算速度快、運(yùn)算量大等

  優(yōu)勢(shì)的“暴力搜索法”, 是人類在對(duì)弈規(guī)定的時(shí)間限制內(nèi)無(wú)

  法做到的。但是由于圍棋局面數(shù)量太大, 這樣的運(yùn)算量對(duì)

  于計(jì)算機(jī)來(lái)講也是相當(dāng)之大, 目前的計(jì)算機(jī)硬件無(wú)法在對(duì)

  弈規(guī)定的時(shí)間內(nèi), 使用計(jì)算機(jī)占絕對(duì)優(yōu)勢(shì)的“暴力搜索法”

  完成圍棋所有局面的擇優(yōu), 所以這樣的下棋思路不適用于

  圍棋對(duì)弈。

  搜索量巨大的問(wèn)題一直困擾著圍棋人工智能, 使其發(fā)

  展停滯不前,直到2 0 0 6 年, 蒙特卡羅樹(shù)搜索的應(yīng)用出現(xiàn),

  才使得圍棋人工智能進(jìn)入了嶄新的階段, 現(xiàn)代圍棋人工智

  能的主要算法是基于蒙特卡洛樹(shù)的優(yōu)化搜索。

  2 圍棋人工智能基本原理

  目前圍棋人工智能最杰出的代表, 是由谷歌旗下人工

  智能公司DeepMind創(chuàng)造的AlphaGo圍棋人工智能系統(tǒng)。它

  在與人類頂級(jí)圍棋棋手的對(duì)弈中充分發(fā)揮了其搜索和計(jì)

  算的優(yōu)勢(shì), 幾乎在圍棋界立于不敗之地。

  Alph a G o系統(tǒng)的基本原理是將深度強(qiáng)化學(xué)習(xí)方法與蒙

  特卡洛樹(shù)搜索結(jié)合, 使用有監(jiān)督學(xué)習(xí)策略網(wǎng)絡(luò)和價(jià)值網(wǎng)

  絡(luò), 極大減少了搜索空間, 即在搜索過(guò)程中的計(jì)算量, 提高

  了對(duì)棋局估計(jì)的準(zhǔn)確度。

  2.1 深度強(qiáng)化學(xué)習(xí)方法

  深度學(xué)習(xí)源于人工神經(jīng)網(wǎng)絡(luò)的研究, 人類大量的視覺(jué)

  聽(tīng)覺(jué)信號(hào)的感知處理都是下意識(shí)的, 是基于大腦皮層神經(jīng)

  網(wǎng)絡(luò)的學(xué)習(xí)方法, 通過(guò)模擬大腦皮層推斷分析數(shù)據(jù)的復(fù)雜

  層狀網(wǎng)絡(luò)結(jié)構(gòu), 使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)

  成的多個(gè)處理層對(duì)數(shù)據(jù)進(jìn)行高層抽象, 其過(guò)程類似于人們

  識(shí)別物體標(biāo)注圖片。現(xiàn)如今, 應(yīng)用最廣泛的深度學(xué)習(xí)模型

  包括: 卷積神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)、堆棧自編碼網(wǎng)絡(luò)和遞

  歸神經(jīng)網(wǎng)絡(luò)等。

  強(qiáng)化學(xué)習(xí)源于動(dòng)物學(xué)習(xí)、參數(shù)擾動(dòng)自適應(yīng)控制等理

  論, 通過(guò)模擬生物對(duì)環(huán)境以試錯(cuò)的方式進(jìn)行交互達(dá)到對(duì)環(huán)

  境的最優(yōu)適應(yīng)的方式, 通過(guò)不斷地反復(fù)試驗(yàn), 將變化無(wú)常

  的動(dòng)態(tài)情況與對(duì)應(yīng)動(dòng)作相匹配。強(qiáng)化學(xué)習(xí)系統(tǒng)設(shè)置狀態(tài)、

  動(dòng)作、狀態(tài)轉(zhuǎn)移概率和獎(jiǎng)賞四個(gè)部分, 在當(dāng)前狀態(tài)下根據(jù)

  策略選擇動(dòng)作, 執(zhí)行該過(guò)程并以當(dāng)前轉(zhuǎn)移概率轉(zhuǎn)移到下一

  狀態(tài), 同時(shí)接收環(huán)境反饋回來(lái)的獎(jiǎng)賞, 最終通過(guò)調(diào)整策略

  來(lái)最大化累積獎(jiǎng)賞。

  深度學(xué)習(xí)具有較強(qiáng)的感知能力, 但缺乏一定的決策能

  力; 強(qiáng)化學(xué)習(xí)具有決策能力, 同樣對(duì)感知問(wèn)題無(wú)能為力。深

  度強(qiáng)化學(xué)習(xí)方法是將具有感知能力的深度學(xué)習(xí)和具有決

  策能力的強(qiáng)化學(xué)習(xí)結(jié)合起來(lái), 優(yōu)勢(shì)互補(bǔ), 用深度學(xué)習(xí)進(jìn)行

  感知, 從環(huán)境中獲取目標(biāo)觀測(cè)信息, 提供當(dāng)前環(huán)境下的狀

  態(tài)信息; 然后用強(qiáng)化學(xué)習(xí)進(jìn)行決策, 將當(dāng)前狀態(tài)映射到相

  應(yīng)動(dòng)作, 基于初期匯報(bào)評(píng)判動(dòng)作價(jià)值。

  深度強(qiáng)化學(xué)習(xí)為復(fù)雜系統(tǒng)的感知決策問(wèn)題提供了一

  種全新的解決思路。

  2.2 蒙特卡洛樹(shù)搜索

  蒙特卡洛樹(shù)搜索是將蒙特卡洛方法與樹(shù)搜索相結(jié)合

  形成的一種搜索方法。所謂蒙特卡洛方法是一種以概率統(tǒng)

  計(jì)理論為指導(dǎo)的強(qiáng)化學(xué)習(xí)方法, 它通常解決某些隨機(jī)事件

  出現(xiàn)的概率問(wèn)題, 或者是某隨機(jī)變量的期望值等數(shù)字特征

  問(wèn)題。通過(guò)與環(huán)境的交互, 從所采集的樣本中學(xué)習(xí), 獲得關(guān)

  于決策過(guò)程的狀態(tài)、動(dòng)作和獎(jiǎng)賞的大量數(shù)據(jù), 最后計(jì)算出

  累積獎(jiǎng)賞的平均值。

  蒙特卡洛樹(shù)搜索算法是一種用于解決完美信息博弈

 ?。╬erfect information games,沒(méi)有任何信息被隱藏的游戲)

  的方法,主要包含選擇(Selection)、擴(kuò)展(Expansion)、模擬

加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1PC0805全集成單相無(wú)刷直流電機(jī)可編程閉環(huán)驅(qū)動(dòng)器英文資料
  2. 0.59 MB   |  1次下載  |  免費(fèi)
  3. 2變頻器維修資料大全
  4. 1.28 MB   |  1次下載  |  4 積分
  5. 3HD-1二合一恒電位儀的工作原理
  6. 0.01 MB   |  次下載  |  1 積分
  7. 4rk3562ddr4設(shè)計(jì)資料圖
  8. 0.74 MB   |  次下載  |  2 積分
  9. 5SQ33239 CPC8 ZVS 反激同步整流技術(shù)手冊(cè)
  10. 1.62 MB   |  次下載  |  免費(fèi)
  11. 6變頻器維修入門
  12. 1.08 MB   |  次下載  |  4 積分
  13. 7SY5231 次級(jí)側(cè)同步整流技術(shù)手冊(cè)
  14. 0.89 MB   |  次下載  |  免費(fèi)
  15. 8LT3580 升壓/反相DC/DC 帶2A開(kāi)關(guān)的轉(zhuǎn)換器技術(shù)手冊(cè)
  16. 0.46 MB   |  次下載  |  免費(fèi)

本月

  1. 1EMC PCB設(shè)計(jì)總結(jié)
  2. 0.33 MB   |  10次下載  |  免費(fèi)
  3. 2耗盡型MOS FET產(chǎn)品目錄選型表
  4. 0.14 MB   |  4次下載  |  免費(fèi)
  5. 3PD取電芯片 ECP5702規(guī)格書(shū)
  6. 0.88 MB   |  4次下載  |  免費(fèi)
  7. 4九陽(yáng)JYCP-21ZD-A主控板電路圖資料
  8. 2.33 MB   |  2次下載  |  10 積分
  9. 5氮化鎵GaN FET/GaN HEMT 功率驅(qū)動(dòng)電路選型表
  10. 0.10 MB   |  2次下載  |  免費(fèi)
  11. 6TI系列-米爾TI AM62L核心板開(kāi)發(fā)板-高能效低功耗嵌入式平臺(tái)
  12. 1.51 MB  |  1次下載  |  免費(fèi)
  13. 7PD取電芯片,可取5/9/12/15/20V電壓ECP5702數(shù)據(jù)手冊(cè)
  14. 0.88 MB   |  1次下載  |  免費(fèi)
  15. 8飛騰S5000C-64雙路服務(wù)器系列應(yīng)用宣傳冊(cè)--一乘科技
  16. 945.81 KB  |  1次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233095次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191464次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  10. 158M  |  183360次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81606次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73832次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分