電子發(fā)燒友網(wǎng)>電子資料下載>傳感與控制>圍棋人工智能基本原理及其意義

圍棋人工智能基本原理及其意義

2474220 2017-09-13 | rar | 2.78 MB | 次下載 | 免費(fèi)

普通下載普通下載

資料介紹

　　人工智能（Artificial Intelligence，AI）主要研究人類思

　　維、行動(dòng)中那些尚未算法化的功能行為，使機(jī)器像人的大

　　腦一樣思考、行動(dòng)。長(zhǎng)期以來(lái)，圍棋作為一種智力博弈游

　　戲，以其變化莫測(cè)的博弈局面，高度體現(xiàn)了人類的智慧，為

　　人工智能研究提供了一個(gè)很好的測(cè)試平臺(tái)，圍棋人工智能

　　也是人工智能領(lǐng)域的一個(gè)重要挑戰(zhàn)。

　　傳統(tǒng)的計(jì)算機(jī)下棋程序的基本原理，是通過(guò)有限步數(shù)

　　的搜索樹(shù)，即采用數(shù)學(xué)和邏輯推理方法，把每一種可能的

　　路徑都走一遍，從中選舉出最優(yōu)路徑，使得棋局勝算最大。

　　這種下棋思路是充分發(fā)揮計(jì)算機(jī)運(yùn)算速度快、運(yùn)算量大等

　　優(yōu)勢(shì)的“暴力搜索法”，是人類在對(duì)弈規(guī)定的時(shí)間限制內(nèi)無(wú)

　　法做到的。但是由于圍棋局面數(shù)量太大，這樣的運(yùn)算量對(duì)

　　于計(jì)算機(jī)來(lái)講也是相當(dāng)之大，目前的計(jì)算機(jī)硬件無(wú)法在對(duì)

　　弈規(guī)定的時(shí)間內(nèi)，使用計(jì)算機(jī)占絕對(duì)優(yōu)勢(shì)的“暴力搜索法”

　　完成圍棋所有局面的擇優(yōu)，所以這樣的下棋思路不適用于

　　圍棋對(duì)弈。

　　搜索量巨大的問(wèn)題一直困擾著圍棋人工智能，使其發(fā)

　　展停滯不前，直到2 0 0 6 年，蒙特卡羅樹(shù)搜索的應(yīng)用出現(xiàn)，

　　才使得圍棋人工智能進(jìn)入了嶄新的階段，現(xiàn)代圍棋人工智

　　能的主要算法是基于蒙特卡洛樹(shù)的優(yōu)化搜索。

　　2 圍棋人工智能基本原理

　　目前圍棋人工智能最杰出的代表，是由谷歌旗下人工

　　智能公司DeepMind創(chuàng)造的AlphaGo圍棋人工智能系統(tǒng)。它

　　在與人類頂級(jí)圍棋棋手的對(duì)弈中充分發(fā)揮了其搜索和計(jì)

　　算的優(yōu)勢(shì)，幾乎在圍棋界立于不敗之地。

　　Alph a G o系統(tǒng)的基本原理是將深度強(qiáng)化學(xué)習(xí)方法與蒙

　　特卡洛樹(shù)搜索結(jié)合，使用有監(jiān)督學(xué)習(xí)策略網(wǎng)絡(luò)和價(jià)值網(wǎng)

　　絡(luò)，極大減少了搜索空間，即在搜索過(guò)程中的計(jì)算量，提高

　　了對(duì)棋局估計(jì)的準(zhǔn)確度。

　　2.1 深度強(qiáng)化學(xué)習(xí)方法

　　深度學(xué)習(xí)源于人工神經(jīng)網(wǎng)絡(luò)的研究，人類大量的視覺(jué)

　　聽(tīng)覺(jué)信號(hào)的感知處理都是下意識(shí)的，是基于大腦皮層神經(jīng)

　　網(wǎng)絡(luò)的學(xué)習(xí)方法，通過(guò)模擬大腦皮層推斷分析數(shù)據(jù)的復(fù)雜

　　層狀網(wǎng)絡(luò)結(jié)構(gòu)，使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)

　　成的多個(gè)處理層對(duì)數(shù)據(jù)進(jìn)行高層抽象，其過(guò)程類似于人們

　　識(shí)別物體標(biāo)注圖片。現(xiàn)如今，應(yīng)用最廣泛的深度學(xué)習(xí)模型

　　包括：卷積神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)、堆棧自編碼網(wǎng)絡(luò)和遞

　　歸神經(jīng)網(wǎng)絡(luò)等。

　　強(qiáng)化學(xué)習(xí)源于動(dòng)物學(xué)習(xí)、參數(shù)擾動(dòng)自適應(yīng)控制等理

　　論，通過(guò)模擬生物對(duì)環(huán)境以試錯(cuò)的方式進(jìn)行交互達(dá)到對(duì)環(huán)

　　境的最優(yōu)適應(yīng)的方式，通過(guò)不斷地反復(fù)試驗(yàn)，將變化無(wú)常

　　的動(dòng)態(tài)情況與對(duì)應(yīng)動(dòng)作相匹配。強(qiáng)化學(xué)習(xí)系統(tǒng)設(shè)置狀態(tài)、

　　動(dòng)作、狀態(tài)轉(zhuǎn)移概率和獎(jiǎng)賞四個(gè)部分，在當(dāng)前狀態(tài)下根據(jù)

　　策略選擇動(dòng)作，執(zhí)行該過(guò)程并以當(dāng)前轉(zhuǎn)移概率轉(zhuǎn)移到下一

　　狀態(tài)，同時(shí)接收環(huán)境反饋回來(lái)的獎(jiǎng)賞，最終通過(guò)調(diào)整策略

　　來(lái)最大化累積獎(jiǎng)賞。

　　深度學(xué)習(xí)具有較強(qiáng)的感知能力，但缺乏一定的決策能

　　力；強(qiáng)化學(xué)習(xí)具有決策能力，同樣對(duì)感知問(wèn)題無(wú)能為力。深

　　度強(qiáng)化學(xué)習(xí)方法是將具有感知能力的深度學(xué)習(xí)和具有決

　　策能力的強(qiáng)化學(xué)習(xí)結(jié)合起來(lái)，優(yōu)勢(shì)互補(bǔ)，用深度學(xué)習(xí)進(jìn)行

　　感知，從環(huán)境中獲取目標(biāo)觀測(cè)信息，提供當(dāng)前環(huán)境下的狀

　　態(tài)信息；然后用強(qiáng)化學(xué)習(xí)進(jìn)行決策，將當(dāng)前狀態(tài)映射到相

　　應(yīng)動(dòng)作，基于初期匯報(bào)評(píng)判動(dòng)作價(jià)值。

　　深度強(qiáng)化學(xué)習(xí)為復(fù)雜系統(tǒng)的感知決策問(wèn)題提供了一

　　種全新的解決思路。

　　2.2 蒙特卡洛樹(shù)搜索

　　蒙特卡洛樹(shù)搜索是將蒙特卡洛方法與樹(shù)搜索相結(jié)合

　　形成的一種搜索方法。所謂蒙特卡洛方法是一種以概率統(tǒng)

　　計(jì)理論為指導(dǎo)的強(qiáng)化學(xué)習(xí)方法，它通常解決某些隨機(jī)事件

　　出現(xiàn)的概率問(wèn)題，或者是某隨機(jī)變量的期望值等數(shù)字特征

　　問(wèn)題。通過(guò)與環(huán)境的交互，從所采集的樣本中學(xué)習(xí)，獲得關(guān)

　　于決策過(guò)程的狀態(tài)、動(dòng)作和獎(jiǎng)賞的大量數(shù)據(jù)，最后計(jì)算出

　　累積獎(jiǎng)賞的平均值。

　　蒙特卡洛樹(shù)搜索算法是一種用于解決完美信息博弈

　?。╬erfect information games，沒(méi)有任何信息被隱藏的游戲）

　　的方法，主要包含選擇（Selection）、擴(kuò)展（Expansion）、模擬

加入交流群

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載下載該資料的人還在閱讀

更多 >

人工智能+消費(fèi)：技術(shù)賦能與芯片驅(qū)動(dòng)未來(lái) 9次下載
步進(jìn)馬達(dá)基本原理 9次下載
直流電源系統(tǒng)基本原理
數(shù)模和模數(shù)轉(zhuǎn)換的基本原理PPT課件下載 8次下載
開(kāi)關(guān)電源的基本原理及組成、不同技術(shù)綜述 50次下載
神經(jīng)網(wǎng)絡(luò)的基本原理 10次下載
半導(dǎo)體二極管參數(shù)符號(hào)及其意義總結(jié) 19次下載
BP神經(jīng)網(wǎng)絡(luò)基本原理簡(jiǎn)介 18次下載
蟻群算法的基本原理及其改進(jìn)算法.ppt 6次下載
實(shí)驗(yàn)二 AD09基本原理圖的設(shè)計(jì) 0次下載
人工智能彌補(bǔ)醫(yī)療資源的不足與診斷肺癌的介紹及其意義 0次下載
傅立葉變換紅外光譜儀的基本原理及其應(yīng)用 7次下載
智能控制--模糊控制的基本原理 0次下載
人工智能及其應(yīng)用 0次下載
VoIP的基本原理與技術(shù)

LLM預(yù)訓(xùn)練的基本概念、基本原理和主要優(yōu)勢(shì) 4.6k次閱讀
人工智能模型有哪些 3.1k次閱讀
人工智能深度學(xué)習(xí)的五大模型及其應(yīng)用領(lǐng)域 7.7k次閱讀
神經(jīng)網(wǎng)絡(luò)的基本原理 3k次閱讀
人工智能中文本分類的基本原理和關(guān)鍵技術(shù) 3.4k次閱讀
無(wú)功補(bǔ)償裝置的基本原理及作用 1.3k次閱讀
無(wú)功補(bǔ)償?shù)?b class="flag-6" style="color: red">意義及基本原理 1.2k次閱讀
什么是人工智能上百個(gè)人工智能的經(jīng)典問(wèn)答 6.8k次閱讀
淺析單片機(jī)中PWM的基本概念和基本原理 1.2w次閱讀
六張圖看懂人工智能的前世今生 4.9k次閱讀
騰訊微信翻譯團(tuán)隊(duì)開(kāi)源的人工智能圍棋項(xiàng)目 PhoenixGo 6.4k次閱讀
人工智能為何這么熱_人工智能價(jià)值與應(yīng)用_無(wú)人機(jī)屬于人工智能嗎 8.2k次閱讀
人工智能需要哪些知識(shí)_人工智能需要學(xué)什么_如何自學(xué)人工智能 4.5w次閱讀
為什么要發(fā)展人工智能_發(fā)展人工智能經(jīng)濟(jì)意義分析 4.9w次閱讀
“人工智能＋”或再掀新一輪熱潮經(jīng)濟(jì)形態(tài)迎巨變 639次閱讀

評(píng)論

資料 -- | 積分 --

查看他上傳的所有資料

+關(guān)注個(gè)人主頁(yè)

上傳資料賺積分

下載排行

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

圍棋人工智能基本原理及其意義

資料介紹

評(píng)論

下載排行

本周

本月

總榜

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

搜索歷史

圍棋人工智能基本原理及其意義

資料介紹

評(píng)論

下載排行

本周

本月

總榜

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费