最強(qiáng)AlphaGo Zero誕生自學(xué)3天100比0秒殺AlphaGo

2017-10-20 14:52:00

來(lái)源：臺(tái)灣網(wǎng)

字號(hào)

　　臺(tái)灣網(wǎng)10月20日訊　據(jù)臺(tái)灣“東森新聞雲(yún)”報(bào)道，今(2017)年5月，DeepMind公司創(chuàng)造的AlphaGo與圍棋世界冠軍柯潔在中國(guó)烏鎮(zhèn)對(duì)弈，以壓倒性的3:0勝出，人工智慧發(fā)展震驚全球。

　　不可思議的是，時(shí)隔不到半年，Google旗下AI實(shí)驗(yàn)室?guī)?lái)更強(qiáng)大的AlphaGo　Zero，它完全不需要倚靠人類(lèi)的知識(shí)和指導(dǎo)，從零開(kāi)始自我訓(xùn)練只需3天就100:0打敗舊版。

　　在過(guò)去，強(qiáng)大的人工智慧依靠人類(lèi)事前輸入大量資料，幫助它學(xué)習(xí)、訓(xùn)練技能，Alpha　Go成為圍棋大師前自然也不例外。近日，DeepMind公司在《自然》(Nature)科學(xué)期刊上發(fā)表一篇學(xué)術(shù)論文《不需要人類(lèi)知識(shí)就稱(chēng)霸圍棋》(Mastering　the　game　of　Go　without　human　knowledge)，展示了強(qiáng)化版的程式AlphaGo　Zero，證明在全球最困難的棋藝競(jìng)技中，人工智慧可以在沒(méi)有任何人類(lèi)知識(shí)的基礎(chǔ)上，純粹靠自我學(xué)習(xí)成為制霸王者。

　　AlphaGo　Zero代表從零開(kāi)始，DeepMind開(kāi)發(fā)團(tuán)隊(duì)只輸入了基本的圍棋規(guī)則，剩下的時(shí)間它會(huì)自行下棋，記錄下每次的勝負(fù)決策、不斷學(xué)習(xí),自己成為自己的老師，加上沒(méi)有人類(lèi)的經(jīng)驗(yàn)和成規(guī)束縛，讓人工智慧突破舊有的知識(shí)限制，發(fā)展出新的弈棋策略，快速達(dá)到登峰造極新境界。

　　AlphaGo　Zero誕生後，只花了3天時(shí)間就贏了去年打敗李世乭的AlphaGo版本，局?jǐn)?shù)勝負(fù)是毫無(wú)懸念的100:0。21天之後，AlphaGo　Zero再度進(jìn)化，能力超越了今年打敗世界冠軍柯潔的AlphaGo　Master版本；40天后，它完成了2900萬(wàn)次的對(duì)戰(zhàn)學(xué)習(xí)，與過(guò)去最強(qiáng)的AlphaGo對(duì)弈，它的勝率來(lái)到90%，成為至今最優(yōu)秀的版本，也是歷史上最強(qiáng)的“圍棋棋手”。

　　DeepMind指出，不使用任何人類(lèi)知識(shí)，AlphaGo　Zero使用的是新的“強(qiáng)化學(xué)習(xí)”方法，通過(guò)神經(jīng)網(wǎng)路和演演算法結(jié)合，持續(xù)自我對(duì)弈練習(xí)幾百萬(wàn)、幾千萬(wàn)場(chǎng)，每次的更新都能增強(qiáng)、調(diào)整系統(tǒng)，用以預(yù)測(cè)下一步落子的方向和遊戲輸贏走勢(shì)。幾天時(shí)間內(nèi)，AlphaGo　Zero就從一塊純潔的白板，在上頭不斷揮灑、創(chuàng)造知識(shí)，很快勝過(guò)了人類(lèi)累積千年的圍棋智慧。(臺(tái)灣網(wǎng)　孫伊靜)

[責(zé)任編輯：孫伊靜]

国产精品亚洲综合久久,久久6久久66热这里只是精品,日本免费午夜成人福利剧院,精品人妻在线无码

地方站點(diǎn)

臺(tái)灣網(wǎng)移動(dòng)版

最強(qiáng)AlphaGo Zero誕生自學(xué)3天100比0秒殺AlphaGo

相關(guān)新聞

国产精品亚洲综合久久,久久6久久66热这里只是精品,日本免费午夜成人福利剧院,精品人妻在线无码

地方站點(diǎn)

臺(tái)灣網(wǎng)移動(dòng)版

最強(qiáng)AlphaGo Zero誕生 自學(xué)3天100比0秒殺AlphaGo

相關(guān)新聞

最強(qiáng)AlphaGo Zero誕生自學(xué)3天100比0秒殺AlphaGo