国产精品亚洲综合久久,久久6久久66热这里只是精品,日本免费午夜成人福利剧院,精品人妻在线无码

  • 臺(tái)灣網(wǎng)移動(dòng)版

    臺(tái)灣網(wǎng)移動(dòng)版

最強(qiáng)AlphaGo Zero誕生 自學(xué)3天100比0秒殺AlphaGo

2017-10-20 14:52:00
來(lái)源:臺(tái)灣網(wǎng)
字號(hào)

  臺(tái)灣網(wǎng)10月20日訊 據(jù)臺(tái)灣“東森新聞雲(yún)報(bào)道,今(2017)年5月,DeepMind公司創(chuàng)造的AlphaGo與圍棋世界冠軍柯潔在中國(guó)烏鎮(zhèn)對(duì)弈,以壓倒性的3:0勝出,人工智慧發(fā)展震驚全球。

  不可思議的是,時(shí)隔不到半年,Google旗下AI實(shí)驗(yàn)室?guī)?lái)更強(qiáng)大的AlphaGo Zero,它完全不需要倚靠人類(lèi)的知識(shí)和指導(dǎo),從零開(kāi)始自我訓(xùn)練只需3天就100:0打敗舊版。

  在過(guò)去,強(qiáng)大的人工智慧依靠人類(lèi)事前輸入大量資料,幫助它學(xué)習(xí)、訓(xùn)練技能,Alpha Go成為圍棋大師前自然也不例外。近日,DeepMind公司在《自然》(Nature)科學(xué)期刊上發(fā)表一篇學(xué)術(shù)論文《不需要人類(lèi)知識(shí)就稱(chēng)霸圍棋》(Mastering the game of Go without human knowledge),展示了強(qiáng)化版的程式AlphaGo Zero,證明在全球最困難的棋藝競(jìng)技中,人工智慧可以在沒(méi)有任何人類(lèi)知識(shí)的基礎(chǔ)上,純粹靠自我學(xué)習(xí)成為制霸王者。

  AlphaGo Zero代表從零開(kāi)始,DeepMind開(kāi)發(fā)團(tuán)隊(duì)只輸入了基本的圍棋規(guī)則,剩下的時(shí)間它會(huì)自行下棋,記錄下每次的勝負(fù)決策、不斷學(xué)習(xí),自己成為自己的老師,加上沒(méi)有人類(lèi)的經(jīng)驗(yàn)和成規(guī)束縛,讓人工智慧突破舊有的知識(shí)限制,發(fā)展出新的弈棋策略,快速達(dá)到登峰造極新境界。

  AlphaGo Zero誕生後,只花了3天時(shí)間就贏了去年打敗李世乭的AlphaGo版本,局?jǐn)?shù)勝負(fù)是毫無(wú)懸念的100:0。21天之後,AlphaGo Zero再度進(jìn)化,能力超越了今年打敗世界冠軍柯潔的AlphaGo Master版本;40天后,它完成了2900萬(wàn)次的對(duì)戰(zhàn)學(xué)習(xí),與過(guò)去最強(qiáng)的AlphaGo對(duì)弈,它的勝率來(lái)到90%,成為至今最優(yōu)秀的版本,也是歷史上最強(qiáng)的“圍棋棋手”。

  DeepMind指出,不使用任何人類(lèi)知識(shí),AlphaGo Zero使用的是新的“強(qiáng)化學(xué)習(xí)”方法,通過(guò)神經(jīng)網(wǎng)路和演演算法結(jié)合,持續(xù)自我對(duì)弈練習(xí)幾百萬(wàn)、幾千萬(wàn)場(chǎng),每次的更新都能增強(qiáng)、調(diào)整系統(tǒng),用以預(yù)測(cè)下一步落子的方向和遊戲輸贏走勢(shì)。幾天時(shí)間內(nèi),AlphaGo Zero就從一塊純潔的白板,在上頭不斷揮灑、創(chuàng)造知識(shí),很快勝過(guò)了人類(lèi)累積千年的圍棋智慧。(臺(tái)灣網(wǎng) 孫伊靜)

[責(zé)任編輯:孫伊靜]
  • 
    <small id="mmm0m"></small>
  • <tfoot id="mmm0m"></tfoot>
  • <sup id="mmm0m"></sup>