
據(jù)韓媒報(bào)道,超越圍棋人工智能“AlphaGo”的“AlphaZero”已面世,“AlphaZero”圍棋的特點(diǎn)是在沒有教科書或棋譜的情況下,只要知道游戲法則,就具備掌握所有棋類游戲的能力。特別是以圍棋為對象,與“AlphaGo”不同的是一個(gè)算法可以適用于國際象棋、昭和(日本象棋)等其他棋類游戲,是AI廣泛應(yīng)用的重要里程碑,因此備受期待。
12月7日,包括谷歌Deep Mind創(chuàng)始人兼CEO德米斯·哈比斯在內(nèi)的13位研究學(xué)者在“科學(xué)”雜志上發(fā)表了題目為“通過自我學(xué)習(xí)掌握國際象棋、昭和、圍棋的通用強(qiáng)化學(xué)習(xí)算法”。
“AlphaZero”與“AlphaGo”一樣都是不需要大數(shù)據(jù)學(xué)習(xí),“AlphaZero”用了4個(gè)小時(shí)打敗了2016年國際象棋AI冠軍”Stockfish”,用了2個(gè)小時(shí)打敗了2017年昭和象棋AI冠軍” Elmo”,”Stockfish”與” Elmo”都是在輸入大數(shù)據(jù)的基礎(chǔ)上采用檢索最優(yōu)數(shù)的方式,“AlphaZero”則是像人的大小腦一樣用深層神經(jīng)網(wǎng)技術(shù)自己積累數(shù)據(jù),采用快速找出勝算高且最優(yōu)數(shù)的方式。
“AlphaZero”用了8個(gè)小時(shí)就贏了圍棋9段王者李世石,而之前“AlphaGo”用了30個(gè)小時(shí),在圍棋領(lǐng)域與“AlphaGo”對決的勝率達(dá)到61%。Deep Mind研究員戴維德表示“最近因?yàn)榧夹g(shù)的發(fā)達(dá),出現(xiàn)了能夠輕松征服國際象棋、象棋、圍棋之類的棋類游戲算法,AI開發(fā)的下一個(gè)課題是征服多個(gè)人參與的視頻游戲,類似于戰(zhàn)略模擬的游戲”。
另外,Deep Mind 于12月2日在墨西哥坎昆舉行的蛋白質(zhì)構(gòu)造預(yù)測學(xué)術(shù)大會(huì)上用AI ”AlphaFold”成功預(yù)測了生命的基本分子蛋白質(zhì)的三維形態(tài),“AlphaFold”成功預(yù)測了43個(gè)蛋白質(zhì)中25個(gè)結(jié)構(gòu)構(gòu)造并取得第一名,而第二名獲得者只成功預(yù)測了43個(gè)蛋白質(zhì)中的3個(gè)構(gòu)造。