參考消息網(wǎng)12月6日?qǐng)?bào)道據(jù)英國(guó)《新科學(xué)家》周刊網(wǎng)站12月1日?qǐng)?bào)道,一種人工智能可以在西洋陸軍棋(Stratego)中擊敗人類專家棋手。

相比國(guó)際象棋、圍棋或撲克牌,西洋陸軍棋可能形成的棋局更多。
總部設(shè)在英國(guó)的“深層思維”公司開發(fā)的人工智能成為這種棋盤游戲的頂級(jí)在線玩家之一。
這種人工智能程序?qū)W會(huì)了用較小的棋子虛張聲勢(shì),還學(xué)會(huì)了為取勝而犧牲掉重要棋子。

“深層思維”公司的科學(xué)家朱利恩·佩羅拉特說(shuō):“最讓我們感到驚訝的行為是,(這種人工智能)具備為獲取對(duì)手布局和策略信息而犧牲有價(jià)值棋子的能力。”
西洋陸軍棋的游戲規(guī)則是,兩個(gè)玩家試圖奪取對(duì)手的軍旗,而軍旗隱藏在由40個(gè)棋子組成的陣列中。大多數(shù)棋子為編號(hào)1至10的士兵,軍銜較高的士兵和軍銜較低的士兵在棋盤上相遇時(shí),前者會(huì)吃掉后者。但玩家看不到對(duì)手棋子的身份,除非來(lái)自對(duì)立兩軍的兩個(gè)棋子碰到一起——這種規(guī)則不同于可以看清對(duì)手棋子的國(guó)際象棋。
報(bào)道指出,加劇游戲難度的是,西洋陸軍棋其實(shí)是一種極其復(fù)雜的游戲,共有10535種可能的棋局。相比之下,圍棋有10360種可能的棋局。國(guó)際象棋和撲克牌就更少了。
佩羅拉特和他在“深層思維”公司的同事們開發(fā)了名為“DeepNash”的人工智能。為了能夠徹底征服西洋陸軍棋,這種人工智能自行下了55億盤棋,模擬訓(xùn)練時(shí)間大致相當(dāng)于幾百年。但這種人工智能并不依賴任何有關(guān)人類下棋策略的知識(shí)。它進(jìn)行訓(xùn)練也不是為了戰(zhàn)勝特定的對(duì)手。
“深層思維”公司的卡爾·塔爾斯說(shuō),DeepNash下棋并不是靠搜索出所有可能的棋局,因?yàn)槟菑挠?jì)算的角度講是不可能做到的,這種人工智能擁有一種算法,可持續(xù)引導(dǎo)其采取最佳策略。最佳策略旨在確保在與完美對(duì)手對(duì)局時(shí)至少有50%的勝率——即使對(duì)手對(duì)人工智能打算做什么了如指掌。
其結(jié)果是,盡管對(duì)手信息被隱藏起來(lái),可能出現(xiàn)的棋局極多,每一步棋都有很多不同的走法,但人工智能還是能作出制勝?zèng)Q策。
紐約大學(xué)的朱利安·托格柳斯說(shuō):“這是我們以前確實(shí)無(wú)法做到的新情況。”
不論是人類對(duì)手還是人工智能對(duì)手,DeepNash在對(duì)局中都已占據(jù)支配地位。
DeepNash通過(guò)在線游戲平臺(tái)與人類專家棋手進(jìn)行了50場(chǎng)排名賽,勝率高達(dá)84%,成為排名前三的棋手——人類棋手并未意識(shí)到他們?cè)诤腿斯ぶ悄軐?duì)局。
“深層思維”公司研發(fā)的這款人工智能與頂級(jí)機(jī)器人棋手對(duì)局的勝率更是高達(dá)97%,其中多個(gè)機(jī)器人棋手此前還贏得過(guò)“計(jì)算機(jī)西洋陸軍棋國(guó)際錦標(biāo)賽”冠軍。