近日,研究人員開(kāi)發(fā)的一個(gè)人工智能(AI)系統(tǒng),它在終極、無(wú)限德州撲克中戰(zhàn)勝了人類。而在幾星期前,另一AI系統(tǒng)則在德州撲克單挑中戰(zhàn)勝了人類。相關(guān)論文近日刊登于《科學(xué)》雜志。

近年來(lái),人工智能獲得數(shù)次突破,在諸如國(guó)際象棋和圍棋等游戲中戰(zhàn)勝人類。不過(guò),這些游戲的一個(gè)共同特點(diǎn)是,棋手可能有完全信息。但撲克不同,讓這種游戲難得多的原因是每個(gè)玩家對(duì)可能的玩法有著不對(duì)稱的信息。
近日,加拿大阿爾伯塔大學(xué)計(jì)算機(jī)系的Matej Morav ík研發(fā)了一個(gè)被稱為DeepStack的AI系統(tǒng),它在每3000次無(wú)限德州撲克比賽后,具有統(tǒng)計(jì)意義地打敗了11名職業(yè)撲克選手中的10名(它也打敗了第11名選手,但結(jié)果不具有統(tǒng)計(jì)學(xué)顯著意義)。
研究人員表示,在游戲的每個(gè)時(shí)間點(diǎn),DeepStack會(huì)重新計(jì)算游戲策略,而不是將可能玩法計(jì)算到最后,它對(duì)允許進(jìn)行的玩法深度和類型做了限制。這將可能的決策點(diǎn)從超過(guò)10160個(gè)減少至大約107個(gè)(160和7是上標(biāo)),DeepStack的電腦芯片能在5秒鐘內(nèi)完成決策。
這種AI系統(tǒng)將有助于解決涉及信息不對(duì)稱的現(xiàn)實(shí)世界問(wèn)題,例如捍衛(wèi)戰(zhàn)略資源和做出重要的醫(yī)療建議等。