根據(jù)meta基礎(chǔ)人工智能研究外交團(tuán)隊(duì)(FAIR)的一項(xiàng)新研究,一個(gè)名為CICERO的人工智能(AI)代理已經(jīng)完全掌控了在線棋盤游戲《外交》,它在在線外交玩法中進(jìn)行了40場(chǎng)速戰(zhàn),得分是人類玩家平均水平的兩倍。研究結(jié)果將于今天(11月22日)發(fā)表在《科學(xué)》雜志上。

人工智能在玩國(guó)際象棋和圍棋等競(jìng)爭(zhēng)性游戲方面已經(jīng)取得了成功,這些游戲可以只使用自我游戲訓(xùn)練來學(xué)習(xí)。然而,像外交這樣需要自然語言談判、合作和多個(gè)玩家之間競(jìng)爭(zhēng)的游戲一直具有挑戰(zhàn)性。

FAIR開發(fā)的新代理不僅能夠模仿自然語言,更重要的是,它還能分析游戲中人類伙伴的一些目標(biāo)、信念和意圖。研究人員說,它利用這些信息找出一個(gè)考慮到一致的和競(jìng)爭(zhēng)的利益的行動(dòng)計(jì)劃,并以自然語言交流該計(jì)劃。
在一個(gè)在線外交聯(lián)盟的40場(chǎng)快速游戲中,CICERO與人類進(jìn)行了匿名比賽,它的得分是人類玩家平均得分的兩倍以上,并且在參加過多場(chǎng)游戲的參與者中名列前10%。CICERO作為人類玩家與82名獨(dú)特的玩家"過招",關(guān)鍵在于,研究人員沒有看到任何游戲中的信息表明人類玩家認(rèn)為他們是在與一個(gè)人工智能代理游戲。