
“冷撲大師”是卡內(nèi)基梅隆大學開發(fā)的無限德州撲克人工智能系統(tǒng)。今年1月,它擊敗了人類頂尖玩家。在這次比賽中,每當這些玩家發(fā)出一個動作,它就會被傳送到卡內(nèi)基梅隆大學的計算機服務(wù)器上。
中國“龍之隊”華人頂尖牌手由2016年世界撲克大賽金手鏈冠軍得主杜悅領(lǐng)軍。杜悅估計,雖然“冷撲大師”是目前撲克界最強的人工智能,但人類頂尖牌手仍有10%的勝率。
創(chuàng)新工場CEO暨人工智能工程院院長李開復之所以發(fā)起這場撲克人機對戰(zhàn),和他1988年在母??▋?nèi)基梅隆大學開發(fā)“奧賽羅”的經(jīng)歷息息相關(guān),后者成為第一個擊敗黑白棋世界冠軍的人機對弈系統(tǒng)。
“德州撲克是創(chuàng)投圈人士愛玩的一項活動,AI更是創(chuàng)投圈近年來關(guān)注的重點,這次活動對AI的宣傳和推動將起到重要作用。”賽事協(xié)辦方春光里運營總監(jiān)董冬則告訴科技日報記者。“我當然希望人類能贏,但‘冷撲大師’畢竟曾打敗過美國頂尖的德?lián)溥x手。”董冬說。
人工智能專家一直將這些游戲作為開發(fā)和測試的工具,在此之前,計算機已經(jīng)在國際象棋、西洋雙陸棋中擊敗了人類,去年的AlphaGo更是名聲大噪。“撲克則有些不同,因為你不知道你的對手拿的是什么牌。”作為德州撲克愛好者,董冬分析。
談到與圍棋比賽、AlphaGo的不同,李開復表示,德州撲克更接近人性,因為信息是有隱藏的,牌手可以誠實或欺騙地表達。這些種種的推敲,更像是人與人之間的商業(yè)、外交博弈,“冷撲大師”的技術(shù)都與這些因素相關(guān)。
通過對手的動作表情判斷對手牌的強弱,是德州撲克相當重要的一種游戲技巧,而“冷撲大師”作為一個冷冰冰的人工智能系統(tǒng),如何應對人類棋手復雜的心理戰(zhàn)呢?
對此,李開復表示,對于“冷撲大師”來說,心理戰(zhàn)其實是基于一個優(yōu)化結(jié)果最大化的一個計算,它計算該怎樣去做才能得到最多的積分牌。他說,撲克機器人的研發(fā)基于博弈論,并且結(jié)合了大量的數(shù)學和概率理論,撲克程序在賽前不曾研擬歷史牌譜,直接在比賽同時動態(tài)優(yōu)化勝率最高的數(shù)學模型,利用戰(zhàn)略推理揭露玩家底牌的隱藏信息,從而建構(gòu)出智能化的AI談判策略套路。在技術(shù)研發(fā)的背后,其實電腦并不對人類玩家的心理戰(zhàn)術(shù)進行任何模擬或分析,反倒以博弈論加上大量數(shù)學打敗了頂尖牌手。
卡內(nèi)基梅隆大學計算機學院院長安得烈·穆爾教授則認為,“冷撲大師”表面呈現(xiàn)的是撲克,背后實際是一個大型的談判算法。撲克AI并沒有用到神經(jīng)網(wǎng)絡(luò)和機器學習這兩種技術(shù),而是用了比較古典的線性規(guī)劃。
李開復認為,現(xiàn)今這套人工智能撲克程序背后的模型,將適用于需要用到戰(zhàn)略推理和多方談判的場景。從企業(yè)談判、商務(wù)談判、外交談判、甚至到生活方面的房屋買賣談判,10年內(nèi)都將會部分或全面被人工智能所取代。