国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 發(fā)那科機器人  工業(yè)  機器人  上海  ABB機器人  自動化  工業(yè)機器人  工業(yè)機器人展  機器  展會 

怎樣開發(fā)“逢賭必贏”的德州撲克機器人?

   日期:2017-04-06     來源:騰訊科技    作者:LLY     評論:0    
標簽:
    每年夏天,世界上最好的撲克機器人都會聚到一起——其實是開發(fā)它們的計算機科學研究人員聚到一起——舉辦一個撲克錦標賽。近年來,有三個機器人團隊顯露了比較明顯的優(yōu)勢:第一個是阿爾伯塔大學的團隊,目前有大約十幾人在開發(fā)撲克程序。接下來是卡內(nèi)基梅隆大學的團隊,他們的撲克機器人名為 “Tartanian”。然后是獨立研究者埃里克·杰克遜(Eric Jackson),他開發(fā)了一個名為“Slumbot”的程序。
  錦標賽采用的規(guī)則分好幾種,各個團隊會根據(jù)規(guī)則不同對機器人的“個性”進行調(diào)整。有些比賽采用淘汰制,每一輪都有兩個機器人互相對抗,到結(jié)束時,籌碼最少的機器人會被淘汰。為了贏得這種比賽,機器人需要有強大的求生本能。它們的得分只要能順利進入下一輪就足夠了——太貪心不是好事。然而,在另外一些比賽中,總分最多的機器人才能獲勝。在這些比賽中,機器人就需要盡可能地每場多贏一些,因此它們需要有更強的進攻性才行。
 
  大多數(shù)參加錦標賽的機器人已經(jīng)開發(fā)了好多年,經(jīng)過成百上千萬次,乃至數(shù)十億次的撲克訓練。然而,錦標賽的獎金并不多。獲勝的研究人員可能會覺得很自豪,賺到了吹牛的資本,但他們獲得的獎金數(shù)目和拉斯維加斯沒法比。那么,這其中的誘惑又是什么呢?
 
  撲克與象棋的不同之處
 
  每當一臺計算機玩撲克的時候,它面對的是一個我們大家都很熟悉的問題:如何處理缺少的信息。
 
  在一些游戲中,比如下象棋的時候,信息不是一個問題。玩家可以看到的一切。他們知道哪個棋子在哪里,對手是怎么走棋的。這種游戲的關(guān)鍵不在于玩家無法觀察到事情,而在于他們無法處理所有可用的信息。這就是為什么一只猴子隨便下的棋有可能(盡管可能性很渺茫)打敗象棋大師的原因。
 
  有了良好的玩游戲算法——以及強大的計算能力——信息處理問題是可能破解的。所以阿爾伯塔大學計算機科學家喬納森·謝弗(Jonathan Schaeffer)和同事們開發(fā)了完美的跳棋策略,形成了計算機如何破解國際象棋的一些理論。機器可以計算所有不同的棋子走法,用純粹的蠻力法擊敗對手是有可能的。但撲克就不一樣了。無論撲克玩家的牌技都多精湛,都必須面對這樣一個事實:你看不到對方的牌。雖然撲克游戲也有規(guī)則和限制,但總是存在著一些未知因素。
 
  在生活中,很多問題也有同樣的特點。比如談判、拍賣、議價——都是不完全的信息博弈。 “撲克是一個完美的縮影,可以代表我們在現(xiàn)實世界中遇到的很多種狀況。”謝弗說。
 
  “仙王座”駕到
 
  2015年,阿爾伯塔的研究人員在《科學》雜志上發(fā)表了一篇關(guān)于“仙王座”(Cepheus)撲克程序的文章,標題是《雙人限注德州撲克被攻破》(H eads-Up Limit Hold’em Poker Is Solved)。
 
  在進行了大量的訓練后,仙王座可以成為撲克高手。為了積累經(jīng)驗,它一直不斷地玩撲克,大約每秒種兩千局。隨著時間的推移,它越來越善于探索可能的組合,這意味著在它的出牌策略中,對手可以攻擊的薄弱環(huán)節(jié)越來越少。最終,這個機器人學會了(從長遠來看)如何避免失敗,哪怕它面對的是一個無懈可擊的玩家。研究人員用“遺憾最小化”算法來對仙王座加以完善:每場比賽之后,它會進行回顧,考慮如果用另外的方式出牌,可能會出現(xiàn)怎樣的情況,然后再利用這些信息,從錯誤中學習技能。
 
  仙王座已經(jīng)表明,即使在復雜的情況下,它也可以找到一個最優(yōu)化的策略。研究人員指出,在一系列其他場景,比如設計守衛(wèi)巡邏路線,研發(fā)醫(yī)藥療法等等中,這種算法可能也會相當有用。
 
  當然,這項研究還有一個不那么實用的原因。該團隊在這篇科技論文的末尾引用了阿蘭·圖靈的一句話,大意是說,我們做這項工作的主要動機是因為它充滿了樂趣。
 
  人類處在劣勢了嗎?
 
  電腦程序在象棋、跳棋、撲克游戲中表現(xiàn)不凡,你可能會覺得,人類在這樣的比賽不再具有競爭力了。圖靈曾指出,如果一個人試圖假裝自己是一臺機器,“他就會表現(xiàn)得很糟糕。”讓一個人來做計算,他的速度會比計算機慢得多,而且還更容易算錯。
 
  即便如此,這個世界上仍然存在著一些令機器人發(fā)懵的情況。在玩智力游戲《危險邊緣》(Jeopardy!)的時候,IBM機器人“沃森”對長度較短的線索最感頭痛。如果主持人說出一個類別和一個名稱,比如“第一夫人”和羅納德·里根 —— 沃森需要很長時間才能在其數(shù)據(jù)庫搜索找到正確的回應(“誰是南希·里根?”)在這個節(jié)目中,如果主持人給出的線索較長,也比較復雜,沃森就可以擊敗人類選手,但是如果線索只有幾個詞,人類就會占上風。在問答節(jié)目中,“簡潔”似乎是機器人的天敵。
 
  撲克游戲也是如此。機器人需要時間來研究對手的出牌方式,然后加以利用。而職業(yè)撲克玩家可以更迅速地摸清其他玩家的手法。 “人類善于利用很少的數(shù)據(jù)來做出有關(guān)對手的假設,”謝弗說。
 
  阿爾伯塔大學的撲克團隊也發(fā)現(xiàn),人類特別容易受到強硬戰(zhàn)術(shù)的影響。 “一般來說,人類撲克高手在擊敗對手的策略方面,虛張聲勢是很重要的一條,” 阿爾伯塔大學的計算機科學研究員邁克爾·約翰森說。 “虛張聲勢策略給對手施加了很大的壓力,讓他們做出艱難的決定,因此往往非常有效。”在和人類玩家玩牌時,機器人也試圖模仿這種行為,引發(fā)對手的錯誤。
 
  也就是說,機器人似乎可以通過模仿人類的行為來獲得很多優(yōu)勢。有時候,就連模仿人類的缺陷也會帶來好處。
 
 
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點,也不代表本網(wǎng)站對其真實性負責。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與中國機器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應并做處理。
電話:021-39553798-8007
更多>相關(guān)專題
0相關(guān)評論

推薦圖文
推薦專題
點擊排行
?