
敗于人工智能的柯潔
前言:AlphaGo在和人類最強棋手柯潔面前獲得了3連勝。圍棋AI就這樣比預期提前10年完勝了人類棋手,AlphaGo無疑對圍棋界造成了巨大的影響。人類先前積累的定式在AlphaGo面前已經成為了過去式,并且AlphaGo的進攻也顛覆了圍棋的常識。人類棋手該如何面對AI。大橋拓文六段將分析動搖圍棋界的AI。
將棋界的藤井聰太四段在出道后獲得了29連勝,創(chuàng)造了新紀錄。這個新聞跨過了將棋界,這個熱潮成為了一個最新的社會現象??v觀日本的圍棋·將棋界,1996年羽生善治達成了前無古人的獨占七冠,當時在社會上成為了巨大的新聞。當然一個中學生棋士在正式比賽獲得了29連勝是一個偉大的記錄,使得棋界的新聞成為一個社會現象,對被AI壓制的棋手們來說,是一個振奮人心的消息。
AI侵入圍棋界是2016年的事情,美國谷歌公司旗下的DeepMind開發(fā)的AlphaGo橫空出世。在去年春天,擊敗了韓國頂尖棋手李世石九段之后,在韓國國內據說發(fā)生了“AI抑郁癥”的現象。
今年5月,升級版的AlphaGo再次出現在人們的視野中,最終以3-0的比分將目前的世界最強棋手,中國的柯潔九段擊敗。雖然此時棋手們已經做好了心理準備,但是AlphaGo的進步依舊讓人非常震驚。
從李世石到柯潔的一年間,人們對AlphaGo的意義也發(fā)生了巨大的變化。圍棋AI從勝負層面,變成了“為了更好地理解圍棋的工具”,棋手們漸漸開始學習AlphaGo的棋。
實際上,柯潔在人機大戰(zhàn)之后,已經獲得了20連勝,并且AlphaGo的下法在全世界范圍內都被研究。據說將棋界的藤井聰太四段也在靈活運用AI的下法。
我們和超過人類棋手水平的AI進行練習,如果舉棒球的例子,就好比在擊球練習場打時速200公里的球(人類投手最高紀錄是169km/h)。雖然這種練習方式可能會使自己的動作變形,不得不說是一個“雙刃劍”,但是一旦成功,效果會非常驚人。
谷歌公司旗下的DeepMind將圍棋作為了AI的試驗場。圍棋是一項深奧的游戲,可以說見不到底。但是必定會分出勝負。從這樣一個游戲中見證AI的進步,然后由此可以面對AI,對我來說是沒有比這個更開心的了。
擁有直覺的AlphaGo
圍棋是在19乘19共361格的棋盤上進行的游戲,其變化數量要比宇宙上任何一個原子數都要大。即便是計算機也會對如此龐大的數量震懾,這就是以前圍棋很難被電腦攻破的原因。
不過,有人會認為“電腦可以枚舉所有的變化,所以很強”。但是AlphaGo的計算并沒有想象中的快。比如美國IBM公司開發(fā)的深藍,在1秒鐘可以計算2億手,但是AlphaGo在1秒鐘只能算1萬步。
即便如此,AlphaGo為什么還是這么強?
AlphaGo能夠在所有圍棋AI中脫穎而出,深度學習的引入是最大的因素。而圍棋AI從深度學習中學到的東西,就是我們人類的“直覺”和“感覺”。
為了能解釋直覺和感覺是何物,我就拿實地和厚勢,引入兩個圍棋的概念進行說明。在對局過程中,就出現下圖那樣的棋型。
上圖解釋:被白棋包圍的■是白棋的地盤,因為有10個■所以里面是10目,雖然黑棋沒有明顯的地盤,但是如果可以很好的利用外圍,可能會做出比白棋更大的地盤在這個圖,■指的是白棋確定的地盤,而■有10個,所以被認為“這里有10目棋,白棋的實地較大”。相反黑棋在目前階段還沒有確定的地盤。
但是,黑棋這堵墻今后可以在右邊,下邊以及中央的戰(zhàn)斗中得到利用,黑棋很有可能做出比白棋更大的地盤。因為黑棋這堵墻今后可以被利用,所以可以評價黑棋“這個厚勢不錯”,相反如果這堵墻沒有被完美利用,就會被評價“這個厚勢沒有下出應有的棋”。
也就是說,厚勢可以說是投資,需要有一定的洞察力,可以去正確評價并且利用厚勢。而判斷這個厚勢今后可以起到什么樣的效果,這才是圍棋最有意思的地方。
在針對成年人的圍棋入門講座里,經常把實地比喻成現金,厚勢比喻成對未來的投資,他們就很容易理解這兩個名詞了。在很久以前德川家康就把圍棋作為自己的愛好,最近幾年也有不少經營者也喜歡下圍棋,或許從圍棋中可以學到風險管理吧。
我們棋手在掌握實地和厚勢的平衡中進行對局。然后厚勢的未來趨勢則根據我們人類從前積累的經驗進行直接判斷。對棋手來說判斷厚勢對哪方有利,就像找到下一手棋那樣困難。
2016年橫空出世的AlphaGo根據自己給自己積累的經驗,學會了人類的直覺和感覺并且提高其準確度,才得以戰(zhàn)勝頂尖棋手。在當時AlphaGo的棋,對我們人類來說還是可以理解的。
但是,2017年春天,升級后的AlphaGo公布了左右互搏的50盤棋,對圍棋界的影響甚大。AlphaGo剛開始還在學習人類的棋譜,后來經過自我對戰(zhàn)積累了幾千萬盤之后,根據自己的經驗進行學習。當然讓他記住所有的定式估計起不到效果,但是一點一點地汲取信息才是神經網絡的作用。