熱搜： 佳士科技 irobot 工業(yè)機(jī)器人機(jī)器人 ABB 機(jī)器人產(chǎn)業(yè)聯(lián)盟發(fā)那科庫卡碼垛機(jī)器人機(jī)械手

經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進(jìn)了？

日期：2017-05-24 來源：雷鋒網(wǎng) 作者：LLY 評論：0

標(biāo)簽：

　　烏鎮(zhèn)圍棋峰會第一局已經(jīng)結(jié)束了，歷時(shí)4個(gè)半小時(shí)，以柯潔九段執(zhí)黑負(fù)于 AlphaGo，AlphaGo 贏四分之一子告終，這樣風(fēng)平浪靜的結(jié)果想必很多人都預(yù)測到了，不過大家從一開始就知道關(guān)注的重點(diǎn)，不在于柯潔怎么輸?shù)?，而是AlphaGo已經(jīng)進(jìn)化到什么程度了，距離Deep Mind團(tuán)隊(duì)出論文來詳解AlphaGo有多強(qiáng)還有一段時(shí)間，So我們其實(shí)可以從現(xiàn)場觀戰(zhàn)中來看出一些端倪。

　　棋速

　　第一局棋下到一半的時(shí)候，不少棋友群里的人沸騰了，發(fā)現(xiàn)AlphaGo落子速度非常快，每步棋落子速度在30S－40S之間波動(dòng)，對此圍棋業(yè)余5段趙老師表示：“（這局棋）像安樂死，不知不覺就輸了，（相比去年）機(jī)器落子飛快但錯(cuò)誤基本沒有”。

　　綜合整局，AlphaGo落子表現(xiàn)冷靜、果斷，而柯潔的落子狀況較多變。最終在比賽進(jìn)行了四個(gè)多小時(shí)之后，AlphaGo贏四分之一子。

　　棋風(fēng)

　　AlphaGo1.0的時(shí)候（去年3月跟李世石對戰(zhàn)的時(shí)候），它的棋風(fēng)概括起來就是擅長記住棋譜+增強(qiáng)學(xué)習(xí)+計(jì)算能力，身上還能看到人類棋風(fēng)的影子，等AlphaGo喬裝成Master60連勝的時(shí)候，許多圍棋大師包括聶衛(wèi)平在內(nèi)開始評價(jià)其棋風(fēng)“很難揣測Master的風(fēng)格……它永遠(yuǎn)都沒有表情，永遠(yuǎn)不受情緒影響，永遠(yuǎn)一個(gè)節(jié)奏，就是要贏你。”而今天，第一局棋還沒結(jié)束的時(shí)候，搜狗王小川已在知乎上發(fā)文剖析AlphaGo2.0 棋風(fēng)“完全脫離人類經(jīng)驗(yàn)”——“而AlphaGo2.0脫離了機(jī)器對人模仿，走棋風(fēng)格也將完全脫離人的定式。在與柯潔的比賽中，會不斷出現(xiàn)我們意想不到的走棋，而且這些走棋在教科書中會被認(rèn)為是低級錯(cuò)誤或者完全不可理喻，但凡一個(gè)正常的棋手都不會這么玩，但凡一個(gè)新手這么玩都會被點(diǎn)撥這樣不對。而AlphaGo2.0會不斷制造這樣的局面，關(guān)鍵他還是對的。”

　　不過最后還是柯潔說了算，他在會后的采訪中用了一個(gè)很好的例子說明了AlphaGo的棋風(fēng)莫測：（在回顧比賽時(shí)也對第54手的斷）時(shí)，他表示了肯定：“很震驚，這在人類的下法中是不能有的。在斷之后，它把自己的腳步實(shí)地化，變得更厚，一石二鳥。”。

　　算法

　　AlphaGo1.0的時(shí)候（去年3月跟李世石對戰(zhàn)的時(shí)候）使用的算法精髓，根據(jù)FB田淵棟看完Nature論文的解讀，由估值網(wǎng)絡(luò)評估棋局，策略網(wǎng)絡(luò)選擇落子，快速走子（Fast rollout）適當(dāng)加速，再用蒙特卡羅樹搜索把以上這三個(gè)部分連起來，形成一個(gè)完整的系統(tǒng)。

　　這一次雖然知乎論壇等活躍地盤已經(jīng)開始紛紛推測這次的AlphaGo2.0用了什么牛叉的算法，有了硬件的預(yù)測失誤，真相還是等Deep Mind后面來親自公布，目測算法預(yù)測這個(gè)要根據(jù)它的單機(jī)版10個(gè)GPU＋TPU助力預(yù)測比較靠譜。

　　硬件需求降低

　　根據(jù)DeepMind員工發(fā)表在2016年1月Nature期刊的論文，分布式版本（AlphaGo Distributed）使用了1202個(gè)CPU和176個(gè)GPU。

　　不過這次比賽AlphaGo用的何種硬件配置，DeepMind在會后的新聞發(fā)布會中表示，這次比賽的AlphaGo是新版本，它改善了新的算法，主要進(jìn)步是計(jì)算量少了十倍，自我對弈更強(qiáng)。Hassabis稱，在比賽中程序是在一個(gè)單一的機(jī)器上運(yùn)作的，這與去年不一樣，當(dāng)時(shí)是分布式的。這次有更強(qiáng)大的算法，運(yùn)作起來更簡單也更好，獲得的速度更快。另外Hassabis表示，計(jì)算力可以“在Google云中獲得，用的是TPU，十個(gè)處理單位，少了十倍的計(jì)算量”。簡單點(diǎn)說，這次的AlphaGo是單機(jī)版。

　　迭代速度

　　哈薩比在此鏈接中的劍橋大學(xué)的一次演講中提到，以前從零訓(xùn)練一個(gè)AlphaGo要三個(gè)月，現(xiàn)在只需要一個(gè)星期（“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”）。

　　如果稱對戰(zhàn)李世石期間的版本為V18迭代版本，喬裝成Master60連勝并宣布升級完成的時(shí)刻為V25版本，現(xiàn)在的AlphaGo又是V多少版本，訓(xùn)練的時(shí)候會不會一周都不要了？這是我們明天要親自問DeepMind團(tuán)隊(duì)的。

　　從單人對戰(zhàn)到團(tuán)隊(duì)對戰(zhàn)

　　心細(xì)的朋友肯定注意到了，柯潔和AlphaGo對弈之外，5月26號上午還有一場配對賽，配對賽雙方－－－古力＋AlphaGoV連笑＋AlphaGo，即對弈雙方分別由一位棋手與AlphaGo組成，棋手與AlphaGo合作進(jìn)行比賽。5月26號上午下午則是陳耀華，周睿羊，羋昱延，時(shí)越，唐韋星和AlphaGo的5對1團(tuán)隊(duì)賽。

　　Google之所以敢這樣設(shè)置賽制，唯一的解釋就是，AlphaGo現(xiàn)在既懂人類下圍棋的那部分，又懂AI下圍棋的那部分，并可以做到融會貫通，所以它才敢挑戰(zhàn)配對賽這種跟另一個(gè)同伴高度配合的賽制，又敢挑戰(zhàn)測試自己“戰(zhàn)斗力”極限的團(tuán)體賽。AI最可怕的部分不是它單個(gè)力量有多強(qiáng)，而是它開始懂得和周遭“互動(dòng)”，這樣的融匯是不是比去年3月的人機(jī)大戰(zhàn)可怕多了呢？

　　小結(jié)：

　　上次AlphaGo喬裝成Master測試的時(shí)候，柯潔已經(jīng)落敗給Master過一次，他不是沒見識過AI圍棋的厲害，但結(jié)合柯潔今天在現(xiàn)場的冷靜表現(xiàn)，和他昨晚莫名其妙地深夜感慨，我們有理由相信，這不是一場比AI圍棋選手和人類圍棋選手哪個(gè)更厲害的選手，DeepMind團(tuán)隊(duì)一定有些懸而未決的答案需要這場比賽給一個(gè)肯定的驗(yàn)證，然后再往那個(gè)方向?qū)崿F(xiàn)更深一步的探索。

更多>相關(guān)資訊

0 條相關(guān)評論

推薦圖文

機(jī)器人賦能產(chǎn)業(yè)，智贏	機(jī)器人也會創(chuàng)造英國
2018年中國智慧機(jī)場行	智能工廠全面解讀！
艾貓?jiān)缃虣C(jī)器人亮相20	360智能硬件助力美國

推薦資訊

點(diǎn)擊排行

^{<blockquote id="5orct"></blockquote>}

• 深圳博銘維又一力作，管道周邊地質(zhì)災(zāi)害探測神器	• 北京啟動(dòng)建設(shè)國家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)
• Project Loon前CEO已加盟自主機(jī)器人交付企業(yè)Sta	• 嘉定將試點(diǎn)打造機(jī)器人“智慧園區(qū)”
• 提高工效、節(jié)省人力！美空軍用機(jī)器人給戰(zhàn)機(jī)“洗	• 人工智能是否可信？專家：一些疾病診斷AI準(zhǔn)確率
• 上千億激光焊接市場被激發(fā)，但國產(chǎn)機(jī)器人90%的	• 廣州：無人機(jī)遞藥機(jī)器人送餐
• 即日起正式施行協(xié)作機(jī)器人末端接口技術(shù)條件標(biāo)準(zhǔn)	• 即將實(shí)施的協(xié)作機(jī)器人末端接口標(biāo)準(zhǔn)，將對協(xié)作機(jī)

恰佩克獎(jiǎng)	機(jī)器人高峰論壇	北大機(jī)器人	金屬加工在線	AI中國網(wǎng)	埃森焊接展	機(jī)氣林
工博會	趕考網(wǎng)	中國機(jī)床網(wǎng)	ITES深圳工業(yè)展	電氣自動(dòng)化網(wǎng)	高壓電氣網(wǎng)	人工智能機(jī)器人
亞洲工業(yè)網(wǎng)	二手設(shè)備網(wǎng)	展覽會信息網(wǎng)	重慶房交匯網(wǎng)	VLAI未來四足機(jī)器人官網(wǎng)	中國傳動(dòng)網(wǎng)	華北機(jī)床網(wǎng)
數(shù)控機(jī)床市場網(wǎng)	國家標(biāo)準(zhǔn)化委員會

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進(jìn)了？

經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進(jìn)了？