記者 陳姝

日前騰訊宣布,其人工智能球隊摘得足球AI比賽——首屆谷歌足球Kaggle競賽冠軍,該冠軍球隊來自騰訊AI Lab研發(fā)的絕悟WeKick版本。騰訊方面表示,“AI+游戲”是騰訊攻克AI終極研究難題——通用人工智能(AGI)的關鍵一步。從圍棋機器人“絕藝”到“絕悟”,不斷讓AI從0到1去學習進化,未來有望在醫(yī)療、制造等領域帶來更為深遠的影響。
11個智能體的合作與對抗
一直以來,足球運動團隊策略以其復雜性、多樣性和高難度,成為長期困擾世界頂尖AI研究團隊的難題。Kaggle創(chuàng)立于2010年,是全球最大的數(shù)據(jù)科學社區(qū)和數(shù)據(jù)科學競賽平臺。此次比賽由Google Research與英超曼城俱樂部在Kaggle平臺上聯(lián)合舉辦,吸引了來自世界頂級院校和研究機構的1100多支科研強隊參與挑戰(zhàn)。
這不是一場真實的足球賽,比賽使用Google Research Football 環(huán)境,更像是一款由AI操作的FIFA游戲。比賽采取11vs11的賽制,參賽團隊需要控制其中1個智能體與10個內(nèi)置智能體組成球隊。這場比賽規(guī)則與正常足球賽一樣,雙方擁有一樣的球員,沒有主客場、狀態(tài)好壞的數(shù)值差異,沒有替補球員、沒有加時賽、進球多獲勝(否則平局),目標都是將球踢入對方球門。
比賽中,每個球員都各由一個單獨的智能體控制,參賽團隊需要實時選擇并控制其中一個智能體,與其他內(nèi)置智能體配合。因此,每個“球員”不僅需要觀察對手的行為,還需要留意己方隊員的情況,這需要非常復雜的團隊協(xié)作和競爭策略,以及高速的實時決策能力。最終,來自騰訊AI Lab研發(fā)的絕悟WeKick版本,憑借1785.8的總分在與全球頂級技術團隊的競技中以顯著優(yōu)勢勝出。
能打“王者”也能踢足球
實際上,這次奪冠的“絕悟”正是《王者榮耀》中的那個AI。“絕悟”為何要在游戲領域四處征戰(zhàn)?騰訊花大力氣研發(fā)“絕悟”有何原因?
據(jù)騰訊AI Lab專家介紹,AI研究近年成為國際科技公司必爭之地,游戲則是檢驗AI能力的試金石。1997年DeepBlue戰(zhàn)勝國際象棋第一人,2016年的圍棋AI AlphaGo戰(zhàn)勝李世石,這兩大AI劃時代事件都與游戲相關。
業(yè)內(nèi)普遍認為,復雜策略游戲可能會是下一塊寶地。AI能學會類似于人的長期策略規(guī)劃和協(xié)作能力,代表著多智能體決策最高水準。正因為在挑戰(zhàn)性和應用性的巨大價值,騰訊長期關注并持續(xù)投入該領域。
早在2016年,騰訊AI Lab就已開始了“AI+游戲”的研究之路。當時研發(fā)的圍棋AI“絕藝”相繼在UEC杯、AI龍星戰(zhàn)以及圍棋人工智能大賽等頂級賽事中3次奪冠,并成為中國國家隊圍棋訓練專用AI。圍棋AI的難點在于大規(guī)模離散決策空間探索,突破強化學習理論實踐瓶頸,探索超過人類的優(yōu)化策略。
2017年,騰訊開始在星際爭霸2這類RTS游戲(即時戰(zhàn)略游戲)中進行“AI+游戲”研究。與圍棋相比,星際爭霸2是一個不完全信息博弈場景,需在復雜連續(xù)的決策空間下進行面向長期決策的決策。同年,AI Lab還與王者榮耀展開AI聯(lián)合研究,并取得了喜人的成績。
據(jù)介紹,“絕悟”作為策略協(xié)作型AI,寓意擁有絕佳領悟力的AI。2018年8月,“絕悟”已達到王者業(yè)余頂尖水平,并在2019年8月的王者榮耀世界冠軍杯半決賽上通過了5v5賽區(qū)聯(lián)隊測試,達到電競職業(yè)水平。2020年11月底,“絕悟”首次讓AI精通了所有英雄的技能,而此次絕悟WeKick版本的整體設計正是基于絕悟完全體遷移得到,并針對足球任務進行了一些針對性的調(diào)整,驗證了“絕悟”AI底層架構與方法的通用性。
攻克AI終極難題關鍵一步
騰訊AI Lab表示,長遠來看,“AI+游戲”將是騰訊攻克AI終極研究難題——通用人工智能(AGI)的關鍵一步。如果在模擬真實世界的虛擬游戲中,AI學會跟人一樣快速分析、決策與行動,就能執(zhí)行更困難復雜的任務并發(fā)揮更大作用。實際上,從圍棋AI“絕藝”到策略決策型AI“絕悟”,再到如今的AI足球隊絕悟WeKick版本,體現(xiàn)了AI Lab的深度強化學習智能體步步進化,逐漸向更復雜更多樣化的問題遷移,而每一次進展,都離AGI這一終極目標更近一步。
此外,AGI代表研發(fā)能在通用系統(tǒng)中執(zhí)行多種復雜命令,達到或超越人類水平的AI,從絕藝到絕悟,不斷讓AI從0到1去學習進化,并發(fā)展出一套合理的行為模式,這中間的經(jīng)驗、方法與結論,長期來看,有望在大范圍內(nèi),如醫(yī)療、制造、無人駕駛、農(nóng)業(yè)到智慧城市管理等領域帶來更為深遠的影響。
騰訊AI Lab于2016年4月成立。官網(wǎng)顯示,作為騰訊公司級AI實驗室,AI Lab基礎研究方向包括計算機視覺、語音識別、自然語言處理和機器學習,應用探索結合了騰訊場景與業(yè)務優(yōu)勢,為內(nèi)容、游戲、社交和平臺工具型AI四類。2020年,AI Lab重點在虛擬集成世界與機器人兩大研究方向上的重要探索,除AI+游戲外,還在AI+醫(yī)療、AI+醫(yī)藥等領域取得一系列成果。
除“絕悟”外,2020年4月,圍棋AI“絕藝”與中國國家圍棋隊續(xù)約3年。作為“教練”,絕藝能從對弈、復盤、拆解、分析等多個維度,為中國圍棋事業(yè)的發(fā)展提供助力,與人類頂尖棋手一起探索圍棋的更多可能。