4月14日,第二屆“騰訊開(kāi)悟多智能體強(qiáng)化學(xué)習(xí)大賽”(以下稱(chēng)“大賽”)決賽在成都落幕,來(lái)自20多所頂尖高校的AI研發(fā)團(tuán)隊(duì),經(jīng)過(guò)半年來(lái)的比拼,共有4支團(tuán)隊(duì)進(jìn)入決賽。經(jīng)過(guò)現(xiàn)場(chǎng)激烈角逐,來(lái)自清華大學(xué)計(jì)算機(jī)系的團(tuán)隊(duì)獲得本屆大賽冠軍。
本屆大賽由騰訊AI Lab、王者榮耀、騰訊新文創(chuàng)總部、騰訊高校合作、騰訊游戲?qū)W堂等共同發(fā)起。騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)依托于騰訊太極機(jī)器學(xué)習(xí)平臺(tái),為參賽團(tuán)隊(duì)提供了研究資源、全棧打通的閉環(huán)科研驗(yàn)證環(huán)境和輔助管理服務(wù);算力方面,基于遨馳分布式云操作系統(tǒng)的新一代全球領(lǐng)先的異構(gòu)加速引擎技術(shù),為本屆AI大賽全程提供資源及技術(shù)支持。
據(jù)開(kāi)悟平臺(tái)技術(shù)專(zhuān)家介紹,各隊(duì)在算法模型設(shè)計(jì)、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)以及訓(xùn)練方式等方面,分別進(jìn)行了探索嘗試,訓(xùn)練出了較高強(qiáng)度的AI,并且在對(duì)戰(zhàn)中表現(xiàn)出了獨(dú)特的戰(zhàn)略風(fēng)格。
本次賽事的四強(qiáng)隊(duì)伍,來(lái)自清華大學(xué)自動(dòng)化系的王博源同學(xué)在分享中表示:“我們?cè)趨①愡^(guò)程中極大地促進(jìn)了合作能力,為今后的科研做好了鋪墊”;來(lái)自西安交通大學(xué)的王子儒同學(xué)更是表示,本次參賽經(jīng)歷讓隊(duì)員們堅(jiān)定了未來(lái)從事的科研方向。
開(kāi)放AI能力,讓參賽者聚焦算法研究
本屆賽事沿用過(guò)往面向高校的邀請(qǐng)賽制,進(jìn)一步擴(kuò)大了開(kāi)放規(guī)模,邀請(qǐng)20多所國(guó)內(nèi)外知名高校參賽。參賽隊(duì)伍需要在指定的時(shí)間內(nèi),在給定的資源下訓(xùn)練出最優(yōu)模型,并最終部署好使用最優(yōu)模型的AI服務(wù)器,提交系統(tǒng)完成1V1、3V3對(duì)局挑戰(zhàn)。
在賽事各階段,每支參賽隊(duì)伍都可獲得等量的訓(xùn)練資源。這意味著參賽者無(wú)法通過(guò)無(wú)限加大算力來(lái)提升AI能力,而是需要不斷優(yōu)化模型。同時(shí),為了讓參賽者將目光聚焦于算法本身,賽事禁止參賽者為AI編寫(xiě)規(guī)則,AI只能通過(guò)行為反饋來(lái)優(yōu)化自身策略。
目前AI學(xué)界面臨的四大挑戰(zhàn):算法、數(shù)據(jù)、算力、場(chǎng)景。研究場(chǎng)景稀缺、沒(méi)有數(shù)據(jù)、算法測(cè)試?yán)щy、算力昂貴等問(wèn)題一直困擾高校AI研究團(tuán)隊(duì);隨著高校對(duì)強(qiáng)化學(xué)習(xí)算法研究的不斷深入,計(jì)算資源的需求量也水漲船高。除了機(jī)器資源本身,高校也缺乏容易上手的AI開(kāi)放實(shí)驗(yàn)平臺(tái)。
騰訊正在將自身的AI能力開(kāi)放給AI研究者,致力于成為國(guó)內(nèi)科研的助推器。
“開(kāi)悟”是騰訊牽頭構(gòu)建的AI多智能體與復(fù)雜決策開(kāi)放研究平臺(tái),依托騰訊AI Lab和王者榮耀在算法、算力和實(shí)驗(yàn)場(chǎng)景方面的核心優(yōu)勢(shì),旨在為學(xué)術(shù)研究人員和算法開(kāi)發(fā)者開(kāi)放國(guó)內(nèi)領(lǐng)先、國(guó)際一流研究與應(yīng)用探索平臺(tái)。
其中,王者榮耀為高校AI研究提供了一種現(xiàn)實(shí)可用的場(chǎng)景。這款移動(dòng)端的MOBA類(lèi)游戲,具有高復(fù)雜度、高挑戰(zhàn)性、強(qiáng)協(xié)作性的特點(diǎn)。據(jù)統(tǒng)計(jì),在王者5V5對(duì)局中,玩家的動(dòng)作狀態(tài)空間高達(dá)10的20000次方,遠(yuǎn)遠(yuǎn)大于圍棋及其他簡(jiǎn)單游戲,甚至超過(guò)整個(gè)宇宙的原子總數(shù)(10的80次方)。
“開(kāi)悟”持續(xù)擴(kuò)大開(kāi)放范圍,發(fā)力AI人才教育
賽事之外,騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)正持續(xù)擴(kuò)大開(kāi)放范圍,發(fā)力AI人才教育。
今年3月,成都大運(yùn)會(huì)“數(shù)智競(jìng)技”邀請(qǐng)賽正式啟動(dòng),該邀請(qǐng)賽由大運(yùn)會(huì)執(zhí)委會(huì)主辦、騰訊承辦,邀請(qǐng)全球12所高校的學(xué)生于開(kāi)悟平臺(tái)上進(jìn)行AI技術(shù)博弈,最終成績(jī)將于今年7月大運(yùn)會(huì)期間發(fā)布。
騰訊新文創(chuàng)總部自2020年落戶(hù)成都,不斷探索區(qū)域科技創(chuàng)新、文化創(chuàng)新,與城市的整體力量合作,大運(yùn)會(huì)世界大學(xué)生數(shù)智競(jìng)技邀請(qǐng)賽和第二屆“開(kāi)悟"Al大賽落地蓉城,是立足成都,講好科技故事的創(chuàng)新實(shí)踐。通過(guò)與互聯(lián)網(wǎng)企業(yè)的協(xié)作以及連接新型數(shù)字文化載體,推動(dòng)建設(shè)人工智能開(kāi)放交流的“科技+體育”新體系。
今年上半年,“開(kāi)悟”平臺(tái)還基于兩屆賽事的積累,與北京大學(xué)、清華大學(xué)、電子科技大學(xué)、中科大四所國(guó)內(nèi)高校合作開(kāi)發(fā)了創(chuàng)新課程,進(jìn)一步幫助高校學(xué)生在實(shí)踐中理解強(qiáng)化學(xué)習(xí)知識(shí),目前相關(guān)課程已經(jīng)陸續(xù)開(kāi)課。
從短期來(lái)看,若AI能在類(lèi)似“王者榮耀”這樣復(fù)雜的環(huán)境中,學(xué)會(huì)人一樣實(shí)時(shí)感知、分析、理解、推理、決策到行動(dòng),就可能在多變、復(fù)雜的真實(shí)環(huán)境中發(fā)揮更大作用。下一個(gè)AI里程碑可能會(huì)在復(fù)雜策略游戲中誕生。
長(zhǎng)遠(yuǎn)來(lái)說(shuō),AI攻克游戲的能力將有助于解決真實(shí)世界的復(fù)雜問(wèn)題。借助開(kāi)悟平臺(tái),騰訊AI Lab和王者榮耀希望聯(lián)動(dòng)更多有興趣的高校和學(xué)者參與,共同在游戲環(huán)境中探討和研究這些難題,并尋找AI新技術(shù)覆蓋更多場(chǎng)景的可能性,服務(wù)醫(yī)療、工業(yè)、農(nóng)業(yè)、交通等行業(yè)。