国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機器人  機器人  ABB  機器人產(chǎn)業(yè)聯(lián)盟  發(fā)那科  機械手  碼垛機器人  庫卡 

為什么要研究游戲 AI 呢?

   日期:2021-11-30     來源:AI科技大本營、Datawhale    作者:angela     評論:0    
 AI作為時下計算機算法的超級巨星,在例如CV、NLP、語音、機器人等諸多領域都有廣泛的應用。而在游戲領域,AI的應用往往被認為只是把游戲角色擬人化,算法的第一印象也通常是強化學習。但實際當中,AI在游戲中的應用卻不止于此。本文就來介紹一下游戲領域的AI應用與算法。

首先擺在我們面前的是,為什么要研究游戲AI呢?

游戲可以看做現(xiàn)實問題的折射,研究它可以為解決現(xiàn)實問題提供有價值的樣本;同時,游戲的算法永遠不會被單單的幾種算法所束縛,多種形式的AI方法可以分別或結合在不同的游戲中。更重要的,當然是因為它很有趣~!!!!:P

引用《AI與游戲》 中的話:

自 AI 的想法誕生以來,游戲一直為 AI 的研究過程提供助力。游戲不僅提出有趣且復雜的問題來供AI解決————例如去精通一個游戲;它們也為(人類,甚至機器)用戶能夠體驗到的創(chuàng)意以及表達提供了一個畫布。因此可以說,游戲是罕見的,是科學(解決問題)與藝術相碰撞并相互作用的領域,而這些因素也讓游戲?qū)τ贏I的研究來說成為一個獨特并且優(yōu)秀的環(huán)境。然而不僅是AI在游戲中提升,游戲也在AI研究中得到了發(fā)展。——《Artificial Intelligence and Games》

01 從游戲環(huán)節(jié)看AI應用

在游戲領域中,AI的應用其實并不僅僅是人們印象中的玩家型戰(zhàn)斗AI。傳統(tǒng)意義上的游戲制作融入了AI的方法之后在各個環(huán)節(jié)都催生了相應的應用與算法。如果我們將一款游戲拆開來看他的各個環(huán)節(jié),這些AI的應用就變得直觀起來。

1.1 游戲畫面

在游戲制作的環(huán)節(jié)里,開發(fā)者需要制作相應角色的動畫模型,來滿足使用者在游戲內(nèi)視覺上的需求,在傳統(tǒng)的游戲制作上,通常需要一名專門游戲原畫師來制作相應的內(nèi)容,但是聚焦到游戲內(nèi)角色們的表情與動作這些細節(jié)上時,動畫的設計通常變得吃力不討好起來,應用視覺AI可以將人們的動作投影到角色身上,生成相應的動作表情;而在環(huán)境的設計中,AI也可以起到相似的效果,通過輸入現(xiàn)實的圖片來得到相應的游戲畫面。在這個問題上,CV中的機器學習方法例如姿態(tài)識別,表情識別,GAN等起到了關鍵性的作用。下面幾個例子帶你一窺AI是如何創(chuàng)造游戲畫面的。

▲ 動作識別

▲ 表情識別

▲ 深度強化學習

▲ AlphaGo中基于蒙特卡洛搜索樹的深度強化學習

▲ 演化算法

1.2 玩家型AI

該類型應該是最被大眾所熟知的游戲AI類型,2017年AlphaGo擊敗世界圍棋冠軍李世石,2019年OpenAI Five擊敗DOTA2世界冠軍OG證明了AI在游戲上的表現(xiàn)可以超越人類。而此類AI問題本質(zhì)上可以看成是路徑規(guī)劃問題,即根據(jù)當前的游戲狀態(tài)生成相應的動作序列。典型的以強化學習、深度強化學習為代表的游戲AI目前在國內(nèi)的游戲工業(yè)界已被大量研究,在某些游戲類型例如棋牌類、回合制策略游戲中,蒙特卡洛搜索樹(行為樹)、演化算法、A*等在線學習算法也具有一定優(yōu)勢。

1.3 游戲內(nèi)容

在這一方面的AI應用常常不為人所知,通常被稱為Procedural Content Generation(PCG)。在游戲內(nèi)容(地圖)的產(chǎn)出上,以魔獸爭霸3為例,一方面依賴于游戲本體制作時開發(fā)者制作的地圖;另一方面依賴于社區(qū)玩家的自定義地圖,而社區(qū)玩家內(nèi)容又更是由玩家數(shù)量所決定,豐富且可行的游戲內(nèi)容是吸引玩家入坑的重要保障。利用AI去生成可行的游戲內(nèi)容是非常值得研究的方向。目前該方向的主流算法包括演化算法、GAN等

▲ AI生成游戲內(nèi)容

▲ GAN的應用

1.4 游戲初始化平衡

目前在卡牌類游戲中,為了初始化得到的卡牌或是環(huán)境相對平衡,在PVE游戲中體現(xiàn)為玩家可以戰(zhàn)勝Bot,PVP游戲例如爐石傳說、自走棋,防止出現(xiàn)雙方卡牌差距過大導致輸?shù)?,可以利用AI來設計發(fā)牌的策略。該方向的主要算法為演化算法

▲ 爐石中的演化算法平衡牌組

1.5 游戲測試

在游戲制作完成后,開發(fā)者們需要測試游戲內(nèi)存在的bug,這毫無疑問是重要的,如果一款游戲存在大量的bug,對該游戲的評價和收益都會造成巨大的影響。而測試游戲需要大量的時間,在這一方面,測試專用的agent可以被設計來面對這一挑戰(zhàn),目前這一塊的算法主要為蒙特卡洛搜索樹、強化學習、深度強化學習等。

▲ 深度強化學習自動測試agent

1.6 用戶畫像

在游戲的運營過程中,玩家在游戲內(nèi)的行為會產(chǎn)生豐富且復雜的數(shù)據(jù),這些數(shù)據(jù)內(nèi)折射了玩家的行為,分析并合理利用這些數(shù)據(jù)可以提煉出有價值的信息,這些信息可以用作促進游戲更新更多玩家喜歡的內(nèi)容,預測玩家的行為和喜好,檢測作弊外掛等。這一種游戲中的數(shù)據(jù)分析問題被稱為用戶畫像問題,利用合理的機器學習算法可以極大提升玩家的游戲體驗。

▲ 用戶畫像分析

02 AI應用在游戲中的詳細分類

【硬核預警】下面將參考開篇提到的的《Artificial Intelligence and Games》,對游戲領域的AI從應用方法兩方面做匯總介紹,在方法部分會涉及大量AI技術。

根據(jù)上圖,AI在游戲中的具體應用可以大致劃分為三個方向:

利用AI玩游戲利用AI為玩家建模利用AI生成游戲內(nèi)容2.1 利用AI玩游戲

在游戲中建立bot。

(1)應用為導向

a.與玩家對抗/協(xié)作依據(jù)數(shù)據(jù)和預算產(chǎn)生不同水平的agent,可以與玩家共同匹配作為PVE的NPC等提高玩家體驗水平,由此引申的功能可以有動態(tài)難度調(diào)節(jié),游戲自動平衡。

b.游戲bug測試在投入運行前,可以通過投入大量的有測試行為的agent進入游戲,根據(jù)其行動期間的log異常來得到一些bug,或是通過bot間的對戰(zhàn),依據(jù)一定的判定方法來得到版本數(shù)值平衡性分析。

c.合成數(shù)據(jù)收集在游戲投入運行得到一定的玩家數(shù)據(jù)前,可以使用agent的行動來得到仿真的玩家數(shù)據(jù),例如陣型識別,勝率預測等數(shù)據(jù)。

d.產(chǎn)生更強力的agent根據(jù)共同演化的方法,一系列基礎的agent可以通過參數(shù)演化或者agent間對抗性的方法來催生性能更好的agent。

e.尋路(Pathfinding)尋路規(guī)劃可以被視為AI動作序列輸出的一種特例。在某些游戲例如馬里奧中,尋路算法本身就構成了AI player。

(2)方法為導向

根據(jù)是否使用了游戲提供的仿真模型(即可根據(jù)目前的游戲狀態(tài)以及可執(zhí)行動作得到后續(xù)的幀的游戲狀態(tài)可以將其分為Model-based與Model-free的agent。

a.Model based(基于模型的agent)

Planning-based:最佳優(yōu)先搜索(例如 ),蒙特卡洛樹搜索,演化規(guī)劃基于模型的強化學習b.Model Free(無模型方法)

靜態(tài)類方法:狀態(tài)機,行為樹,基于效用(啟發(fā)式)函數(shù)的AI方法planning-based:STRIPS(符號化表示規(guī)劃)c.學習類方法

強化學習:需要高度表格化表示。深度強化學習:基于游戲圖像,不需要標記數(shù)據(jù),但需要有游戲?qū)崟r的獎勵設置。演化算法:通過演化算法來更新神經(jīng)網(wǎng)絡結構和權重來達到最優(yōu)化。模仿學習:根據(jù)玩家的數(shù)據(jù)來學習游戲的策略,基于游戲圖像,需要玩家數(shù)據(jù)。逆強化學習:根據(jù)策略來學習游戲中的獎勵分布。2.2 利用AI生成游戲內(nèi)容

就是PCG(Procedural content generation),利用AI的方法去協(xié)助設計游戲系統(tǒng),前置要求是需要比較好的數(shù)據(jù)(包括數(shù)據(jù)的質(zhì)量,數(shù)據(jù)的代表方式,數(shù)據(jù)的數(shù)量)和有代表性的評估方法(包括美學,可玩性,新奇性)。具體的應用方法需要進一步查閱資料。

(1)應用為導向

a.(輔助)生成游戲中的內(nèi)容(影響規(guī)則):關卡、地圖、物品、武器、任務、人物、規(guī)則等。

b.(輔助)生成游戲中的外觀(不影響規(guī)則):人物外觀,表情,武器外觀,音效等。

c.輔助設計

d.修復地圖bug:對無法抵達的死角做檢測與替換等。

e.數(shù)據(jù)壓縮:將游戲數(shù)據(jù)壓縮到更小的尺寸。

(2)方法為導向

a.元胞自動機使用領域規(guī)則根據(jù)隨機初始狀態(tài)生成大量不規(guī)則圖形,可用于熱量、雨水、液體流動、壓力爆炸等環(huán)境系統(tǒng)建模,也可以生成洞窟等小型地圖,但無法保證可控性

b.基于文法方法定義一系列文法規(guī)則來生成內(nèi)容。

c.基于搜索方法(通常為Evolutionary Algorithms,EA):相較于機器學習的方法,搜索方法可以大大減少所需求的數(shù)據(jù)量,關鍵問題有例如需要確定較好的內(nèi)容表示形式,需要有一種較好的評估手段。有以下幾種分類:

EA類算法:遺傳算法,演化策略,演化編程EA like 算法:粒子群演算法,差分進化算法content representation評估方法直接評估是通過某種函數(shù)去約束評估生成的內(nèi)容,包括Theory-driven和Data-driven,區(qū)別在于評估函數(shù)是基于理論還是經(jīng)驗模型的。基于仿真是利用bot AI去進行游戲來評估游戲的內(nèi)容。包括靜態(tài)評估和動態(tài)評估,區(qū)別是評估函數(shù)是否會隨著時間改變。互動評估屬于實時評估,通過人類玩家的體驗進行評價。包括隱式評估-通過玩家玩游戲產(chǎn)生的數(shù)據(jù)來分析內(nèi)容好壞,以及顯式評估- 玩家直接評分d.機器學習方法PCG研究的一個新方向是在現(xiàn)有內(nèi)容上訓練生成器,以便能夠產(chǎn)生更多相同類型和風格的內(nèi)容。這是受最近的深度神經(jīng)網(wǎng)絡研究結果的啟發(fā),其中生成式對抗網(wǎng)絡和變異自動編碼器等網(wǎng)絡架構在學習生成臥室、貓或人臉等圖像方面取得了很好的效果,同時也受到了早期研究結果的啟發(fā),其中較簡單的學習機制如馬爾科夫鏈和較復雜的架構如遞歸神經(jīng)網(wǎng)絡都在一些語料庫的訓練后學習生成文本和音樂。

神經(jīng)網(wǎng)絡,包括GAN,AutoEncoder和NeuroEvolution等等。概率模型,包括決策樹等大致的PCGML數(shù)據(jù)代表方式與訓練方法總結如下:1.數(shù)據(jù)representation:- Sqquences: 利用順序的向量來作為輸入(輸出)數(shù)據(jù)- Grid: 使用2D的網(wǎng)格結構來作為輸入(輸出)數(shù)據(jù)- Graph:使用原始圖像作為輸入(輸出)數(shù)據(jù)2.PCGML訓練方法:- Backpropagation: 利用反向傳播作為訓練NN的方法來- Evolution: 使用演化計算方法來訓練NN或是直接生成結果- Frequency Count:使用統(tǒng)計學與馬爾科夫鏈變種來計算概率- Expectation Maximization: 利用EA算法來訓練無監(jiān)督學習模型- Matrix Factorization:矩陣因子化是一種數(shù)學方法來將輸入的矩陣分解到更低維度的方法

e.將游戲生成內(nèi)容與玩家體驗結合(EDPCG,Expierience-driven PCG),它包括了三個核心方面: 情緒激發(fā)、情緒檢測和情緒表達

情緒激發(fā): 游戲為激發(fā)情感提供了出色的背景構件,因為刺激是變化的,來自不同的來源,如圖像、聲音、故事等等。情緒檢測: 游戲用戶(玩家)通常更愿意提供更多的多模態(tài)性質(zhì)的輸入(通過傳感器),只要這將導致體驗的增強。從某種意義上說,玩家是情感計算和多模態(tài)交互研究的最佳用戶。情緒表達: 用戶在游戲中自愿經(jīng)歷一系列的體驗:這些體驗從非常積極的到非常消極的都有。同時,游戲中的情感體驗是受玩家影響的! 因此,玩家習慣于并在很大程度上對基于情感的表達持開放態(tài)度!2.3 利用AI為玩家建模

利用游戲產(chǎn)生的數(shù)據(jù)來為玩家建立體驗行為模型(包括其消費預測,游戲性行為預測,體驗感預測)或是進一步利用該數(shù)據(jù)來更新與描述游戲(例如平衡性分析,游戲流派,提供給Agent更多的訓練數(shù)據(jù))

以潛行恐怖游戲《Hello Neighbor》中的玩家建模例子。在這款游戲中,AI打造的領居會一直跟蹤玩家,并從過去的錯誤中吸取教訓,致力于打敗玩家。

(1)應用為導向

a.理解玩家在游戲中的體驗。AI可以根據(jù)玩家的體驗感來評測游戲各個組件與系統(tǒng); 輔助更新新的游戲活動; 輔助更新前兩個AI系統(tǒng)。b.理解玩家在游戲中的行為。AI輔助分析游戲行為,例如發(fā)掘一些新的游戲玩法;可以根據(jù)異常數(shù)據(jù)來判定外掛等作弊系統(tǒng);形成可觀的游戲數(shù)據(jù)來支持新的游戲AI迭代;輔助設計更具有公平性的匹配系統(tǒng);預測玩家的行為;對玩家社交群體分類;分析玩家的性格

(2)方法為導向

a.經(jīng)驗VS行為(Experience vs Behavior)

Experience: 玩家在游戲過程中的感受,包括:一系列(合成的)感受、認知、行為狀態(tài),或是其他的用戶狀態(tài),情緒和認知等Behavior:玩家在游戲過程中的行為。b.高級概念分類

model-based(理論驅(qū)動):從一些列玩家心理學、認知學的研究中得到一些玩家對應游戲的模型,來自上而下的設計游戲model-free(數(shù)據(jù)驅(qū)動):不利用之前的學科研究來對玩家進行自下而上的建模,其中包括可視化,例如熱力圖來衡量玩家的活動頻率。c.監(jiān)督學習玩家建模包括尋找一個函數(shù),將玩家的一組可測量的屬性映射到特定的玩家狀態(tài)。按照監(jiān)督學習的方法,這是通過機器學習或自動調(diào)整模型的參數(shù)來實現(xiàn)的,以適應包含一組輸入樣本的數(shù)據(jù)集,每個樣本與目標輸出配對。輸入樣本對應于可測量的屬性(或特征)列表,而目標輸出對應于我們有興趣學習預測的每個輸入樣本的玩家狀態(tài)的注釋。如前所述,注釋可以從行為特征,如關卡或玩家原型的完成時間,到玩家經(jīng)驗的估計,如玩家的挫折感等。

d.無監(jiān)督學習很多時候,我們面臨的數(shù)據(jù)集是沒有關于玩家行為或經(jīng)驗狀態(tài)的目標輸出。在這種情況下,玩家的建模必須依靠無監(jiān)督學習。無監(jiān)督學習的重點是通過發(fā)現(xiàn)輸入的關聯(lián),在沒有獲得目標輸出的情況下,將模型與觀察結果相匹配。輸入通常被視為一組隨機變量,通過觀察輸入向量之間的關聯(lián)來建立模型。應用于玩家建模的無監(jiān)督學習包括聚類和關聯(lián)挖掘等任務。

參考

[1]Georgios N. Yannakakis and Julian Togelius. Lecture. Slide 3. Playing Games. [Online].http://gameaibook.org/lectures/

[2]Georgios N. Yannakakis and Julian Togelius. Lecture. Slide 4. Generating Content. [Online].http://gameaibook.org/lectures/

[3]Summerville, Adam, Sam Snodgrass, Matthew Guzdial, Christoffer Holmgrd, Amy K. Hoover, Aaron Isaksen, Andy Nealen, and Julian Togelius. "Procedural content generation via machine learning (PCGML)." IEEE Transactions on Games 10, no. 3 (2018): 257-270. [pdf]

[4]Georgios N. Yannakakis and Julian Togelius. Lecture. Slide 5. Modeling Players. [Online].http://gameaibook.org/lectures/

 
 
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉載自其他媒體,并不代表本網(wǎng)站贊同其觀點,也不代表本網(wǎng)站對其真實性負責。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與中國機器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應并做處理。
電話:021-39553798-8007
更多>相關資訊
0相關評論

推薦圖文
推薦資訊
點擊排行
?