美國(guó)卡內(nèi)基梅隆大學(xué)的研究人員利用神經(jīng)網(wǎng)絡(luò)技術(shù)開發(fā)了一種人工智能殺人機(jī)器人。不過,好在這種機(jī)器人只能用在游戲《毀滅戰(zhàn)士》(Doom)中。

你或許認(rèn)為,由于游戲中的死亡都是虛擬的,所以無關(guān)緊要。但\在電腦眼中,一切都是虛擬的。所以,即便是應(yīng)用到現(xiàn)實(shí)世界,人類在它們眼中也跟游戲角色沒有區(qū)別。
你或許有一個(gè)問題:這種人工智能殺人機(jī)器人與之前的游戲中內(nèi)置的電腦有何區(qū)別?畢竟,之前的游戲也可以與電腦對(duì)戰(zhàn)。

這些人工智能機(jī)器人都可以在游戲中自主運(yùn)行,了解各種參數(shù)、坐標(biāo)、優(yōu)勢(shì)、地點(diǎn)、槍械型號(hào)和衛(wèi)生設(shè)備。但與之前的電腦角色相同的是,它們可以通過程序?qū)μ囟ㄓ螒騾?shù)做出特定反應(yīng)。
這款人工智能機(jī)器人由桂拉米·拉普爾(Guillaume Lample)和戴文德拉·辛格·錢普洛特(Devendra Singh Chaplot)開發(fā)。它玩游戲的方式與人類相同,它也會(huì)盯著屏幕,識(shí)別角色環(huán)境和方位,然后在地圖上尋找出路,射擊任何移動(dòng)的物體。
事實(shí)上,之前已經(jīng)有一些類似的人工智能技術(shù),可以通過自學(xué)《Space Invaders》等簡(jiǎn)單的游戲來找到獲得高分的辦法。但這個(gè)最新的人工智能機(jī)器人較之前的技術(shù)提升了一個(gè)等級(jí)。
整個(gè)的神經(jīng)網(wǎng)絡(luò)主要是通過像素?cái)?shù)據(jù)接受訓(xùn)練,跟人類觀看屏幕的方式類似——但制作者也有一點(diǎn)作弊的行為:他們幫助機(jī)器人通過游戲引擎獲得基本的洞察力,了解屏幕上是否有敵人或其他物品。
這套人工智能系統(tǒng)的強(qiáng)化策略如下:如果能夠撿起東西,迅速移動(dòng),并殺死對(duì)方,便可獲得褒獎(jiǎng);如果受傷或死亡,則會(huì)受到懲罰。這套系統(tǒng)最終的表現(xiàn)好于游戲內(nèi)置的電腦和人類選手。
整套系統(tǒng)分成兩部分,一部分是導(dǎo)航系統(tǒng),可以負(fù)責(zé)四處移動(dòng),收集東西,并學(xué)會(huì)如何解讀環(huán)境圖像。另外一部分則是設(shè)計(jì)系統(tǒng),可以了解何時(shí)有敵人出現(xiàn)在屏幕上,瞄準(zhǔn)合適的目標(biāo)后扣動(dòng)扳機(jī)。