Google 在機(jī)器人學(xué)習(xí)上又進(jìn)一步:周三,Google 旗下一研究團(tuán)隊(duì)宣布,他們開(kāi)發(fā)了一套人工智能系統(tǒng),可以自主理解和操作游戲,而且其水平分分鐘超越人類(lèi)游戲高手。
據(jù)彭博社報(bào)道,這套系統(tǒng)由初創(chuàng)公司 DeepMind Technologies 研發(fā),Google 在去年收購(gòu)了這家公司。Google 表示,它是 Google 開(kāi)發(fā)具有自主學(xué)習(xí)能力人工智能技術(shù)的“第一個(gè)關(guān)鍵階段”。
這套系統(tǒng)能自主操作 Atari 2600 游戲機(jī)上的 49 款游戲。在實(shí)驗(yàn)中,人工智能系統(tǒng)在游戲中打完一關(guān),或者獲得高分,會(huì)獲得“狗糧”的獎(jiǎng)勵(lì)。
Google 的這套系統(tǒng)將儲(chǔ)存和獎(jiǎng)勵(lì)整合,讓機(jī)器人從環(huán)境中學(xué)習(xí)處理方法,并不斷修正之后的行為。

最后,在 29 款游戲的測(cè)試中,人工智能系統(tǒng)都表現(xiàn)出色,成績(jī)超過(guò)人類(lèi)游戲熟手玩家。共 43 次超越知名游戲算法。比如在視頻彈球游戲 Video Pinball 中,人工智能系統(tǒng)能輕而易舉打敗人類(lèi),得分甚至較專(zhuān)業(yè)玩家高出 20 倍。
這項(xiàng)實(shí)驗(yàn)的目的并非單純讓你在游戲里開(kāi)外掛,其背后的的應(yīng)用場(chǎng)景非常廣泛。人工智能系統(tǒng)如果能自主觀察、學(xué)習(xí)周?chē)氖澜?,并主?dòng)采取措施,它將有很多用途。比如應(yīng)用在 Google 無(wú)人駕駛汽車(chē)上。
盡管這仍與科幻電影里的人工智能相去甚遠(yuǎn),Google 的系統(tǒng)也只能勝任簡(jiǎn)單的小游戲,但這已經(jīng)是不錯(cuò)的開(kāi)端。DeepMind 聯(lián)合創(chuàng)始人、Google 技術(shù)副總裁 Demis Hassabis 說(shuō):這套系統(tǒng)目前只是掌握和理解了游戲的結(jié)構(gòu),但并沒(méi)有建立理性的認(rèn)識(shí),或抽象的知識(shí)。我們的最終目標(biāo)是開(kāi)發(fā)通用智能機(jī)器,但實(shí)現(xiàn)這一目標(biāo)還需要數(shù)十年的時(shí)間”。
與之前的人工智能系統(tǒng)相比,Google 的這一設(shè)計(jì)是一個(gè)進(jìn)步,因?yàn)槲④?、IBM、Clarifai 和 MetaMind 開(kāi)發(fā)的圖像識(shí)別系統(tǒng)通常需要人工干預(yù)。Hassabis 說(shuō),Google 將開(kāi)發(fā)更先進(jìn)的技術(shù),人工智能系統(tǒng)也將模仿生物,增添長(zhǎng)期記憶和戰(zhàn)略規(guī)劃系統(tǒng)。
短期內(nèi),這套系統(tǒng)有望在 3D 游戲中做到游刃有余,面對(duì)更復(fù)雜的環(huán)境可以繼續(xù)完成游戲。如果這一成果變現(xiàn),諸多領(lǐng)域都能得到實(shí)質(zhì)性的應(yīng)用。Hassabis 說(shuō):
如果人工智能系統(tǒng)能在賽車(chē)游戲中運(yùn)行,那它就可能有能力駕馭真正的汽車(chē)。