研究這個(gè)世界上最先進(jìn)的人工智能系統(tǒng),可能是一種非常奇怪的體驗(yàn)。一方面,你意識(shí)到自己正在進(jìn)行世界上最前沿的研究,兼負(fù)責(zé)人類有史以來最大的技術(shù)革命變革。另一方面,有時(shí)候你還會(huì)看到一些非常怪異和有趣的想法。
舉個(gè)例子,谷歌負(fù)責(zé)人工智能技術(shù)研發(fā)的子公司DeepMind最近就正在研發(fā)一種名為“在復(fù)雜環(huán)境下運(yùn)動(dòng)行為”的人工智能系統(tǒng)。這項(xiàng)研究探索了如何通過強(qiáng)化學(xué)習(xí)技術(shù)來告訴計(jì)算機(jī)在陌生和復(fù)雜的環(huán)境中適應(yīng)。而這是我們目前在虛擬世界中測試的一種基本的人工智能研究,而未來有一天,這項(xiàng)研究會(huì)幫助機(jī)器人在陌生的環(huán)境中直接爬樓梯或者躲避障礙物。
在演示中,我們看到這個(gè)火柴棍一樣的小人所有的動(dòng)作都是自動(dòng)完成的。跳躍、躲避和下蹲,所有都是計(jì)算機(jī)自行設(shè)計(jì)了自己的行為,并且獲得從A到B的最佳途徑,而DeepMind的程序員要做的,只是給配備一組虛擬的傳感器(告訴自己是否處于直立狀態(tài)),然后然小人自動(dòng)前進(jìn)。計(jì)算機(jī)可以通過實(shí)驗(yàn)和錯(cuò)誤的方式來處理不同的移動(dòng)方式。
這項(xiàng)研究最新奇之處就在于,研究人員正在探索復(fù)雜的環(huán)境如何教會(huì)一個(gè)人工智能機(jī)器人進(jìn)行復(fù)雜和正確的動(dòng)作。通常情況下,強(qiáng)化學(xué)習(xí)產(chǎn)生的行為很脆弱,而一旦進(jìn)入到不熟悉的環(huán)境中,系統(tǒng)就會(huì)崩潰。比如一個(gè)會(huì)在家里爬樓梯的嬰兒,卻無法自己學(xué)會(huì)乘坐電梯。
而通過這項(xiàng)研究證明,事實(shí)并非總是如此,強(qiáng)化學(xué)習(xí)技術(shù),可以用來教授人工智能系統(tǒng)處理更復(fù)雜的運(yùn)動(dòng)。