
之前的深度學(xué)習(xí)能力已成功提升了(機(jī)器人的)語言、圖像識(shí)別能力;加州大學(xué)伯克利分校的研究者們研發(fā)了一種新算法,使機(jī)器人通過練習(xí)和試錯(cuò),自己學(xué)會(huì)完成任務(wù);這兩種深度學(xué)習(xí)技術(shù)頗為相似。研究者們說它們這種方式與人類學(xué)習(xí)方式更為接近。
在這個(gè)視頻中,我們看到機(jī)器人Willow Garage PR2學(xué)習(xí)怎樣玩樂高玩具、學(xué)會(huì)完成各種不同的簡(jiǎn)單任務(wù),包括開瓶蓋、組裝玩具飛機(jī)、插入鞋楦等。

當(dāng)機(jī)器人離開工廠,進(jìn)入更為嘈雜、充滿未知數(shù)的環(huán)境之中,如家庭、辦公室時(shí),這些能力對(duì)他們至關(guān)重要。當(dāng)然這也是“Rosie”和“杰森”(電影《摩登家庭》人物)一直以來的夢(mèng)想;要實(shí)現(xiàn)這一夢(mèng)想,機(jī)器人首先要學(xué)會(huì)觀察環(huán)境、學(xué)會(huì)適應(yīng)變化、掌握許多技能;最理想的是:每一種新環(huán)境機(jī)器人都能適應(yīng),不用重寫程序。
“重點(diǎn)是,機(jī)器人面對(duì)一種新事物時(shí),我們不用為它重新編程。”該項(xiàng)目領(lǐng)導(dǎo)者之一,加州大學(xué)伯克利分校教授Pieter Abbeel 說,“寫入一個(gè)程序,告訴機(jī)器人怎樣學(xué)習(xí),機(jī)器人使用同一個(gè)程序?qū)W習(xí)完成我們交給它的所有新任務(wù)。”
另一個(gè)關(guān)鍵是:機(jī)器人能閱讀分析海量數(shù)據(jù)。
BRETT,全稱叫做“消滅枯燥工作的伯克利機(jī)器人”,能通過攝像頭記錄其周邊環(huán)境,每次嘗試(任務(wù))后給自己的表現(xiàn)打分;嘗試某個(gè)任務(wù)時(shí),它的神經(jīng)網(wǎng)絡(luò)(92000個(gè)神經(jīng)元)會(huì)判斷任務(wù)完成與否——神經(jīng)系統(tǒng)不停地計(jì)算、工作,直至機(jī)器人找到解決辦法。
雖然這一技術(shù)與語言認(rèn)知能力的技術(shù)類似,但實(shí)現(xiàn)前者的難度更大。
“在一個(gè)事先沒有預(yù)設(shè)好的3D環(huán)境中行動(dòng),(對(duì)機(jī)器人)是一個(gè)全新的挑戰(zhàn),”博士研究生Chelsea Finn說。“沒有明確的方向指引、沒有案例告知怎樣解決問題,沒有類似于語言和圖像識(shí)別程序那樣的解決方案。”
BRETT像大多數(shù)機(jī)器人一樣,行動(dòng)緩慢;但如果給它一點(diǎn)提示(如任務(wù)開始、結(jié)束階段的協(xié)助),10分鐘之內(nèi)它就能學(xué)會(huì)完成一項(xiàng)新工作;如果沒有任何幫助,它完成任務(wù)的時(shí)間則會(huì)延長(zhǎng)到3個(gè)小時(shí)左右。
研究團(tuán)隊(duì)希望未來幾年內(nèi)使機(jī)器人的表現(xiàn)更出色。隨著計(jì)算機(jī)程序處理大數(shù)據(jù)的能力加強(qiáng),而且數(shù)據(jù)庫容量擴(kuò)大,(機(jī)器人)完成復(fù)雜任務(wù)指日可待。
“讓我們的機(jī)器人學(xué)會(huì)打掃房間、洗熨衣服,我們還有很長(zhǎng)的路要走。”Abbeel說。“但初步結(jié)果顯示,掌握了深度學(xué)習(xí)能力,對(duì)于機(jī)器人從零開始到學(xué)會(huì)完成復(fù)雜任務(wù),有革命性的作用。未來5到10年內(nèi),我們也許將親眼見證機(jī)器人學(xué)習(xí)能力的驚人變化。”