機(jī)器人最出名的弱點就是不會通過反復(fù)練習(xí)學(xué)習(xí)做一件事。你能在一個機(jī)器人的大腦里打包許多信息,但是卻沒辦法教它完成沒有事先編程好的任務(wù)。甚至連簡單的搬磚和扭飲料瓶都做不到。
不過這種情況很快就會改變了,加州大學(xué)伯克利分校的研究員們正在研究一種新算法讓機(jī)器人可以通過練習(xí)、犯錯來學(xué)習(xí)所有新技能,就像人類一樣。切實點說,這個算法可能最終可能產(chǎn)生機(jī)器人管家,能幫你完成各種不想做的無聊乏味的家務(wù)活(換燈泡、洗廁所、疊衣服)。
一般來說,機(jī)器人認(rèn)識世界是全靠大量預(yù)編程序的,讓它們知道在什么情況下作何反應(yīng)。這種算法可用于可控制的環(huán)境里(如實驗室或醫(yī)療機(jī)構(gòu)),如果它們要更加融入我們的日常生活,機(jī)器人必須要學(xué)會適應(yīng)未知環(huán)境,這會是人工智能技術(shù)發(fā)展的關(guān)鍵一步。
為此,伯克利分校“人與機(jī)器人倡議”活動的參與研究員正轉(zhuǎn)向稱為“深度學(xué)習(xí)”的人工智能分支,這個技術(shù)是來源于大腦利用神經(jīng)線路來感知世界并進(jìn)行互動。
機(jī)器人研究者Sergey Levine介紹說:“人類并不是生來就會所有的行為模式,但我們也不需要被編程。我們用一生的時間從他人、實踐中學(xué)習(xí)、掌握這些技能。這個學(xué)習(xí)的過程根植于我們的神經(jīng)系統(tǒng),我們甚至沒辦法言傳身教到底要怎樣才能做好這件事,只能提供一些建議和指導(dǎo)讓他們自己領(lǐng)悟?qū)W習(xí)。”
如果你用過Siri、谷歌的語音助手或是谷歌街景,那你就已經(jīng)從(深度學(xué)習(xí))中獲益了。不過把深度學(xué)習(xí)應(yīng)用到動作技能上卻有更多挑戰(zhàn)。從復(fù)雜程度來說, 肢體任務(wù)比單純地用視覺或聽覺被動感知要難得多。
在近期的實驗中,研究員一直在研究一個他們叫“伯克利清理乏味任務(wù)機(jī)器人”(Berkeley Robot for the Elimination of Tedious Tasks,BRETT)的小機(jī)器人,BRETT被訓(xùn)練完成了一系列簡單的動作任務(wù),比如把楔子釘進(jìn)洞里或堆樂高磚。這個算法包括BRETT學(xué)習(xí)新人物的好壞,達(dá)到多熟練會有獎勵機(jī)制。這個獎勵制度很關(guān)鍵:能幫助他完成任務(wù)的會得更高的分,而沒用得動作則不會得分,這樣會讓他的神經(jīng)網(wǎng)絡(luò)傳達(dá)成千上萬的參數(shù)。
到目前為止,BRETT的訓(xùn)練結(jié)果令人震驚。如果把物體在一個場所的位置告訴他,他一般能在十分鐘里面完成一個新任務(wù)。如果位置未知,那他就要同時開動視覺和動作控制馬達(dá),那么這個學(xué)習(xí)過程需要幾個小時。
伯克利分校電氣工程與計算機(jī)科學(xué)系的Pieter abbeel說:“在我們的機(jī)器人學(xué)習(xí)打掃房間或洗衣服之前,我們?nèi)匀挥泻荛L的路要走,不過我們目前出的初步結(jié)果表明這種深度學(xué)習(xí)技術(shù)可以讓機(jī)器人從零開始學(xué)習(xí)復(fù)雜的任務(wù),這將帶來革命性的影響。在接下來的額五到十年里,它們的學(xué)習(xí)能力或許會有明顯進(jìn)步。”
想想過年時候的大掃除全都可以交給機(jī)器人,是不是很爽?