不遠(yuǎn)的未來,機(jī)器人助理就會(huì)成為我們?nèi)粘I畹囊徊糠?mdash;—但愿教它們新任務(wù)的時(shí)候不用非得編程。要是非得先學(xué)編程才能使用機(jī)器人,那這頓飯還是我自己做吧?,F(xiàn)在,一個(gè)新系統(tǒng)讓教機(jī)器人就像教孩子一樣容易(也許不那么容易?)不過這回機(jī)器人統(tǒng)治論者又有了新口實(shí),因?yàn)闄C(jī)器人可以用這個(gè)新系統(tǒng)互相之間分享技能了。訓(xùn)練機(jī)器人有兩個(gè)基本方法。一個(gè)是為它的行動(dòng)編程,這要求時(shí)間和編寫代碼的技能;另一個(gè)是把你想讓它做的事演示給它看,擺弄它的實(shí)體或者移動(dòng)它的數(shù)字表征都行,也可以做出樣子來讓它模仿。但一些任務(wù)的精確程度不是人類能輕松做出樣子的——比如拆除炸彈引信之類的。
現(xiàn)在,用一個(gè)叫作 C-LEARN 的系統(tǒng),科學(xué)家們賦予了機(jī)器人知識(shí),這些知識(shí)表現(xiàn)為一些簡(jiǎn)單的步驟,在學(xué)習(xí)新任務(wù)時(shí),機(jī)器人可以智能地應(yīng)用這些知識(shí)。
“(C-LEARN)實(shí)用又有效。”并未參與本項(xiàng)研究的加州伯克利大學(xué)機(jī)器人專家 Anca Dragan 說。
C-LEARN 從單一演示中學(xué)習(xí)多步驟操作,并可實(shí)現(xiàn)機(jī)器人間的技能共享
在這個(gè)系統(tǒng)中,人類用戶首先幫助構(gòu)建機(jī)器人的知識(shí)庫。研究人員通過在軟件程序中點(diǎn)擊并拖動(dòng)其四肢,教導(dǎo)了一個(gè)名叫 Optimus 的雙臂機(jī)器人。他們展示了諸如抓住圓柱體的頂部或塊的側(cè)面這樣的動(dòng)作,從不同的位置進(jìn)行了七次任務(wù)。每次運(yùn)動(dòng)都有輕微的變化,機(jī)器人就會(huì)尋找模式,然后將其整合到系統(tǒng)中。例如,如果抓手總是最終大致平行于物體,則機(jī)器人將推斷并行度是該過程的重要約束(constraint)。
在這一點(diǎn)上,機(jī)器人是“像一個(gè)2歲的寶寶,只是知道如何夠到某個(gè)東西并抓住它。”研究負(fù)責(zé)人、MIT 計(jì)算機(jī)科學(xué)家 Claudia Pérez D'Arpino 說。憑借其知識(shí)庫,機(jī)器人只需一次演示即可學(xué)習(xí)新的多步驟任務(wù)。用戶使用 C-LEARN 軟件向機(jī)器人展示所需的任務(wù),然后批準(zhǔn)或糾正機(jī)器人的嘗試。非常簡(jiǎn)單易行。
沒有參與本研究的西雅圖華盛頓大學(xué)機(jī)器人專家 Maya Cakmak 說:“十多年前機(jī)器人就可以遵從幾何約束了,然而,此前只有專家才能夠使用它們。”
為了測(cè)試系統(tǒng),研究人員教了Optimus 四個(gè)多步驟任務(wù):拿起一個(gè)瓶子放在一個(gè)水桶里;用雙手抓住并抬起一個(gè)托盤;用一只手打開一個(gè)盒子,然后用另一只手按下盒子中的一個(gè)按鈕;用一只手抓住一個(gè)立方體上的把手,并用另一只手把一根桿子直拉出立方體。對(duì)于每個(gè)任務(wù),Optimus 接受了一次演示,并進(jìn)行了10 次嘗試。 40 次嘗試中,一共成功37 次,研究人員將于本月晚些時(shí)候在 ICRA 會(huì)議上進(jìn)行報(bào)告。
為了增加挑戰(zhàn)難度,研究人員將 Optimus 的知識(shí)庫及其對(duì)四項(xiàng)任務(wù)的計(jì)劃轉(zhuǎn)移給了機(jī)器人Atlas ,Atlas 是個(gè)始終能保持平衡的雙足機(jī)器人。Atlas 設(shè)法完成了四項(xiàng)任務(wù)。但是當(dāng)研究人員刪除掉一些轉(zhuǎn)移的知識(shí)——例如保持某些移動(dòng)平行的約束后,它失敗了。
這種知識(shí)轉(zhuǎn)移會(huì)有實(shí)際的應(yīng)用價(jià)值。D'Arpino 說:“你能教一個(gè)德國工廠里的機(jī)器人做的事,沒理由不能轉(zhuǎn)移到加拿大的另一個(gè)機(jī)器人身上。”當(dāng)然,那些認(rèn)為未來一片黑暗的悲觀主義者關(guān)心的是,通過互聯(lián)網(wǎng)互相傳遞新技能將成為機(jī)器人統(tǒng)治世界的第一步。
D'Arpino 目前正在考察人類與 Optimus 的首次互動(dòng)是否就可以教會(huì)它新的技巧。雖然還不能討論過多細(xì)節(jié),但迄今為止前景樂觀。接下來,她希望教會(huì)機(jī)器人靈活地即時(shí)調(diào)整自己學(xué)到的技能。
最終目標(biāo)之一是教會(huì)機(jī)器人拆彈,這個(gè)任務(wù)對(duì)精確性要求很高。機(jī)器人需要快速、高精度地引導(dǎo)。其他應(yīng)用包括發(fā)現(xiàn)大災(zāi)中的人類、制造電子產(chǎn)品、幫助患病或懶惰的人做家務(wù)。“這是家居機(jī)器人的發(fā)展方向,但問題是現(xiàn)在它們什么都做不來。”D’Arpino說,“除了吸塵,現(xiàn)在的機(jī)器人還能給你做什么?這真的挺難的。”她希望能改變這個(gè)現(xiàn)狀。