當(dāng)安南耶·阿加瓦爾(Ananye Agarwal)帶著他的“狗”,在美國卡內(nèi)基梅隆大學(xué)附近的公園來回散步時,其他的狗和狗主人時常會駐足觀察。

(來源:COURTESY OF THE RESEARCHERS)
這是因為阿加瓦爾的“狗”是一個機器狗,而且是一個特別的機器狗:其他機器狗必須使用內(nèi)置地圖才能四處活動,而他的機器狗則使用了內(nèi)置攝像頭。
阿加瓦爾是卡耐基梅隆大學(xué)的一名博士生,他所在的研究團隊開發(fā)了一種新技術(shù),可以讓機器人利用計算機視覺和強化學(xué)習(xí)在復(fù)雜的地形上行走。研究人員希望,他們的工作能夠幫助機器人更容易部署并融入現(xiàn)實世界。
加州大學(xué)伯克利分校的研究生阿什·庫馬爾(Ashish Kumar)說,與市場上現(xiàn)有的、使用內(nèi)置地圖移動的機器人不同,這個機器人只使用攝像頭來操控其在戶外的活動。他也是這項工作的論文作者之一,論文將在下個月的CoRL(Conference on Robot Learning,機器人學(xué)習(xí)大會)上展示。
當(dāng)然,還有很多同樣利用攝像頭來引導(dǎo)機器人運動的嘗試,但他們僅限于平坦的地形。阿加瓦爾及其研究團隊可以讓機器人走上樓梯、跨越石頭、跳過縫隙。

(來源:COURTESY OF THE RESEARCHERS)
他們首先將機器狗(四足機器人)放在模擬環(huán)境中進行訓(xùn)練,練習(xí)在不同的場景下移動,所以它大致掌握了戶外的地形,以及上下樓梯是什么樣子的。
當(dāng)在現(xiàn)實世界中部署時,四足機器人前面的攝像頭會捕捉畫面并引導(dǎo)它的運動。此外,該機器人通過強化學(xué)習(xí)學(xué)習(xí)如何調(diào)整步態(tài),來更好地在樓梯和不平坦的地面上導(dǎo)航。
據(jù)悉,強化學(xué)習(xí)是一種人工智能技術(shù),允許系統(tǒng)通過反復(fù)試驗和試錯來不斷進步??▋?nèi)基梅隆大學(xué)的助理教授迪帕克·帕塔克(Deepak Pathak)是該團隊的一員,他表示移除內(nèi)置地圖提升了機器人的魯棒性,因為它不再受到地圖中潛在錯誤的限制。
谷歌的研究科學(xué)家Jie Tan沒有參與這項研究,他表示讓機器人將相機上的原始像素,轉(zhuǎn)換為探索周圍環(huán)境所需的精確和平衡的運動,
他說,這項工作是他首次看到“一個小型和低成本的機器人”可以展示出如此令人印象深刻的移動性。
華盛頓大學(xué)機器學(xué)習(xí)和機器人控制的研究員石冠亞認(rèn)為,該團隊已經(jīng)“在機器人學(xué)習(xí)和自主性方面取得了突破”。meta AI研究科學(xué)家阿克沙·拉萊(Akshara Rai)對這一觀點表示同意。
拉萊說:“這項工作是建造這種有感知能力的機器人,并且是實現(xiàn)戶外部署的很有希望的一步。”
然而,盡管該團隊的工作有助于改善機器人的行走方式,但它不會幫助機器人提前確定要去哪里。拉萊指出,導(dǎo)航對于在現(xiàn)實世界中部署機器人十分重要。在機器狗能夠在公園里自主閑逛或在房子里幫你拿東西之前,還需要做更多的工作。
谷歌的科學(xué)家Jie Tan強調(diào),雖然這個機器人可以通過前置攝像頭了解深度,但它無法應(yīng)對光滑的地面或長得很高的草等情況,因此它可能會掉入水坑或被困在泥地里。