麻省理工學院(MIT)的仿生學實驗室最近讓迷你獵豹機器人(MiniCheetah)的速度打破了記錄:雖然它還比不上飛人博爾特,但它可能已經比你跑得快了。此外,這個機器人沒有視力,而麻省理工學院的研究人員也并沒有訓練它走或跑。相反,它是自己學會的,而且只用了三個小時。
其中的關鍵在于:將人工從大部分制造過程中移除,以及模擬器的廣泛使用。
“傳統(tǒng)上,人們一直在使用的(訓練機器人)的過程需要你研究實際的系統(tǒng)并手動設計模型......這個過程是好的,也是成熟的,但它的可擴展性不是很強。”麻省理工學院教授PulkitAgrawal最近在TechFirst的播客上告訴筆者。“但現在,我們正在將人類從特定行為的設計中移除。”

麻省理工學院的迷你獵豹機器人在3小時內自己學會了走路和跑步。圖片來源:JOHNKOETSIER
Agrawal說,用傳統(tǒng)方法訓練機器人需要大約100天的高強度訓練。這是計算機科學家和工程師在設計行為和完成數月的試錯學習所需要的時間。
將時間縮短到3個小時意味著要大量使用使用來自英偉達(NVIDIA)和其他合作伙伴的技術模擬器,同時也意味著要改變訓練方法,即從告訴機器人該做什么,變成到讓它(相對)自由地去犯錯。
“如果我要移除一個人類設計師……我需要付出代價。”Agrawal說。“這個代價就是我們要做試錯學習,但這需要更多的數據……如果你在現實世界中做這個,代價是非常昂貴的,因為它需要100天的現實世界經驗,而且如果機器人摔倒了,那就不太妙。所以,模擬器提供的是一種安全的游樂場,機器人在這里摔倒以后還可以從頭來過,而且模擬器的運行速度比現實時間快得多。”
所以,模擬器和可以犯下沒有后果的錯誤的自由就是這其中最要緊的兩個因素。
之前的機器人運行控制系統(tǒng),比如波士頓動力公司(BostonDynamics)的機器人和麻省理工學院的獵豹3(Cheetah3),都是經過人工分析設計的。麻省理工學院表示,這意味著要依靠工程師來分析運動的物理特性,制定抽象概念,并實現控制器的層次結構,從而使機器人保持平衡和運行。在現實世界中,這意味著試錯、分析錯誤、調整軟件模型,以及重新嘗試……與此同時,你還得盡量避免機器人硬件在每次掉下來的時候都把自己砸成碎片。
所以模擬是可行的,自我學習也是可行的,但還有一個關鍵步驟,那就是讓模擬的技能適應現實世界,畢竟現實世界與模擬環(huán)境還是有所不同。(無論你的模擬環(huán)境有多好,它都不可能完全等同于現實。)
麻省理工學院表示:“我們開發(fā)了一種方法,通過這種方法,機器人的行為可以從模擬經驗中得到改善,而且我們的方法還能在現實世界中成功部署這些學到的行為。為什么機器人的運行技能在現實世界中能運行良好,其背后的邏輯就是:在它在這個模擬器中看到的所有環(huán)境中,有些環(huán)境將教會機器人在現實世界中有用的技能。當在現實世界中操作時,我們的控制器就會實時識別并執(zhí)行相關技能。”
其結果就是,這款迷你獵豹機器人能以普通人所能達到的速度奔跑:大約每秒4米,或每小時9英里。
這聽起來可能不是很快,但對這個特殊的機器人來說,這已經創(chuàng)下了一個記錄。畢竟,它只有一英尺高,20磅重。麻省理工學院的研究生GabrielMargolis說,只要擴大尺寸,它的速度就會提高。這也就意味著,即便他們是想打敗博爾特,而不僅僅是坐在輪椅上的老奶奶,他們也可以做到。(早在2012年,波士頓動力公司就推出了一款跑得和博爾特一樣快的機器人。不過,那個機器人是在跑步機上運動,并且由外部動力驅動的,而且它有一個支持系統(tǒng)。)
但還有另一個令人驚訝的部分:這個機器人沒有視力。
“我們所展示的這款機器人的所有行為基本上都是在沒有視力的情況下實現的。”Margolis說。“這款機器人的腳上也沒有觸摸傳感器,但它是通過關節(jié)的運動來感覺環(huán)境。”
在生物學中,這被稱為本體感覺或運動感:一種不用看就能知道你的四肢在哪里以及它們在做什么的能力。(多年前,當筆者在早春時節(jié)蹚過一條山間小溪時就體會過這種能力。當時我的腳在冰冷的水中失去了知覺,于是不得不把它們推到河床里,以測試在哪里可以找到堅實的立足點。)
這讓獵豹機器人能感覺到它所處的是什么表面:無論是雪還是冰,是水泥還是草還是碎石,獵豹都會相應地調整其運動方法和速度。
Margolis說:“我們當然對增加更多的傳感器感興趣,但我們展示的所有這些行為實際上都是在沒有傳感器的情況下實現的。使用視覺當然有一些優(yōu)點,但也有很多缺點,其中之一就是模擬的速度會慢很多,所以你可能無法以同樣的方式獲得如此快速的提升。”
但有一個合理的問題是:為什么要給這款機器人配上腿呢?
畢竟,用輪子來前進反而更快,更有效率,也更容易學習或編程,而且需要的平衡也少得多。這個問題的答案在于,你希望機器人最終能做什么。
“它們可以去到很多輪式機器人不能去到的地方。”Margolis說。“例如我們可以(通過這種技術)讓應急車輛進入人們的家中救人;我們還可以用它開展送貨服務,把東西送到你的樓梯上,到你的門廊,甚至到你的家里。”
對于那些可能想從麻省理工學院的有腿機器人研究中受益的人來說,好消息是這是免費的。Agrawal說,該代碼是開源項目,任何人都可以下載和使用它,復制結果,并在它的基礎上進行構建。
“好消息是,我們真的是在一個低成本的平臺上進行這項研究,所以即使你自己建造了一個四足機器人,你也可以在它上面部署我們的系統(tǒng),因為我們的系統(tǒng)不需要任何專門或昂貴的設備。”Agrawal說。“所以,從某些方面來說,我們的研究是非常民主的。”