科技媒體 notebookcheck (8 月 27 日)發(fā)布博文,報道稱波士頓動力公司宣布,其四足機器人犬 Spot 通過強化學習掌握了多次后空翻。
官方表示這一動作并非客戶的直接需求,但這背后的強化學習訓練能顯著提升 Spot 在極端情況下的生存能力,例如在跌倒、滑倒或絆倒時更好地調(diào)整姿態(tài),從而保護機身及背部昂貴的傳感器免受損壞。
在研發(fā)過程中,波士頓動力首先在計算機中模擬后空翻動作。然而,正如公司機器人工程師阿倫?庫馬爾在視頻中介紹的那樣,初期將訓練成果應用到真實機器人上幾乎每次都會失敗。
為了減少損壞風險,團隊最初在體操墊上進行測試,隨后逐漸增加挑戰(zhàn)難度,直至讓 Spot 在更高風險的環(huán)境中完成動作。
波士頓動力表示,Spot 解鎖連續(xù)后空翻這個高難度技能后,還帶來了意外收獲 —— 其行走姿態(tài)變得更加自然,接近真實四足動物的動作模式。
強化學習是此次訓練的核心方法。通過大量試錯與反饋調(diào)整,Spot 逐漸掌握了精確的身體控制能力,甚至能在前腿安裝滾輪的情況下保持平衡。