某些機(jī)器人挑戰(zhàn)有著明確的應(yīng)用場景,而有些挑戰(zhàn)則需要機(jī)器人系統(tǒng)根據(jù)場景的變化靈活應(yīng)變。而教小型機(jī)器人玩足球?qū)儆诤笳?。近日發(fā)表的一篇論文[PDF]中,詳細(xì)介紹了使用強化學(xué)習(xí)來教MIT的Mini Cheetah機(jī)器人扮演守門員角色;

使用四足動物的足球守門是一個具有挑戰(zhàn)性的問題,它將高度動態(tài)的運動與精確和快速的非抓握物體(球)操縱相結(jié)合。機(jī)器人需要在很短的時間內(nèi)(通常不到一秒)使用動態(tài)運動機(jī)動對潛在的飛行球做出反應(yīng)并攔截。在本論文中,我們建議使用分層無模型RL框架來解決這個問題。
實際上,機(jī)器人需要鎖定足球并在不到一秒鐘的時間內(nèi)自行移動以阻擋球。機(jī)器人的參數(shù)在模擬器中定義,Mini Cheetah依靠三個動作——回避、俯沖和跳躍——通過確定運動時的軌跡來阻止足球進(jìn)門。
