足式機(jī)器人常見(jiàn)的有雙足機(jī)器人和四足機(jī)器人,相對(duì)于其它種類(比如車輪,履帶),它的靈活性和穿透力更強(qiáng),能在更多的復(fù)雜環(huán)境中穿行。所以,足式機(jī)器人的運(yùn)動(dòng)控制成為了當(dāng)前機(jī)器人的一個(gè)重要研究方向,它可以取代人的巡警、搜索、故障診斷、業(yè)務(wù)、偵察等實(shí)際情況。

一般情況下,腳踏車的運(yùn)動(dòng)控制可以分成兩種。一種是以傳統(tǒng)方式為基礎(chǔ),比如軌跡優(yōu)化和模型預(yù)測(cè)控制。這類方法通常需要對(duì)機(jī)器人的運(yùn)動(dòng)學(xué)方程、地面形狀、摩擦系數(shù)等方面的足夠的了解。但是,在復(fù)雜的環(huán)境下,這種方法常常很困難。與此相反,另外一種訓(xùn)練方式在復(fù)雜的環(huán)境中表現(xiàn)得更好。將一個(gè)神經(jīng)網(wǎng)路在模擬機(jī)中直接進(jìn)行培訓(xùn),然后移植到現(xiàn)實(shí)生活中,這個(gè)方法被稱作「仿真向?qū)嶋H轉(zhuǎn)移」。由于深層次的強(qiáng)化學(xué)習(xí)能夠極大地降低對(duì)某一領(lǐng)域的知識(shí)的依賴性,而且所得到的訓(xùn)練策略也會(huì)顯示出較好的健壯性。
由于現(xiàn)有的深度學(xué)習(xí)模型的能力不足,很難支撐更多的復(fù)雜場(chǎng)景下的機(jī)器人進(jìn)行運(yùn)動(dòng),因此,大多數(shù)的增強(qiáng)學(xué)習(xí)方法都是以單一的機(jī)械軀體作為訓(xùn)練對(duì)象。經(jīng)過(guò)強(qiáng)化學(xué)習(xí)和培訓(xùn)后,該控制器僅適用于單一的機(jī)械手,當(dāng)機(jī)械手的性能發(fā)生變化時(shí),其操作者必須重新進(jìn)行培訓(xùn)。近幾年,基于增強(qiáng)學(xué)習(xí)的方式,諸如采用模塊化網(wǎng)絡(luò)體系結(jié)構(gòu)、基于機(jī)器人條件的策略、基于圖神經(jīng)網(wǎng)絡(luò)的方式,為機(jī)器人的各種具體(比如,不同的外形)的機(jī)器人提供了一種公共的控制器。但是,有些算法只是在模擬的情況下得到了證實(shí),并沒(méi)有在實(shí)際的機(jī)器人上得到證實(shí)。
由于機(jī)器人形態(tài)與控制方法之間復(fù)雜的關(guān)系,設(shè)計(jì)一個(gè)跨具身的機(jī)器人控制器目前還是一個(gè)有挑戰(zhàn)性的問(wèn)題。