
騰訊視頻動(dòng)物在落下永久性運(yùn)動(dòng)障礙后,將終其一生去適應(yīng)這種行動(dòng)的不便,最終找到一種相對(duì)安全穩(wěn)重的運(yùn)動(dòng)方式。Sorbonne University 研究員 Jean-Baptiste Mouret 和一隊(duì)科學(xué)家打算將人類(lèi)對(duì)運(yùn)動(dòng)功能障礙的適應(yīng)應(yīng)用到機(jī)器人身上。在科學(xué)家眼中,只要找到人類(lèi)適應(yīng)性的數(shù)學(xué)模型,就能通過(guò)程序讓機(jī)器人也學(xué)會(huì)去“適應(yīng)”。
就像用身體去感知不同事物的幼兒,只是為了了解自己。
在最近一期的《自然》上,上述團(tuán)隊(duì)發(fā)表了一個(gè)算法,理論上能幫助“受傷”的機(jī)器人重新站起來(lái),而且這個(gè)過(guò)程是完全智能的——機(jī)器人自動(dòng)不斷試錯(cuò)來(lái)適應(yīng)新的身體狀況。于是機(jī)器人帶著科學(xué)家預(yù)設(shè)的智慧和直覺(jué)開(kāi)始了實(shí)驗(yàn)。一開(kāi)始機(jī)器人只知道自己身體是完好無(wú)損的,一旦受傷,它就會(huì)測(cè)試不同的“跛著走”策略,直至找到最好的方式。

在貝葉斯優(yōu)化算法(Bayesian Optimization)支持下,機(jī)器人將從 13000 種步伐中選出一種方案并開(kāi)始運(yùn)用,同時(shí)傳感器記錄行走的速度和方向,來(lái)評(píng)估這個(gè)步伐是否夠好。當(dāng)電腦有 90%的置信度時(shí),機(jī)器人將接受這一步法并按著預(yù)訂的路線繼續(xù)行走。經(jīng)過(guò)反復(fù)嘗試,機(jī)器人逐漸排除了一些不太靠譜的步法,對(duì)于新傷的適應(yīng)時(shí)間也縮短到了一兩分鐘。
與傳統(tǒng)算法的區(qū)別就是,新算法讓機(jī)器人“知道”自己健全時(shí)的行進(jìn)方式,并根據(jù)記憶去選擇最優(yōu)方案;而傳統(tǒng)算法不會(huì)把這種“記憶”考慮進(jìn)去。新算法在多數(shù)時(shí)候表現(xiàn)得更好,然而也有少數(shù)例外??茖W(xué)家猜測(cè),在較嚴(yán)重的傷害下,機(jī)器人的前置記憶可能將失去指導(dǎo)意義。
這種研究的意義遠(yuǎn)遠(yuǎn)不止于讓機(jī)器人適應(yīng)損壞的肢體,更廣的層面上,通過(guò)前置記憶和貝葉斯優(yōu)化算法可以讓機(jī)器人適應(yīng)不同的工作環(huán)境,以及工作中的突發(fā)狀況。

讓機(jī)器人學(xué)會(huì)像生物一樣去適應(yīng)變化是一項(xiàng)極其艱巨的任務(wù)。動(dòng)物對(duì)于環(huán)境的適應(yīng)來(lái)自于對(duì)環(huán)境的感知以及幾千上萬(wàn)年的進(jìn)化和代代遺傳,和機(jī)器人相比簡(jiǎn)直是人民幣玩家。哪怕目前應(yīng)用新算法的機(jī)器人仍然笨拙,讓機(jī)器人像生物一樣跛著走也具有重大的科研意義。