說到可以給人穿衣服的機器人,你最先想到的是不是這個PR2機器人?

它由美國格魯吉亞理工學院的研究團隊開發(fā),可以利用力道感測幫人穿衣服;并且借助神經網絡技術,來學習和提升自己的穿衣技能。
近日,美國麻省理工學院研究人員研發(fā)了一種新算法,能讓機器人靈活地幫人類穿衣服。

據悉,該算法可為機器人找到有效的運動規(guī)劃,能確保人類人身安全,并避免 " 機器人凍結 " 問題。
▍讓機器人穿衣服,要克服這兩大難題
讓機器人給人類穿衣服,聽起來容易,要做到則需攻克技術難題。
一個人幫朋友往杯子里倒咖啡很容易,但對機器人說,要學會這個看似簡單的任務,它需要仔細觀察和理解人類的行為。
因為機器人不具備像人一樣控制自身行為的意識和能力,所以要實現機器人和人類的安全交互,需要對機器人的行為進行系統的規(guī)劃和協調。
如果能構建正確適當的人體運動建模(包含人類如何移動、反應和響應),那么機器人就能流暢地與人交互,但在很多情況下,完美無缺的建模并不存在。
例如,如果讓家用機器人使用一種簡單的默認模型,來教機器人如何幫人穿衣服,這個模型不會解釋人類反應存在很大的不確定性,跟每個人的個性、習慣都有關系。
比如,給蹣跚學步的孩子穿衣服,和給不太靈活還虛弱的老人、或容易疲勞的殘障人士穿衣服,需要用到不同的方法。
如果僅根據默認的模型進行軌跡規(guī)劃,那么機器人可能會碰傷人類。但如果在確保人類安全方面過于保守,那機器人可能會認為附近空間活動都不安全,因而不會移動,則又出現 " 機器人凍結(Freezing Robot)" 的問題。
▍模型預測控制(MPC)算法保證人類安全
人機交互時,機器人采用的安全方法包括預測和反應。預測方法允許機器人預測人類行為,同時規(guī)劃無碰撞運動。反應方法是使機器人能夠實時檢測碰撞,并在碰撞時做出相應反應以減少和人接觸產生的力。
這項研究論文的第一作者、麻省理工學院的博士 Shen Li 說:" 在不影響任務效率的前提下,開發(fā)算法來防止機器人對人類身體造成傷害是一項關鍵挑戰(zhàn)。"研究人員首先對 " 安全" 進行了重新的定義,在之前的相關研究中,對于人機交互預測和反應方法方面的人身安全定義是:避免碰撞和減少接觸產生的力。
通過結合這兩個定義,研究人員在人類感知運動規(guī)劃(HAMP)的背景下重新定義 " 安全 " 為:避免碰撞和發(fā)生碰撞時產生的安全沖擊兩個方面。
對比之前的方法,很多方法都是按順序集成預測和反應方法,機器人首先使用運動規(guī)劃器來尋找路徑,然后使用兼容控制器來執(zhí)行。但兩者方法是分別優(yōu)化其自身特定目標,而不是兩種方法保持同一個目標。
針對這些情況,本研究的研究人員提出了一種安全規(guī)劃器,在一個框架內集成預測和反應方法。
結合 Koller 等學者的研究,研究人員還開發(fā)了一種模型預測控制算法。根據他們自己的定義,即使人類的動態(tài)模型不確定,這個算法也能保證人類的安全。
該團隊的算法對于人類建模中的不確定性信息進行了推理,他們不是讓機器人只了解一種涉及潛在反應的單一默認模型,而是讓機器人學習更多可能的模型,來更接近人類,模仿人類如何理解其他人。隨著機器人收集數據地不斷增加,它會自己減少不確定性并改進這些人類行為模型。
例如,假設人類對穿衣的反應有兩種可能的模型。" 模式一 " 是人在穿衣時向上移動," 模式二 " 是人在穿衣時向下移動。借助團隊的算法,當機器人計劃其運動時,它不會選擇一種模型,而是會盡量確保兩種模式都是安全的。無論人是向上還是向下移動,機器人找到的行動軌跡都能保證人的安全。
▍成功在確保安全前提下給人穿衣服
在實驗中,機器人幫助人類穿上夾克,證明這種算法是一種強大的工具,它能讓機器人更精準高效地幫助行動不便的人。
除了關注人類身體是否安全之外,未來該團隊的工作可能會集中在調查機器人輔助穿衣任務期間人類的主觀感受。
美國卡內基梅隆大學機器人研究所助理教授 Zackory Erickson 說:" 這種多方面的方法結合了集合理論、人類感知安全約束、人體運動預測和安全人機交互的反饋控制,有可能應用于各種輔助機器人場景,最終目標是使機器人能夠為殘障人士提供更安全的幫助。"▍人機交互安全性還有提升空間
從掃地機器人、廚師機器人、送餐機器人、看護機器人到本研究的穿衣機器人等等,機器人的種類和功能越來越多,使用的場景也在不斷增多,尤其老人、小孩和殘障人士,除了家人的照顧之外,未來機器人可能也會提供越來越多樣的幫助。
機器人數量和使用范圍的拓寬,人機交互更加密切。到目前,人機交互的安全性問題像這個穿衣機器人實驗一樣,只是在某一或某類特定場景下實驗成功,其他場景還有待核驗。人機交互的安全性還有不少可提升空間。