MIT 研發(fā)出的反饋系統(tǒng)能夠讓人類操作者僅通過(guò)大腦信號(hào)就能實(shí)時(shí)糾正機(jī)器人做出的選擇。
為了讓機(jī)器人按照人類想法行事,它們就得理解我們。很多時(shí)候,這意味著不得不做出妥協(xié):教機(jī)器學(xué)懂得人類語(yǔ)言的玄妙,比如,為它們提供特定任務(wù)的具體指令。
但是,如果可以研發(fā)出一種類似人類自然延伸的機(jī)器人,讓它們可以按照我們的想法自如行動(dòng),又會(huì)怎么樣?
麻省理工學(xué)院的計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的團(tuán)隊(duì)和波士頓大學(xué)正在攻克這一難題,他們打造出了一種反饋系統(tǒng),讓人類僅用大腦就可以迅速糾正機(jī)器人犯下的錯(cuò)誤,這款 MIT 研發(fā)出的反饋系統(tǒng)能夠讓人類操作者僅通過(guò)大腦信號(hào)就能實(shí)時(shí)糾正機(jī)器人做出的選擇。

使用腦電圖(EGG)檢測(cè)器(用來(lái)記錄大腦活動(dòng)的)輸出的數(shù)據(jù),當(dāng)機(jī)器人執(zhí)行某個(gè)目標(biāo)分類任務(wù)時(shí),該系統(tǒng)可以識(shí)別出人類是否注意到機(jī)器人犯錯(cuò)了。這一團(tuán)隊(duì)研發(fā)的新的機(jī)器學(xué)習(xí)算法能夠幫助系統(tǒng)分類 10 到 30 微秒空間中的腦電波。
盡管該系統(tǒng)當(dāng)前只能處理相對(duì)簡(jiǎn)單的二項(xiàng)選擇,但是,這篇論文的資深作者表示,該研究表明,人類有一天能夠以更加充滿直覺(jué)的方式控制機(jī)器人。
「想象一下你無(wú)需輸入命令、按按鈕或口頭命令,就可以迅速告訴機(jī)器人做出某個(gè)動(dòng)作。」CSAIL 主任 Daniela Rus 說(shuō),「這種高效的解決方案將提升人類監(jiān)管工廠機(jī)器人、無(wú)人駕駛汽車(chē)以及其它尚未發(fā)明技術(shù)的能力。」
在該項(xiàng)研究中,團(tuán)隊(duì)使用了一臺(tái)「Baxter」人形機(jī)器人,該機(jī)器人的生產(chǎn)廠商是 Rethink Robotics,其負(fù)責(zé)人是前 CSAIL 主任,也是 iRobot 的聯(lián)合創(chuàng)始人 Rodney Brooks。
這篇論文的作者是波士頓大學(xué)(BU)的 PhD candidate Andres F. Salazar-Gomez、CSAIL 的 PhD candidate Joseph DelPreto 和 CSAIL 研究科學(xué)家 Stephanie Gil,指導(dǎo)老師為 Rus 和波士頓大學(xué)的教授 Frank H. Guenther。該論文已經(jīng)被將于今年 5 月在新加坡舉辦的 IEEE 機(jī)器人與自動(dòng)化國(guó)際會(huì)議(ICRA)接收。
通過(guò)直覺(jué)與機(jī)器人互動(dòng)
在過(guò)去,通過(guò) EEG-控制的機(jī)器人需要人類以計(jì)算機(jī)可識(shí)別的固定方式進(jìn)行「思考」。例如,一個(gè)操作人員面前有兩束亮光,他必須要看其中一個(gè)才能讓機(jī)器進(jìn)行特定工作,因?yàn)槊恳皇凉舛寂c機(jī)器人的特定工作任務(wù)有關(guān)。
這種方法的缺陷在于訓(xùn)練過(guò)程和對(duì)人思維活動(dòng)的建模是非常耗時(shí)耗力的,特別是對(duì)那些監(jiān)督導(dǎo)航與構(gòu)建工作的人來(lái)說(shuō)更是如此,因?yàn)檫@些任務(wù)需要高強(qiáng)度的注意力。
Rus 的團(tuán)隊(duì)想把這整個(gè)過(guò)程變得更自然點(diǎn)。為了實(shí)現(xiàn)該目標(biāo),他們聚焦于一種稱為「誤差相關(guān)電位(error-related potential,ErrP)」的大腦信號(hào),只要我們的大腦意識(shí)到了一個(gè)錯(cuò)誤,這種信號(hào)就會(huì)生成。當(dāng)機(jī)器人給出它打算做哪一種選擇時(shí),該系統(tǒng)就會(huì)使用 ErrP 信號(hào)來(lái)判斷人類是否同意機(jī)器的這個(gè)決定。
「當(dāng)你看著這個(gè)機(jī)器人時(shí),你所需要做的僅僅是在大腦中同意或者反對(duì)它正在做的事情就可以了,」Rus 說(shuō)道,「你不必訓(xùn)練自己一定要以某種特定方式來(lái)思考——我們的機(jī)器會(huì)來(lái)適應(yīng)你,而不是反過(guò)來(lái)?!?/div>
大腦 ErrP 信號(hào)非常微弱,也就是說(shuō)該系統(tǒng)必須要調(diào)整得足夠到位才能讓它既可以分類這些信號(hào)又可以配合反饋回路中的人類操作員。除了首要檢測(cè) ErrP 信號(hào)外,當(dāng)系統(tǒng)沒(méi)有意識(shí)到來(lái)自人類的糾錯(cuò)信號(hào)時(shí),團(tuán)隊(duì)也讓機(jī)器去偵測(cè)所謂的「次要錯(cuò)誤(secondary errors)」。
「如果機(jī)器人不確定自己的決定,它可以觸發(fā)一種人類反饋機(jī)制來(lái)獲得更加準(zhǔn)確的答案,」Gil 說(shuō)道,」這些信號(hào)可以非常有效地改善精度,創(chuàng)造一個(gè)人機(jī)之間持續(xù)交流相互決策的對(duì)話過(guò)程。」
盡管該系統(tǒng)還仍然無(wú)法實(shí)時(shí)識(shí)別第二類錯(cuò)誤信號(hào),但 Gil 預(yù)計(jì)該模型在能夠識(shí)別該信號(hào)后可以提升 90% 的精度。
此外,由于 ErrP 信號(hào)的強(qiáng)度已被證明可以顯示機(jī)器人的錯(cuò)誤到底有多嚴(yán)重,所以,該團(tuán)隊(duì)相信未來(lái)的系統(tǒng)可以擴(kuò)展到更加復(fù)雜的多選項(xiàng)任務(wù)中去。
Salazar-Gomez 指出,該系統(tǒng)甚至也適用于那些無(wú)法進(jìn)行口語(yǔ)交流的人:像拼寫(xiě)這樣的任務(wù)可以通過(guò)一系列離散的二元選擇(discrete binary choices)來(lái)完成,Salazar-Gomez 將其比作一種高級(jí)版本的眨眼機(jī)制,該機(jī)制允許中風(fēng)患者 Jean-Dominique Bauby 可以撰寫(xiě)自己的回憶錄《潛水鐘與蝴蝶(Le Scaphandre et le Papillon)》。
「該項(xiàng)工作讓我們距開(kāi)發(fā)有效腦控制機(jī)器人和假體的目標(biāo)更近了一步,」弗萊堡大學(xué)計(jì)算機(jī)教授 Wolfram Burgard 說(shuō)道(他沒(méi)有參與此項(xiàng)研究),「考慮到將人類語(yǔ)言翻譯成一種有意義的機(jī)器可識(shí)別的信號(hào)是件異常困難的事情,該領(lǐng)域的工作對(duì)于未來(lái)的人機(jī)協(xié)作實(shí)在是具有深遠(yuǎn)影響。」
該項(xiàng)目的部分資助來(lái)自波音公司(Boeing)與美國(guó)國(guó)家科學(xué)基金會(huì)(National Science Foundation)。以下是對(duì)原論文的摘要介紹:
論文題目:通過(guò) EEG 信號(hào)實(shí)時(shí)糾正機(jī)器人所犯的錯(cuò)(Correcting Robot Mistakes in Real Time Using EEG Signals )
摘要:借由人類合作者大腦活動(dòng)與機(jī)器人進(jìn)行交流能夠提供一種直接而且快速的反饋回路,對(duì)人類合作者來(lái)說(shuō),這一交流方式簡(jiǎn)單而且自然,從而使得根據(jù)直覺(jué)與機(jī)器人互動(dòng)完成各種任務(wù)就不再是夢(mèng)。這一論文探索了將誤差相關(guān)電位(ErrP)應(yīng)用到閉環(huán)機(jī)器人控制的方法。ErrP 信號(hào)對(duì)機(jī)器人任務(wù)特別有用,因?yàn)樗鼈兪谴竽X活動(dòng)對(duì)預(yù)期之外誤差做出反應(yīng)的過(guò)程中自然出現(xiàn)的。我們解碼了人類操作員實(shí)時(shí)控制一臺(tái) Rethink Robotics Baxter 機(jī)器人完成一個(gè)兩項(xiàng)選擇任務(wù)過(guò)程中的 ErrP 信號(hào)。我們也表明,利用這一閉環(huán)機(jī)器人任務(wù)期間生成的、與潛在誤差相關(guān)的次要互動(dòng)信號(hào)能夠大大提升機(jī)器人的分類任務(wù)表現(xiàn),這也暗示著新的讓機(jī)器人獲取人類反饋的手段。我們完整描述了整個(gè)系統(tǒng)的設(shè)計(jì)和應(yīng)用,也展現(xiàn)了實(shí)時(shí)閉環(huán)以及開(kāi)環(huán)控制實(shí)驗(yàn)結(jié)果,以及對(duì)主要(primary)和次要(secondary)ErrP 信號(hào)的離線分析。我們使用了一般人群的受試者完成實(shí)驗(yàn)任務(wù),這些受試者之前未經(jīng)訓(xùn)練或篩選。因此,這一研究證實(shí)了 EGG 為基礎(chǔ)的回路方法的潛力,有望實(shí)現(xiàn)無(wú)縫的機(jī)器人控制,也朝著實(shí)時(shí)直覺(jué)互動(dòng)這一目標(biāo)更進(jìn)了一步。

圖 1:基于實(shí)時(shí)解碼觀察者的 EEG 信號(hào),機(jī)器人被告知它的首個(gè)動(dòng)作是錯(cuò)誤的,并且它會(huì)根據(jù)合適的物體類別做出正確選擇

圖 4:系統(tǒng)包含一個(gè)主要的實(shí)驗(yàn)控制器、Baxter 機(jī)器人、一個(gè) EEG 獲取與分類系統(tǒng)。一個(gè) Arduino 系統(tǒng)轉(zhuǎn)播控制器和 EEG 系統(tǒng)之間的信息。機(jī)械連接開(kāi)關(guān)檢測(cè)機(jī)械臂動(dòng)作啟動(dòng)。

圖 6:識(shí)別一次 EEG 數(shù)據(jù)緩沖中的 ErrP 的各種預(yù)處理和分類階段。這個(gè)決策會(huì)立即影響到機(jī)器人的行為,而機(jī)器人的行為又會(huì)影響到 EEG 信號(hào),從而形成反饋回路的閉環(huán)。
聲明:凡資訊來(lái)源注明為其他媒體來(lái)源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問(wèn)或質(zhì)疑,請(qǐng)立即與中國(guó)機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
電話:021-39553798-8007
更多>相關(guān)專題
0 條相關(guān)評(píng)論