11月6日下午,第七屆中國(guó)國(guó)際機(jī)器人高峰論壇服務(wù)機(jī)器人主題論壇上,北京雷動(dòng)云合智能技術(shù)有限公司CEO廖鴻宇以《家用機(jī)器人的計(jì)算機(jī)視覺》為題為我們分享了當(dāng)前家用機(jī)器人的技術(shù)現(xiàn)狀及突破。(以下文字根據(jù)現(xiàn)場(chǎng)速記整理,僅供參考)

廖鴻宇說他進(jìn)入機(jī)器人行業(yè)的初衷是因?yàn)樽约簩?duì)于機(jī)器人的濃厚興趣, 2012年踏入人工智能技術(shù)這個(gè)新興領(lǐng)域,創(chuàng)辦了現(xiàn)在的北京雷動(dòng)云合智能技術(shù)有限公司。
廖鴻宇談到雷動(dòng)云合在機(jī)器人行業(yè)的著眼點(diǎn)是以機(jī)器人視覺應(yīng)用作為突破口,雷動(dòng)公司剛起步的時(shí)候碰到了較大的困難,做3D的器件結(jié)構(gòu)是很復(fù)雜的,如果沒有大投入一般創(chuàng)業(yè)公司很難把它做好,蘋果和英特爾這些大企業(yè)投入大量人力物力去做,周期很長(zhǎng),成果卻不明顯。由于前期的資本限制,雷動(dòng)公司想到了先解決機(jī)器人的行走問題,從最右側(cè)2D結(jié)構(gòu)光開始,到可以探測(cè)機(jī)器人平面的地圖,因?yàn)闆]有應(yīng)用技術(shù)的難題所以成本很低,而現(xiàn)在家用機(jī)器人包括清潔機(jī)器人100多塊錢就可以給機(jī)器人提供環(huán)境識(shí)別,這樣就可以推動(dòng)2C機(jī)器人的普及,機(jī)器人很容易實(shí)現(xiàn)在家里自由行走,而不像在大商場(chǎng)里面看到很昂貴的機(jī)器人在自由行走。
這里用了一些視覺原理,雷動(dòng)公司把一個(gè)投影圖像用一個(gè)激光打一個(gè)光斑到環(huán)境當(dāng)中或者變色物體當(dāng)中,用攝像頭拍了物體以后進(jìn)行處理,通過對(duì)光斑的結(jié)構(gòu)分析還有攝像頭的計(jì)算,可以得出目標(biāo)點(diǎn)的距離,然后再以此形成一套系統(tǒng),這一套技術(shù)就被稱作主動(dòng)技術(shù)或者主動(dòng)識(shí)別技術(shù)。
另外一種技術(shù)就是TOF技術(shù),以前主要是用在無(wú)人駕駛上,因?yàn)樗鼘?duì)應(yīng)室外比較好,近兩年有的公司也開始推出TOF芯片,可以讓機(jī)器人獲得一個(gè)景深的圖像,用這種方法就可以從2D圖像中得到一個(gè)3D的模型,蘋果用的3D結(jié)構(gòu)光,到目前還是有一定問題的,雷動(dòng)公司做人臉識(shí)別識(shí)別范圍也就半米左右,但對(duì)于機(jī)器人來(lái)說,五六米的環(huán)境當(dāng)中用結(jié)構(gòu)光可能就不太好了,這個(gè)時(shí)候TOF技術(shù)就比較適用,這是另外一個(gè)技術(shù),其實(shí)它也是環(huán)境探測(cè)的技術(shù)。
再有一個(gè)就是現(xiàn)在很熱的,包括單目的和雙目的VSLAM。相當(dāng)于一個(gè)攝像機(jī)加了一個(gè)投影的裝置,這邊的兩個(gè)都是攝像頭,所以不用主動(dòng)環(huán)境投射什么東西,因?yàn)槎际瞧胀ǖ臄z像頭,可以采用一些廉價(jià)的裝置方式。然而現(xiàn)在這種雙目識(shí)別還是碰到了比較大的量產(chǎn)問題,因?yàn)殡p目識(shí)別有兩個(gè)在量產(chǎn)當(dāng)中標(biāo)定式的困難。為了讓攝像頭做得更好,量產(chǎn)當(dāng)中需要解決兩個(gè)問題,一個(gè)是這個(gè)攝像頭稍微有一點(diǎn)變化就會(huì)影響我們整個(gè)的參數(shù),如何在量產(chǎn)當(dāng)中保證它的穩(wěn)定,在工人組裝量產(chǎn)的時(shí)候保證組裝不變形,這些都是要想辦法克服的問題。
第二個(gè),每個(gè)攝像頭內(nèi)部有一個(gè)參數(shù),因?yàn)閂SLAM的測(cè)試對(duì)每一個(gè)點(diǎn)都要進(jìn)行測(cè)算,所以攝像頭稍微有一點(diǎn)不光滑那每一個(gè)點(diǎn)的像素差異都會(huì)對(duì)測(cè)距產(chǎn)生誤差。一般的攝像頭主要是用來(lái)拍照的,其實(shí)拍照動(dòng)一兩個(gè)像素點(diǎn)是看不出來(lái)的,然而人們更關(guān)注的美顏或者怎么拍的更加漂亮。于是想到了一個(gè)更聰明的辦法,就是給這個(gè)雙目識(shí)別配上一個(gè)裝置,可以方便的行走。
目前雷動(dòng)云合智能技術(shù)有限公司跟中國(guó)移動(dòng)在做一個(gè)項(xiàng)目,調(diào)試家里的雙目攝像頭,使其可以完成監(jiān)控后用VSLAM做自由行走。由于它只有兩個(gè)行走的輪子,兩個(gè)攝像頭,所以成本可以壓的很低,這個(gè)是在低成本環(huán)境下VSLAM的應(yīng)用。
這是雷動(dòng)公司其中的一個(gè)應(yīng)用,現(xiàn)在很多人家里的掃地機(jī)器人,已經(jīng)到了第三代,第一代實(shí)際上是沒有特定路線的,碰到墻就會(huì)彈回來(lái),第二代有芯片,會(huì)記錄你的行走軌跡,但它沒有規(guī)劃。第三代的有一個(gè)地圖導(dǎo)航,要先建圖然后再做路徑規(guī)劃。有人可能覺得家用掃地機(jī)器人很便宜,實(shí)際上它用的技術(shù)往往比商業(yè)場(chǎng)景當(dāng)中的更難。
對(duì)于酒店機(jī)器人而言,機(jī)器人首先需要被引導(dǎo)著在酒店里面走一圈,才能把這個(gè)地圖構(gòu)建出來(lái),只要有一個(gè)機(jī)器人地圖構(gòu)建出來(lái)了,剩下的服務(wù)機(jī)器人會(huì)直接導(dǎo)入這個(gè)地圖,相對(duì)來(lái)說在商業(yè)場(chǎng)景里面對(duì)于機(jī)器人的自動(dòng)建圖要求比較低。
但是家用機(jī)器人不一樣,在家里不會(huì)有人引導(dǎo)它建地圖,所以它的建圖要求更高。在雷動(dòng)公司的合作方案中,將傳感器設(shè)計(jì)成了機(jī)器人的眼睛,大腦板形成地圖導(dǎo)航,小腦板做運(yùn)動(dòng)控制,還有各軀體部分。機(jī)器人發(fā)展過程當(dāng)中我們發(fā)現(xiàn),往往生物結(jié)構(gòu)更加類似的機(jī)器人會(huì)更加穩(wěn)定,這也是做機(jī)器人的一個(gè)重大突破,就是模仿人神經(jīng)元的計(jì)算方式。機(jī)器人歷史上幾代的技術(shù)發(fā)展都是在研究人或者生物的結(jié)構(gòu)之后再去做一些實(shí)驗(yàn),由此實(shí)驗(yàn)?zāi)苋〉靡恍┹^好的效果,人工智能研究當(dāng)中對(duì)于腦認(rèn)知的研究成為了一個(gè)重點(diǎn)。
雷動(dòng)公司在第三代的機(jī)器人身上實(shí)現(xiàn)了雷達(dá)的功能,雷達(dá)智能探測(cè)一個(gè)平面的物體,對(duì)于地面上很多細(xì)小的東西導(dǎo)入圖像識(shí)別,以便可以做更好的規(guī)劃或者是規(guī)避。
機(jī)器人規(guī)避的動(dòng)作不難做到,關(guān)鍵是怎么識(shí)別出這個(gè)地面的物體,還要考慮到技術(shù)成本的限制。家用機(jī)器人在其中做了一些家庭場(chǎng)景應(yīng)用,比如老人摔倒,小孩子爬低爬高,對(duì)此機(jī)器人都會(huì)做一些匹配和報(bào)警,通過大量數(shù)據(jù)的收集分析后,可以準(zhǔn)確的報(bào)警。
最后廖鴻宇又談到了人臉識(shí)別方面。人臉識(shí)別對(duì)人們而言并不陌生,在高鐵站都可以刷人臉過關(guān),但是在家庭環(huán)境中,人臉識(shí)別實(shí)際上還是有不一樣的場(chǎng)景需要做細(xì)節(jié)的調(diào)整。
首先,人是不會(huì)習(xí)慣正對(duì)著機(jī)器的,家里的機(jī)器人可能也是側(cè)著或者在光照不好的環(huán)境中,這種情況下為了更好地進(jìn)行人臉識(shí)別,還會(huì)另外識(shí)別你的體態(tài),平時(shí)行走的姿勢(shì)。綜合來(lái)說只要把家里的人準(zhǔn)確的識(shí)別出來(lái)就可以了,其他的人可以歸為陌生人。另外是關(guān)于家里物體的識(shí)別,包括沙發(fā)、電視機(jī)、床這些識(shí)別,識(shí)別這些物體的目的是什么呢?這是為了方便機(jī)器人在家人離開以后自動(dòng)分辨出客廳和臥室,在關(guān)聯(lián)語(yǔ)音識(shí)別功能后,就可以直接對(duì)機(jī)器人說“去臥室”,它就會(huì)自己就過去了。