嵌入式機(jī)器人視覺(jué)系統(tǒng)的開(kāi)發(fā)已經(jīng)到達(dá)轉(zhuǎn)折點(diǎn)。各種各樣的設(shè)備不僅變得更加智能,而且變得更加了解在世界上所處的位置,伯克利設(shè)計(jì)技術(shù)有限公司(BDTI)總裁、最近成立的嵌入式視覺(jué)聯(lián)盟(EVA)創(chuàng)始人Jeff Bier表示。
這與成本迅速下降的傳感器——特別是圖像傳感器以及分析這些數(shù)據(jù)的處理邏輯有很大的關(guān)系。BDTI公司花了很長(zhǎng)時(shí)間來(lái)建立數(shù)字信號(hào)處理器基準(zhǔn),最終發(fā)現(xiàn)某段時(shí)期內(nèi)總有一個(gè)主要的應(yīng)用驅(qū)動(dòng)力,至少目前為止是這樣,Bier表示。“在20世紀(jì)90年代早期,主要驅(qū)動(dòng)力是數(shù)字化無(wú)線技術(shù);在20世紀(jì)90年代末期,是消費(fèi)類(lèi)數(shù)字音頻;在21世紀(jì)初,是消費(fèi)類(lèi)數(shù)字視頻。”他指出,“嵌入式視覺(jué)有望成為下一個(gè)重要的驅(qū)動(dòng)力。”
另外一個(gè)觀點(diǎn)是,20世紀(jì)80年代和80年代以前是DSP的軍事化應(yīng)用時(shí)代,而80年代以后的30年是DSP的工業(yè)與企業(yè)應(yīng)用時(shí)代,比如生產(chǎn)線和計(jì)算機(jī)監(jiān)控。
下一個(gè)時(shí)代無(wú)疑是促進(jìn)消費(fèi)的時(shí)代,比如游戲和汽車(chē)的電傳線控(drive-by-wire)等應(yīng)用。隨著應(yīng)用處理器性能的提高和成本的下降,潛在應(yīng)用將呈爆發(fā)式增長(zhǎng),Bier認(rèn)為。視覺(jué)系統(tǒng)在安全關(guān)鍵和救生應(yīng)用中早有使用,例如汽車(chē)上的車(chē)道偏離告警和碰撞避免系統(tǒng),能夠防止溺水事故的游泳池告警系統(tǒng)等。
Mobileye NV公司已經(jīng)能夠提供基于視覺(jué)的先進(jìn)駕駛輔助系統(tǒng)。公司成立于1999年,成功開(kāi)發(fā)出了運(yùn)行在被稱(chēng)為EyeQ的專(zhuān)有處理器上的專(zhuān)有圖像處理算法。EyeQ處理器最初是由意法半導(dǎo)體(ST)采用0.18um CMOS工藝為Mobileye公司制造的。芯片和軟件算法首先被賣(mài)給寶馬和沃爾沃等汽車(chē)OEM客戶。
大約2007年時(shí),上述解決方案就成為了汽車(chē)配件市場(chǎng)產(chǎn)品。解決方案架構(gòu)由2個(gè)32位ARM946E處理器內(nèi)核、4個(gè)視覺(jué)計(jì)算引擎(VCE)、1個(gè)多通道DMA和多個(gè)外設(shè)組成。其中一個(gè)ARM946E用于管理4個(gè)VCE、多通道DMA以及其它外設(shè)。4個(gè)VCE和另外一個(gè)ARM946E執(zhí)行諸如跟蹤和圖案分類(lèi)等任務(wù)所要求的所有密集型視覺(jué)運(yùn)算。
Bier指出,對(duì)于從增強(qiáng)實(shí)景(augmented reality)到貼片機(jī)等無(wú)數(shù)應(yīng)用來(lái)說(shuō),嵌入式視覺(jué)“不是必須發(fā)明的一個(gè)事物,而是已經(jīng)有30或40年的實(shí)際學(xué)術(shù)研究成果可以借鑒。”《電子工程專(zhuān)輯》認(rèn)為手勢(shì)識(shí)別是值得期待的2011年十大技術(shù)之一,而微軟的Kinect的出現(xiàn)勢(shì)必打破機(jī)器人視覺(jué)格局。
Kinect是Xbox 360的3D運(yùn)動(dòng)檢測(cè)附加產(chǎn)品。Xbox解決方案使用可見(jiàn)光譜圖像檢測(cè)、紅外檢測(cè)和本地處理的組合來(lái)判斷場(chǎng)景中的人物和深度,其硬件基本來(lái)自以色列公司PrimeSense。微軟開(kāi)發(fā)的識(shí)別軟件則將信息融合進(jìn)了游戲。
今年6月,微軟宣布推出兼容Windows軟件開(kāi)發(fā)套件的免費(fèi)beta版本Kinect。開(kāi)發(fā)人員、學(xué)術(shù)研究人員和愛(ài)好者都可以使用這種開(kāi)發(fā)套件創(chuàng)建相關(guān)應(yīng)用,并使用Kinect技術(shù)實(shí)現(xiàn)在Windows 7上運(yùn)行的深度檢測(cè)、人體運(yùn)動(dòng)跟蹤以及語(yǔ)音和目標(biāo)識(shí)別功能。
嵌入式視覺(jué)聯(lián)盟(EVA)的成立則強(qiáng)調(diào)了這個(gè)行業(yè)轉(zhuǎn)折點(diǎn)的到來(lái)。
Bier認(rèn)為EVA聯(lián)盟將發(fā)揮三重作用:提高人們對(duì)這種技術(shù)潛力的理解;分享實(shí)用的技術(shù)訣竅,包括經(jīng)驗(yàn)證的解決問(wèn)題的方法甚至算法和代碼;提供一個(gè)感興趣的各方都能聯(lián)網(wǎng)參與的論壇。“標(biāo)準(zhǔn)化肯定需要,也許標(biāo)準(zhǔn)化就是EVA的最終目標(biāo)之一。”Bier指出。
在所有各種計(jì)算機(jī)設(shè)備中包含圖像傳感器將帶來(lái)計(jì)算機(jī)視覺(jué)的“民主化”,使得每臺(tái)筆記本電腦成為潛在的開(kāi)發(fā)平臺(tái),Bier表示。“像OpenCV之類(lèi)的東西對(duì)此起著推波助瀾的作用。”他指出。OpenCV(針對(duì)開(kāi)源計(jì)算機(jī)視覺(jué))是一個(gè)主要用于實(shí)時(shí)計(jì)算機(jī)視覺(jué)的編程函數(shù)庫(kù)。
OpenCV庫(kù)是Intel公司于1999年最早創(chuàng)建的,現(xiàn)在由機(jī)器人技術(shù)研究實(shí)驗(yàn)室和技術(shù)孵化企業(yè)Willow Garage有限公司提供支持,在開(kāi)源伯克利軟件發(fā)布許可條件下可免費(fèi)使用。OpenCV包含500多個(gè)函數(shù),包括通用圖像處理、相機(jī)防抖、立體聲和3D功能、檢測(cè)、識(shí)別、適配、跟蹤和其它機(jī)器學(xué)習(xí)函數(shù)。
雖然OpenCV庫(kù)最早是由Intel開(kāi)發(fā)的,但OpenCV是一種交叉平臺(tái),擁有可在Windows、Linux、Android和MAC系統(tǒng)上運(yùn)行的C++、C、Python以及不久后還將增加的Java界面。Willow Garage公司擁有內(nèi)建OpenCV的機(jī)器人操作系統(tǒng)(ROS),也是PR2個(gè)人機(jī)器人的開(kāi)發(fā)商。