
華中科大光電子專業(yè)畢業(yè)后,李昌檀先后在索尼、飛利浦、聯(lián)想等大廠里工作了十幾年,具體工作略有差別,但核心一直沒變,那就是圍繞“光電子”,做手機(jī)攝像頭的系統(tǒng)、硬件、底層軟件和集成。
在這個(gè)行當(dāng)里,李昌檀取得了不少成績(jī),比如在 iphone 還沒有光學(xué)防抖功能的時(shí)候,他做了中國(guó)第一款光學(xué)防抖手機(jī),雖然由于各種原因,賣的并不好。十多年的研究,李昌檀希望自己能站在更高的維度上來看產(chǎn)品,他想知道用戶真實(shí)的需求是什么,也想知道如何能做出有用的產(chǎn)品,但大廠分工細(xì)致,層級(jí)嚴(yán)格,已經(jīng)無法滿足他的需求。
于是,2014年李昌檀開始了第一次創(chuàng)業(yè),作為初始團(tuán)隊(duì)加入了一個(gè) VR 公司 。這次創(chuàng)業(yè)最大的收獲,就是讓他結(jié)識(shí)了黃石生博士。黃石生畢業(yè)于清華大學(xué)計(jì)算機(jī)系,師從計(jì)算機(jī)圖形學(xué)領(lǐng)域的胡事民教授,在過去一直專注于圖像與視頻等媒體的研究,在圖形學(xué)與視覺領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議(SIGGRAPH/SIGGRAPH Asia/TVCG)上,發(fā)表過四篇文章。
相識(shí)一年之后,李昌檀聯(lián)合黃博士,創(chuàng)辦遠(yuǎn)形時(shí)空,開始了第二段創(chuàng)業(yè)生涯。李昌檀對(duì)雷鋒網(wǎng)新智造說:
我們要做一些有用的事情,技術(shù)門檻高,是一門手藝活,有很多坑,需要一個(gè)一個(gè)爬出來,不是模式的創(chuàng)新,也沒有很大的杠桿。
這個(gè)手藝活,就是基于視覺的 vSLAM 軟硬件解決方案。在李昌檀看來,原先做的手機(jī),現(xiàn)在流行的VR、無人車、無人機(jī)等沒有本質(zhì)的區(qū)別,都是用于人機(jī)交互的一個(gè)工具,底層技術(shù)是相通的。但有個(gè)區(qū)別在于,原先做相機(jī),主要是讓人看,現(xiàn)在是要讓機(jī)器能夠看懂。
雷鋒網(wǎng)新智造了解到,SLAM 技術(shù)的全稱為 simultaneous localization and mapping ,即實(shí)時(shí)定位及地圖構(gòu)建,SLAM 并不是一項(xiàng)新技術(shù),國(guó)內(nèi)外都有數(shù)十家公司在研究。黃石生介紹說,無論是定位還是地圖,分開做都不是難事,難點(diǎn)在于結(jié)合,同時(shí)要保證即時(shí)。
SLAM 不僅僅是一項(xiàng)技術(shù),其實(shí)更是一個(gè)包含傳感器和算法實(shí)現(xiàn)的系統(tǒng)。在傳感器方面,可以選擇的比較多,比如激光雷達(dá)、攝像機(jī)、視覺里程計(jì)、GPS等,主流的是激光雷達(dá)和攝像機(jī)。
有了傳感器感知環(huán)境之外,還需要算法實(shí)現(xiàn),讓機(jī)器“看得見”。遠(yuǎn)形時(shí)空選擇的解決方案是攝像頭+慣性導(dǎo)航+算法。黃石生認(rèn)為,這樣的解決方案,有以下幾個(gè)優(yōu)勢(shì):
小型化
雖然激光雷達(dá)精度可以達(dá)到毫米級(jí),但在工程上無法小型化,尤其是旋轉(zhuǎn)式的激光雷達(dá)。從目前在自動(dòng)駕駛領(lǐng)域的實(shí)現(xiàn)來看,都需要給激光雷達(dá)預(yù)留很大的空間,在 VR/AR 等小型設(shè)備上,幾乎沒有用武之地。
成本低
激光雷達(dá)成本相當(dāng)高昂,旋轉(zhuǎn)式的激光雷達(dá)成本在8000-80000美元之間,固態(tài)雷達(dá)相對(duì)便宜不少,但相比攝像頭還是非常昂貴,這對(duì)于廠商來說,成本很高。
響應(yīng)頻率高
激光雷達(dá)的響應(yīng)頻率不如攝像頭,可以輕松達(dá)到50-60赫茲,慣性導(dǎo)航則更高,可以達(dá)到1000赫茲,這樣輸出信息時(shí)就非??臁?/div>
擴(kuò)展性強(qiáng)
使用攝像頭的解決方案,除了用來實(shí)時(shí)定位構(gòu)建地圖外,用戶還可以利用它擴(kuò)展其他功能,比如人臉識(shí)別、手勢(shì)等其他視覺識(shí)別的功能。
特別就 VR 領(lǐng)域而言,現(xiàn)有的視覺解決方案都是由外而內(nèi)的追蹤,比如通過 Lighthouse 和 Constellation 的高精度追蹤系統(tǒng),而遠(yuǎn)形時(shí)空提供的 SLAM 解決方案,則不需要配合,是一體化的解決方案。
但以攝像頭為主的解決方案采集到的信息量大,背后需要配套非常強(qiáng)大的算法來進(jìn)行處理。經(jīng)過李昌檀和黃石生的努力,在雙目 SLAM 和單目 SLAM 兩方面,算法和性能都有了非常大的提升。
在vSLAM學(xué)術(shù)研究方面,有很多優(yōu)秀的工作,有的已經(jīng)開源(例如ORBSLAM、LSD-SLAM、OKVIS、DSO、ORB-VIO、SVO等),為追求準(zhǔn)確性這些方法往往采用計(jì)算強(qiáng)度很高的視覺優(yōu)化(Bundle Adjustment),導(dǎo)致計(jì)算功耗很難降低,而純視覺的 SLAM 往往受光照條件、高速旋轉(zhuǎn)運(yùn)動(dòng)、抖動(dòng)等等影響而產(chǎn)生不穩(wěn)定,因此,這些方法在產(chǎn)品化在實(shí)際產(chǎn)品化過程中有較大難度。
遠(yuǎn)形時(shí)空推出的雙目 SLAM 和單目 SLAM ,不僅僅依靠攝像頭,還輔助慣性傳感器(即 Visual-Inertial SLAM),很大程度上克服了純視覺 SLAM 的缺點(diǎn)。另外,為提高穩(wěn)定性和精度,遠(yuǎn)形時(shí)空?qǐng)F(tuán)隊(duì)在傳感器硬件、慣性輔助的圖像特征追蹤、丟失重定位等核心技術(shù)方面都做了優(yōu)化,提高了 vSLAM 的穩(wěn)定性和精度。
遠(yuǎn)形時(shí)空?qǐng)F(tuán)隊(duì)推出的雙目 SLAM 和單目 SLAM 的精度均在厘米級(jí),drift 小于1%,而計(jì)算功耗很小,比同類產(chǎn)品減小超過至少一半以上的計(jì)算量,最低時(shí)只是1/4左右。
在機(jī)器視覺領(lǐng)域,其實(shí)存在著眾多玩家,比如百度前日剛收購(gòu)的硅谷公司 xPerception,其定位和業(yè)務(wù)范圍與遠(yuǎn)形時(shí)空非常類似,國(guó)內(nèi)還有格靈深瞳、速感科技、Human+、拓視覺等初創(chuàng)企業(yè)。面對(duì)競(jìng)爭(zhēng)相對(duì)激烈的市場(chǎng),李昌檀認(rèn)為:
其實(shí)我們也看到一些比較優(yōu)秀的創(chuàng)業(yè)團(tuán)隊(duì),我們覺得非常好,大家能夠一起教育市場(chǎng),把這個(gè)市場(chǎng)做大。而且,暫時(shí)還沒有一個(gè)可以通吃產(chǎn)品,我們非常希望做一個(gè)能用在很多領(lǐng)域的產(chǎn)品,但實(shí)際上還不存在通用的解決方案。所以,無論競(jìng)爭(zhēng)是否激烈,必須得在某一個(gè)細(xì)小的領(lǐng)域扎根下來,再拓展更容易一些。
目前,遠(yuǎn)形時(shí)空基于這種解決方案,做出了一個(gè)嵌入式的硬件產(chǎn)品,并將首先在 VR 領(lǐng)域進(jìn)行落地,國(guó)內(nèi)外各有一家 VR 廠商已在洽談合作,預(yù)計(jì)在年內(nèi)會(huì)有進(jìn)一步消息。現(xiàn)在公司共有10人左右的技術(shù)團(tuán)隊(duì),已完成數(shù)百萬的天使輪融資,即將開始下一輪的融資計(jì)劃,大概千萬量級(jí)。新一輪融資將會(huì)用于產(chǎn)品量產(chǎn)、新品研發(fā)、團(tuán)隊(duì)擴(kuò)充三個(gè)方面。
更多>相關(guān)資訊
0 條相關(guān)評(píng)論