
編者按:在所有追逐自動(dòng)駕駛的新創(chuàng)公司中,來(lái)自山景城的 Drive.ai 可能是一個(gè)特殊的存在,這家公司利用擴(kuò)展性十足的深度學(xué)習(xí)訓(xùn)練自動(dòng)駕駛汽車讓外界印象深刻。
Drive.ai 聯(lián)合創(chuàng)始人兼 CEO Sameep Tandon 認(rèn)為,深度學(xué)習(xí)才是短期內(nèi)打造出自動(dòng)駕駛車輛的唯一可行之路。
“從長(zhǎng)遠(yuǎn)來(lái)看,一個(gè)有效的學(xué)習(xí)系統(tǒng)也是最有意義的。駕駛不是件易事,有時(shí)許多微妙的問(wèn)題會(huì)成為最大的困難,如果不想依靠深度學(xué)習(xí)來(lái)訓(xùn)練自動(dòng)駕駛汽車,恐怕這類產(chǎn)品永遠(yuǎn)也無(wú)法面世。”Tandon 說(shuō)。
雖然 Drive.ai 成立才兩年時(shí)間,但這家公司的車隊(duì)(4 輛車)已經(jīng)開(kāi)始在舊金山灣區(qū)上路了。
Drive.ai 專注于自動(dòng)駕駛和人工智能,由來(lái)自斯坦福大學(xué)人工智能實(shí)驗(yàn)室核心成員建立。高舉深度學(xué)習(xí)大旗,這家公司的自動(dòng)駕駛汽車已經(jīng)快速掌握了在各種復(fù)雜路況下讓車輛實(shí)現(xiàn)自動(dòng)駕駛的技巧。
“我認(rèn)為這是業(yè)內(nèi)頭一次從深度學(xué)習(xí)的角度看待自動(dòng)駕駛。”Tandon 說(shuō)道。“這與傳統(tǒng)自動(dòng)駕駛來(lái)自機(jī)器人技術(shù)的觀點(diǎn)截然相反。”Drive.ai 公司創(chuàng)始人兼董事長(zhǎng) Carol Reiley 補(bǔ)充道。“大多數(shù)公司只是將深度學(xué)習(xí)技術(shù)看作一個(gè)零部件,但我們則看得更加全面。”
對(duì)大多數(shù)公司來(lái)說(shuō),深度學(xué)習(xí)只是用于自動(dòng)駕駛汽車感知和識(shí)別周圍物體。深度學(xué)習(xí)確實(shí)擅長(zhǎng)這部分,因?yàn)橹灰鼘W(xué)會(huì)了識(shí)別一種特殊模式,即使你不再一一教授,它也能將物品的識(shí)別能力擴(kuò)展到其他前所未見(jiàn)的事物身上。換句話來(lái)說(shuō),擅長(zhǎng)學(xué)習(xí)的“深度學(xué)習(xí)”能舉一反三,通過(guò)自己的“努力”自學(xué)成才,識(shí)別出路上形形色色的行人。
當(dāng)然,識(shí)別出圖像中的行人只是一種感知模式,在決策和路徑規(guī)劃時(shí),深度學(xué)習(xí)還會(huì)形成其他模式。
舉例來(lái)說(shuō),在“十字路口”和“紅燈是否右轉(zhuǎn)”兩種情形下,深度學(xué)習(xí)就很有用。不過(guò),這項(xiàng)技術(shù)能根據(jù)現(xiàn)場(chǎng)情況自主判斷的能力反而成了汽車廠商最擔(dān)心的,這種“類人”的模式識(shí)別能力會(huì)讓車輛做出一些微妙的選擇,而這種有別于基于規(guī)則(rule-base )系統(tǒng)的能力有時(shí)可能會(huì)讓乘客陷入麻煩。
黑盒子
深度學(xué)習(xí)在模式識(shí)別上的能力絕對(duì)是該技術(shù)最好的賣點(diǎn),但由于模式識(shí)別是神經(jīng)網(wǎng)絡(luò)算法的一部分,因此許多人擔(dān)心該系統(tǒng)是一個(gè)“黑盒子”。
簡(jiǎn)答來(lái)說(shuō),一旦深度學(xué)習(xí)系統(tǒng)訓(xùn)練完成,只要給它輸入數(shù)據(jù),它就會(huì)對(duì)這些數(shù)據(jù)進(jìn)行解讀并輸出結(jié)果。不過(guò),我們現(xiàn)在無(wú)法理解深度學(xué)習(xí)在輸入和輸出階段之間到底是如何做決定的,這也是許多企業(yè)選擇傳統(tǒng)決策方式且限制深度學(xué)習(xí)在感知和識(shí)別上應(yīng)用的原因。
業(yè)內(nèi)認(rèn)為,如果自動(dòng)駕駛系統(tǒng)出現(xiàn)錯(cuò)誤,廠商必須找到該錯(cuò)誤并進(jìn)行修復(fù),但如果連錯(cuò)誤是如何產(chǎn)生的都無(wú)法知曉,又怎么能避免錯(cuò)誤再次發(fā)生?
Tandon 并不否認(rèn)這個(gè)問(wèn)題,但他表示:“我們不但想讓深度學(xué)習(xí)在決策和感知上協(xié)助自動(dòng)駕駛汽車,還想給這些車輛‘灌輸’規(guī)則和人類常識(shí),確保車輛安全。”
在處理黑盒子問(wèn)題時(shí),Drive.ai 避開(kāi)了許多雷區(qū),摒棄了端對(duì)端系統(tǒng)。Tandon 表示:“如果在運(yùn)用深度學(xué)習(xí)時(shí)能將其打散成數(shù)塊,就會(huì)發(fā)現(xiàn)我們可以使用不同方法對(duì)其進(jìn)行驗(yàn)證,這樣一來(lái)你對(duì)系統(tǒng)的穩(wěn)定運(yùn)轉(zhuǎn)就更有信心了。”
Drive.ai 的研發(fā)人員表示他們掌握了一窺黑盒子內(nèi)部的小技巧,得到的信息足以驗(yàn)證這個(gè)“黑盒子”到底發(fā)生了什么。對(duì)于該方法,Tandon 解釋稱:“當(dāng)我們開(kāi)始打造深度學(xué)習(xí)感知系統(tǒng)時(shí),發(fā)現(xiàn)挑戰(zhàn)性最大的場(chǎng)景之一就是立交橋。”
立交橋遮擋形成的陰影會(huì)讓感知系統(tǒng)產(chǎn)生誤報(bào)(發(fā)現(xiàn)有障礙)。在學(xué)習(xí)階段,Tandon 表示團(tuán)隊(duì)可以讓算法不斷嘗試挑戰(zhàn)此類復(fù)雜場(chǎng)景,隨后利用一些人造的案例來(lái)擴(kuò)充數(shù)據(jù)庫(kù)。
拿到了結(jié)果找出系統(tǒng)存在的缺陷后,就可以對(duì)場(chǎng)景進(jìn)行針對(duì)性修改。通過(guò)不斷訓(xùn)練,立交橋?qū)Ω兄到y(tǒng)來(lái)說(shuō)已經(jīng)是小菜一碟。“隨后你就能在系統(tǒng)的級(jí)別對(duì)其進(jìn)行驗(yàn)證了。”Tandon 表示。
深度學(xué)習(xí)系統(tǒng)的訓(xùn)練
深度學(xué)習(xí)系統(tǒng)的成長(zhǎng)靠的是源源不斷的數(shù)據(jù)。對(duì)大多數(shù)公司來(lái)說(shuō),盡可能多地搜集數(shù)據(jù)就成了公司的核心任務(wù)。
不過(guò),Drive.ai 在搜集數(shù)據(jù)上有自己的想法,這家公司更重視數(shù)據(jù)的質(zhì)量而非數(shù)量。此外,為數(shù)據(jù)提供標(biāo)注也是它們訓(xùn)練深度學(xué)習(xí)算法時(shí)的獨(dú)門絕技。

為數(shù)據(jù)做標(biāo)注是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作
為數(shù)據(jù)做標(biāo)注雖然簡(jiǎn)單,但這項(xiàng)工作卻非常冗長(zhǎng)乏味。有時(shí),標(biāo)注員需要在非常簡(jiǎn)單的數(shù)據(jù)片段上標(biāo)出車輛、行人、路標(biāo)、交通燈和任何與自動(dòng)駕駛有關(guān)的物體。
“大公司一般都有一支規(guī)模龐大的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)。”Reiley 說(shuō)道。“這些人每天圍著雷達(dá)圖像上的方盒子做標(biāo)注,工作量非常巨大。Drive.ai 也有此類工作,不過(guò)我們一直在努力優(yōu)化以便提高速度。”
與大公司相比,Drive.ai 的標(biāo)注團(tuán)隊(duì)并不大,因?yàn)檫@家公司的數(shù)據(jù)標(biāo)注工作是由深度學(xué)習(xí)完成的。“在許多場(chǎng)景下,我們的深度學(xué)習(xí)系統(tǒng)就能勝任主要工作了,團(tuán)隊(duì)成員需要的只是確認(rèn)數(shù)據(jù)標(biāo)注是否準(zhǔn)確。”Tandon 解釋道。“當(dāng)然,在有些場(chǎng)景下還需要人類出手,標(biāo)注員會(huì)幫深度學(xué)習(xí)系統(tǒng)鋪路,以便它們能不斷進(jìn)步。眼下,在某些場(chǎng)景中深度學(xué)習(xí)系統(tǒng)的標(biāo)注能力比人類還要強(qiáng)。”
不過(guò),既然 Drive.ai 能找到這種行之有效的方法,為什么其他公司就沒(méi)走上類似的道路?
“我們也感到很奇怪,到底是什么阻擋了其他公司全面使用深度學(xué)習(xí)系統(tǒng)?”Tandon 說(shuō)道。“細(xì)想之后我們發(fā)現(xiàn),別的公司面臨的問(wèn)題可真不少,畢竟這套系統(tǒng)高度集成化,想讓每個(gè)部分都各司其職可不容易。”
Reiley 同意這一觀點(diǎn),她認(rèn)為:“每一個(gè)決定都必須是軟件驅(qū)動(dòng)并針對(duì)深度學(xué)習(xí)和軟硬件整合優(yōu)化的。為了順利完成該步驟,大家都專注于算法,但 Drive.ai 有其他應(yīng)用。自動(dòng)駕駛技術(shù)可不是個(gè)簡(jiǎn)單的算法,它牽涉的復(fù)雜軟硬件問(wèn)題是前人從未解決過(guò)的。”
雨中的傳感器
Drive.ai 的自動(dòng)駕駛硬件在設(shè)計(jì)之初就考慮到了兼容性問(wèn)題,其核心部件是車頂?shù)膫鞲衅麝嚵校〝z像頭和激光雷達(dá),只需簡(jiǎn)單改裝就能用在大多數(shù)車輛上。
與此同時(shí),這套系統(tǒng)還能用上原車自帶的傳感器,如自適應(yīng)巡航時(shí)用到的雷達(dá)和后置攝像頭。除此之外,Drive.ai 還想利用大屏幕完成車輛與路上行人或其他車輛司機(jī)的“交流”。
總的來(lái)說(shuō),Drive.ai 的自動(dòng)駕駛系統(tǒng)共有 9 個(gè)高清攝像頭、2 個(gè)雷達(dá)和 4 個(gè)激光雷達(dá),該系統(tǒng)會(huì)不斷收集數(shù)據(jù),以供深度學(xué)習(xí)和自動(dòng)駕駛系統(tǒng)使用。
雖然傳感器售價(jià)依舊昂貴,但 Drive.ai 聯(lián)合創(chuàng)始人 Joel Pazhayampallil 表示,現(xiàn)在系統(tǒng)內(nèi)的傳感器性能有些過(guò)剩,未來(lái)會(huì)逐漸減少傳感器數(shù)量。
“我認(rèn)為未來(lái)用不到這么多傳感器,可能現(xiàn)在的一半就完全足夠。”Pazhayampallil 說(shuō)。“我們的算法在不斷進(jìn)步,將不同的傳感器數(shù)據(jù)結(jié)合后,傳感器的數(shù)據(jù)收集能力有了大幅提高,激光雷達(dá)負(fù)責(zé)低分辨率深度數(shù)據(jù),而攝像頭則搜集高分辨率環(huán)境信息。”
這種深度學(xué)習(xí)做出的多通道冗余決策是自動(dòng)駕駛車輛的優(yōu)勢(shì)之一,它能在傳感器失靈時(shí)保證車輛的安全。深度學(xué)習(xí)算法可在感知數(shù)據(jù)缺乏時(shí)繼續(xù)工作,這也是傳統(tǒng)的基于規(guī)則(rule based)系統(tǒng)所不具備的。
需要注意的是,這里的傳感器失靈可能不是軟硬件出了故障,而是因某些原因(如炫光、黑暗和被水遮擋)無(wú)法搜集到可用的數(shù)據(jù)。
因此,雨中自動(dòng)駕駛挑戰(zhàn)性較高,除了水分會(huì)吸走激光雷達(dá)的能量、路面反光嚴(yán)重之外,傳感器被水滴遮擋也是重要原因之一。“如果想讓自動(dòng)駕駛汽車適應(yīng)更多復(fù)雜的環(huán)境,就得在攝像頭、激光雷達(dá)、雷達(dá)等設(shè)備發(fā)生故障時(shí)應(yīng)對(duì)自如。”Tandon 說(shuō)道。
上路測(cè)試
在我們?cè)嚦?/font> Drive.ai 的自動(dòng)駕駛車輛時(shí), Drive.ai 技術(shù)主管 Tory Smith 全程陪同。試乘階段天公作美,加州過(guò)去幾個(gè)月的壞天氣并未出現(xiàn),因此傳說(shuō)中的雨中自動(dòng)駕駛我們沒(méi)能體驗(yàn)到。
Drive.ai 的目標(biāo)是 Level 4 級(jí)別的自動(dòng)駕駛,但在現(xiàn)有的法律法規(guī)下,主駕駛位上還需要司機(jī)以備不時(shí)之需。在20 分鐘的試乘過(guò)程中,Drive.ai 的自動(dòng)駕駛車輛穿越了山景城郊區(qū),期間有 16 個(gè)叉路口和 1 個(gè)十字路口。
總得來(lái)說(shuō),這輛車運(yùn)行順暢,能勝任駕駛?cè)蝿?wù),不過(guò)與普通人類駕駛員相比,它有時(shí)會(huì)猶豫不決。Smith 稱這是他們有意為之,“自動(dòng)駕駛車輛必須為人所接受,如果在某些情況下它比人類駕駛員還大膽,乘客就會(huì)覺(jué)得不舒服。此外,在測(cè)試中還是謹(jǐn)慎為好。”
在試乘過(guò)程中,Drive.ai 的目標(biāo)算是達(dá)到了,我們只遇到了一次司機(jī)介入的情況。說(shuō)實(shí)話,這種比較無(wú)聊的乘車感受確實(shí)更符合自動(dòng)駕駛汽車的身份。
這次司機(jī)介入是因?yàn)橐肄D(zhuǎn)駛?cè)胍粭l主路,雖然在加州紅燈也可以右轉(zhuǎn),但 Drive.ai 的車輛還是會(huì)停下等待。
Smith 表示 Drive.ai 做出這樣的選擇是因?yàn)閭鞲衅餍阅苡邢蕖?ldquo;我們的激光雷達(dá)視距只有 50 到 75 米,在車速達(dá) 45 或 50 英里(約合 72-80 千米/小時(shí))時(shí),車輛就無(wú)法精確判斷交通通行情況了。
隨后當(dāng)綠燈亮起,車輛轉(zhuǎn)到了最右車道準(zhǔn)備轉(zhuǎn)彎,有輛卡車停在路邊阻斷道路,因此司機(jī)只好切換到手動(dòng)模式繞過(guò)卡車,隨后再次開(kāi)啟自動(dòng)駕駛系統(tǒng)。
“通常我們可能會(huì)等待卡車駛離道路,”Smith 說(shuō)道。“在路徑規(guī)劃上,讓車輛能自主躲過(guò)路上的障礙物是我們正在努力的目標(biāo)。”不過(guò),這個(gè)問(wèn)題可不僅是路徑規(guī)劃那么簡(jiǎn)單。對(duì)于自動(dòng)駕駛汽車來(lái)說(shuō),它可以選擇等待或者繞過(guò)卡車。但是,怎么來(lái)判斷卡車的狀態(tài)?通過(guò)引擎聲、車輛尾燈還是卡車周圍的活動(dòng)?
在這種情況下做出判斷對(duì)駕駛員來(lái)說(shuō)是小菜一碟,但想讓自動(dòng)駕駛汽車學(xué)會(huì)就得訓(xùn)練,讓它知道在哪種情況下應(yīng)該做出哪些反應(yīng)。
“人類不太擅長(zhǎng)做非常精確的事情,但處理模棱兩可的事情卻非常在行,因此傳統(tǒng)基于規(guī)則的(rule-base)理念根本行不通,因?yàn)楦鞣N復(fù)雜的路況實(shí)在是太多了。在深度學(xué)習(xí)架構(gòu)內(nèi)開(kāi)發(fā)一個(gè)系統(tǒng)就能彌補(bǔ)這一缺陷,在遇到復(fù)雜情況時(shí)讓車輛做出自主判斷,這是一種靠直覺(jué)來(lái)解決問(wèn)題的方式。”Smith 說(shuō)道。
對(duì) Drive.ai 來(lái)說(shuō),駕駛員介入的情況正是它們最珍貴的財(cái)富,為了找到這些需要介入的情況,Drive.ai 做了大量測(cè)試。
像人類一樣駕駛
在試乘結(jié)束后,Smith 問(wèn)了一個(gè)問(wèn)題。“與其他公司的自動(dòng)駕駛汽車相比,有沒(méi)有感覺(jué)我們的車跑起來(lái)更像人類駕駛員?”
把機(jī)器人與人相提并論很容易引起歧義(人類駕駛的事故率稍高,但也有領(lǐng)先機(jī)器的地方),Smith 舉了一個(gè)例子: Drive.ai 的車輛如何探測(cè)交通信號(hào)燈。
目前,業(yè)內(nèi)通行的做法是直接在地圖上標(biāo)出車輛行駛區(qū)域內(nèi)每個(gè)交叉路口的位置,這樣一來(lái)自動(dòng)駕駛汽車就知道什么時(shí)候該看紅綠燈了。
如果行駛范圍限制在某個(gè)區(qū)域,這種做法有其可行性。但一旦行駛范圍擴(kuò)大,自動(dòng)駕駛車輛可能處理不了這種情形。與通行做法不同的是,Drive.ai 會(huì)搜集更多有關(guān)交通信號(hào)燈的數(shù)據(jù),對(duì)不同路口、角度、時(shí)間和天氣情況對(duì)這些數(shù)據(jù)進(jìn)行標(biāo)注后,深度學(xué)習(xí)系統(tǒng)就能像人類一樣識(shí)別出交通信號(hào)燈了。
“深度學(xué)習(xí)還有個(gè)優(yōu)勢(shì),那就是它能有效利用周邊環(huán)境信息,而不是只盯著交通信號(hào)燈。舉例來(lái)說(shuō),有時(shí)我們不用看信號(hào)燈也知道該停車還是前進(jìn),因?yàn)槲覀兛梢愿鶕?jù)前方車輛動(dòng)向判斷現(xiàn)在的情況。如果在標(biāo)注時(shí)將這種情況考慮在內(nèi),就能讓自動(dòng)駕駛車輛像人類一樣駕駛。未來(lái),這種判斷方式還能幫深度學(xué)習(xí)系統(tǒng)處理其他任務(wù)。”Smith 解釋道。
Drive.ai 的未來(lái)
對(duì)于公司未來(lái)的發(fā)展軌跡,Tandon 信心十足。“今年我們的自動(dòng)駕駛車輛就將正式上路測(cè)試,未來(lái) 6 個(gè)月我們的車隊(duì)就會(huì)小規(guī)模上路供用戶使用。一兩年內(nèi),在特定的區(qū)域內(nèi) Drive.ai 絕對(duì)能擺脫駕駛員的束縛,實(shí)現(xiàn)徹底的自動(dòng)駕駛?,F(xiàn)在唯一的問(wèn)題是,Drive.ai 征服灣區(qū)的腳步到底能走多快,我們何時(shí)才能進(jìn)軍下一個(gè)城市?”
Drive.ai 起初將主要精力放在物流領(lǐng)域,對(duì)這家公司來(lái)說(shuō)送貨比送人更加重要。因此,Drive.ai 需要解決的問(wèn)題就少了很多——至少不用考慮乘客接受度。
除了走好當(dāng)下的道路,Tandon 對(duì)未來(lái)也興趣十足。“如果我們能將好的策略和好的技術(shù)結(jié)合,自動(dòng)駕駛汽車就能成為第一種在現(xiàn)實(shí)世界范圍使用的機(jī)器人。滿世界的機(jī)器人會(huì)讓我激動(dòng)得直起雞皮疙瘩,而自動(dòng)駕駛汽車可能就是首款與人類朝夕相處的機(jī)器人。”