2016 年,人工智能在美好理想和殘酷現(xiàn)實的夾縫中野蠻生長。



當從業(yè)者們認為,人工智能時代是“技術(shù)為王”的時代,但面對價格戰(zhàn)、商務(wù)戰(zhàn)、公關(guān)戰(zhàn)時,技術(shù)似乎不再是唯一的信仰。當從業(yè)者們認為,手握學(xué)術(shù)大牛、刷爆各種榜單就能所向披靡時,“AI 產(chǎn)品經(jīng)理比科學(xué)家重要”、“刷榜是沒意義的”等反駁性觀點也越來越被業(yè)內(nèi)認可。當從業(yè)者們認為,招一大批名校博士就可與巨頭比劃時,虛高的薪水和拿不出手的產(chǎn)品讓企業(yè)不得不開始考慮性價比的問題。

余凱,地平線機器人創(chuàng)始人兼 CEO,前百度研究院執(zhí)行院長,曾領(lǐng)導(dǎo)百度深度學(xué)習(xí)研究院( IDL )、多媒體技術(shù)部(語音,圖像)、圖片搜索產(chǎn)品部等團隊。2012年以來,余凱創(chuàng)建百度IDL,發(fā)起和領(lǐng)導(dǎo)了百度大腦、百度自動駕駛等一系列項目,并連續(xù)三次榮獲公司最高榮譽——“百度最高獎”。余凱發(fā)表的論文被引用超過 11000 次,獲 2013 年國際機器人學(xué)習(xí)大會( ICML )最佳論文獎銀獎,曾任 ICML 和 NIPS 領(lǐng)域主席。他于 2011 年在斯坦福大學(xué)計算機系客座主講人工智能課程,還曾率隊于 2010 年獲得首屆 Image Net 評測世界第一名。
公開課內(nèi)容
1. AI 科技評論:2016 年 AI 圈最讓你記憶深刻的幾件大事 ?
AI 計算硬件:英偉達的股票在一年時間內(nèi)從 100 億美金 500 億美金,震驚業(yè)界。背后的原因是處理器架構(gòu)因為人工智能的需求正在被重新定義,Google 也推出 TPU 來做 Inference,除此之外,包括地平線機器人在內(nèi)的不少公司正朝著這個方向去探索。
算法層面:如生成式對抗網(wǎng)絡(luò)等算法的突破性進展,使我們看到除了CNN、RNN、LSTM,技術(shù)還在不斷推陳出新,讓這個行業(yè)變得越來越有意思。
開源平臺:今年開源平臺體系在不斷成熟,如 Tensor Flow、Caffe 等,特別是由中國學(xué)生發(fā)起的 MX Net成為亞馬遜 AWS 官方訓(xùn)練平臺這件事,很了不起。
Alpha Go 事件:改寫全社會從街頭百姓到政治對人工智能的認知,實現(xiàn)了大家均認為不能實現(xiàn)的事情。
人才流動:Hinton 的得意門生、CMU 副教授 Ruslan,最近耐不住寂寞加入蘋果,擔任蘋果人工智能研究總監(jiān)。斯坦福大學(xué)李飛飛教授也加入谷歌。
2. AI 科技評論:今年人工智能行業(yè)相比于去年有哪些宏觀和微觀的進步?
我感觸最深的是從 2006-2016 年這十年間,是深度學(xué)習(xí)的普及和推廣期,其在很多應(yīng)用中取得突破性進展。但所有成果均為感知方面的東西,如圖像識別、語音識別等。而從今年開始,最大的不同像 Alpha Go 和自動駕駛等人工智能系統(tǒng)開始從感知過渡到?jīng)Q策。這些系統(tǒng)基于對這個世界的理解,從而主動優(yōu)化它的決策機制。因此從感知到?jīng)Q策是最大的變化,人工智能只有做決策才能真正改變世界。
我認為在未來的 10 年里,怎么優(yōu)化地去做決策是人工智能的重點課題。
3. AI 科技評論:為何成立 OPEN AI LAB;為何選擇做嵌入式人工智能?
歷史上技術(shù)創(chuàng)新和商業(yè)模式的創(chuàng)新都是相伴相生的,我們也看到,開放總是會打敗封閉,怎么打造良性的產(chǎn)業(yè)生態(tài)是我們非常關(guān)心的。因此最近地平線和 ARM、安創(chuàng)空間、全志聯(lián)合成立 OPEN AI LAB,我們希望把技術(shù)向半導(dǎo)體廠商、開發(fā)者開放,大家一起去定義嵌入式人工智能的標準。至于為何要做嵌入式人工智能?過去推動人工智能的核心要素可以概括為大數(shù)據(jù)、大計算、大平臺:其在互聯(lián)網(wǎng)和云端做人工智能的技術(shù)與服務(wù)。如果朝更遠的方向看,我們會發(fā)現(xiàn)除了從云端部署人工智能,其實很多場景下急需在設(shè)備端部署人工智能,使這些設(shè)備具備環(huán)境感知、人機交互、決策控制的能力。
以自動駕駛為例,如果有孩子橫穿馬路,當自動駕駛系統(tǒng)感知到之后,需要把信號傳送到云端再做決策,假如當時網(wǎng)絡(luò)不穩(wěn)定的話,結(jié)果是不可想象的,因此我們需要本地計算去做實時決策。
創(chuàng)業(yè)公司做項目一定要選擇大公司不大容易進入的維度,BAT 在數(shù)據(jù)、人才、資源、服務(wù)方面的勢能,創(chuàng)業(yè)公司很難去挑戰(zhàn)。但本地低功耗人工智能計算不是他們的強項,也不是他們的業(yè)務(wù)重點。另外我認為創(chuàng)業(yè)一定要選難度較大的事情去做,嵌入式人工智能需要把軟硬件結(jié)合,并重新定義處理器架構(gòu),這是非常復(fù)雜的工程。這項任務(wù)雖然困難,但我認為只要達到這樣的維度才能構(gòu)建寬廣的護城河。我們希望把嵌入式人工智能構(gòu)建成一種開放生態(tài),使其未來在端上產(chǎn)生很多創(chuàng)新,讓意想不到的創(chuàng)新點在此發(fā)生:開放式生態(tài)可以把許多想法從一個創(chuàng)意變成產(chǎn)品,而這些想法和產(chǎn)品又會反哺地平線。
4. AI 科技評論:您覺得在 IDL 和創(chuàng)業(yè)最大的區(qū)別在哪兒?
無論在 IDL 還是在地平線,對我而言其實都是在創(chuàng)業(yè)和創(chuàng)新。當年我從國外回到北京,創(chuàng)立百度深度學(xué)習(xí)研究院,最初其實也是在做一件很新的事,當時國內(nèi)沒有一家機構(gòu)在做深度學(xué)習(xí),因為它很小眾。初期我們被很多人質(zhì)疑為什么要投入這么大的精力去做這么窄的方向。然而在今天看來,這個很小眾的事情已經(jīng)成為很多人都在關(guān)注的主題,整個世界也因此而改變。
地平線機器人實際上也是在做一件很小眾的事情,我們不在云端、服務(wù)器、GPU 上做,而是在嵌入式中去做人工智能,這也是件很小眾的事情,然而在我看來把一件事情從小做大是很讓人著迷的。
小公司相比于大公司資源確實十分匱乏,但實際上地平線的目標卻比我在百度期間的目標還要大,我們不是服務(wù)一個公司,而是撬動一個產(chǎn)業(yè),這個挑戰(zhàn)難度比以往大了幾個數(shù)量級。
在創(chuàng)業(yè)公司坐事情的難度體現(xiàn)在方方面面,比如招聘,百度有著成熟、強大的 HR 體系支持我做這件事情。而小公司往往沒什么名氣,如何吸引頂級人才加入也是一件難事。此外還有很多瑣事和細節(jié),我們每天都在做非常具體的事情,但這又是很理想主義的事情,縱使挑戰(zhàn)難度很大,但這也使得人生更有意義。
5. AI 科技評論:根據(jù)你在大公司研究院和創(chuàng)業(yè)公司的招人經(jīng)驗,分享下在 AI 團隊的招人心得。
在美國和百度時,招聘是我每天需要面對的事,因此我自身有著相當多的經(jīng)驗。另一方面,在地平線我們也在積極吸引優(yōu)秀人才的加入。吸引人才加入是一件很有挑戰(zhàn)的事情,因為現(xiàn)在人工智能人才還是比較稀少,我們做的事情又比較難,而且又是一條長線征途,所以有些人不理解我們的方向,我們做的事情在他們看來是既小眾又沒那么容易變現(xiàn)的事。
我遇到一些從事人工智能算法的同學(xué),他們有幾年深度學(xué)習(xí)經(jīng)驗就迫不及待地想改變世界,所以不太愿意去做一些偏長線的事情,但他們沒有意識到真正有價值的事情都是困難的事情、有壁壘的事情。所以我經(jīng)常告訴他們創(chuàng)業(yè)是一場艱苦的修行,而不是一場 Party,如果艱苦的修行走下來,無論是在路上還是在山頂上,那種滿足感和成就感都是無法比擬的。
當公司做的方向跟主流方向不一樣時,這種情況下吸引來的人才是極為難得和特殊的,因為他們是經(jīng)過自己冷靜思考來做事情,這批人往往是推動公司上下做一番事業(yè)的人才。地平線確實非常有幸,在很短的時間內(nèi)招到了頂尖人才:包括算法、軟件系統(tǒng)專家、硬件專家。我在百度時領(lǐng)導(dǎo)的團隊平均年齡是 26 歲,而地平線工程師平均年齡是 32 歲。因為我們是非常偏技術(shù)的公司,確實需要非常資深的人加入。
6. AI 科技評論:“現(xiàn)在最缺的是AI產(chǎn)品經(jīng)理,而不是研究大牛”,你認同這句話嗎?
對于一個商業(yè)公司來講,算法人才和產(chǎn)品經(jīng)理同等重要。這里我要強調(diào)一點,何為研究大牛?我認為研究大牛的特質(zhì)是“要有自己的思考和深厚的積累,他能夠持續(xù)的創(chuàng)新”。其實能創(chuàng)造性地做出世界級成果的人是非常稀缺的,在國內(nèi)我認為只有 5 到 10 人才能達到這個標準。一個算法人才普遍學(xué)習(xí)過 1-3 年的深度學(xué)習(xí)、會用開源平臺去訓(xùn)練模型,即使是這樣的人也不多,而這些人更談不上是研究大牛。所以我認為研究大牛是一種很稀缺的人才。
當然,AI 產(chǎn)品經(jīng)理也非常重要,因為他定義需求。如果造出來一個東西技術(shù)水平高,但不能解決實際問題,技術(shù)再高也沒有實際價值。因此我們在創(chuàng)辦一個商業(yè)公司,AI 產(chǎn)品經(jīng)理也十分重要。
7. AI 科技評論:外界有一種說法,大致是目前各個To B的人工智能公司之間技術(shù)差距相對較小,因此很多時候銷售和商務(wù)團隊決定了公司的命運。你怎么看待這個說法?

這個問題正中行業(yè)要害。從目前來講,絕大部分人工智能創(chuàng)業(yè)公司都是在基于 GPU 這樣的計算平臺和在基于 Caffe、Tensor Flow 這樣的開源平臺用比較成熟的模型結(jié)構(gòu)來訓(xùn)練,然后做一些解決性問題和 Demo,差異化確實不明顯。基于現(xiàn)在的開源模式來做創(chuàng)新,在算法方面壁壘確實也不高。
所以這就導(dǎo)致在一些標準問題里各家的效果都差不多,技術(shù)差距也并不大。這里面的核心原因之一就是中國人工智能原創(chuàng)性技術(shù)太少。
最近大家在說中國 AI 的人才、技術(shù)儲備、研究、創(chuàng)新都有優(yōu)勢,這個觀點我不太認同。實際上,國內(nèi)學(xué)生在已經(jīng)討論出解決辦法的情況下去做拿競賽、刷分,這方面我們很擅長。但真正做出 Alpah Go 這樣的創(chuàng)新,咱們還差些火候,而且國內(nèi)也缺乏孵化這種創(chuàng)新的土壤。今年深度學(xué)習(xí)原創(chuàng)性的基礎(chǔ)研究在大步向前發(fā)展,然而我?guī)缀鯖]看到哪些進步是國內(nèi)產(chǎn)生的。
另外一方面,商務(wù)和銷售確實非常重要,因為只有把技術(shù)和具體應(yīng)用場景拉近才能產(chǎn)生價值落地。技術(shù)研發(fā)也一定要有差異化,這種差異化如果只是做研究,只是去 Follow 開源平臺等這些大家都在討論的事情,這是很主流的做法,如果你一定要關(guān)注主流算法,潛臺詞就是你已經(jīng)放棄了差異化。因此你一定要深入特定的問題,深入解決那個場景下的各種限制條件,去針對性地提出特殊的方法解決實際需求,這是讓你更有差異化的途徑。
科學(xué)家創(chuàng)業(yè)需要對商業(yè)和實際需求抱有充分的敬畏之心,商務(wù)和銷售團隊也并不至于決定公司的命運,關(guān)鍵在于團隊之間的配合。商務(wù)和銷售比較看重眼前需求,對技術(shù)趨勢缺乏準確預(yù)見,而一個公司要走得長遠,還得看清未來技術(shù)發(fā)展趨勢。
8. AI 科技評論:不少歐美 AI 初創(chuàng)公司最終賣給了谷歌等巨頭,但國內(nèi)這種情況很少,你怎么看待這一現(xiàn)象?
人工智能作為一個新的產(chǎn)業(yè)方向,早期都處于探索階段,初創(chuàng)技術(shù)公司獨立存活的概率并不高,所以會選擇被大公司收購,這是一個較為明智的做法。
國外工業(yè)界和技術(shù)創(chuàng)新生態(tài)比較健康,大公司愿意付出成本為前沿性技術(shù)做人員收購,而且在不考慮成本的情況下。而國內(nèi)很少有大公司愿意為技術(shù)和人才收購付出很好的溢價。
其實每個公司被收購都有一個內(nèi)在邏輯:這些公司不是范范地提供通用技術(shù),而是在某個維度有著一定的獨特性,如 Deep Mind 不僅在做深度學(xué)習(xí),還將深度學(xué)習(xí)與增強學(xué)習(xí)相結(jié)合然后應(yīng)用在圍棋、游戲等場景。這背后的邏輯,我認為很大程度上是文化原因。國內(nèi)公司更愿意用高成本去挖人,而不愿為獨特團隊或知識產(chǎn)權(quán)付出高成本。我希望這個現(xiàn)象能發(fā)生改變,出現(xiàn)更多出于對人才和知識產(chǎn)權(quán)的收購。大公司如果能夠意識到這點,我覺得能夠?qū)鴥?nèi)技術(shù)創(chuàng)新產(chǎn)生非常正面的影響。
9. AI 科技評論:目前全球人工智能的投入產(chǎn)出比似乎并不是很高。我做個假設(shè),如果資本市場耐不住寂寞,開始縮小對人工智能領(lǐng)域的投資,你認為今天這種水平的人工智能到底會憑借頑強的生命力走到黎明,還是進入下一個寒冬?
人工智能產(chǎn)業(yè)仍處于早期階段,重大應(yīng)用場景還在不斷摸索,產(chǎn)出的確非常低。但如果回到“。com”時代,你會發(fā)現(xiàn)當時的商業(yè)模式也是探索了很長時間。
資本市場確實有追逐短期回報的現(xiàn)象,所以明年下半年到后年,即便整個 AI 投資市場趨冷也并不奇怪。AI 行業(yè)與“。com”時代一樣,即便是趨冷,但也不會影響到整體的趨勢。因為 AI 確實在推動產(chǎn)業(yè)發(fā)展,實實在在創(chuàng)造價值,它不會進入一個萬劫不復(fù)的寒冬。
10. AI 科技評論:不少人提到人工智能泡沫的說法,你認為現(xiàn)在存不存在泡沫?
實事求是的說,如果按照投資機構(gòu)的計算方法,AI 泡沫是一定存在的。AI 創(chuàng)業(yè)公司確實估值比較高,而且市場進展也并不盡如人意,到明年或后年一定會有所變化。從長期趨勢來看,適當泡沫純屬正常,就像啤酒有泡沫味道才更好,正是因為泡沫才讓各公司都有機會去登上舞臺。不論怎樣,大家亮個嗓子,在舞臺上唱一下。
我也經(jīng)常跟投資人聊這個事,經(jīng)過觀察國內(nèi)十幾年的產(chǎn)業(yè)周期發(fā)現(xiàn):以往多數(shù)項目均為 2C 產(chǎn)品,都是以產(chǎn)品創(chuàng)新和微創(chuàng)新為鮮明特征。中國沒有經(jīng)歷通過技術(shù)創(chuàng)新為主的經(jīng)濟增長模式,而硅谷等地已經(jīng)歷過好幾波技術(shù)創(chuàng)新,這在中國很少見。中國大部分投資機構(gòu)和創(chuàng)業(yè)者,并不善于技術(shù)類投資以及做 To B 這種生意,所以大家還不太習(xí)慣對這類公司進行估值。
我們一談到投資和創(chuàng)業(yè),永遠面對新的產(chǎn)業(yè)方向,然而在面對新的產(chǎn)業(yè)方向即便是海外專業(yè)投資公司也不一定看得準,所以也能看到像投資 MagicLeap 這樣的新型公司都是有爭議的。
11. AI 科技評論:當下很多投資機構(gòu)和媒體都把人工智能捧在手里,你認為這會推動 AI 更快發(fā)展,還是過度溺愛會讓它墮落?
AI 從純技術(shù)和純學(xué)術(shù)話題轉(zhuǎn)變?yōu)槿鐣懻摰脑掝},使得專業(yè)的聲音很有可能被淹沒,這是我所擔心的。投資機構(gòu)和媒體的所有動向都會影響到產(chǎn)業(yè)的發(fā)展,AI 從業(yè)人員卻難控制。
AI 在內(nèi)部環(huán)境受到 VC 和媒體的萬千寵愛,但外部的環(huán)境是很殘酷的、理性的、不相信眼淚的。在這種情況下,企業(yè)應(yīng)保持冷靜,抓準切入的點,保證服務(wù)價值從而構(gòu)建自己的護城河。整個行業(yè)的發(fā)展一定是由理性驅(qū)動,一定是由實實在在的需求和價值來驅(qū)動,因此我個人并不是特別擔心投資機構(gòu)和媒體過多溺愛這個行業(yè)從而致其墮落。當然,大浪淘沙一定會有所選擇,真正能夠平心靜氣把創(chuàng)業(yè)當作艱苦修行而非豪華盛宴的創(chuàng)業(yè)者會走到最后。
12. AI 科技評論:對 2017 年人工智能行業(yè)的格局和發(fā)展做個展望和預(yù)測。
我對 2017 年充滿了期待,希望這幾大方向有著一定的進展:
希望人工智能處理器硬件行業(yè)會有大的突破。
算法上繼續(xù)持續(xù)創(chuàng)新。
應(yīng)用場景上的重大突破:如醫(yī)療、自動駕駛、智能家居等。
從整個創(chuàng)業(yè)投資角度講,明年下半年 VC 應(yīng)該會更加冷靜、理性地思考,這里并不是指降低投資力度,而是聚焦投資范圍。同時對未來發(fā)展方向和路徑會考慮地更加清楚,把資本注入重點方向和具有價值的團隊。

群友問答環(huán)節(jié) :
1.怎么看待近期谷歌無人車事業(yè)部拆分成獨立公司?這個案例可否理解為自動駕駛已經(jīng)遇到天花板了?
從百度到地平線,我都做過自動駕駛的事情。根據(jù)我自身觀察,谷歌無人車事業(yè)部拆分這件事一點都不奇怪。谷歌一直存在幾個嚴重問題:
商業(yè)策略:谷歌沒有思考清楚商業(yè)模式,到底該提供整車,還是成為技術(shù)服務(wù)商、供應(yīng)商。
技術(shù)路線:谷歌的計劃很激進,想一步跨到不需要方向盤的無人駕駛水平。事實上谷歌的雖然目標很大,但技術(shù)路線較為很保守,導(dǎo)致目標與技術(shù)路線并不匹配。谷歌無人車是基于高精度地圖的自動駕駛方案,該方案有很大局限性,需要事先對整個環(huán)境做出全面感知,這使得其在處理不確定性事件方面有所欠缺。這種不確定性體現(xiàn)在長尾情況,而不是常見情況,而在長尾挑戰(zhàn)層面,谷歌在技術(shù)線上沒有很好地去處理這個問題。
2.如何看待近期比較熱的強化學(xué)習(xí)和遷移學(xué)習(xí),他們在應(yīng)用方面的發(fā)展現(xiàn)狀怎么樣,以及所面臨的挑戰(zhàn)?
強化學(xué)習(xí)現(xiàn)在面臨的主要挑戰(zhàn)是怎么 Handle Long-term Dependence 的問題,如果最后它 Reward 很長時間才顯現(xiàn),它怎么去影響當前的 Policy ,是一個很大的問題。強化學(xué)習(xí)的代表 Alpha Go 實際上運用了巧妙的方法如 Learning From Experience 去下圍棋,這一點很有意思 。那么未來如何在理論上有一個優(yōu)美的框架,我覺得還是挺值得探討的。
另外,強化學(xué)習(xí)的框架相對而言是一個比較黑箱的系統(tǒng),這與感知不同,在感知方面黑箱一點也可以,但在決策上一定要用白箱的、可理解的方式去做,尤其是自動駕駛領(lǐng)域。
關(guān)于遷移學(xué)習(xí)這一問題,其實深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)天然就擁有遷移學(xué)習(xí)的特性,比如用 Image Net 去訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu),實際上它的很大一部分參數(shù)在其他問題上可以復(fù)用。在參數(shù)領(lǐng)域的遷移學(xué)習(xí),大家都搞的比較清楚,但在結(jié)構(gòu)方面的遷移學(xué)習(xí),現(xiàn)在還并不太清楚。結(jié)構(gòu)反映了更高層的學(xué)習(xí)問題,基于模型結(jié)構(gòu)的遷移學(xué)習(xí)將會是下一個熱點。
3.您對哪個深度學(xué)習(xí)開源平臺在 2017 年的發(fā)展有比較大的期待?
谷歌依靠自己強大的號召力推動了 Tensor Flow,鑒于其強大背景,使得它在明年仍舊很值得期待。而在近期被亞馬遜選為官方平臺的 MX Net 同樣值得期待,MX Net 是一個更加開放的中性平臺。如果想深入開發(fā)技術(shù)、開發(fā)原創(chuàng)新技術(shù)、追求技術(shù)自主性的話推薦用 MXNet。從生態(tài)層面講,如果整個人工智能的開發(fā)都基于 Tensor Flow,這對生態(tài)的健康有著負面影響,容易被一家公司壟斷,將會影響到產(chǎn)業(yè)鏈的方方面面,如處理器和應(yīng)用等方面的部署。
除此之外,也推薦大家使用我在百度期間孵化的“親兒子”百度 Paddle Paddle。
4.基于人工智能技術(shù)的公司未來會越來越多,算法、平臺、產(chǎn)品、市場中,哪方面更可能成為一家成功公司的核心競爭力?
我先下個結(jié)論:最不容易成功的是基于純算法的公司,主要原因是壁壘低?,F(xiàn)在新的開源創(chuàng)新方式使得新算法不斷冒出來,基本上每個小時都在創(chuàng)新,如果一個公司的核心競爭力基于聰明程度,這很不靠譜。這個世界上永遠比你更聰明的人,而且很多。
無論是平臺還是產(chǎn)品,其核心競爭力在這兩方面:
巨大的市場需求
足夠的差異化和獨特性,不可復(fù)制性
滿足這兩點,你的產(chǎn)品和解決方案或服務(wù)才擁有核心競爭力。