眼下人工智能很熱,門派也很多,在“人工智能(AI)”與“智能增強(qiáng)(IA)”經(jīng)歷了多輪“此消彼長(zhǎng)”之后,未來的“江湖”會(huì)怎樣?在“深度學(xué)習(xí)”被很多巨頭奉為有關(guān)生死存亡的技術(shù)和能力之后,誰會(huì)是取代“deeplearning”的下一個(gè)“AI殺手”?當(dāng)IT巨頭都在角逐“類人腦計(jì)算”時(shí),“類人腦”的現(xiàn)實(shí)之路還有多遠(yuǎn)?作為為全球芯片巨頭,英特爾有什么樣的AI布局?英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)會(huì)給出什么樣的答案?



AI和IA需要“在一起”
IT和武俠江湖很像,也分學(xué)派和流派。關(guān)于人工智能(Artificial Intellingence,AI)與智能增強(qiáng)(Intellingence Argumentation,IA),科技預(yù)言家約翰·馬爾科夫在他的《與機(jī)器人共舞》一書中有清晰的分類和定義。
五六十年前,當(dāng)一撥人投身于“未來的計(jì)算機(jī)能夠建立起和人一樣的智慧”(人工智能)的時(shí)候,另一撥人扎進(jìn)了“交互式計(jì)算”里,認(rèn)為計(jì)算機(jī)更多的是在增強(qiáng)人的智慧而非取代人類,去做了“智能增強(qiáng)”。前一撥人認(rèn)為,計(jì)算機(jī)是可以獨(dú)立完成一些事情,不需要人的參與。后一撥人認(rèn)為,計(jì)算機(jī)始終無法脫離人,需要以人為中心,所以他們更多去做“智能增強(qiáng)”。
宋繼強(qiáng)表示,要讓機(jī)器獨(dú)立具備人的能力,不是一件容易的事情,也遇到一些瓶頸,所以在早些年AI熱過后,又沉寂下去。而去做機(jī)器與人協(xié)作的這撥人,希望提高機(jī)器效率,很重要的一個(gè)維度就是解決“Human in the loop”(人機(jī)交互)。
這兩撥人平行研究,偶爾會(huì)有交集,并且此消彼長(zhǎng)。當(dāng)AI特別熱的時(shí)候,人機(jī)交互就會(huì)沉寂下去,當(dāng)人機(jī)交互熱的時(shí)候,AI又會(huì)“消停”下來。
從宋繼強(qiáng)的觀點(diǎn)來看,要想加速人工智能的商業(yè)應(yīng)用,這個(gè)兩條平行線是應(yīng)該合二為一的。目前看,獨(dú)立的AI,比如說AlphaGo在人給它進(jìn)行大量訓(xùn)練之后,在與人下棋的那段時(shí)間是可以獨(dú)立完成一些事情,甚至某些方面超過人,但是到目前為止我們還看不到AI在通用和全面能力上趕上和超過人的跡象,而且還非常遙遠(yuǎn)。
在構(gòu)造基于AI的自主機(jī)器里面有三個(gè)關(guān)鍵的維度,第一步是感知,二是認(rèn)知,三是行動(dòng),要把這三個(gè)步驟連貫起來形成一個(gè)閉環(huán)。
從“感知”和“行動(dòng)”的維度看,目前有了很多進(jìn)步。而其實(shí)最難突破的是“認(rèn)知”。因?yàn)樗嗖煌袠I(yè)的知識(shí),包括對(duì)心理學(xué)、對(duì)人、對(duì)物體,對(duì)知識(shí)等如何建模。目前看,這個(gè)維度還沒有達(dá)到人類可用的程度。
宋繼強(qiáng)舉了語意理解的例子。比如一句話是聲音信號(hào),變成了文字,這個(gè)文字不同的語言文字有不同的表示。中文的“太陽”和英文的“Sun”,他們對(duì)應(yīng)都是一個(gè)物體,這個(gè)符號(hào)太陽與你語句里邊的其他的詞,會(huì)形成一些關(guān)系,到底你說這句想表達(dá)什么,這個(gè)語意理解要從你這個(gè)感知層的一些符號(hào)去推算。
這其中還要消除“語義歧義”。比如“乒乓球拍賣完了”這句話,有好幾種意思表達(dá),究竟是“乒乓球拍,賣完了!”還是“乒乓球拍賣,完了!”這需要結(jié)合上下文,需要結(jié)合語境才能準(zhǔn)確了解。
除了語義歧義,我們?nèi)嗽趯?duì)話中不是每句話都把所有信息說全的,人是很容易識(shí)別,但是計(jì)算機(jī)要做到很不容易。
再比如你說“幫我去冰箱中拿可樂”這句話,人很容易就可以完成幫你拿可樂這一系列的動(dòng)作。但機(jī)器人是“蒙”的,它得算很多,因?yàn)槿笔Ш芏嘈畔?,首先冰箱在哪?什么是可樂?長(zhǎng)什么樣?從這兒到冰箱那兒要怎么走過去?太多事情他不懂,這里面涉及很多知識(shí),需要將很多知識(shí)庫建起來,放進(jìn)去,機(jī)器人才能很好地去完成這一動(dòng)作。
在知識(shí)缺失或者信息不完整等背景下,“智能增強(qiáng)”派上了用場(chǎng)。比如說,智能機(jī)器人通過語音、屏幕交互,把缺失的信息以比較自然、而不是太笨的方式呈現(xiàn)給用戶,讓用戶替他去解決。比如機(jī)器人已從網(wǎng)上搜來了一些知識(shí),可樂有幾種,減肥的,紅色的,它就可以問人:“你要哪種可樂?”機(jī)器人不知道冰箱在那里,機(jī)器人可以問人:“這個(gè)冰箱是不是在某個(gè)廚房?”這樣的問題人是可以接受的。我們通過一部分人工智能,一部分人機(jī)交互,把這個(gè)閉環(huán)形成,讓機(jī)器人用起來,加快商業(yè)化應(yīng)用,機(jī)器人的智慧成長(zhǎng)之路就可以加快。
我們都知道一個(gè)事物的快速成長(zhǎng)有兩個(gè)途徑,一個(gè)是靠軍事使用,另一個(gè)是靠商業(yè)推動(dòng)。商業(yè)應(yīng)用是我們看到可能讓機(jī)器人成長(zhǎng)起來的最好路徑。通過AI+IA,這個(gè)路就沒有那么遠(yuǎn)了。
宋繼強(qiáng)最近與德國(guó)做機(jī)器人的院士進(jìn)行交流。院士坦言,即便是最厲害的深度學(xué)習(xí)也不可能將識(shí)別準(zhǔn)確率做到100%,算法只是其中的一步,事實(shí)上機(jī)器人要運(yùn)行穩(wěn)定、要可靠,還有很多維度的事情要完善,還有很多問題要解決。在AI+IA的發(fā)展思路上,德國(guó)院士與宋繼強(qiáng)的觀點(diǎn)是一致的。

知識(shí)庫是下一AI競(jìng)爭(zhēng)關(guān)鍵點(diǎn)
目前大家對(duì)人工智能的關(guān)注焦點(diǎn)是算法,“深度學(xué)習(xí)”尤其火。應(yīng)該說,深度學(xué)習(xí)是目前解決AI問題的最好方法,但并不排除未來還會(huì)有更高效的AI算法出來,事實(shí)上解決人工智能的問題,不同的工具在不同的維度有不同的優(yōu)勢(shì)。
宋繼強(qiáng)表示,另外一個(gè)維度是中國(guó)應(yīng)該關(guān)注的,就是前面提及的“知識(shí)庫”(Knowledge Vault),這是AI的另一個(gè)難題。
麻省理工(MIT)等是比較早開始做知識(shí)庫的機(jī)構(gòu),當(dāng)時(shí)為了讓機(jī)器人在室內(nèi)工作,需要建立一個(gè)知識(shí)庫,主要覆蓋室內(nèi)的常識(shí)(Open Mind Common Sense)。比如讓機(jī)器人從室內(nèi)到門外,門是關(guān)著的,機(jī)器人看到門是關(guān)的,它是不知道如何出去的,門牽扯到哪些?開關(guān)如何操作,門才可以開?這是一套連接的知識(shí)網(wǎng)絡(luò)。當(dāng)時(shí)學(xué)術(shù)界做這樣一套常識(shí),投入很多人力,幾屆學(xué)生一起做才完成,用半結(jié)構(gòu)化的短句,把知識(shí)做在里面,這些知識(shí)通過一定的模式可以查詢出來。僅僅是一個(gè)室內(nèi)場(chǎng)景,建立常識(shí)庫就很不容易,而且稍稍變化一下環(huán)境就不適用,比如在國(guó)外建立的常識(shí)庫,拿到中國(guó)就未必適用了。
在宋繼強(qiáng)看來,知識(shí)庫是人工智能里邊最復(fù)雜的東西,因?yàn)橹R(shí)日新月異。他舉了一個(gè)非常淺顯的網(wǎng)絡(luò)語言的例子,現(xiàn)在年輕人三天兩頭換新詞,如果不更新這些詞匯,你就不懂他講的是什么意思。
宋繼強(qiáng)提及了谷歌公司正在建立全球最大的知識(shí)庫的事情,可能這個(gè)信息還沒有引起更大的關(guān)注。谷歌通過算法自動(dòng)搜索網(wǎng)上的信息,利用機(jī)器學(xué)習(xí)將數(shù)據(jù)變成知識(shí),到目前,谷歌已經(jīng)收集了16億件事實(shí),而谷歌表示這個(gè)知識(shí)庫要建立起來至少需要十年的時(shí)間。而事實(shí)上,這是一個(gè)非常有“野心”的事情,因?yàn)橐坏┙⑵饋?,意味著全球的智能設(shè)備都有可能需要去使用其知識(shí)庫,它就有可能左右這個(gè)世界的所有智能設(shè)備。
我在網(wǎng)上搜索了一下國(guó)外分析師對(duì)谷歌正在構(gòu)建知識(shí)庫的評(píng)價(jià),還是嚇了一跳。比如,“知識(shí)庫除了改善人機(jī)交互之外,也會(huì)推動(dòng)現(xiàn)實(shí)增強(qiáng)技術(shù)的發(fā)展”。“知識(shí)庫還能夠改變我們研究人類社會(huì)的方法,甚至可以對(duì)未來做精準(zhǔn)的預(yù)測(cè)”。“知識(shí)庫改善人們的生活和娛樂,甚至是戰(zhàn)爭(zhēng)的方式”。
目前全球許多大公司都在構(gòu)建知識(shí)庫。在宋繼強(qiáng)看來,構(gòu)建知識(shí)庫這個(gè)事情也只有大公司可為,因?yàn)樽鏊鼤r(shí)間跨度很長(zhǎng),小公司根本支撐不下去。而且這個(gè)知識(shí)庫如果被別人利用了,智能設(shè)備的觀點(diǎn)都會(huì)發(fā)生變化,它會(huì)影響機(jī)器人以后的價(jià)值觀,重要性不言而喻,不能被短期利益驅(qū)動(dòng)。而且知識(shí)庫和文化和地域有關(guān),我們不可能一大堆的設(shè)備總用英語去查詢,所以它需要本地化、中文化,美國(guó)做的知識(shí)庫肯定不太適合中國(guó)。中國(guó)的大公司應(yīng)該注意到這個(gè)維度。中國(guó)的公司中,宋繼強(qiáng)認(rèn)為,百度和騰訊都有可能做這個(gè)事情。
除了知識(shí)庫中國(guó)需要發(fā)力,宋繼強(qiáng)認(rèn)為中國(guó)應(yīng)該發(fā)力的第二個(gè)方面是自然語言處理。因?yàn)樵谡J(rèn)知推理中,很重要的一個(gè)關(guān)鍵是如何在比較少的數(shù)據(jù)中,推理得到有意義的結(jié)果,在其中很多是與自然語言相關(guān),而中國(guó)在自然語言理解上有優(yōu)勢(shì)。從視覺識(shí)別來看,國(guó)內(nèi)和國(guó)際沒有太大的區(qū)別。而在自然語言識(shí)別上有很多差別,我們推動(dòng)AI往下走,很多技術(shù)與之密切相關(guān)。只有在知識(shí)庫和自然語言理解上做好,我們才敢把更多的事情交給機(jī)器人。
CPU、FPGA和ASIC
談及AI離不開計(jì)算力,從字符識(shí)別語音識(shí)別到圖像識(shí)別,對(duì)計(jì)算能力的要求是一步一步往上走的,這一步一步的往上走離不開計(jì)算能力的大幅提升和成本的大幅下降。現(xiàn)在AI要求計(jì)算能力不斷提升,有的公司也采用圖形加速器去做訓(xùn)練、去做識(shí)別,遇到的難題之一就是計(jì)算能力提升,功耗也變大。而很多智能設(shè)備是移動(dòng)的,不管是無人車還是服務(wù)機(jī)器人,都要求續(xù)航時(shí)間,都對(duì)功耗降低有迫切需求。而做AI智能設(shè)備有三步,識(shí)別、推理、行動(dòng),所以不僅僅是要它進(jìn)行識(shí)別,還要它進(jìn)行分析、挖掘信息,計(jì)算能力和功耗之間的矛盾就變得越來越突出了。
怎么解決?一個(gè)方式是用軟件的方式。人工智能是一個(gè)軟硬結(jié)合的系統(tǒng),其實(shí)不是純軟件的事,軟件可以做一些算法優(yōu)化,把計(jì)算量砍下來。第二個(gè)是硬件的方式。就是用很經(jīng)濟(jì)、很有效的方式使用電力。這其中也有幾類,最通用的方式是CPU,比如英特爾的酷睿系列、至強(qiáng)系列,這些通用的處理器,最通用的同時(shí)功耗也高。另一種是專用芯片ASIC(Application-SpecificIntegrated Circuit),它可以做到功耗很低,但是性能很強(qiáng)。ASIC方案是一個(gè)終極解決方案。處于軟件和硬件方式中間的是FPGA,F(xiàn)PGA的功耗和通用性處于中間檔,功耗比CPU和GPU都低,他有一定的配置靈活性,配置起來是要靠寫硬件的代碼。而且它的成本比ASIC要高,所以當(dāng)量還不足以支撐大規(guī)模制造專用芯片的時(shí)候,通常會(huì)采用FPGA。
講清楚CPU和FPGA以及ASIC的關(guān)系,大家就很好理解為什么英特爾要收購Nervana這家初創(chuàng)公司的原因了,因?yàn)镹ervana是做專用AI芯片的,是AI的ASIC供應(yīng)商,現(xiàn)在的AI需求到了需要專用AI芯片的時(shí)候了。據(jù)稱,Nervana處理器速度將可達(dá)到GPU的10倍,而投靠英特爾,可以讓Nervana獲得強(qiáng)大的芯片制造能力、資金能力和生態(tài)鏈整合能力。所以這樁婚姻會(huì)非常自然。
宋繼強(qiáng)表示,從數(shù)據(jù)顯示來看,目前在全球計(jì)算中心的計(jì)算量中,有10%是與AI相關(guān),雖然看起來占比還不是很高,但是成長(zhǎng)性超快,還在加速成長(zhǎng)中,而且AI有引擎帶動(dòng)效應(yīng),所以英特爾加速這個(gè)部分的布局是非常順理成章的。
在AI這個(gè)路徑上看,從CPU到FPGA到ASIC,英特爾做了很好的布局。講完這條線路,大家一定會(huì)關(guān)心另外一條線路“類人腦計(jì)算”,因?yàn)槟菞l路其實(shí)才更接近于AI的需求。而目前包括IBM、谷歌以及中國(guó)都在加速在這個(gè)路徑上的布局。作為全球芯片的巨頭,英特爾不做類人腦芯片的研發(fā)嗎?
宋繼強(qiáng)表示,英特爾并非不做,只是現(xiàn)在還沒有到透露的時(shí)候,一般大家看到的都是已經(jīng)相對(duì)商業(yè)化的英特爾技術(shù)路線,對(duì)于未來的研究,英特暫時(shí)不會(huì)公布。
我曾在幾年前參加英特爾在硅谷舉行的英特爾全球研究院展示日活動(dòng),那時(shí),英特爾就已經(jīng)在進(jìn)行“類人腦芯片”和計(jì)算架構(gòu)的研發(fā),主要是放在美國(guó)研究院,只是現(xiàn)在還沒有到公布的時(shí)候,而全球的類人腦計(jì)算都還處于比較早期的階段,商業(yè)化之路還很遙遠(yuǎn)。