在講人工智能之前,我想向大家介紹一下我的一些背景:在30多年前,我就進(jìn)入了人工智能領(lǐng)域。我是在1980年首先做的自然語言處理,1982年做的計(jì)算機(jī)視覺,1983做的語音識(shí)別,1985年做的人機(jī)對弈,1996年做的VR/AR……那時(shí)候我的這些選擇基本上都是非常“糟糕錯(cuò)誤”的職業(yè)選擇,因?yàn)槊恳患虑?,我都是在它的黃金時(shí)代之前。從這個(gè)事情上,其實(shí)我也想說,做計(jì)算機(jī)研究這個(gè)領(lǐng)域,還要在正確的時(shí)候選擇正確的事情。

但現(xiàn)在是人工智能的黃金時(shí)代。為了說明這個(gè)問題,我還帶一些實(shí)際的數(shù)據(jù)來跟大家分享。人工智能有很多分支,其中之一是機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)里面還有一個(gè)分支是深度學(xué)習(xí),今天我更多的會(huì)用深度學(xué)習(xí)作為案例。
人工智能是一種工具
最近人工智能成為全球熱門新聞話題,很多是因?yàn)榇蠹铱吹紸lphaGo在幾個(gè)月前擊敗了李世石,最近在網(wǎng)上還傳出年底之前它要挑戰(zhàn)柯杰的消息。但有一點(diǎn)讓我覺得很可惜:大家對這個(gè)話題討論的重心都放在了人工智能是不是在模仿人腦,“奇點(diǎn)”是否即將來臨這樣的問題上,卻沒有真正關(guān)注人工智能對我們的現(xiàn)實(shí)影響。

“奇點(diǎn)”認(rèn)為未來機(jī)器將有各種的智能、人類必須做一些事情來保護(hù)自己。但我認(rèn)為人工智能要取代人還是一個(gè)非常遙遠(yuǎn)的事情。我們需要更關(guān)注的事情是人工智能是今天能夠拿來用的工具,它能幫助人類解決問題,能取代重復(fù)性的工作,能創(chuàng)造商業(yè)價(jià)值。正因?yàn)檫@個(gè)理由,我認(rèn)為今天我們進(jìn)入了人工智能的黃金時(shí)代。
幾乎所有思考模式可以被理性推算的工作崗位,在有足夠數(shù)據(jù)支撐的時(shí)候,都會(huì)被取代。為什么AlphaGo這么厲害?就是因?yàn)樗梢詣?dòng)用到幾千臺(tái)機(jī)器每天和自己對弈上萬盤的圍棋;以后為什么自動(dòng)駕駛會(huì)這么厲害呢?因?yàn)樗梢杂盟母鞣N的sensor在路上搜集數(shù)據(jù),這不是任何一個(gè)司機(jī)可以匹敵的。
科普深度學(xué)習(xí)
深度學(xué)習(xí)是一種神經(jīng)網(wǎng)絡(luò),它的特點(diǎn)是使用了多層網(wǎng)絡(luò),能夠?qū)W習(xí)抽象概念,同時(shí)融入自我學(xué)習(xí),而且收斂相對快速。
收斂快速可能是一種技巧。簡單的來說,如果我們有很多笑臉,輸入到一個(gè)神經(jīng)網(wǎng)絡(luò)里面去,最后你希望讓機(jī)器能識(shí)別這是姚明,那是馬云。但是要一次性學(xué)會(huì)這么多會(huì)比較困難,所以就需要用到一個(gè)比較快速收斂的技巧——自我學(xué)習(xí)。通過自我學(xué)習(xí),機(jī)器會(huì)逐步從大量的樣本中逐層抽象出相關(guān)的概念,然后做出理解,最終做出判斷和決策。
比如它可以有好幾層的nodes和connection,經(jīng)過這些nodes和connection,它在每一個(gè)層次會(huì)感知到不同的抽象特征,且一層比一層更為高級。經(jīng)過自我學(xué)習(xí),從一個(gè)臉輸進(jìn)去再從同樣的一個(gè)臉輸出來,它就從里面抽象的學(xué)習(xí)到了一個(gè)人的臉重要特征。
深度學(xué)習(xí)的分層無監(jiān)督訓(xùn)練
經(jīng)過這個(gè)學(xué)習(xí)之后,再去做監(jiān)督訓(xùn)練,對不足之處進(jìn)行微調(diào)。例如,如果我輸入了馬云的臉,出來的卻是王寶強(qiáng),那訓(xùn)練系統(tǒng)就會(huì)報(bào)告錯(cuò)誤,進(jìn)行微調(diào)后,以便于下一次機(jī)器正確概率更高。
分層無監(jiān)督訓(xùn)練
但也要注意overtraining的問題,我們就對整個(gè)數(shù)學(xué)公式做一點(diǎn)微調(diào),用大量的數(shù)據(jù),不斷重復(fù)。
深度學(xué)習(xí)在最初,訓(xùn)練速度慢,所以難進(jìn)入工業(yè)級別或者應(yīng)用級別,但現(xiàn)在,我們的計(jì)算機(jī)變的越來越快,另外也有了更多取巧的訓(xùn)練和識(shí)別做法,深度學(xué)習(xí)能被應(yīng)用的領(lǐng)域越來越寬。人工智能大規(guī)模應(yīng)用的時(shí)機(jī)已經(jīng)到了。一個(gè)很簡單的評估標(biāo)準(zhǔn)就是,我們的深度學(xué)習(xí)的機(jī)器,是不是超越人類的能力表現(xiàn)。
深度學(xué)習(xí)的應(yīng)用領(lǐng)域
在過去的五年,深度學(xué)習(xí)的準(zhǔn)確度從75%多提升到了97%左右,而人的表現(xiàn)準(zhǔn)確率大概是95%。從95%到97%聽起來只進(jìn)步了2%,但實(shí)際上是把錯(cuò)誤率降低了40%。如果這種進(jìn)步持續(xù),未來人工智能可以進(jìn)入一些可應(yīng)用的領(lǐng)域。這就是今天我講人工智能進(jìn)入黃金時(shí)代的證據(jù):在很多領(lǐng)域,包括face++的人臉識(shí)別,Apple、Google,科大訊飛的語音識(shí)別,它們的認(rèn)知水平將在未來幾年的時(shí)間內(nèi)超過人類。
深度學(xué)習(xí)的應(yīng)用領(lǐng)域舉例
深度學(xué)習(xí)首先可以應(yīng)用于識(shí)別,包括人臉識(shí)別和語音識(shí)別等,這些可以用于安防,安檢等。
人臉語音的數(shù)據(jù)來之不易,但是BI,商業(yè)的流程、互聯(lián)網(wǎng)的數(shù)據(jù)卻非常豐富。Google、百度很早就已經(jīng)在搜索廣告以及推薦系統(tǒng)里面充分使用了類機(jī)器學(xué)習(xí)技術(shù),解決該推薦什么商品,一個(gè)商品怎么定價(jià),在什么位置會(huì)賣的最多,應(yīng)該把這樣的產(chǎn)品賣給誰等問題。這一類的推銷可以直接產(chǎn)生經(jīng)濟(jì)價(jià)值。
將智能用于炒股其實(shí)也是一個(gè)不錯(cuò)的選擇。利用智能,可以隨時(shí)來算一籃子股票和期貨應(yīng)該如何對沖。機(jī)器可以二十四小時(shí)不睡覺,每天都在算怎么能賺最多的錢。除此之外,深度學(xué)習(xí)的技術(shù)可以把各種的因素都融合進(jìn)來,比如公司的高管變動(dòng),即時(shí)新聞,行業(yè)里變動(dòng)……甚至你可以對一個(gè)智能系統(tǒng)說如果明天巴西發(fā)生了地震,什么股票該被購買。
銀行保險(xiǎn)方面,比如說貸款審批,可以通過機(jī)器來判斷;醫(yī)學(xué)方面,在診斷的完善上,是可以用機(jī)器學(xué)習(xí)來做。
前一陣我在美國碰到了一些科學(xué)家,他們正在用機(jī)器學(xué)習(xí)的方法來發(fā)明新藥。將試驗(yàn)的排列組合交給機(jī)器,所有的實(shí)驗(yàn)都是通過機(jī)器學(xué)習(xí)精準(zhǔn)進(jìn)行。
在教育方面也有應(yīng)用。智能化的教育系統(tǒng)會(huì)識(shí)別你的學(xué)習(xí)水平,然后根據(jù)你的水平確定學(xué)習(xí)內(nèi)容。
人工智能將重塑億萬級別的領(lǐng)域
人工智能會(huì)重塑很多億萬級別的領(lǐng)域。當(dāng)然這個(gè)不是明天就會(huì)發(fā)生。比如,在我們的計(jì)算架構(gòu)上面,現(xiàn)在還是需要時(shí)間去做算法的改進(jìn)提升,需要去研究如何部署云端架構(gòu),另外深度學(xué)習(xí)用時(shí)仍太長;有一些重要技術(shù)的推進(jìn),實(shí)際上是因?yàn)橛辛碎_源或者API或者標(biāo)準(zhǔn)的出現(xiàn),但現(xiàn)在仍有很多方面還沒有出現(xiàn)相關(guān)標(biāo)準(zhǔn)。當(dāng)然Google的TensorFlow等提供了一些開源的方法,但是其實(shí)他們還沒有真正的平臺(tái)化。
在一些領(lǐng)域中,很多技術(shù)性問題可以在兩三年內(nèi)得到解決,但是還有很多問題并非如此簡單,比如語義。語音識(shí)別是相對簡單的:音進(jìn)來,字出去,一個(gè)API就可以調(diào)動(dòng)。但是音進(jìn)來,確定是何種情境的語義出去就很難。
傳感器一定程度來說是價(jià)格的問題、如何普及的問題。GoogleCar雖然很牛,但是正傳感器實(shí)在太貴了。降低價(jià)格就需要量,但價(jià)格不下去量也起不來,要解決這個(gè)問題也需要一定的時(shí)間。
最后還有很多機(jī)械方面的問題。控制機(jī)械運(yùn)動(dòng)的算法,硬件運(yùn)動(dòng)后給出的回饋等等還需要一些開發(fā)。
人工智能幫助企業(yè)打造競爭力
深度學(xué)習(xí)的挑戰(zhàn)
但是深度學(xué)習(xí)以及機(jī)器學(xué)習(xí)還面臨很多挑戰(zhàn)。這里有幾個(gè)問題。
第一,目前仍然沒有統(tǒng)一的平臺(tái)。第二,深度學(xué)習(xí)的網(wǎng)絡(luò)太大,需要海量的數(shù)據(jù)。第三,計(jì)算特別慢。第四,機(jī)器無法用人的語言告知做事的動(dòng)機(jī)和理由。比如AlphaGo打敗李世石,你要問AlphaGo是為什么走這步棋,它是答不上來的。
即便有如此多的局限,我們還是認(rèn)為人工智能在很多領(lǐng)域可以迅速應(yīng)用,并且可以幫助企業(yè)打造競爭壁壘。
第一,壟斷大數(shù)據(jù)優(yōu)勢。關(guān)于數(shù)據(jù)需要注意的幾點(diǎn)是,首先壟斷性大數(shù)據(jù)不是公開的數(shù)據(jù),不是剽來的數(shù)據(jù),也不是買來的數(shù)據(jù)。其次,無標(biāo)簽的數(shù)據(jù)也不會(huì)給你帶來優(yōu)勢。再次,人工給數(shù)據(jù)設(shè)置標(biāo)簽太慢。最好的數(shù)據(jù)是閉環(huán)的數(shù)據(jù),所謂閉環(huán)的數(shù)據(jù)就是在你應(yīng)用的時(shí)候可以捕捉到數(shù)據(jù)并且知道最終你的抉擇對不對。我們投資的face++,它有和美圖、阿里的合作,就一定程度形成了特別大的數(shù)據(jù)的優(yōu)勢。
第二,擁有龐大的機(jī)群。包括需要什么處理系統(tǒng)的支持,怎么去部署,用什么樣的計(jì)算架構(gòu)等。
第三,你要有一批特別懂的人。沒有平臺(tái)的時(shí)候,你就只能把一批人丟進(jìn)去,讓他們?nèi)ソ鉀Q特別大的問題。
第四,利用算法調(diào)節(jié)彌補(bǔ)平臺(tái)缺失。當(dāng)然這構(gòu)成一個(gè)短期的競爭優(yōu)勢,從長期看,一旦大的人工智能平臺(tái)出來,這種優(yōu)勢就不存在了。
人工智能如何快速商業(yè)化
第一,不要用人工智能去取代人。很多情況之下他只要能輔助人就可以了。
第二,要聰明的找到容錯(cuò)的用戶界面。搜索引擎的精確度其實(shí)是很低的,但它在界面中給用戶提供很多結(jié)果,而用戶只要能找到他滿意的那個(gè),就會(huì)認(rèn)為搜索引擎很棒。
第三,讓用戶提供自然的大數(shù)據(jù)。很多人把Siri當(dāng)成一個(gè)搞笑工具,會(huì)問它諸如“你是男是女”這種無聊問題,蘋果就把這些無聊的問題深度分析了一下,用于優(yōu)化Siri,讓它對正常問題的解答能讓人們在一定程度上得到滿足。人們滿足了以后,就會(huì)繼續(xù)的問,蘋果也就可以得到更多的數(shù)據(jù)。
第四,關(guān)注局限領(lǐng)域。Google很偉大,它要做全天候全路況的無人駕駛,但我們完全可以先做一個(gè)用于局限領(lǐng)域的無人車,然后我們通過它獲取數(shù)據(jù),學(xué)習(xí)教訓(xùn),不斷改進(jìn)。GoogleCar表現(xiàn)優(yōu)異,但是它碰到一些極端的情況,比如大風(fēng)大雨的漆黑天,就沒轍了。既然如此,為什么我們不先考慮做一些可控環(huán)境下的商業(yè)駕駛項(xiàng)目?
人工智能的未來藍(lán)圖
大數(shù)據(jù)應(yīng)用方面,現(xiàn)階段我們已經(jīng)看到很多互聯(lián)網(wǎng)應(yīng)用,BI、商業(yè)自動(dòng)化馬上也會(huì)使用相關(guān)的技術(shù),未來幾年,離錢最近、產(chǎn)生用戶最多、產(chǎn)生價(jià)值最大的領(lǐng)域可能就是金融、醫(yī)療、教育,當(dāng)然也包括任何有大數(shù)據(jù)的行業(yè)。
在感知方面,今天的人臉識(shí)別、語音識(shí)別已經(jīng)做的蠻好。對于VR/AR,我們在短期還不是太樂觀,但是隨著它三五年以后慢慢得到普及,一定需要非常多的新的自然語言的界面。此外,我們大膽預(yù)測三到五年之內(nèi)會(huì)有一個(gè)人工智能平臺(tái)出現(xiàn)。
我們并不認(rèn)可家庭機(jī)器人會(huì)很快出現(xiàn),理由是消費(fèi)者的期望值是最高的,今天機(jī)器人的技術(shù),有時(shí)候會(huì)看起來太傻,另外價(jià)格也太貴,感應(yīng)器不夠靈敏。任何行業(yè)都要有經(jīng)濟(jì)理由來投資這個(gè)領(lǐng)域,不斷迭代優(yōu)化它的技術(shù),再進(jìn)入下一個(gè)階段,所以機(jī)器人簡單來說應(yīng)該是工業(yè)、商業(yè),最后普及到家庭,所以今天很多對家庭機(jī)器人過火的觀點(diǎn)和做法我們是不認(rèn)可的。
關(guān)于無人駕駛,我們的觀點(diǎn)是雖然GoogleCar很偉大,但是因?yàn)樗ミm應(yīng)各種路況。我們認(rèn)為可以先在局限環(huán)境中慢慢推進(jìn)無人駕駛。
從長期看,未來人工智能會(huì)在所有的領(lǐng)域徹底改變?nèi)祟?,產(chǎn)生更多的價(jià)值,會(huì)讓很多現(xiàn)在重復(fù)性的工作被取代,然后讓人去做人真正應(yīng)該去做的事情。