不管怎么說(shuō),現(xiàn)在確實(shí)是開啟人工智能時(shí)代的最佳時(shí)機(jī)。因?yàn)?,?duì)人工智能起到關(guān)鍵作用的的幾個(gè)技術(shù)因素在這幾年開始趨于融合,比如數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng),大型計(jì)算能力,特別是深度學(xué)習(xí)技術(shù)獲得了迅速的發(fā)展。


一個(gè)新興技術(shù),在應(yīng)用層面開始被認(rèn)可,人工智能某種程度上改變了其幾十年來(lái)介乎科學(xué)與工程學(xué)之間的尷尬地位。這些應(yīng)用,包括機(jī)器人(智能個(gè)人助理)、無(wú)人駕駛、醫(yī)療、金融等,人工智能在未來(lái)將會(huì)無(wú)孔不入。
無(wú)人駕駛、機(jī)器人 起飛卻無(wú)法落地的人工智能
先來(lái)說(shuō)說(shuō)無(wú)人駕駛,谷歌在很久以前便開始在這一領(lǐng)域布局,對(duì)谷歌來(lái)說(shuō),提前釋放所謂的黑科技是其慣用的PR手段。無(wú)疑谷歌這一手段是成功的,近兩年,眾多汽車廠商與百度開始將這一概念在國(guó)內(nèi)釋放。

理論上無(wú)人駕駛也是人工智能一個(gè)非常有前景的應(yīng)用領(lǐng)域。但目前無(wú)論是技術(shù)上還是倫理上,無(wú)人駕駛短期內(nèi)面臨很多無(wú)法解決的問(wèn)題。
首先是安全問(wèn)題,據(jù)央視《法治在線》欄目報(bào)道,今年1月,一位23歲男青年駕駛著自己的特斯拉轎車在京港澳高速河北邯鄲段公路行駛,未能及時(shí)躲避前方的道路清掃車而發(fā)生追尾,事故導(dǎo)致該名車主身亡??梢岳斫鉃榧夹g(shù)實(shí)操上仍存在著諸多未解決的問(wèn)題。
其次國(guó)內(nèi)不少?gòu)S商也正在無(wú)人駕駛領(lǐng)域持續(xù)投入,包括百度、樂(lè)視等等,但這些廠商無(wú)一例外目前都沒有拿出太多讓大眾滿意的成果。
同時(shí)比較關(guān)鍵的一點(diǎn)是,對(duì)于無(wú)人駕駛來(lái)說(shuō),愿景雖好,但實(shí)現(xiàn)很難。今年4月,公安部交通管理科學(xué)研究所副所長(zhǎng)孫正良曾公開表示,“未來(lái)需要建立車車通信、車路通信的安全認(rèn)證機(jī)制,以及讓路側(cè)設(shè)備智能化、電子化。如果這些東西都沒有,將來(lái)要求無(wú)人駕駛難度相當(dāng)大。”
可見無(wú)人駕駛這項(xiàng)人工智能技術(shù)真正落地還需要很長(zhǎng)一段時(shí)間。
除無(wú)人駕駛技術(shù)外,一些公司還開始做起了機(jī)器人,比較有名的是由日本軟銀集團(tuán)和法國(guó)Aldebaran Robotics共同研發(fā)的Pepper,除此之外還有“小度”、“賢二”以及一些國(guó)內(nèi)創(chuàng)業(yè)公司所研發(fā)的機(jī)器人,在品質(zhì)上雖然有高有低,但都以?shī)蕵?lè)博眼球?yàn)橹?,并沒有實(shí)質(zhì)的場(chǎng)景應(yīng)用價(jià)值。
語(yǔ)音助手可能是未來(lái)AI落地最靠譜的方向
相對(duì)于無(wú)人駕駛、智能機(jī)器人,幾年前為了“解放雙手”, 語(yǔ)音助手被看作下一代非常有潛力的交互方式和搜索方式。而近兩年人工智能技術(shù)開始成熟之后,語(yǔ)音助手被賦予了更多的意義,人們期待未來(lái)語(yǔ)音助手真正能夠理解用戶、幫助用戶完成一些任務(wù)。從技術(shù)的角度,這幾年國(guó)內(nèi)外的幾個(gè)大廠商都已經(jīng)基本完成了第一階段的技術(shù)積累。

美國(guó)科技界兩大巨頭——蘋果和谷歌,都在近期顯示出加碼智能語(yǔ)音助手的決心。一個(gè)是iPhone7發(fā)布會(huì)上,蘋果的AirPods增加了Siri的使用場(chǎng)景,而Google 近期在發(fā)布會(huì)上也突出了Google Assistant的核心地位,無(wú)論是Pixel還是Google Home,其內(nèi)在核心都是Google Assistant的運(yùn)用和聯(lián)動(dòng)。
所謂的智能語(yǔ)音助手,顧名思義是在語(yǔ)音正確識(shí)別的基礎(chǔ)上,理解用戶所表達(dá)的真正意思,并為用戶提供實(shí)質(zhì)性的幫助。而語(yǔ)音識(shí)別的準(zhǔn)確率是智能語(yǔ)音助手真正發(fā)揮智能的技術(shù)基礎(chǔ)。
其實(shí),人類已經(jīng)花費(fèi)了幾十年去研究語(yǔ)音識(shí)別技術(shù),但誤差率一直都無(wú)法降低,直至去年,在英語(yǔ)識(shí)別方面,人類在室內(nèi)的語(yǔ)音識(shí)別誤差率還停留在約8%,語(yǔ)音識(shí)別技術(shù)的誤差率則在12%,而且還是實(shí)驗(yàn)室內(nèi)的結(jié)果。
從目前的發(fā)展來(lái)看,國(guó)內(nèi)的語(yǔ)音識(shí)別技術(shù)已經(jīng)開始領(lǐng)先于國(guó)外。我們以目前語(yǔ)音識(shí)別領(lǐng)域排名第一的搜狗公開的數(shù)據(jù)來(lái)看,目前搜狗輸入法的語(yǔ)音識(shí)別準(zhǔn)確率已經(jīng)超過(guò)了97%。
97%的準(zhǔn)確率是什么概念?相當(dāng)于一些人耳朵不好分辨的語(yǔ)音內(nèi)容,搜狗語(yǔ)音識(shí)別已經(jīng)能聽得懂了。這個(gè)比例,其實(shí)已經(jīng)超越了國(guó)外的語(yǔ)音識(shí)別技術(shù)水平。此外,搜狗輸入法的語(yǔ)音識(shí)別功能平均每天被調(diào)用次數(shù)達(dá)到1.9億次,這樣的數(shù)據(jù)規(guī)模也是目前國(guó)內(nèi)語(yǔ)料規(guī)模最大的,同時(shí)也讓搜狗輸入法的語(yǔ)音識(shí)別準(zhǔn)確率可以更迅速地提升。
但是就像王小川自己說(shuō)的,人工智能劃分為識(shí)別、生成和決策三個(gè)階段,識(shí)別與生成是同等重要的;而要讓人工智能產(chǎn)生市場(chǎng)價(jià)值,決策才是讓人工智能變成商業(yè)智能的核心。正常的邏輯下,針對(duì)特定場(chǎng)景的人工智能才是當(dāng)前最成熟,也是最容易落地的。
事實(shí)上,這幾年特別是在國(guó)內(nèi),之所以智能語(yǔ)音助手能夠在用戶群中廣為普及,某些娛樂(lè)應(yīng)用功不可沒,比如兩年前的微軟小冰。
這種應(yīng)用的好處在于接地氣,娛樂(lè)性很強(qiáng),具有一定的“病毒性營(yíng)銷”效應(yīng),能夠迅速讓用戶體驗(yàn)語(yǔ)音識(shí)別、語(yǔ)義理解。但其實(shí)這種娛樂(lè)類的語(yǔ)音助手,個(gè)人認(rèn)為受限于開放環(huán)境的限制條件,無(wú)法提供針對(duì)所有用戶提出問(wèn)題的正確回應(yīng)。
在我看來(lái),在保證語(yǔ)音識(shí)別準(zhǔn)確率的基礎(chǔ)上,搜索引擎公司擁有做智能語(yǔ)音助手的最好基因,畢竟搜索本來(lái)就是一種用戶獲取信息的方式,語(yǔ)音助手本身就是對(duì)搜索的體驗(yàn)進(jìn)一步升級(jí)。利用語(yǔ)音識(shí)別技術(shù)針對(duì)于垂直場(chǎng)景所開發(fā)的智能語(yǔ)音助手,更切合實(shí)際應(yīng)用,這種方式要比噱頭更有實(shí)際意義,也有利于人工智能技術(shù)的實(shí)際發(fā)展。
值得一提的是,搜狗目前已經(jīng)開始在垂直場(chǎng)景下發(fā)力,比如前一陣子推出的“語(yǔ)音修改”,用戶可以用自然語(yǔ)言的形式修改自己輸入的內(nèi)容,比如“把弓長(zhǎng)張修改為立早章”等。在智能導(dǎo)航領(lǐng)域,用戶如果想要去機(jī)場(chǎng),只需要告知導(dǎo)航系統(tǒng)航班號(hào),即可提供相應(yīng)機(jī)場(chǎng)地點(diǎn)與時(shí)間等信息。
當(dāng)然,我們也有理由相信,技術(shù)的發(fā)展會(huì)為我們帶來(lái)通用型的語(yǔ)音助手,但個(gè)人認(rèn)為,短期之內(nèi)做好垂直場(chǎng)景的體驗(yàn)和技術(shù)積累,會(huì)讓通用型助手來(lái)得更快。