九月是各個學(xué)校開學(xué)的季節(jié),也是廣大學(xué)生重裝上陣,開始在更高級更廣闊的知識海洋中探索、成長的時刻。在這樣一個充滿希望,又看得見收獲的季節(jié),一個滿身閃耀著智慧光芒,處處散發(fā)著知識清香的小度機(jī)器人,搶到了不少頭條。
9月20日,中國科技館的全國科普日展覽活動中,中共中央政治局常委、中央書記處書記劉云山等國家領(lǐng)導(dǎo)現(xiàn)場體驗(yàn)了小度機(jī)器人,并為小度點(diǎn)贊。
9月16日晚,江蘇衛(wèi)視的芝麻開門節(jié)目,小度以“文藝女青年”的身份亮相,并回答出歷史、文學(xué)、電影、音樂四個領(lǐng)域的四十道題目。節(jié)目中的小度不僅表現(xiàn)得知識淵博,所有問題全部答對,而且語言風(fēng)趣,屢次調(diào)侃節(jié)目主持人彭宇,令人印象深刻。
那么是什么樣的技術(shù)使這樣一個萌萌噠的小度機(jī)器人顯示出如此強(qiáng)大的“知識范兒”呢?我們不妨從技術(shù)的角度來分析一下小度機(jī)器人。從百度百科上面的介紹來看,小度機(jī)器人的核心是百度的中文深度問答系統(tǒng)。她最擅長的是百科知識類的問答,上知天文、下知地理、影視音樂、無所不知,能夠給出精準(zhǔn)答案。

那么何謂“深度問答”?它又是如何能成為一個機(jī)器人的核心呢?我們還要從“圖靈測試”說起。
深度問答的雛形,圖靈測試已經(jīng)成為機(jī)器人類的圖騰
圖靈測試一詞來源于計(jì)算機(jī)科學(xué)和密碼學(xué)的先驅(qū)阿蘭·麥席森·圖靈寫于1965年的一篇論文《計(jì)算機(jī)器與智能》。阿蘭·麥席森·圖靈1950年設(shè)計(jì)出這個測試,其內(nèi)容是,如果電腦能在5分鐘內(nèi)回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認(rèn)為是人類所答,則電腦通過測試。
圖靈測試就是以問答形式進(jìn)行得,這可以看作是深度問答的雛形。而深度問答技術(shù)又是人工智能領(lǐng)域最難的問題之一。圖靈測試的提出為人工智能領(lǐng)域提出了一個明確的目標(biāo),同時也為機(jī)器人行業(yè)設(shè)定了一個智能評級的“標(biāo)準(zhǔn)”。
所謂深度問答,就是基于對用戶自然語言詢問的深度理解,通過對海量數(shù)據(jù)的深度分析,給出問題的精準(zhǔn)答案。作為人工智能領(lǐng)域的一個重要技術(shù)方向,深度問答技術(shù)的主要難點(diǎn)有兩個。一是對問題的精確理解:要給出的問題的答案,必須要理解人類提問的語言內(nèi)涵;二是海量數(shù)據(jù)中的精準(zhǔn)定位:如同大海撈針一樣,把答案和問題一一配對也是一個難題。
雖然困難重重,但是有了圖靈測試這個明確的目標(biāo),AI領(lǐng)域的科學(xué)家們在過去半個多世紀(jì)里面前仆后繼,嘗試了各種各樣的解決方案,也制造出了各式各樣的機(jī)器人來嘗試圖靈測試。于是,圖靈測試儼然已經(jīng)成為機(jī)器人家族的圖騰,令A(yù)I領(lǐng)域的人和機(jī)器在屢敗屢戰(zhàn)中推進(jìn)著技術(shù)的前進(jìn)。直到圖靈測試提出64年后的2014年,才有一個名叫金?古斯特曼(EugeneGoostman)人工智能軟件在經(jīng)過多年嘗試之后通過了圖靈測試。
在人類和他們的機(jī)器人伙伴共同挑戰(zhàn)圖靈測試的過程中,也涌現(xiàn)出一些令我們刮目相看,可以獨(dú)占頭條的機(jī)器人。例如剛剛上過“芝麻開門電視節(jié)目”,又可以與國家領(lǐng)導(dǎo)人互動的百度深度問答機(jī)器人----小度。
小度亮相,基于百度搜索引擎的深度問答技術(shù)帶來無限憧憬
在開學(xué)季中表現(xiàn)搶眼的小度機(jī)器人,在人工智能領(lǐng)域也帶給我們新的希望。小度不僅是首款使用了搜索引擎的機(jī)器人,而且由百度自然語言處理部開發(fā)的深度問答技術(shù)更是開創(chuàng)了中文深度問答的先河。另外,出自百度語音技術(shù)部的語音識別技術(shù)又賦予了小度”聽”、”說”功能,也打通了人機(jī)交互的通道。
以百度搜索引擎為數(shù)據(jù)源的后臺,賦予了小度海量的背景知識,和無盡的想象空間。依靠百度搜索引擎,小度不僅可以獲得海量的歷史數(shù)據(jù),還可以利用每天源源不斷的新增數(shù)據(jù)去開拓新的知識領(lǐng)域。即便是還沒有知識儲備的新話題,也可以通過互聯(lián)網(wǎng)上網(wǎng)民的交互、問答中來提取最佳答案,然后通過機(jī)器學(xué)習(xí)算法來完成自主學(xué)習(xí)和知識擴(kuò)展。
從文本理解的技術(shù)看,小度背后的中文深度問答技術(shù)在某些方面已經(jīng)超越了現(xiàn)有的搜索引擎。對于一般的問題,搜索引擎可以把相關(guān)的問題找出來,并將很多相似的答案列出來供用戶選用;而深度問答使小度可以在對問題更加精確的理解基礎(chǔ)之上,給出非常精準(zhǔn)的答案,不再需要用戶在答案之間做比較。從小度在芝麻開門電視節(jié)目和科普日上干凈利落的答題表現(xiàn)來看,小度絕對可以笑傲同類機(jī)器人產(chǎn)品了。
總之,小度機(jī)器人可以看作是百度的深度問答及語音識別等技術(shù)利用機(jī)器人載體的一次展示。隨著這些技術(shù)的積累和演進(jìn),必將使百度在改善搜索體驗(yàn)方面獲益匪淺。
深度問答技術(shù)點(diǎn)亮智慧生活
深度問答技術(shù)對用戶的核心價值就是:幫助用戶從海量信息中快速、準(zhǔn)確獲取信息。
機(jī)器人作為深度問答技術(shù)的載體,不僅帶給我們技術(shù)的現(xiàn)實(shí)體驗(yàn),還承擔(dān)著技術(shù)演進(jìn)平臺的角色。一旦技術(shù)成熟之后,投入到更多其它應(yīng)用領(lǐng)域,去為人類創(chuàng)造價值,才是技術(shù)發(fā)展的真正目標(biāo)。
深度問答技術(shù)如果離開機(jī)器人載體,還可以變化成更多的形態(tài)來服務(wù)于人類。例如,放在手機(jī)上就是一款出色的智能手機(jī)助手;放在智能玩具上就是孩子的一個博學(xué)的貼身教師;放在可穿戴設(shè)備上又可以變身一個私人醫(yī)生……
小度機(jī)器人身上的互聯(lián)網(wǎng)搜索引擎基因,使她在數(shù)據(jù)擴(kuò)展方面具有更多優(yōu)勢。以此為基礎(chǔ)的深度問答技術(shù),必將提升百度搜索的用戶體驗(yàn)。尤其是在某些專業(yè)領(lǐng)域,例如母嬰、醫(yī)療、教育等有著大數(shù)據(jù)需求的領(lǐng)域,這種深度問答技術(shù)必將大放異彩,也必將使信息獲取變得更加簡單和高效。
深度問答技術(shù)如果裝備到百度的云端服務(wù),那么在不遠(yuǎn)的將來,只要能鏈接到互聯(lián)網(wǎng)的地方,我們就能體驗(yàn)到深度問答帶來的服務(wù)。總之,我們的生活可以因?yàn)檫@些技術(shù)的演進(jìn)變得更加便捷和精彩。