教會(huì)機(jī)器人如何開展真正的對(duì)話,是人工智能所面臨的最艱難挑戰(zhàn)之一。
智能語音賽道上,亞馬遜或?qū)⑹前賾?yīng)最大的競(jìng)爭(zhēng)對(duì)手。
這個(gè)競(jìng)賽名字叫——Alexa Prize。
賽事目的:鼓勵(lì)大眾,創(chuàng)造出能夠像人類那樣聊天的人工智能機(jī)器人。
獲獎(jiǎng)標(biāo)準(zhǔn):創(chuàng)建一個(gè)使用 Alexa 的聊天機(jī)器人,且能正常地與人類交談 20 分鐘。
獎(jiǎng)勵(lì): 150 萬美元的獎(jiǎng)金(另外還有 200 萬美元的其它贈(zèng)款和獎(jiǎng)品)。
「作為 Alexa Prize 的一部分,參賽者打造出的所有技術(shù)都適用于 Alexa?!?/div>
未來,亞馬遜希望Alexa將可以像人類那樣進(jìn)行對(duì)話,談?wù)撝T如電影、新聞和體育之類的話題,回答人們所關(guān)心的細(xì)節(jié)問題。
但是如何將Alexa打造成一個(gè)像鋼鐵俠的賈維斯那樣內(nèi)斂而機(jī)智的虛擬助手呢?
對(duì)于今年 Alexa Prize 的參賽隊(duì)伍來說,解決這項(xiàng)艱巨任務(wù)有兩個(gè)基本方法。
第一種是利用機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí),去分析大量數(shù)據(jù),并慢慢篩選出一個(gè)正常對(duì)話的模式。
這是最令人興奮且最新式的選擇,然而,不斷有團(tuán)隊(duì)表示,這也是最不切實(shí)際的做法。
一位參賽選手說道:「每個(gè)人都從機(jī)器學(xué)習(xí)開始,最終,每個(gè)人都意識(shí)到它并不真的管用。」
原因是什么呢?
人類語言是由嚴(yán)格的語法、音調(diào)以及多樣的變化構(gòu)成的,同時(shí)也充滿了不確定性,人們可以使用無限多的詞語來傳達(dá)相同的基本信息。人工智能系統(tǒng)很難僅僅通過數(shù)據(jù)去學(xué)習(xí)這些知識(shí),也很難保證正確率。
第二種方法則是為聊天機(jī)器人編寫一個(gè)可遵照的話術(shù)模板,這是一種被稱為「手工制作」或「硬編碼」的人工智能設(shè)計(jì)方式。例如,如果一個(gè)用戶說「最喜愛的球隊(duì)」這個(gè)詞,并以問句的形式表達(dá)出來,那么計(jì)算機(jī)可能會(huì)掃描特定運(yùn)動(dòng)方面的索引,找到提及「棒球」的相關(guān)內(nèi)容,然后輸出一個(gè)預(yù)先寫好的回復(fù):「我最喜歡的球隊(duì)是洋基隊(duì)」。
來自瑞典皇家理工學(xué)院(KTH)的 Fantom 聊天機(jī)器人團(tuán)隊(duì)就使用了這種方法,用一個(gè)眾包平臺(tái) Turk為聊天機(jī)器人寫回復(fù)。他們將收到的每一個(gè)會(huì)話問題,發(fā)送給一個(gè)人類 Turker,由人類來編輯話術(shù)并將其發(fā)送回去。
雖然他們的聊天機(jī)器人利用人類來生成回復(fù),但是在回復(fù)會(huì)話的反饋方式方面,蘊(yùn)含著一個(gè)強(qiáng)大的機(jī)器學(xué)習(xí)元素。每次聊天機(jī)器人聽到一個(gè)無法回復(fù)的新問題時(shí),它會(huì)把問題發(fā)送給 Turker,并把他們的回復(fù)添加到一個(gè)巨大的對(duì)話樹中。
機(jī)器學(xué)習(xí)將有助于識(shí)別出那些已經(jīng)遇到過的問題的變種。如果聊天機(jī)器人已經(jīng)回答過某個(gè)問題,例如“我喜歡足球。你最喜歡的球隊(duì)是哪個(gè)?”,那么當(dāng)它被問及“你最喜歡的足球隊(duì)是哪個(gè)?”時(shí),它就可以使用同樣的回復(fù)。
“隨著時(shí)間的推移,我們將開發(fā)出越來越多的智能策略來填充這棵對(duì)話樹”,團(tuán)隊(duì)的Ulme Wennberg 說,“以便讓它能夠理解我們剛剛談?wù)摿耸裁?,你想談?wù)撌裁?,我們?yīng)該談?wù)撌裁础?rdquo;
這種方法可以獲得想要的與提問相一致的結(jié)果,但設(shè)計(jì)過程費(fèi)時(shí),且只能處理有限數(shù)量的話題。
這一種方法也是百應(yīng)目前采用的方法。但是,百應(yīng)的做法似乎更高明。一是,百應(yīng)自己開發(fā)了一套語音識(shí)別行業(yè)模型,指定話術(shù)所屬行業(yè),機(jī)器人識(shí)別和回復(fù)匹配更精準(zhǔn)。二是,百應(yīng)發(fā)布了涵蓋各個(gè)行業(yè)的話術(shù)模板(陸續(xù)上線中),可以迅速復(fù)制成熟的機(jī)器人話術(shù),然后再次基礎(chǔ)上稍加個(gè)性化修改即可。百應(yīng)的方案,有效解決了「硬編碼」人工智能設(shè)計(jì)方式所暴露出的適應(yīng)范圍小、設(shè)計(jì)費(fèi)時(shí)費(fèi)力的難點(diǎn)。
亞馬遜高管表示,Alexa Prize 展示了他們的一種決心。
「我可以看到制造商正在制造什么,我們的算法團(tuán)隊(duì)正在提出什么,最尖端的科技是什么。我和我的團(tuán)隊(duì)可以將這些點(diǎn)相連接,為客戶想要的未來去做一些冒險(xiǎn)。」
他認(rèn)為,客戶想要的是一種通過與空氣對(duì)話就可以掌控身邊數(shù)字化世界的鑰匙。
這也解釋了為什么亞馬遜會(huì)豪擲350萬美金來舉辦一個(gè)競(jìng)賽:智能語音交互就是未來,或者更準(zhǔn)確地說,它是未來的一部分。
注:Mechanical Turk 是亞馬遜旗下的一個(gè)勞務(wù)眾包平臺(tái)。平臺(tái)上的任務(wù)通常是費(fèi)力和重復(fù)性的,包括音頻錄制、數(shù)據(jù)錄入、識(shí)別照片和視頻中的對(duì)象等。而這些正是人工智能所要自動(dòng)化的任務(wù),對(duì)于許多需要生成訓(xùn)練數(shù)據(jù)或測(cè)試其系統(tǒng)的人工智能研究人員來說,Mechanical Turk 是一個(gè)不可或缺的的工具。
參考資料:《獎(jiǎng)金高達(dá)350萬美元的Alexa Price競(jìng)賽背后,是亞馬遜在聊天機(jī)器人上的野心》,機(jī)器之心
更多>相關(guān)資訊
0 條相關(guān)評(píng)論