如果我們回顧AI領(lǐng)域在過(guò)去50年的演變與發(fā)展,最大的成就莫過(guò)于為AI研究開天辟地的算法?;蛟S在未來(lái)的10年內(nèi),我們將不會(huì)覺得聊天機(jī)器人有何特別之處,而是將它視為類似app或是亟待想象的一種黑科技那樣,習(xí)以為常。

人工智能一路高歌猛進(jìn) 聊天機(jī)器人成重要切口
隨著技術(shù)和市場(chǎng)的高歌猛進(jìn),人工智能正成為數(shù)據(jù)、服務(wù)、產(chǎn)品接入人類生活的重要入口。聊天機(jī)器人的演變與發(fā)展讓它慢慢融入人們的日常生活,從手機(jī)上的虛擬助理到實(shí)際在線客服,聊天機(jī)器人的發(fā)展之路不算短。隨著聊天機(jī)器人的商業(yè)發(fā)展的基礎(chǔ)要素日趨成熟,生態(tài)系統(tǒng)逐步建立,以Google開發(fā)聊天機(jī)器人App——GoogleAllo,微軟推出了ChatBot聊天機(jī)器人,豐田明年將發(fā)售迷你聊天機(jī)器人“KIROBOMINI”為代表,越來(lái)越多的企業(yè)開始入局聊天機(jī)器人。今天小編帶你一起回顧這項(xiàng)技術(shù),看看它的機(jī)遇與挑戰(zhàn)。
聊天機(jī)器人50年發(fā)展簡(jiǎn)述
在20世紀(jì)60年代中期,計(jì)算機(jī)科學(xué)家JosephWeizenbaum發(fā)明了第一個(gè)chatbot(聊天機(jī)器人)——Eliza。Eliza通過(guò)使用模式匹配和替代方法來(lái)模擬對(duì)話,呈現(xiàn)出程序能更理解人們問題的假象,暫時(shí)性地讓一個(gè)真正的人類認(rèn)為他們正在和另一個(gè)人聊天。

在這之后有多種不同用途的機(jī)器人被開發(fā)出來(lái),其中一個(gè)有代表性的聊天機(jī)器人系統(tǒng)是ALICE。ALICE產(chǎn)生于1995年,在2000年、2001年和2004年三次獲獎(jiǎng),隨ALICE一同發(fā)布的AIML被廣泛應(yīng)用。ALIC之后相繼有多種使用機(jī)器學(xué)習(xí)技術(shù)的聊天機(jī)器人問世,微軟小冰,AppleSiri,百度度秘等等。
現(xiàn)在的聊天機(jī)器人能夠理解人們所說(shuō)的內(nèi)容,一般是基于NLP(自然語(yǔ)言處理)為書面或口頭用語(yǔ)設(shè)定特定語(yǔ)義。此外,很多聊天機(jī)器人使用專業(yè)系統(tǒng)軟件,即模仿人類專家進(jìn)行決策,提取一小部分信息來(lái)回答問題。
隨著深度學(xué)習(xí)的興起和AlphaGo對(duì)于深度學(xué)習(xí)的成功應(yīng)用,聊天機(jī)器人又有了新的技術(shù)手段,一些聊天機(jī)器人廠商已經(jīng)開始嘗試應(yīng)用深度學(xué)習(xí)技術(shù)。相信在不遠(yuǎn)的未來(lái),更多的聊天機(jī)器人將會(huì)采用深度學(xué)習(xí)方法,接入海量數(shù)據(jù),來(lái)預(yù)測(cè)問題進(jìn)而對(duì)寬泛的主題做出快速響應(yīng),以能夠及時(shí)提出回答相關(guān)問題。
聊天機(jī)器人具體應(yīng)用場(chǎng)景
一直以來(lái)說(shuō)到聊天機(jī)器人,大家可能會(huì)想到微軟的小冰和小娜,以及蘋果的Siri。很多人認(rèn)為他們是很有意思,但大多數(shù)情況下,沒什么用處的技術(shù)。但是近年來(lái),它有了一些具體的應(yīng)用場(chǎng)景,比如客服、私人助理、知識(shí)問答、陪聊等。
聊天機(jī)器人應(yīng)用場(chǎng)景劃分:
機(jī)器人類型代表產(chǎn)品:
客服機(jī)器人小I機(jī)器人、京東JIMI機(jī)器人,阿里小蜜商家版
私人助理類AppleSiri、GoogleNow、微軟Cortana、百度度秘、出門問問,助理來(lái)也
知識(shí)問答類IBMWatson、WolframAlpha
陪聊機(jī)器人微軟“小冰”、微信“小微”、“小黃雞”
客服機(jī)器人的主要功能是回答用戶提出的有關(guān)產(chǎn)品或服務(wù)的問題,降低企業(yè)客服運(yùn)營(yíng)成本、提升用戶體驗(yàn)的目的。代表性的系統(tǒng)有小I機(jī)器人、京東JIMI機(jī)器人,阿里小蜜商家版等。用戶與客服機(jī)器人溝通,可以了解商品信息、售前、售后等問題,一般而言,當(dāng)機(jī)器人不能回答用戶問題時(shí),系統(tǒng)都會(huì)提供某種機(jī)制將用戶轉(zhuǎn)向人工客服??头C(jī)器人是典型的業(yè)務(wù)機(jī)器人,閑聊話題一般在客服機(jī)器人中處于次要地位。做好客服機(jī)器人的關(guān)鍵是獲取產(chǎn)品和服務(wù)相關(guān)的信息以及掌握詳細(xì)的業(yè)務(wù)規(guī)則。所以類似阿里、京東這樣的公司,自身?yè)碛泻A可唐沸畔ⅲ⒆约褐贫I(yè)務(wù)規(guī)則和流程,相對(duì)而言就比其他公司更容易開發(fā)出實(shí)用的客服機(jī)器人。
私人助理類通過(guò)語(yǔ)音或文字與聊天機(jī)器人進(jìn)行交互,如問天氣、日程管理、訂外賣、打車等,幫助用戶處理日常事務(wù)。助理類的應(yīng)用有AppleSiri、GoogleNow、微軟Cortana、百度度秘、出門問問、助理來(lái)也等。AppleSiri以語(yǔ)音識(shí)別見長(zhǎng),在蘋果終端上可以用語(yǔ)音操作手機(jī),是具有代表性的私人助理。助理類應(yīng)用雖然目標(biāo)是私人助理,但目前更多的人只是體驗(yàn)或者把它當(dāng)成娛樂工具,除了語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)限制外,更重要的因素是它并不適合有些場(chǎng)景,比如訂外賣,現(xiàn)在移動(dòng)端電商非常成熟,可以一鍵購(gòu)物,并且有好的UI體驗(yàn),比用語(yǔ)音或者打字快捷不少,語(yǔ)音受到環(huán)境限制(比如嘈雜環(huán)境),并且有隱私問題。所以私人助理類最關(guān)鍵的還是選好應(yīng)用場(chǎng)景,比如車載智能設(shè)備就是非常合適的場(chǎng)景,開車時(shí)沒法用手操作,使用語(yǔ)音更安全,車內(nèi)環(huán)境也相對(duì)安靜,同時(shí)一般也沒有隱私問題。
知識(shí)問答類的聊天機(jī)器人主要功能包括回答用戶以自然語(yǔ)言形式提出的知識(shí)性問題和需要計(jì)算和邏輯推理型的問題。典型的知識(shí)問答系統(tǒng)有IBMWatson、WolframAlpha等。此類系統(tǒng)研發(fā)成本高,周期長(zhǎng),在特定領(lǐng)域落地也不太容易,像Watson一直在醫(yī)療領(lǐng)域做嘗試,所以一般也只有大公司和技術(shù)創(chuàng)業(yè)型公司愿意承擔(dān)風(fēng)險(xiǎn)嘗試這個(gè)領(lǐng)域。另外一種簡(jiǎn)化形式,是將知識(shí)局限在某個(gè)簡(jiǎn)單的特定領(lǐng)域,典型的有兒童教育和娛樂,科大訊飛的開心熊寶可以通過(guò)語(yǔ)音對(duì)話的形式輔助兒童學(xué)習(xí)唐詩(shī)、宋詞以及回答簡(jiǎn)單的常識(shí)性問題等。這種簡(jiǎn)化形式技術(shù)難度很低,另外兒童教育市場(chǎng)也大,是知識(shí)問答類機(jī)器人的商業(yè)化捷徑。
閑聊類機(jī)器人的主要功能是同用戶進(jìn)行閑聊式的對(duì)話,也就是陪聊。代表性的系統(tǒng)如微軟“小冰”、微信“小微”,較早的還有“小黃雞”等。此類應(yīng)用有時(shí)候也能提供特定服務(wù),如天氣預(yù)報(bào)等。娛樂類機(jī)器人處境比較尷尬,因?yàn)槠浜茈y實(shí)現(xiàn)商業(yè)價(jià)值,像微軟小冰除了廣告效應(yīng)外,并沒有給微軟帶來(lái)實(shí)際利益,所以小冰現(xiàn)在也在做商業(yè)化探索,嘗試進(jìn)入客服等領(lǐng)域。
今天,聊天機(jī)器人已經(jīng)可以讓用戶感知到,它們不僅能傾聽,更能理解,未來(lái)其增長(zhǎng)還有巨大潛力,但目前它們?nèi)匀粺o(wú)法重現(xiàn)人類溝通的互動(dòng),在充分發(fā)揮功能和做到真正被AI驅(qū)動(dòng)之前,還需要克服一些障礙。
聊天機(jī)器人的掣肘與挑戰(zhàn)
聊天機(jī)器人面臨的最大的挑戰(zhàn)之一就是訪問并獲取大量的數(shù)據(jù)。例如大量零售業(yè)的例子中,對(duì)于消費(fèi)者而言,很多消費(fèi)者并不想與電腦互動(dòng),他們希望有真人客服可以幫助其解決問題;對(duì)于零售商而言,他們希望能夠利用這項(xiàng)最新的技術(shù)調(diào)整服務(wù),并為消費(fèi)者提供更加簡(jiǎn)單高效的產(chǎn)品訂購(gòu)方式。聊天機(jī)器人唯一能提供模擬真人交談的體驗(yàn)的方式就是使用AI。但是為了實(shí)現(xiàn)這一目標(biāo),必須攻克建立大數(shù)據(jù)這一難題,這就需要通過(guò)一些方式累積數(shù)據(jù)。
在編譯收集各種數(shù)據(jù)后,還必須要考慮到聊天機(jī)器人在與不同的個(gè)人交互時(shí)的心理學(xué),來(lái)判定每個(gè)人的性格在對(duì)話中對(duì)于體驗(yàn)的影響。想象一下一個(gè)群體的每個(gè)成員對(duì)于同一件事會(huì)有完全不同的描述方式,那么這時(shí)候人們將如何與聊天機(jī)器人進(jìn)行交互?此外,何時(shí)才是機(jī)器人插入對(duì)話的合適時(shí)機(jī)?它們?nèi)绾我龑?dǎo)廣大用戶群體找到正確的解決方案?聊天機(jī)器人在交互體驗(yàn)更加擬人化,能更好地理解、預(yù)測(cè)語(yǔ)言與場(chǎng)景化詞匯中面臨如下多重挑戰(zhàn)。
一是整合語(yǔ)境的挑戰(zhàn)。為了生成明智的回復(fù),系統(tǒng)可能需要整合語(yǔ)言語(yǔ)境和物理語(yǔ)境。在長(zhǎng)對(duì)話中,人們記錄已經(jīng)被說(shuō)過(guò)的話和已經(jīng)交換過(guò)的信息。這是結(jié)合語(yǔ)言語(yǔ)境的例子。最普遍的方法是將對(duì)話嵌入一個(gè)向量中,但在長(zhǎng)對(duì)話上進(jìn)行這樣的操作是極富挑戰(zhàn)性的。此外還可能需要整合其它類型的語(yǔ)境數(shù)據(jù),例如日期/時(shí)間、位置或用戶信息。
二是一致人格的挑戰(zhàn)。當(dāng)生成回復(fù)時(shí),對(duì)于語(yǔ)義相同的輸入,代理應(yīng)該生成相同的回答。例如,你想在“你多大了?”和“你的年齡是多少?”上得到同樣的回答。這聽起來(lái)很簡(jiǎn)單,但是將固定的知識(shí)或者人格整合進(jìn)模型是非常困難的研究難題。許多系統(tǒng)學(xué)習(xí)如何生成語(yǔ)義合理的回復(fù),但是它們沒有被訓(xùn)練如何生成語(yǔ)義上一致的回復(fù)。這一般是因?yàn)樗鼈兪腔诙鄠€(gè)不同用戶的數(shù)據(jù)訓(xùn)練的。
三是意圖與多樣性挑戰(zhàn)。生成式系統(tǒng)的普遍問題是它們往往能生成像“太好了!”或“我不知道”這樣的能適用于許多輸入情況的普遍回復(fù)。谷歌的智能回復(fù)(SmartReply)早期版本常常用“我愛你”回復(fù)一切。一定程度上這是系統(tǒng)根據(jù)數(shù)據(jù)和實(shí)際訓(xùn)練目標(biāo)/算法訓(xùn)練的結(jié)果。然而,人類通常使用針對(duì)輸入的回復(fù)并帶有意圖。因?yàn)樯上到y(tǒng)(特別是開域系統(tǒng))是不被訓(xùn)練成有特定意圖的,所以它們?nèi)狈@種多樣性。
整體來(lái)看,聊天機(jī)器人經(jīng)歷了從問答機(jī)器人到對(duì)話機(jī)器人的發(fā)展,但目前大部分的聊天機(jī)器人都屬于問答機(jī)器人,也就是只能處理一問一答,不能很好的處理對(duì)話,或者說(shuō)不能處理上下文,并不具備真正的人工智能特征。對(duì)話機(jī)器人現(xiàn)在是研究熱點(diǎn),也是趨勢(shì),但目前并沒有成熟的對(duì)話機(jī)器人,即使是號(hào)稱支持對(duì)話的機(jī)器人也是用規(guī)則或者狀態(tài)機(jī)來(lái)處理對(duì)話,能力非常有限,達(dá)不到實(shí)用目的。
聊天機(jī)器人創(chuàng)業(yè)投資浪潮
根據(jù)預(yù)測(cè)數(shù)據(jù)顯示,2016年全球人工智能收入預(yù)計(jì)將達(dá)到6.437億美元,到2025年將增長(zhǎng)至368億美元。預(yù)計(jì)2018年,全世界將有60億臺(tái)設(shè)備用上人工智能技術(shù)。在這樣的前景下,人工智能的創(chuàng)新、創(chuàng)業(yè)和投資日趨活躍。
目前,一方面人工智能已經(jīng)可以支撐聊天機(jī)器人在各個(gè)人機(jī)交互場(chǎng)景下達(dá)到靈活應(yīng)用,大幅降低成本和擴(kuò)大接觸客戶的范圍;另一方面聊天機(jī)器人可以快速便捷地部署在移動(dòng)設(shè)備上,改善或者改變移動(dòng)端信息交互模式(信息交互是手機(jī)體驗(yàn)的核心),也就是說(shuō)從某種程度來(lái)看,聊天機(jī)器人也許會(huì)比目前的手機(jī)應(yīng)用更適合手機(jī),下面第一個(gè)圖表比較了蘋果AppStore和Facebook聊天機(jī)器人平臺(tái)的增速,圖表顯示,在第3至第6個(gè)月,聊天機(jī)器人數(shù)量增長(zhǎng)約170%,同期內(nèi)移動(dòng)應(yīng)用數(shù)量增長(zhǎng)了100%,聊天機(jī)器人增速是應(yīng)用的1.7倍;第二張圖表比較了兩種技術(shù)的開發(fā)者數(shù)量。在問世的第6個(gè)月,活躍的聊天機(jī)器人開發(fā)者數(shù)量是第14個(gè)月時(shí)應(yīng)用的近3倍。
基于聊天機(jī)器人可能帶來(lái)的的巨大市場(chǎng)潛力,商業(yè)公司紛紛開始投入到聊天機(jī)器人的產(chǎn)業(yè)中。很多公司也已經(jīng)在傳播消息和銷售渠道交互的環(huán)節(jié)上部署了聊天應(yīng)用,如Facebook不斷提高M(jìn)essenger平臺(tái)創(chuàng)收能力,蘋果最近宣布將為iMessenger發(fā)布一個(gè)專用應(yīng)用/聊天機(jī)器人商店。
伴隨著智能技術(shù)與生態(tài)系統(tǒng)的日益成熟與完善,聊天機(jī)器人創(chuàng)業(yè)公司蓬勃發(fā)展,風(fēng)險(xiǎn)投資資本也給該產(chǎn)業(yè)的繁榮注入了動(dòng)力。目前,聊天機(jī)器人還處于發(fā)展早期階段,或許未來(lái)2年內(nèi),人與采用人工智能技術(shù)的聊天機(jī)器人之間將能進(jìn)行更復(fù)雜的對(duì)話。但可以預(yù)見的是聊天機(jī)器人和人工智能的融合是一項(xiàng)重要投資,這類標(biāo)的的投資價(jià)值未來(lái)可期。
聊天機(jī)器人未來(lái)展望
聊天機(jī)器人是當(dāng)下AI最火的分支之一,現(xiàn)在以及接下來(lái)的幾年里,它們將在生活中越來(lái)越普及,在服務(wù)中也愈加隱形。新型及創(chuàng)新性的用戶案例可以幫助聊天機(jī)器人在多個(gè)領(lǐng)域提高使用性能,更好地服務(wù)于用戶。當(dāng)然,真正的問題是,聊天機(jī)器人是否可以滿足用戶的期待,以及是否可以說(shuō)服習(xí)慣于真人聊天的用戶轉(zhuǎn)而使用機(jī)器人——如,F(xiàn)acebook將聊天機(jī)器人集成到其Messenger應(yīng)用中,讓企業(yè)可以在上面與他們的客戶進(jìn)行互動(dòng);亞馬遜Echo可以讓用戶使用聊天機(jī)器人來(lái)打開音樂播放器或者支付信用卡賬單;達(dá)美樂披薩可以讓顧客通過(guò)社交媒體下訂單。
如果我們回顧AI領(lǐng)域在過(guò)去50年的演變與發(fā)展,最大的成就莫過(guò)于為AI研究開天辟地的算法。并且隨著普及與應(yīng)用,比如瀏覽器搜索算法,我們不再將它視為AI。我們?cè)诹奶鞕C(jī)器人中看到了同樣的趨勢(shì),因?yàn)檫@些算法正在運(yùn)用于更多的地方,而不僅在你所知的聊天軟件中?;蛟S在未來(lái)的10年內(nèi),我們將不會(huì)覺得聊天機(jī)器人有何特別之處,而是將它視為類似app或是亟待想象的一種黑科技那樣,習(xí)以為常。