對(duì)話交互將是人與機(jī)器最高效的交互方式

交互,就是不同物體進(jìn)行信息交換的過程。信息交換效率是衡量交互最重要的指標(biāo)。人與機(jī)器的交互,將追隨人與人交互的演化路徑。
人與人的交互
在語言發(fā)明前,人類的祖先智人主要是通過什么方式進(jìn)行交流的?一種方式是用肢體做動(dòng)作,模仿各種活動(dòng),比如動(dòng)物;另一種方式則是喊叫,通過不同的喊叫聲來傳達(dá)一些簡(jiǎn)單信息,比如危險(xiǎn)靠近、找到食物。大部分其他動(dòng)物的交流方式到現(xiàn)在也是如此。
第一種交流方式對(duì)應(yīng)的就是圖形交互,用到的器官主要是眼睛,其主要約束來自于空間:距離不能太遠(yuǎn),不能移動(dòng)太快,不能被東西遮擋等。第二種交流方式對(duì)應(yīng)的則是對(duì)話交互,用到的器官主要是耳朵,其對(duì)空間的依賴性更低:距離可以很遠(yuǎn),移動(dòng)和遮擋影響也不大。
在發(fā)明語言后,人類進(jìn)一步提高了第二種交流方式(對(duì)話交互)的效率和信道容量。對(duì)話交互碾壓圖形交互成為人與人最重要的交流方式。使用對(duì)話交互,人類可以同時(shí)與多人進(jìn)行較遠(yuǎn)距離的實(shí)時(shí)交流。相比于圖形(眼睛),現(xiàn)在人類對(duì)語音(耳朵)的并行處理能力要強(qiáng)得多。這可能就是進(jìn)化的結(jié)果。
人類也一直在努力改進(jìn)對(duì)話交互方式。通過電話我們已經(jīng)可以和地球任一個(gè)角落的其他人進(jìn)行交流,前提是對(duì)方得在電話旁邊。對(duì)方老不在怎么辦?讓他一直把電話帶身旁(手機(jī))。什么,你想交互更便捷、便宜,對(duì)話交互時(shí)還能融合圖形交互?微信吧。
最后總結(jié)下人類交流方式的發(fā)展路徑,基本就是在不斷改善對(duì)話交互的效率,降低空間和時(shí)間對(duì)它的約束:
語言發(fā)明前:主要使用圖形交互方式,受空間和時(shí)間約束巨大;
語言發(fā)明后:主要使用對(duì)話交互方式,受空間和時(shí)間約束變小,但仍然很大;
電話和手機(jī)發(fā)明后:極大改善了對(duì)話交互方式,不再受空間約束,但時(shí)間約束仍較大;
?。ㄒ苿?dòng))互聯(lián)網(wǎng)發(fā)明后:人類幾乎一直在線,對(duì)話交互方式基本不再受時(shí)間的約束。
人與機(jī)器的交互
在計(jì)算機(jī)剛被發(fā)明時(shí),計(jì)算機(jī)可以被認(rèn)為是一種很低等的物種。人類作為高級(jí)物種在跟低級(jí)物種計(jì)算機(jī)進(jìn)行交流時(shí),必須遷就計(jì)算機(jī),使用它喜歡的語言(匯編、命令行)。這就像主流文明社會(huì)如果要跟深山里的原始部落進(jìn)行交流,開始階段只能是文明社會(huì)去學(xué)習(xí)原始部落的交流方式然后與他們交流。
隨著計(jì)算機(jī)逐漸被動(dòng)進(jìn)化出外表(圖形),人類逐漸學(xué)會(huì)了與它通過圖形交互進(jìn)行交流,并在發(fā)展過程中逐漸提升交流效率(PC、APP早期時(shí)代)。
文明社會(huì)學(xué)會(huì)了原始部落的語言后,會(huì)反過來再教導(dǎo)原始部落學(xué)習(xí)文明社會(huì)的語言,因?yàn)槲拿魃鐣?huì)所使用的語言表達(dá)能力更強(qiáng),效率更高。人類與計(jì)算機(jī)的交互進(jìn)化路徑也會(huì)如此,因?yàn)樽罱K目的都是人類獲得交互效率的提升。
為什么要計(jì)算機(jī)遷就人類?因?yàn)槿祟愡M(jìn)化太慢。人類在經(jīng)過長(zhǎng)達(dá)百萬年的進(jìn)化后,對(duì)話交互已成為人類目前可接受的最高效溝通方式。顯然我們沒法為了提升與計(jì)算機(jī)的交互效率短時(shí)間讓自己再進(jìn)化進(jìn)化,所以只能讓計(jì)算機(jī)進(jìn)化出人類最喜歡的對(duì)話溝通能力。這就是為什么人類一直不遺余力地發(fā)展計(jì)算機(jī)的(語音)對(duì)話交互能力。
人機(jī)交互接下來的發(fā)展路徑會(huì)和人人交互的發(fā)展路徑相同——人類會(huì)讓機(jī)器一直保持在線。這不就是IoT時(shí)代的目標(biāo)么。隨著IoT萬物互聯(lián)時(shí)代的臨近,人類需要與各種機(jī)器進(jìn)行交互。相比于圖形交互,對(duì)話交互具有更好的遷移性。使用圖形交互,與不同的機(jī)器溝通就要開發(fā)不同的圖形交互界面(想想PC和手機(jī)的圖形交互差別有多大),但我們卻可以跟所有東西使用相同的對(duì)話溝通方式。
讓所有機(jī)器都具有對(duì)話交互能力,人類就可以并行地與多臺(tái)機(jī)器同時(shí)進(jìn)行交互。(想想鋼鐵俠里男主角在工作室工作的情景吧。)沒有對(duì)話交互,那你讓你家吸塵器工作時(shí)還得深情地看著它……
當(dāng)然,以后人類可能會(huì)發(fā)展出更高效的人機(jī)、人人交互方式,比如直接用腦電波進(jìn)行交互(想想三體人)。但這個(gè)目前看還是需要段時(shí)間的。在此之前,
對(duì)話交互是最高效的人人交互方式,也將成為最高效的人機(jī)交互方式。
各種對(duì)話交互(Bot)平臺(tái)
首先需要承認(rèn),現(xiàn)在機(jī)器的智能還非常有限,它們沒法和人類做到什么都能聊(開放域?qū)υ捊换ィ?,但是在某些小的垂直領(lǐng)域它們已經(jīng)能和人聊的很好(任務(wù)導(dǎo)向?qū)υ捊换ィ?。這種現(xiàn)狀應(yīng)該還會(huì)持續(xù)一段時(shí)間?,F(xiàn)在大部分Bot領(lǐng)域的公司做的事都是與任務(wù)導(dǎo)向?qū)υ捊换ハ嚓P(guān)。
那怎么開發(fā)任務(wù)導(dǎo)向的對(duì)話機(jī)器人系統(tǒng)呢?如果你只是想讓機(jī)器人用在一個(gè)固定領(lǐng)域或固定企業(yè)業(yè)務(wù),那么你針對(duì)此領(lǐng)域或此企業(yè)業(yè)務(wù)進(jìn)行技術(shù)優(yōu)化即可。這時(shí)候使用的技術(shù)可以具有領(lǐng)域特性,不需要能夠推廣到其他領(lǐng)域或者其他業(yè)務(wù)。這里最有代表性的是Google的Gmail和Allo中的Smart Reply功能。
如果你的系統(tǒng)是幫助其他開發(fā)者更便捷地開發(fā)對(duì)話機(jī)器人,即Bot創(chuàng)建平臺(tái),那么使用的技術(shù)就最好不要與某個(gè)領(lǐng)域或業(yè)務(wù)有關(guān)。國(guó)外比較典型的是Facebook的Wit.ai和Google的Api.ai,國(guó)內(nèi)也有不少創(chuàng)業(yè)公司在做這方面的事,比如一個(gè)AI、知麻、如意等,基本處于起步階段。
篇幅有限,接下來我們只討論第二類對(duì)話系統(tǒng),即Bot創(chuàng)建平臺(tái),對(duì)Gmail和Allo的Smart Reply感興趣的同學(xué)可以看看我之前寫的《Google的智能問答技術(shù)》。
不同的Bot平臺(tái):可控性與智能性的權(quán)衡
企業(yè)通常會(huì)更關(guān)注自己bot的可控性,也即掌控力度,在出現(xiàn)問題時(shí)必須快速定位并解決。企業(yè)寧愿bot答不上來,也不能允許它瞎答。而用戶當(dāng)然希望bot能解答自己的各種問題,所以bot一定是越智能越好。但可控性和智能性本身就是一對(duì)互相矛盾的性質(zhì),智能本就包含了不可控。我一直記得K.K.在《失控》中的一個(gè)觀點(diǎn):智能來自于失控。
基于可控性和智能性的矛盾性,再考慮到現(xiàn)階段技術(shù)的可行性,各種bot平臺(tái)能做的就只能是在可控性和智能性之間找平衡點(diǎn)了。技術(shù)的發(fā)展只是會(huì)不斷拓展可控性和智能性的帕累托邊界而已。
下面介紹幾類典型的bot平臺(tái):微信與旺旺、Viv、Api.ai與一個(gè)AI、Wit.ai,它們似乎大不相同,其實(shí)也只是在可控性和智能性之間的權(quán)衡不同罷了,見下圖。
一個(gè)bot平臺(tái)想要獲得更好的智能性,那它就要付出可控性的代價(jià)。(一個(gè)AI放在api.ai上面倒不是說現(xiàn)在它的智能性比api.ai強(qiáng),而是表明我們對(duì)一個(gè)AI的定位,希望它能在中文方面做得比api.ai好。)把Gmail的Smart Reply功能放在圖中的原因是把它作為其他bot平臺(tái)的參照對(duì)象。作為特定領(lǐng)域的bot,它能夠更好地兼顧可控性和智能性。
人機(jī)之間的對(duì)話交互會(huì)如何發(fā)展——可控性與智能性的權(quán)衡
下面分別介紹這幾類bot平臺(tái)
一、極度可控的微信和旺旺
其實(shí)我們?cè)缇驮谟酶鞣Nbot服務(wù)了,這些bot太不智能以至于我們都沒把它們往bot這個(gè)方向上想。比如各種電話服務(wù)里的操作步驟,旺旺里商家維護(hù)的常見問題列表,微信公眾號(hào)里的菜單和功能編碼:
人機(jī)之間的對(duì)話交互會(huì)如何發(fā)展——可控性與智能性的權(quán)衡
這些bot雖然不智能,但是卻很有用,因?yàn)樗鼈兒芸煽浚粫?huì)犯錯(cuò)誤。我們點(diǎn)擊微信里的菜單,獲得的響應(yīng)一定是公眾號(hào)管理者設(shè)定好的那個(gè)反饋,不會(huì)因?yàn)橄到y(tǒng)理解錯(cuò)而出現(xiàn)管理者不希望出現(xiàn)的東西。
二、較可控和較智能的Api.ai和一個(gè)AI
Api.ai目前應(yīng)該是美國(guó)最流行的bot創(chuàng)建平臺(tái)。9月19日,Api.ai宣布自己被Google收購(gòu)。相比于Viv,api.ai的優(yōu)勢(shì)是簡(jiǎn)單和可控,它里面的每個(gè)意圖通常只包含一輪對(duì)話,開發(fā)者只需要維護(hù)其中的用戶提問、機(jī)器回復(fù)、動(dòng)作,以及涉及到的實(shí)體。這樣系統(tǒng)可以依據(jù)用戶設(shè)定的這些數(shù)據(jù)訓(xùn)練模型以便在服務(wù)時(shí)預(yù)測(cè)用戶輸入對(duì)應(yīng)的意圖和識(shí)別包含的實(shí)體。
在接收到用戶輸入后,系統(tǒng)會(huì)分析用戶的輸入,預(yù)估用戶的意圖,以及識(shí)別輸入中包含的實(shí)體,這些實(shí)體是在達(dá)成意圖時(shí)需要的。下圖給出了完成一次請(qǐng)求時(shí)的大致流程和一個(gè)示例。
人機(jī)之間的對(duì)話交互會(huì)如何發(fā)展——可控性與智能性的權(quán)衡
Api.ai好的可控性降低了開發(fā)者的使用和維護(hù)門檻,它的靈活性較Viv低但也能滿足大部分應(yīng)用的需求。但是,api.ai對(duì)中文的支持很差,在國(guó)內(nèi)訪問延時(shí)也很大。前幾天它宣布被Google收購(gòu)了,估計(jì)被墻也只是時(shí)間問題?;谶@些原因我們開發(fā)了一個(gè)AI,希望通過一個(gè)AI把a(bǔ)pi.ai范式的強(qiáng)大和便捷帶給國(guó)內(nèi)開發(fā)者。下面詳細(xì)介紹下一個(gè)AI。
一個(gè)AI(www.yige.ai)是一個(gè)創(chuàng)建聊天機(jī)器人(bot)的免費(fèi)在線平臺(tái)。利用一個(gè)AI,開發(fā)者甚至產(chǎn)品和運(yùn)營(yíng)人員都可以輕松地開發(fā)聊天機(jī)器人應(yīng)用,而不需要具備機(jī)器學(xué)習(xí)與自然語言處理等相關(guān)知識(shí)。一個(gè)AI的使命是:
讓每個(gè)人都能輕松開發(fā)一個(gè)AI應(yīng)用。
人機(jī)之間的對(duì)話交互會(huì)如何發(fā)展——可控性與智能性的權(quán)衡
一個(gè)AI中包含幾個(gè)重要概念:詞庫(kù)、場(chǎng)景、動(dòng)作、狀態(tài)。詞庫(kù)是一個(gè)規(guī)范的自然語言短語集合,通常定義為應(yīng)用所在領(lǐng)域的關(guān)鍵詞、術(shù)語。詞庫(kù)在學(xué)術(shù)領(lǐng)域通常被稱為實(shí)體(entity),是自然語言處理中的重要概念。
詞庫(kù)在一個(gè)AI中用于從用戶輸入中提取動(dòng)作和狀態(tài)所需的參數(shù)值。一個(gè)AI不僅內(nèi)置了常用的系統(tǒng)類型,如數(shù)字、日期、時(shí)間等,也為開發(fā)者定義自己詞庫(kù)提供了靈活便捷的支持。開發(fā)者可以定義包含同義詞的同義詞詞庫(kù),也可以定義不包含同義詞的枚舉詞庫(kù),甚至可以定義由其他詞庫(kù)組合而成的組合詞庫(kù)。
一個(gè)AI中的場(chǎng)景通常對(duì)應(yīng)著從用戶提問到AI產(chǎn)生答復(fù)的一輪交互過程。一個(gè)場(chǎng)景主要由用戶提問、AI回復(fù)、動(dòng)作和輸入輸出狀態(tài)所組成。
動(dòng)作是用戶提問匹配到的場(chǎng)景執(zhí)行后觸發(fā)的一個(gè)特定操作,它可以使用從用戶輸入中提取出的詞庫(kù)作為輸入?yún)?shù)。動(dòng)作相當(dāng)于代碼中的函數(shù),其具體實(shí)現(xiàn)在開發(fā)者端,一個(gè)AI系統(tǒng)端只是一個(gè)標(biāo)識(shí),相當(dāng)于函數(shù)聲明。
狀態(tài)記錄了對(duì)話交互的背景信息,主要用于上下文信息(如參數(shù)值)的傳遞。此外,它也被用于管理會(huì)話流,串聯(lián)起原本孤立的不同場(chǎng)景。多個(gè)場(chǎng)景通過場(chǎng)景里的輸入輸出狀態(tài)連接成圖網(wǎng)絡(luò)以完成更加復(fù)雜的功能。
人機(jī)之間的對(duì)話交互會(huì)如何發(fā)展——可控性與智能性的權(quán)衡
一個(gè)AI遵循的流程和Api.ai類似(見之前的流程圖)。在接收到用戶的輸入后,流程如下:

一個(gè)AI首先識(shí)別用戶輸入中的詞庫(kù)和用戶場(chǎng)景。詞庫(kù)和場(chǎng)景的識(shí)別并不是獨(dú)立的,相同的詞在不同的場(chǎng)景下可能屬于不同的詞庫(kù)類型。在場(chǎng)景識(shí)別時(shí)也會(huì)考慮到場(chǎng)景設(shè)定的狀態(tài)是否存在。如果某場(chǎng)景設(shè)定的輸入狀態(tài)不是都存在,則不會(huì)把用戶輸入識(shí)別為此場(chǎng)景。
查看動(dòng)作中需要的必須參數(shù)是否都已獲得取值。如果存在必須參數(shù)還沒有獲得取值,就觸發(fā)設(shè)定好的提示語作為機(jī)器人回復(fù),要求用戶輸入對(duì)應(yīng)的參數(shù)取值。參數(shù)的取值不僅可以來自于此次用戶輸入中的詞庫(kù),也可以來自于輸入狀態(tài)中的變量。對(duì)于非必須參數(shù),可以為他們?cè)O(shè)定默認(rèn)值。
只有所有必須參數(shù)都已收集到取值,此場(chǎng)景才能完成,場(chǎng)景設(shè)定的AI回復(fù)才會(huì)作為回復(fù)返回給用戶。到這里此場(chǎng)景就完成了,用戶之后的輸入就會(huì)觸發(fā)新的循環(huán)。
一個(gè)AI定位于服務(wù)國(guó)內(nèi)開發(fā)者,所以也引入了一些中文相關(guān)的特性,例如查詢接口支持未分詞的整句話輸入,以及分詞后的語句輸入。
關(guān)于一個(gè)AI的由來,可見我之前的文章《創(chuàng)建Bot的中文平臺(tái)——一個(gè)AI(yige.ai)》。更多信息可見一個(gè)AI官方文檔,也歡迎大家去一個(gè)AI官網(wǎng)(www.yige.ai)逛逛,嘗試創(chuàng)建年輕人的第一個(gè)AI應(yīng)用吧^_^。
三、更智能的Viv
Siri的開發(fā)團(tuán)隊(duì)從蘋果離職后開發(fā)了Viv,一個(gè)bot平臺(tái)。Viv還沒正式發(fā)布,只是在今年5月9日的TechCrunch Disrupt(演講視頻)大會(huì)上展示了一下。
Viv中主要包含了兩種對(duì)象:概念對(duì)象(Concept Object)和動(dòng)作對(duì)象(Action Object),其中概念對(duì)象指的就是實(shí)體,而動(dòng)作對(duì)象就是執(zhí)行的動(dòng)作。以概念和動(dòng)作對(duì)象為結(jié)點(diǎn),Viv構(gòu)建了規(guī)模龐大的有向網(wǎng)絡(luò)圖。概念結(jié)點(diǎn)到動(dòng)作結(jié)點(diǎn)的邊表示此動(dòng)作以此概念為輸入?yún)?shù),而動(dòng)作結(jié)點(diǎn)到概念結(jié)點(diǎn)的邊表示此動(dòng)作的輸出中包含了此概念。
如果兩個(gè)概念結(jié)點(diǎn)存在擴(kuò)展(“is a”)或者屬性(“has a”)關(guān)系,那么它們之間也會(huì)存在有向邊。隨著開發(fā)者不斷把新的概念和動(dòng)作對(duì)象加入到Viv系統(tǒng),這個(gè)網(wǎng)絡(luò)圖會(huì)逐漸延伸,越來越大。借助于Viv的動(dòng)態(tài)演化認(rèn)知架構(gòu)系統(tǒng)(Dynamically Evolving Cognitive Architecture System,簡(jiǎn)稱DECAS),Viv能做的事會(huì)隨著網(wǎng)絡(luò)圖的增大而指數(shù)增長(zhǎng)。
DECAS的核心,是如何串聯(lián)起不同的動(dòng)作來達(dá)成目標(biāo)。放在之前提到的概念和動(dòng)作組成的網(wǎng)絡(luò)圖里面說,其實(shí)就是找意圖中概念結(jié)點(diǎn)到意圖中目標(biāo)結(jié)點(diǎn)的各種連通路徑。(雖然Viv沒有具體說,但目標(biāo)結(jié)點(diǎn)應(yīng)該也是一種概念結(jié)點(diǎn)。)Viv把一條路徑稱為一個(gè)計(jì)劃(Plan)。計(jì)劃中使用到的動(dòng)作可以跨應(yīng)用,可以來自于不同開發(fā)者設(shè)定的動(dòng)作。
下圖中給出了達(dá)成跑鞋推薦目標(biāo)的兩個(gè)計(jì)劃,其中計(jì)劃1串聯(lián)了
transform_occupation_to_price和rec_shoes_based_on_price這兩個(gè)動(dòng)作,而計(jì)劃2則是串聯(lián)了transform_occupation_to_type和 rec_shoes_based_on_type這兩個(gè)動(dòng)作。開發(fā)者可以為每個(gè)計(jì)劃設(shè)定一個(gè)價(jià)值函數(shù),DECAS則只需要選擇價(jià)值最高的topN計(jì)劃具體執(zhí)行即可。當(dāng)然,DECAS可能做得更復(fù)雜,比如依據(jù)用戶反饋實(shí)時(shí)調(diào)整計(jì)劃。
人機(jī)之間的對(duì)話交互會(huì)如何發(fā)展——可控性與智能性的權(quán)衡
如果一個(gè)計(jì)劃包含的動(dòng)作所需的必須輸入概念對(duì)象缺失,那么就需要與用戶進(jìn)行多次交互以收集缺失概念對(duì)象的值。
總結(jié)下,Viv是以動(dòng)作為核心的網(wǎng)絡(luò)系統(tǒng)。 它首先讓開發(fā)者定義對(duì)應(yīng)領(lǐng)域的概念對(duì)象和動(dòng)作對(duì)象,然后自動(dòng)生成計(jì)劃(網(wǎng)絡(luò)圖中找兩個(gè)結(jié)點(diǎn)間的路徑),利用用戶輸入中的概念對(duì)象完成用戶的目標(biāo)。相對(duì)于Api.ai和一個(gè)AI只能使用開發(fā)者設(shè)定的意圖來完成已知的需求,Viv在聯(lián)合不同開發(fā)者定義的概念和動(dòng)作對(duì)象后可以執(zhí)行一些不在開發(fā)者設(shè)定范圍內(nèi)的意圖。隨著越來越多開發(fā)者接入Viv,它能做的事會(huì)指數(shù)增長(zhǎng)。Viv在智能性/靈活性方面做得很好,但可控性會(huì)稍差,因?yàn)橥瓿赡繕?biāo)的計(jì)劃都是由系統(tǒng)自動(dòng)生成的,開發(fā)者難以介入。好的靈活性也會(huì)對(duì)開發(fā)者有更高的要求,開發(fā)者初期付出的管理成本可能不低。Viv開發(fā)了很多輔助工具幫助開發(fā)者管理自己的應(yīng)用,但這些工具能把開發(fā)者的管理成本降到什么程度目前尚不清楚。
關(guān)于Viv的更多細(xì)節(jié),可見我之前的文章《原Siri團(tuán)隊(duì)秘密研發(fā)的Viv能攪動(dòng)bot市場(chǎng)嗎?》。
四、在路上的Wit.ai
Wit.ai在2014年就被Facebook收購(gòu)了,今年上半年做了很大的改版。之前它的模式和一個(gè)AI類似,開發(fā)者可以手動(dòng)設(shè)置狀態(tài)以銜接不同的場(chǎng)景。
改版后,它取消了之前一個(gè)場(chǎng)景控制一輪對(duì)話的邏輯,變?yōu)橐怨适拢⊿tory)為對(duì)話單元。一個(gè)故事相當(dāng)于完成用戶某個(gè)需求的一條路徑。所以一個(gè)故事通常包括多輪對(duì)話,或者說一個(gè)故事包括完成同一需求的多個(gè)(隱式)場(chǎng)景。故事是比場(chǎng)景更大的對(duì)話單元。下圖給出了一個(gè)求約會(huì)故事的示例。
人機(jī)之間的對(duì)話交互會(huì)如何發(fā)展——可控性與智能性的權(quán)衡
開發(fā)者可以為同一需求設(shè)定多個(gè)故事,代表完成此需求的多條路徑,但也不需要為所有路徑都創(chuàng)建一個(gè)故事。Wit.ai可以使用已創(chuàng)建的故事來自動(dòng)生成新的路徑以完成某個(gè)需求。如果把故事中的一輪對(duì)話看成一個(gè)AI里的一個(gè)場(chǎng)景,那wit.ai就能自動(dòng)銜接不同故事中的各種場(chǎng)景,以便創(chuàng)建完成需求的新故事或者新路徑。類似的能力在api.ai和一個(gè)AI里更多是依靠開發(fā)者通過狀態(tài)進(jìn)行維護(hù)。
以故事為對(duì)話單元的好處是,開發(fā)者不再需要手動(dòng)設(shè)置場(chǎng)景和狀態(tài)了,系統(tǒng)可以通過學(xué)習(xí)來拆解已有故事并重新拼裝成新的故事。在相同場(chǎng)景數(shù)的情況下wit.ai能回答的用戶提問會(huì)比api.ai和一個(gè)AI多。但這種靈活性帶來的壞處就是可控性下降。開發(fā)者很難控制某些路徑不被自動(dòng)創(chuàng)建,出現(xiàn)問題時(shí)開發(fā)者如何調(diào)整故事也變得很朦朧。而這些問題在api.ai和一個(gè)AI里是不存在的。
Wit.ai正從api.ai和一個(gè)AI這端走向Viv那端。路是不是對(duì)的,只能走著瞧了。
關(guān)于wit.ai的更多細(xì)節(jié),可見我之前的文章《低價(jià)制造chatbots的利器 Wit.ai》。
說了這么多,該說的終于說完了,簡(jiǎn)化一下就兩條內(nèi)容:
對(duì)話交互會(huì)在IoT萬物互聯(lián)時(shí)代爆發(fā),這是追逐交互效率的必然結(jié)果。
不同的bot和bot平臺(tái)的差別其實(shí)只是在可控性和智能性之間的權(quán)衡不同。技術(shù)的發(fā)展只是在不斷拓展可控性和智能性的帕累托邊界而已。我個(gè)人認(rèn)為目前api.ai和一個(gè)AI的范式最適合國(guó)內(nèi)小微企業(yè)。