在今年 3 月份,微軟 CEO Satya Nadella 講到了更普遍的使用人類語言與計算機設備進行交互的產業(yè)趨勢,他稱之為「對話即平臺」趨勢。
他也宣布了數個 bot 計劃,其中包括微軟的 bot 框架。在 4 月份,F(xiàn)acebook 發(fā)布了其帶有 bot 的 Messenger 平臺。然后,在 5 月份,谷歌宣布要嘗試開發(fā)人工智能驅動的 bot,稱之為 Google Assistant。從此之后,人們就普遍認為 bot 將成為從根本上改變計算體驗方式的新型用戶界面(UI)。
App 和網頁模型問題在哪里?
App 平臺多年之前由蘋果公司為智能手機發(fā)明,然后谷歌推出了 Google Play Store。App 平臺基于一個統(tǒng)一的資源模型(這個模型需要手機有一定量的內存和處理速度,從而能夠提供你所需要的一切。)但缺點是如今大批的 App 塞滿了用戶的手機屏幕,即使他們一直使用的 App 并不超過 20 多種。
事實上,被人們頻繁使用的智能手機 App 的數量已經降低了。總的來說,即使有數百萬的 App 被編寫、發(fā)放出去,但大部分一直沒被使用過。這無疑是設備資源以及用戶下載、安裝、管理 App 時間上的極大浪費。
網頁模型在移動用戶界面上的表現(xiàn)更差。通過移動設備使用網頁服務的訪問量很低。這種極低的使用率是因為很多流行的網頁是為非移動的 PC 端設計并優(yōu)化的,通常需要寬帶接入。
智能手機有限的帶寬和計算資源是很多網頁服務的主要障礙。
此外,大部分網頁都遵循以頁面為中心的信息配置的傳統(tǒng)范式,導致(非移動)瀏覽器暗中模仿閱讀器,這對移動設備是次優(yōu)的。
結果就是:我們需要從頭開始重新設計手機 UI ,以實現(xiàn)移動時代的全部潛力。
對話成為移動 UI 的新興范式
幸運的是,在重新設計與執(zhí)行中,有一個新興范式很適合于移動手機。這一新的對話即平臺范式能夠讓手機用戶發(fā)現(xiàn)、訪問、交互對日常生活很重要的信息與服務,從而使有用的信息和服務能夠自然地融入進對話流中。
這一對話 UI 范式將引發(fā)新型生態(tài)系統(tǒng)的形成,要比先前的網頁和 App 生態(tài)系統(tǒng)有更大的規(guī)模收益。這之所以成為可能,是因為信息產業(yè)進入了一個物理世界數字化以及連接這些現(xiàn)實服務的新時代。這一物理的、交互的、以服務為中心的世界超出了先前靜態(tài)的網頁信息配置時代。
消息(messaging)是新型的對話范式的核心,包含一連串的短文本、音頻、視頻消息。
由于其兼具異步與實時兩種性質,消息成為了一個加速器,驅動著數字對話的成長。用戶不再需要花費進行交互預安排的時間成本,仍保留有近乎實時對話的能力。
作為智能對話接口代理的 bot
在對話交互中,比以對話為中心的移動 UI 范式更重要的是各種類型的智能服務。我們有像 Siri、Google Now、Cortana 和 Alexa 這樣的智能個人助手。我們也有可以由自動對話接口獲取的個體 bot。
新興的對話范式最終模式:用戶不再需要下載 App 了,人工智能 bot 會利用語音和自然語言處理能力監(jiān)控并響應消息 UI,自動將必要的服務資源(很可能儲存在云端)提供給用戶。
由于最近機器學習和人工智能技術的巨大進步,實現(xiàn)人工智能 bot 成為了可能。這些進步使我們能將越來越多的我們所關心的東西自動化。過去幾年深度學習的發(fā)展,特別是過去一年半發(fā)展起來的深度強化學習(Deep reinforcement learning,RL),高效利用了不斷增長的數據和計算資源,促進了我們?yōu)槭澜绛h(huán)境、為任何與我們生活相關的應用領域構建計算模型的能力。
在機器學習中,RL 有獨特的特征。你需要用戶的反饋,同時也需要獎勵用戶。就像一盤你暫時不知道獎品是什么的國際象棋比賽。你知道與人工智能的交互會產生任務完成的結果。比如你的目標是預定一個航班,但是 bot 只會說對于完成目標有幫助的事情,即使用戶可能不明白 bot 正努力追求最終目標和獎勵。
機器學習和人工智能技術的進步使得自動語音和自然語言理解觸手可及,最終能讓我們解決對話理解和許多領域的對話問題。基于深度強化學習的人工智能 bot 會理解所有領域的語義,還能夠擴展到現(xiàn)在還無法涉足的領域。
人工智能 bot 會采用迭代和反饋回路來自我發(fā)展,并趨于完美。內置在人工智能 bot 的強化學習組件中的環(huán)境模式能夠自動地且精致地檢測、獲取、創(chuàng)造并積累新知識,讓我們能開發(fā)越來越多的智能服務并積累更多經驗,特別是像預定、付款等行為導向型服務。
三種類型的人工智能 bot
大體來說,有三種類型的人工智能 bot 。第一種類型是搜尋信息的 bot,其目標是明確的。第二種類型是要完成某種任務,其中也可能需要搜尋信息,但在短時間內其目標可能是不明確的。你可能問電影院的開放時間。這不是說你的目標只局限在答案上,而是說獲得答案是你達到最終目標(看電影)的一個步驟。對于第一種類型,獎賞是明確定義的;而對于第二種類型,獎賞也是相當明確的(或者將會是這樣)。
當使用強大的深度強化學習技術進行構建時,以上這兩種 bots都有自己的、定義相當直接的獎賞函數(這是強化學習的關鍵組件)---或者搜尋信息,或者試圖完成特定任務 (比如預定機票和酒店)。
第三種類型的人工智能 bot 需要的指導最多,它們是社交 bot ,有時也被叫做聊天 bot 或閑聊 bot 。這種 bot 的獎賞函數(用于深度強化學習算法)——先簡單稱之為「情感智能」——不可能被輕而易舉地量化。舉個例子,你可能向聊天 bot 尋求建議,或者問一些含糊的問題,比如今天做什么, 或者在同 bot 討論買人壽保險之前先聊聊天。
處理聊天 bot 十分復雜的獎賞函數需要擴大能力,為了給這種能力提供數學基礎,研究界和從業(yè)者需要深入調查。這里的目標是將普遍使用的強化學習算法(例如用于 AlphaGo 中的關鍵學習方法)擴展成更好的算法,這種算法能利用信息理論上的和內在激勵的獎賞。
在轉向其他試圖完成任務型的 bot 對話之前,這種獎勵會抓取用戶在與 bot 的對話中獲取的情緒滿足感。對于計算機科學家和電氣工程師而言,這是一片十分有前景的人工智能研究領域。