近幾年,隨著科技的日益進(jìn)步,智能移動設(shè)備已悄然進(jìn)入了千家萬戶,互聯(lián)網(wǎng)的迅猛發(fā)展使其逐漸突破了傳統(tǒng) PC 市場的束縛,向著移動終端急速前進(jìn)。多終端的互聯(lián)網(wǎng)大環(huán)境下,人們?nèi)粘9ぷ鳌⑸町a(chǎn)生的信息量正以爆炸形式增長。

(來源:Pixabay)

圖 | 科技的日益進(jìn)步讓人與人之間的距離越來越遠(yuǎn)(來源:Pixabay)

圖 | 人們可以和 Blenderbot 2.0 討論某個球星的最新消息(資料圖)

圖 | 人們可以和 Blenderbot 2.0 討論某個球星的最新消息(資料圖)

圖 | 人們可以和 Blenderbot 2.0 討論某個球星的最新消息 (來源:資料圖)
使用搜索引擎,幫助用戶更好地尋找和發(fā)現(xiàn)所需要的信息,一直是信息檢索領(lǐng)域的研究熱點。而面對海量的網(wǎng)絡(luò)信息時,這種逐條信息先瀏覽再判斷的方式無法滿足用戶迅速獲取最有效信息的需求現(xiàn)狀,而這也是傳統(tǒng)搜索引擎的不足之處,在這種情況下,自動問答系統(tǒng)應(yīng)運而生。
目前基于開放域的自動問答系統(tǒng)多采用智能聊天機(jī)器人的形式呈現(xiàn),用戶使用自然語言與機(jī)器人通過一問一答的方式進(jìn)行聊天,十分接近普通人類生活中的聊天模式。聊天機(jī)器人不僅能回答用戶提出的問題,同時還能洞悉用戶的需求,一針見血地解決用戶的實際問題。

(來源:Pixabay)
近年來,聊天機(jī)器人在商業(yè)領(lǐng)域尤其是電子商務(wù)領(lǐng)域得到了青睞,常見的有虛擬私人助理 Siri,微軟小冰、Cortana,Alibaba 聊天機(jī)器人,小 i 和小度等。國外在智能聊天方面的研究較多,且起步較早。
眾所周知的 Siri 成立于 2007 年,2010 年被 Apple 公司收購,成為民用版軟件 Siri 虛擬個人助理,最初以文字聊天服務(wù)為主,之后與 Nuance 合作,增加了語音識別功能,搭載在 iPhone 設(shè)備上,通過簡單易用的對話接口,使用者可以用聲音或文字的方式來搜索周邊消息,并提供訂位、訂票等服務(wù)。Siri 的背景技術(shù)相當(dāng)強大,充分利用了以 Google 為代表的網(wǎng)頁搜索技術(shù)、以 Wikipedia 為代表的知識庫技術(shù)和以 Yelp 為代表的問答及推薦技術(shù)等。
國內(nèi)也有不少智能聊天機(jī)器人日益涌現(xiàn),如小 i,小 Q 和小度等。其中,小 i 于 2001 年研究開發(fā),專注提供智能客服、智能知識庫、智能微應(yīng)用等成熟的解決方案,業(yè)務(wù)涉及通信、電子政務(wù)、智能家居和汽車交通等傳統(tǒng)行業(yè)。
小度是百度研發(fā)的智能信息機(jī)器人,它基于百度強大的搜索引擎技術(shù)和深度問答技術(shù)提供智能交互式的搜索模式,高效滿足用戶的信息搜索需求,提高搜索效率。
目前國內(nèi)外對于智能聊天機(jī)器人的研究大部分都是基于開放域的知識問答系統(tǒng),以知識庫的訓(xùn)練和搜索為主,針對垂直領(lǐng)域、以陪伴共情的方式進(jìn)行人機(jī)交互的聊天機(jī)器人卻少之又少,而現(xiàn)代社會發(fā)展節(jié)奏之快,使得人與人之間的距離越來越遙遠(yuǎn),相比冷冰冰的機(jī)器,人類更需要一個情感發(fā)泄的出口和一個可以信賴的朋友。

圖 | 科技的日益進(jìn)步讓人與人之間的距離越來越遠(yuǎn)(來源:Pixabay)
BlenderBot 2.0 的出現(xiàn)
近日,F(xiàn)acebook 人工智能研究部門在近日推出了聊天機(jī)器人的新一代產(chǎn)品,Blenderbot 2.0。他們宣稱這是第一個可以同時建立長期記憶的聊天機(jī)器人,新一代聊天機(jī)器人可以持續(xù)訪問、搜索互聯(lián)網(wǎng)以獲取最新的信息,并且可以就當(dāng)前話題和人進(jìn)行復(fù)雜交談。"這是對初代 BlenderBot 的重大更新,我們的研究人員于 2020 年將其開源,并率先將多種和人對話技能(如機(jī)器人的自身性格、自身知識等)整合到一個系統(tǒng)中 ",該研究部門成員說到。他們在產(chǎn)品介紹中說,與前一代產(chǎn)品相比,第二代聊天機(jī)器人 Blenderbot 2.0 在與人交談時更擅長了,表現(xiàn)在和人可進(jìn)行時間更長且符合事實邏輯的對話。

圖 | 人們可以和 Blenderbot 2.0 討論某個球星的最新消息(資料圖)
在和人對話期間,研發(fā)小組使用的模型可以生成上下文互聯(lián)網(wǎng)搜索查詢,并讀取結(jié)果,并在回復(fù)人們的問題和評論時整合該信息(意味著模型可以根據(jù)世界的變化而發(fā)生變化)。
該模型可以獲取聊天機(jī)器人在和人對話期間收集的相關(guān)信息并將其存儲在長期記憶中,以便它可以在可能持續(xù)數(shù)天、數(shù)周甚至數(shù)月的正在進(jìn)行的和人對話再次利用到這些信息。同時,和不同的人交談所存儲的信息不同,這可以保證每個人和聊天機(jī)器人交談時所獲得的感受是不同的。研究小組發(fā)布的 BlenderBot 初代版本的記憶時間非常短,可以稱作是 " 魚的記憶 ",而且所擁有的記憶都是靜態(tài)的,也就是說這些記憶僅限于所學(xué)的內(nèi)容,無法獲得額外的知識(比如 NBA 的麥迪在魔術(shù)隊效力時推出了第一代聊天機(jī)器人,但后面麥迪去了火箭隊,第一代聊天機(jī)器人是無法實時獲取和更新這些信息的)。

圖 | 人們可以和 Blenderbot 2.0 討論某個球星的最新消息(資料圖)
同時,研究團(tuán)隊將第一代機(jī)器人 BlenderBot 1.0 和第二代機(jī)器人 BlenderBot 2.0 進(jìn)行對比,第二代機(jī)器人具有可以訪問記憶的能力,同時可以和人進(jìn)行數(shù)天、數(shù)周甚至數(shù)月的話題聊天,也可以進(jìn)行多人對話,并增加它所知道和可以談?wù)摰膬?nèi)容,這些都得益于它可通過互聯(lián)網(wǎng)搜索查詢來使用和構(gòu)建知識體系,比如:正在播放體育節(jié)目最新比分、電影或電視節(jié)目以及最新評論,某個 NBA 球星的職業(yè)生涯是怎么樣等實時信息并入和人對話中。
同時,研究人員公開了第二代聊天機(jī)器人完整模型、代碼和設(shè)置,以及兩個新的和人對話數(shù)據(jù)集,這些數(shù)據(jù)可以利用來用于訓(xùn)練模型,利于其他研究人員推進(jìn)和人對話式人工智能研究。機(jī)器學(xué)習(xí)模型的當(dāng)前趨勢是專注于訓(xùn)練更大的模型,這需要大量的計算資源。但如果讓機(jī)器人對整個互聯(lián)網(wǎng)的信息進(jìn)行存儲是不可能的,所以,研究人員的方法是即時訪問互聯(lián)網(wǎng)的方式。

圖 | 人們可以和 Blenderbot 2.0 討論某個球星的最新消息 (來源:資料圖)
為了訓(xùn)練神經(jīng)網(wǎng)絡(luò),研究人員收集訓(xùn)練數(shù)據(jù)。研究人員還發(fā)布了由此產(chǎn)生的會話數(shù)據(jù)集,稱為互聯(lián)網(wǎng)和多會話聊天向?qū)В渲邪ǎ旱谝粋€數(shù)據(jù)集為 BlenderBot 2.0 提供關(guān)于如何生成相關(guān)搜索引擎查詢的監(jiān)督,以及根據(jù)搜索結(jié)果監(jiān)督相關(guān)響應(yīng)。第二個數(shù)據(jù)集為聊天機(jī)器人提供監(jiān)督,將新鮮知識存儲在長期記憶中,并監(jiān)督給定這些記憶的相關(guān)響應(yīng)。因此,研究人員可以結(jié)合數(shù)據(jù)集執(zhí)行多任務(wù)訓(xùn)練,這使 BlenderBot 2.0 能夠同時使用所有這些技能。研究人員希望研究人員的新聊天機(jī)器人建立在其前身的能力之上。BlenderBot 1.0 接受了混合技能談話任務(wù)的培訓(xùn) —— 利用個性、知識和同理心的展示 —— 并將這三者無縫融合。所以 BlenderBot 2.0 也接受了所有這些資源的訓(xùn)練。
BlenderBot 2.0 的測試
在之前的研究里,研究人員已經(jīng)證實 BlenderBot 1.0 優(yōu)于 Meena 和 DialoGPI 等其他聊天機(jī)器人。為了新模型,研究人員將其與 BlenderBot 1.0 進(jìn)行了對比,評估了它在多會話聊天中的長期和人對話性能以及在和人對話中成功運用知識的能力。根據(jù)評估人員的研究發(fā)現(xiàn) BlenderBot 2.0 將聊天歧義字句從 9.1% 減少到 3.0%,并且在和人對話中的話題一致性提高了 12%,這些結(jié)果表明,新系統(tǒng)的長期記憶模型使其能夠在更長的時間內(nèi)維持更好的和人進(jìn)行對話。