現(xiàn)在很多手機(jī)有聊天功能,不少人很喜歡玩這個游戲。你連續(xù)三次問手機(jī):“今天吃的是什么?”第一次回答:蛋炒飯。第二次回答:嗯,蛋炒飯。第三次回答:這是我最喜歡吃的,我每天都吃,今天也不例外。
這就是一個簡單的交互認(rèn)知的例子。聊天總是在特定聊天語境下發(fā)生的,有獨特的語義或結(jié)構(gòu),對同一個問題的回答是不確定的。人類是通過交互、記憶和計算獲得認(rèn)知的。我們可以對交互認(rèn)知和計算認(rèn)知給出一個簡單的定義:計算認(rèn)知是認(rèn)知主體自身進(jìn)行的,而交互認(rèn)知則在兩個或更多認(rèn)知主體之間進(jìn)行。計算認(rèn)知利用數(shù)值計算、符號計算和多媒體數(shù)字化的處理變換演繹、推斷和挖掘,是概念、判斷、決策的形成過程,是對多感知的覺悟加深理解、發(fā)現(xiàn)價值,以獲得新認(rèn)知的過程。而交互認(rèn)知的本質(zhì)是協(xié)商和學(xué)習(xí),如何聽、說、看、感覺等等,這些行為之間有聯(lián)系,它們都是交互認(rèn)知的外在表現(xiàn)。或許可以這樣認(rèn)為,語言可以理解為是交互認(rèn)知的語義標(biāo)注,圖像可以理解為對交互認(rèn)知的情感標(biāo)注,體感可稱之為肢體語言,交互認(rèn)知的度量可用情商或智商表示。
記憶認(rèn)知和計算認(rèn)知是無法取代交互認(rèn)知的。但我們在人工智能發(fā)展的過程中,可能更多地關(guān)注了計算認(rèn)知,忽略了交互認(rèn)知。我建議進(jìn)行人工智能研究的同仁,能夠更多地關(guān)注交互認(rèn)知領(lǐng)域。
那么交互認(rèn)知研究的突破口在哪里呢?我認(rèn)為,對話是最直接最便捷的交互形式,我們或許可以此為突破口進(jìn)行創(chuàng)新。對話智能是幾乎所有服務(wù)型機(jī)器人必備的功能,聊天所帶來的親和感不可或缺,是社會交流的“剛需”。
因此,交互認(rèn)知可以從研發(fā)“互聯(lián)網(wǎng)+對話機(jī)器人”開始。首先,不要太多的關(guān)注語義和語法,比如主、謂、賓、定、狀、補(bǔ)之類,但要更多關(guān)注語境或語用。例如,我們要優(yōu)先考慮交互的環(huán)境,強(qiáng)調(diào)沉浸感、交互感和構(gòu)想感。其次,我們對話開頭的語境往往具有不確定性,要利用缺省知識填補(bǔ)語境和語用知識,減少語境不確定性。同時,要關(guān)注交互認(rèn)知環(huán)境中的選擇性注意,要研究不確定性交互認(rèn)知中的客觀性、普遍性和積極意義,在不確定性中尋找基本確定性。再次,可以利用大數(shù)據(jù),讓機(jī)器人學(xué)習(xí)和挖掘聊天對象的身份、性格、興趣話題、語用習(xí)慣等,讓“生人”變“熟人”,提高機(jī)器人的智商和情感。
如果連淺層次的對話機(jī)器人的交互認(rèn)知都做不好,自主研發(fā)的機(jī)器人不具備基本的語音交互、圖像交互和體感交互功能,那服務(wù)機(jī)器人產(chǎn)業(yè)就跳不出同質(zhì)化、玩具化、低端化的怪圈