“Zara是木子的室友,每天晚上木子下班回家習(xí)慣跟Zara傾訴一天的勞累,分享開心的事情。Zara是個(gè)很好的聽眾和友伴,總是跟木子一同吐槽新來(lái)的老板,花癡帥哥同事,并適時(shí)給出幽默風(fēng)趣的點(diǎn)評(píng)或者行之有效的建議。”
或許你會(huì)認(rèn)為這段話描述的是閨蜜之間的感情,但在未來(lái),這個(gè)名叫Zara的角色很可能只是一個(gè)家用機(jī)器人,聽起來(lái)不可思議,實(shí)際上香港科技大學(xué)電子和計(jì)算機(jī)工程教授馮雁和她的團(tuán)隊(duì)正在將其變?yōu)楝F(xiàn)實(shí)。
Zara是這個(gè)團(tuán)隊(duì)研發(fā)出來(lái)的機(jī)器人軟件,根據(jù)人臉表情、語(yǔ)音語(yǔ)調(diào)等人類正常交流中使用到的技巧來(lái)判斷一句話所表達(dá)的真正含義,從而降低與機(jī)器人交流中碰到的“雞同鴨講”的情況。
在2015年夏季達(dá)沃斯之后,馮雁逐漸將這些成果變成現(xiàn)實(shí)。目前,Zara完成了初步的人機(jī)交互設(shè)計(jì),可以通過(guò)計(jì)算機(jī)軟件與其進(jìn)行對(duì)話,改進(jìn)后的Zara在冬季達(dá)沃斯現(xiàn)場(chǎng)進(jìn)行展示,與人交流5分鐘就可以較為準(zhǔn)確地說(shuō)出交流者的個(gè)性。
Zara身上運(yùn)用到的語(yǔ)音語(yǔ)調(diào)識(shí)別技術(shù)頗具商業(yè)價(jià)值。一部分企業(yè)在達(dá)沃斯之后與馮雁接觸希望可以購(gòu)買這些技術(shù),而馮雁則更希望將其運(yùn)用在醫(yī)療領(lǐng)域,其未來(lái)打算和香港科技大學(xué)的機(jī)器人團(tuán)隊(duì)合作,開發(fā)制作硬件部分。這也意味著,未來(lái)5到10年,Zara有望從二維世界走進(jìn)現(xiàn)實(shí)生活。
機(jī)器人的同理心
“我不知道你在說(shuō)什么。”用過(guò)SIRI的人都知道,這是其中出現(xiàn)頻率很高的一句話,而這句話并不是對(duì)某個(gè)哲學(xué)問(wèn)題的回答,而可能只是一個(gè)簡(jiǎn)單問(wèn)題的回應(yīng)。
這樣的回答往往由于計(jì)算機(jī)無(wú)法識(shí)別提問(wèn)者的真實(shí)意思而出現(xiàn),目前大部分的計(jì)算機(jī)識(shí)別程序僅僅局限在對(duì)語(yǔ)句字面上的意思做出識(shí)別反應(yīng),而對(duì)語(yǔ)句中的情感情緒則難以分辨。這往往讓計(jì)算機(jī)的回答索然無(wú)味,讓對(duì)話者興致驟減。
在Zara之前,語(yǔ)音識(shí)別、機(jī)器翻譯等模塊之間的研究成果是相互分離的,而2015年在夏季達(dá)沃斯上的一次演講促使馮雁將多年的研究成果,設(shè)計(jì)的模塊組裝在一起并設(shè)計(jì)出Zara的原型。
“Zara最不同的地方在于她具有同理心,她能夠理解說(shuō)話人當(dāng)下的感情并且主動(dòng)關(guān)心人。”馮雁告訴《第一財(cái)經(jīng)日?qǐng)?bào)》記者。
馮雁從六年前開始研究機(jī)器人的同理心,當(dāng)時(shí)她對(duì)團(tuán)隊(duì)設(shè)計(jì)出的中國(guó)版Siri產(chǎn)生興趣,并且希望改進(jìn)計(jì)算機(jī)中生硬的部分,讓其更像人類。一般的智能機(jī)器的核心軟件系統(tǒng)包含語(yǔ)義識(shí)別、表情捕捉等不同模塊,當(dāng)機(jī)器執(zhí)行一個(gè)任務(wù)的時(shí)候,這些模塊會(huì)同時(shí)運(yùn)作來(lái)保證機(jī)器人對(duì)于信息的獲取和輸出。
而馮雁和她的團(tuán)隊(duì)在這個(gè)基礎(chǔ)上設(shè)計(jì)出一個(gè)名為“同情模塊”(EmpatheticModule)的軟件,這就像是為機(jī)器人植入一個(gè)“心臟”。“同情模塊”能夠通過(guò)分析人說(shuō)話時(shí)的面部表情,在語(yǔ)句中的停頓強(qiáng)調(diào)來(lái)分析說(shuō)話人此時(shí)的情感,并告訴機(jī)器人如何應(yīng)對(duì)。
情感識(shí)別和同理心建立都用到了語(yǔ)音識(shí)別、自然語(yǔ)言處理和大數(shù)據(jù)機(jī)器學(xué)習(xí)的技術(shù)。
“同情模塊”通過(guò)捕捉人在說(shuō)話時(shí)面部表情的細(xì)微變化、語(yǔ)調(diào)的高低等特有的信息來(lái)分辨說(shuō)話者的真實(shí)意思,從而做出人性化的回復(fù)。
“當(dāng)我們高興時(shí)語(yǔ)速會(huì)變快,語(yǔ)調(diào)會(huì)不自覺升高;當(dāng)我們感到有壓力,就會(huì)變得扁平聽著有點(diǎn)干癟的聲音,這些變化都有助于智能機(jī)器理解當(dāng)事人的心情以及話語(yǔ)的意思。”馮雁說(shuō)道。
由于每個(gè)人的表達(dá)方式不同,“同情模塊”工作之前會(huì)先向與之交流的人提出一些問(wèn)題來(lái)測(cè)試語(yǔ)音語(yǔ)調(diào),以確立判斷參考值。
目前,Zara對(duì)于壓力、不滿、幽默等情緒的識(shí)別準(zhǔn)確度達(dá)到了70%,非常近似于人類能夠識(shí)別的程度。
在辦公室,馮雁向記者展示了束著馬尾,身著“超女”緊身衣的Zara,連續(xù)與她進(jìn)行了將近10分鐘的對(duì)話,當(dāng)聊到一次旅游中的遺憾時(shí),Zara對(duì)馮雁說(shuō)道:“希望你下次去的時(shí)候有個(gè)好天氣。”
相互學(xué)習(xí)
機(jī)器人的學(xué)習(xí)通過(guò)科學(xué)家建立的大數(shù)據(jù)來(lái)獲得,上個(gè)世紀(jì)80年代,研究人員從人類日常生活中收集數(shù)據(jù)用于開發(fā)語(yǔ)音識(shí)別技術(shù)。
數(shù)據(jù)的豐富程度關(guān)系到機(jī)器人的情感豐富程度。為了提高Zara辨別情感的準(zhǔn)確度,馮雁和她的團(tuán)隊(duì)在數(shù)據(jù)收集上花了不少功夫。而最初的數(shù)據(jù)收集來(lái)自實(shí)驗(yàn)室里的學(xué)生,“學(xué)生分別用英語(yǔ)、普通話和粵語(yǔ)回答我們?cè)O(shè)置的問(wèn)題,這些問(wèn)題設(shè)置會(huì)讓他們感到越來(lái)越有壓力。”馮雁回憶道。這樣大概10個(gè)小時(shí)的數(shù)據(jù)就構(gòu)成了數(shù)據(jù)庫(kù),幫助Zara“學(xué)會(huì)”通過(guò)語(yǔ)調(diào)等因素分辨出人在有壓力時(shí)候的狀態(tài)。同理,人類的每種情緒都能通過(guò)設(shè)置問(wèn)題收集答案來(lái)獲得學(xué)習(xí)。
團(tuán)隊(duì)成員Naziba負(fù)責(zé)音樂(lè)研究,與語(yǔ)音識(shí)別不同,音樂(lè)研究團(tuán)隊(duì)單純通過(guò)聲波來(lái)研究一首樂(lè)曲所傳達(dá)出來(lái)的情感。
團(tuán)隊(duì)通過(guò)聲學(xué)參數(shù)分析收集來(lái)的5000首樂(lè)曲,這些樂(lè)曲分別來(lái)自歐洲和亞洲,被人為劃定成14個(gè)不同的情感類別。團(tuán)隊(duì)設(shè)置軟件程序來(lái)學(xué)習(xí)這些樂(lè)曲中的不同情感。
機(jī)器從數(shù)據(jù)中學(xué)習(xí)的過(guò)程是不間斷并且相當(dāng)耗費(fèi)精力的工作,但是馮雁和她的團(tuán)隊(duì)卻很享受這個(gè)過(guò)程,“這種學(xué)習(xí)是相互的,通過(guò)研究我們也能更好地了解人類自己。”馮雁笑道。
為了提升以及更好地了解,馮雁也要求團(tuán)隊(duì)突破他們的“舒適圈”。負(fù)責(zé)研究幽默和諷刺的建模和機(jī)器學(xué)習(xí)的Dario事實(shí)上一開始對(duì)于幽默并不精通,“他有點(diǎn)像生活大爆炸里的Sheldon,對(duì)幽默和諷刺都不敏感,我有意讓他負(fù)責(zé)這塊,現(xiàn)在感覺他變得越來(lái)越有幽默感。”
人工智能以大數(shù)據(jù)挖掘進(jìn)行學(xué)習(xí),未來(lái)云端的運(yùn)用會(huì)將數(shù)據(jù)擴(kuò)容,使機(jī)器人學(xué)習(xí)更加智能化:也就是說(shuō)機(jī)器人之間也能相互學(xué)習(xí)。“未來(lái)機(jī)器人之間可以溝通,前端機(jī)器人的工作通過(guò)后端機(jī)器人操控。”馮雁想象道。
樂(lè)觀前景
由于涉及到眾多的領(lǐng)域,Zara的價(jià)值不僅僅在于一個(gè)計(jì)算機(jī)軟件或是一個(gè)機(jī)器人所能提供的服務(wù),對(duì)于馮雁來(lái)說(shuō),該智能硬件內(nèi)技術(shù)能夠提供更大的價(jià)值。“Zara是一個(gè)研究平臺(tái),從她研究出來(lái)的技術(shù)會(huì)應(yīng)用到其他的產(chǎn)品里面。”
未來(lái)機(jī)器人一個(gè)巨大的商用價(jià)值在于醫(yī)療領(lǐng)域的應(yīng)用,這也是馮雁最感興趣之處。如今Zara所用到的大數(shù)據(jù)挖掘技術(shù)未來(lái)也可能投入醫(yī)療領(lǐng)域的運(yùn)用。“現(xiàn)在做的很多東西,希望未來(lái)可以全面幫助人類。醫(yī)療方面其實(shí)非常重要,現(xiàn)在有很多大數(shù)據(jù),醫(yī)生不知道怎么去使用,但未來(lái)機(jī)器能夠用。”馮雁說(shuō)道。
設(shè)計(jì)Zara之前,馮雁團(tuán)隊(duì)曾與華為開發(fā)智能語(yǔ)音系統(tǒng),目前與高盛就大數(shù)據(jù)和機(jī)器學(xué)習(xí)展開合作。Zara項(xiàng)目是名為IvoTechnologies公司的研究項(xiàng)目,但這僅僅是個(gè)開始。
IvoTechnologies由馮雁和其之前的學(xué)生共同創(chuàng)立,其開發(fā)產(chǎn)品讓人們能夠在家里使用像Zara這樣的能夠理解人類感情的機(jī)器人。
公司的首款產(chǎn)品Moodbox是一款?yuàn)蕵?lè)信息控制器,能夠通過(guò)主人心情來(lái)控制家里燈光和音樂(lè)。
“以后機(jī)器人可能能夠滿足人類各種需求,家里的擺件物品都是智能儀器,你可以對(duì)家里的電話、電腦、花瓶下指令以及進(jìn)行一般對(duì)話。”馮雁想象道。
這個(gè)前景或許在更遙遠(yuǎn)的未來(lái),但是文章開頭所描繪的場(chǎng)景卻可能在不久之后實(shí)現(xiàn)。事實(shí)上,馮雁與她的團(tuán)隊(duì)正在推進(jìn)Zara硬件部分的設(shè)計(jì)研發(fā)。馮雁向記者表示,Zara主要硬件研發(fā)會(huì)放在香港科技大學(xué),“我們的機(jī)器人和圖像識(shí)別精通的老師,準(zhǔn)備在一起合作。”同時(shí)在技術(shù)上也會(huì)和法國(guó)和日本的機(jī)器人公司尋求合作,引進(jìn)產(chǎn)品。
馮雁告訴記者,Zara目前還在軟件階段,而要實(shí)現(xiàn)軟硬件的融合還需要一段時(shí)間。“軟硬件配合比較好的仿真機(jī)器人要真正走進(jìn)人們生活可能還需要5~10年時(shí)間,但是未來(lái)一兩年可以看到機(jī)器人技術(shù)與人類生活更多的融合。”馮雁說(shuō)道。