在我們的印象中,機器人說話就應該有個機器人的樣子,目光呆滯、手足并用、金屬質(zhì)感十足的遲鈍語調(diào)才是機器人的發(fā)音常態(tài)。但是Cortana卻叛變了,她說話根本不像機器人,反而像極了正常人類,那么她是如何做到的呢?


會說人話因為咱有語氣
這首先要先知道我們?nèi)祟愂窃趺窗l(fā)音的。在每個詞匯中,都會包含有大量的基礎(chǔ)音,這點在我們最初學英語時已經(jīng)有過很多的親身體驗。而這些基礎(chǔ)音疊加在一起就會構(gòu)成我們所說的復雜的語言。

Cortana的語言比我們更復雜
機器人能說話其實利用的便是這一原理。將這些基礎(chǔ)音從語言樣本中一一提取解析出來,然后打碎重新組合,形成新的目標的語言。這一過程我們可以考慮祖宗的活字印刷,只不過是活字變成了基礎(chǔ)音。
Cortana的母語是英語,說英語的難度要小很多。在接收到語言文本以后,Cortana需要先利用計算語義學等邏輯對其進行分析,得知其語義。然后利用合成信號處理等將其解析出人聲基礎(chǔ)音。這樣就可以發(fā)出一些簡單的英文對話了。
讓Cortana說中文,難度更大
那么問題來了,如果Cortana接收到的其他語種呢?我們中國用的可是漢語,Cortana也能說中國話,這是為什么呢?道理其實是類似的,Cortana會將一些英文的語義進行翻譯,轉(zhuǎn)換為中文,然后再以中文的基礎(chǔ)音進行分析構(gòu)建。
而如果Cortana遇到的新的問題,比如語音基礎(chǔ)缺乏等問題,這時人工智能的力量就要發(fā)揮了。利用云端的匹配搜索,Cortana可以尋找相近的基礎(chǔ)音進行取代和體會,當然有時這也并不足以解決問題,那就需要用到真人進行配音了。
強大的微軟云給Cortana注入新動力
而在這個過程中,云技術(shù)會起到很大的影響,比如云存儲、大規(guī)模計算和響應等多方面問題。但是這依然沒有解決一個很重要的問題,很多機器人說話用的都是這個原理。那為什么Cortana說話會沒有機器人味兒呢?
在這點Cortana表現(xiàn)的十分機智。Cortana會根據(jù)當前的對話情景進行情感分析,分析所采用的原理依然是萬能的機器學習。然后利用當前情景的情感因素控制自己的語音和語調(diào),也就會產(chǎn)生相應的語氣。
Cortana也有小情緒
這點相信各位用戶在使用過程中會有一定體驗,比如Cortana道歉或者抱歉時,會選擇很謙遜的語氣,在回答你的問題時會采用很堅定的語氣。這樣語氣的加入會使得原本冷冰冰的單詞拼接變得更像人類的發(fā)音,這也是Cortana不同于其他機器人的地方。
不講道理講科研
當然,Cortana的競爭對手Siri 和Google Now也會采用這些技術(shù)。但是很多用戶表示,還是Cortana的擬人程度會更高一些,這點的原因就不在Cortana身上了,而是在于其背后的微軟研究院。
Cortana的比Siri說話更像人
微軟研究院是一個怎樣強大的存在,如果你有所了解一定會為其所震驚。微軟作為世界上最強大的科技公司之一,微軟研究院可謂是其最大創(chuàng)新依托。微軟研究院與其他公司的創(chuàng)新中心不同,這里完全是一個學院派的作風。
如果談到論文發(fā)表,你可能會想到各種高等院校,但是你知道嗎?微軟研究院所發(fā)表的論文數(shù)量一度排名全球第一,甚至超過最著名的麻省理工等高校。而微軟研究院的甚至還會做出出版教材這種純學術(shù)性事件。
更像科研機構(gòu)的微軟研究院
更為奇葩的一點,其他公司的創(chuàng)新中心員工的考核往往以績效作為考核的標準,而微軟研究院則是以論文發(fā)表的情況為考核標準。這根本就是個超級大學??!微軟研究院以這種類似科研機構(gòu)的專業(yè)精神所打造的產(chǎn)品有著更好的表現(xiàn)也就不太奇怪了。
Cortana“叛變”了機器人語音,改成好好說人話。這絕不僅僅是技術(shù)上的小動作,其背后強大的科研支持才是Cortana越來越好的根源所在。而在這一點上,我國的科技巨頭則需要更多的努力啦。