
(左2為正在接受采訪的 Mike Calcagno,左3為微軟小娜中國負責人閆勃。微軟供圖)
2014年4月,Cortana 在當年的 Build 開發(fā)者大會上亮相之后,被貼上了“微軟版 Siri”的標簽。2015年年中,微軟前所未有地為消費者提供 Windows 10 系統(tǒng)“免費升級”,并且在這個數億人使用的核心產品上集成了 Cortana。2016年3月的 Build 大會,Cortana 成為最亮眼的主角。微軟CEO納德拉稱,基于 Cortana 的第三方對話機器人 Bot 服務將成為新的應用程序(app)……
當普通用戶還搞不清楚 Cortana 比 Siri 強在哪里的時候,這個看起來小小的語音助理,已成為微軟公司下一個最重要的戰(zhàn)略級產品。微軟為什么這么捧 Cortana?全世界不明真相的人們都有點兒“蒙圈”。但僅僅過了兩周,另一全球科技巨頭 Facebook 也在自己的年度開發(fā)者大會上公布了類似的聊天機器人計劃。這下,人們心底的問號,更多了。
4月19日,微軟 Cortana 全球項目負責人Mike Calcagno 在中國進行例行“巡視”,并且與小娜(Cortana 中文版官方名稱)項目負責人閆勃一起接受了雷鋒網的采訪。從他們口中,我們終于弄懂了微軟看到的未來。而且這個未來的出發(fā)點,與來自中國的微信有一些聯系。
即時通訊app的啟發(fā)
當微軟CEO在 Build 2016 上介紹“對話即平臺(Conversations as a Platform)”的時候,中國觀眾一眼就看出了幻燈片配圖里的微信聊天界面。這不是意外,納德拉在臺上轉述了一個關于微信的故事:華人高管陸奇80歲的母親,不太會用電腦上網,也不太會下載各種手機app,卻能從容地生活在微信里,不僅能與人聊天,而且能使用企業(yè)提供的服務(注:Bloomberg的特寫文章中有更詳盡的描述)。納德拉總結道,這展示了人類自然語言的力量,微軟想把這種力量變成一種通用的計算機交互方式。
且慢。難道微軟 CEO 以為,我們通過微信訂餐或者買電影票的時候,像跟人聊天一樣,直接說話就行?其實不是這樣的,根據雷鋒網的理解,納德拉的意思是,如果在即時通訊軟件上使用自然語言完成某些任務更加方便,為什么不呢?實際上,關于即時通訊app將主宰移動互聯網的討論,從去年初就開始在硅谷的投資人中流行起來。微信既連接人與人,又連接商家與客戶所取得的成功,給了全球科技圈極大的啟發(fā)。世界其他各地流行的即時通訊app,比如 Whatsapp、line、Facebook Messager 都開始在接入企業(yè)服務上進行探索。
不過,微軟看這件事的角度有所不同。它從微信這樣的即時通訊app上究竟獲得了什么啟發(fā)?Cortana 全球項目負責人 Mike Calcagno告訴雷鋒網,微信確實是個領先的即時通訊軟件的代表,微軟看到的是:
聊天軟件所提供的對話式交互界面,從人與人的交互,擴展到了人與服務的交互。正因為它比人們使用app或者網站的服務更容易,所以在全世界范圍內都非常流行。如果你沿著這個趨勢繼續(xù)往下追問,在即時通訊軟件的對話式界面中,具體什么樣的方式交互是最自然、最輕松的,就會獲得和微軟一樣的答案——人類的自然語言。
怎么看待 Amazon Echo ?
交流中,Mike Calcagno 提到自然語言交互流行起來的另一個重要推動力是物聯網,因為大部分物聯網設備沒有屏幕,語音是人們與這些設備交互的基礎。這時候雷鋒網想到了家庭語音助理 Amazon Echo,問 Mike Calcagno 怎么看這個設備。
Mike 回應稱自己很喜歡 Echo,這個設備剛好驗證了“對話式交互”的模式是可行的。亞馬遜為它的語音助理 Alexa 找到了一個有吸引力的場景——在家里,尤其是廚房里。Mike 認為,我們將進入一個多助理服務的時代,每個服務都有它擅長的領域。Echo 可以提升廚房的效率,Cortana 也有自己的策略,微軟的目標是把 Cortana 打造成提升商務人士生產力的個人助理。
兩歲 Cortana 的成長經歷
講俏皮話確實不是面向商務人士的 Cortana 最擅長做的事。發(fā)布近兩年來,Cortana 最大的變化是什么?Mike 介紹,變化可以總結為兩個方面,一方面是增加新的技能,尤其是更加主動提供幫助的技能;另一方面是在跟用戶相處中學到更多經驗,摸索提供服務的最佳方式。
關于新技能。Mike 講述了 Build 2016大會上的那個關于“提醒用戶”的例子:我們通過郵件跟別人交流的過程中,經常做了很多承諾,但只能記住其中很少的一部分。Cortana 作為一個合格的秘書,就會使用機器學習技術,查找電子郵件中表達承諾或是表達約定的內容,這些信號可能是細微的,也可能是明確的,比如“我會在下周回復你”或“今天之內完成”,然后主動提醒用戶不要忘記自己答應過的事。從產品理念上說,Cortana 希望自己的行為可以幫助用戶變成更加遵守信用的人。這是微軟想要 Cortana 增加的主動技能。
關于跟用戶相處中學到的經驗。Mike 舉了兩個例子:一個是PC上幫用戶關機。剛開始設計的時候沒考慮過這個功能,但在實際使用中發(fā)現用戶經常會向 Cortana 提出這個問題,問的人多了微軟就給 Cortana 加入了這項技能;另一個例子是手機上問時間。設計的時候,Mike的團隊都覺得手機上本來就會顯示時間,如果人們問這個問題應該是有別的需求,所以把用戶帶到了搜索的界面中。后來他們發(fā)現,原來用戶真的就是想讓 Cortana 把時間讀出來。對 Mike 來說,Cortana 不斷學習的過程還體現在針對同一個問題,可能過幾天,她就能提供不一樣的答案。
基于 Cortana 的“服務號”
Cortana 微軟小娜 聊天機器人
隨著相處時間的增加,Cortana 對用戶的了解之積累越來越多。第三方開發(fā)者如果想要通過聊天機器人(ChatBot)為用戶提供服務,就可以從 Cortana 身上獲得用戶的偏好信息,提供更有針對性的服務。這是 Cortana 的開放平臺吸引第三方開發(fā)者的一個關鍵原因。
Mike 告訴雷鋒網(搜索“雷鋒網”公眾號關注),對于第三方開發(fā)者而言,接入到 Cortana 中為用戶提供服務的另一個關鍵原因是,只需要很小的投入。因為微軟通過 Cortana Intelligence Suite 智能服務包提供了機器人框架(Bot Framework)和認知服務的API,開發(fā)者只需要幾行代碼對接自己的IT系統(tǒng)即可。待將來用戶可以選擇的服務機器人變多了,怎么給這些服務進行排序就會變成重要的挑戰(zhàn)。Mike 說,用戶的喜好會是 Cortana 決定排序的重要因素,究其原因還是因為 Cortana 是最了解你的個人助理。
顛覆app生態(tài)?
作為 Cortana 項目全球和中國區(qū)的負責人,Mike 和閆勃都認為,真正好的個人助理不該是萬能的,而是應該吸引到不同的“專家型”第三方服務,在各個方面為用戶提供專業(yè)的機器人服務。微軟在 Build 大會上舉了在 Cortanta 上調用第三方服務訂外賣和訂酒店的例子,現在就判斷對話式交互的方式,比傳統(tǒng)選擇觸摸或鼠標點擊軟件菜單的方式更加便利,是不切實際的。但開發(fā)者頻頻爆出的掌聲,也告訴我們,如果在 Cortana 中能在恰當的時候提供恰當的第三方服務,的確可以提升至少是部分提升我們的工作效率。
微軟把自己在計算機基礎研發(fā)領域的看家本領,作為認知服務API開放給第三方,目的是吸引到開發(fā)者,共同“開創(chuàng)新交互時代”。納德拉介紹,未來人類自然語言會成為新的UI層,各類第三方Bot服務機器人將組成新的app生態(tài),個人助理軟件則將成為元應用,地位就像電腦上的瀏覽器一樣。
其實沒人懷疑基于自然語言的交互方式是未來的發(fā)展方向,所有人也都清楚如今的app生態(tài)或許幾年后會被顛覆。面對這樣的“新事物”,人們最容易產生的疑惑是,微軟和它的聊天機器人會不會走得太快了一些?