虛火旺盛的2016年眼看著再有十幾天就將成為回憶,如果找一個(gè)關(guān)鍵詞來(lái)形容這一年,最有代表性的一個(gè)詞一定是“人工智能(AI)”??v論2016年人工智能的發(fā)展,在獲得高度關(guān)注度和對(duì)普通用戶洗腦式普及的過(guò)程中,我們也看到不可避免地出現(xiàn)了一些偽人工智能產(chǎn)品,以及人們過(guò)度消費(fèi)人工智能話題所帶來(lái)的疲憊和審丑。

在這樣的狀況下,虎嗅在12月4日的撫摸節(jié)(F&M創(chuàng)新節(jié))上,將人工智能話題放在了一個(gè)理性的位置上,找了一些并非一味鼓吹人工智能的嘉賓來(lái)談人工智能。其中,曾經(jīng)的百度少帥,現(xiàn)在的物靈科技聯(lián)合創(chuàng)始人顧嘉唯,跟我們探討了人工智能該有的樣子——充滿靈性,主動(dòng)給人發(fā)起對(duì)話,“讓人和靈性世界中的機(jī)器人共生共存,成為非常好的人機(jī)融合的世界”。
在一排排彈幕夸他長(zhǎng)得帥的過(guò)程中,顧嘉唯做了一個(gè)17分鐘左右的分享,如果你厭倦了文字,你可以猛戳下面的演講視頻:

如果你覺(jué)得流量不夠用,或者討厭騰訊視頻開(kāi)頭漫長(zhǎng)的廣告,你可以看演講全文的文字版:
之前幾次都是代表人工智能行業(yè)比較大型的公司——微軟和百度,現(xiàn)在代表一個(gè)小公司,新成立的一家公司——物靈科技,2016年剛成立,希望未來(lái)可以像科大訊飛一樣,成為智能行業(yè)新的大型的公司。
今天的主題要講講從萬(wàn)物互聯(lián)到萬(wàn)物智能,我們是怎么思考的。
未來(lái)人工智能的兩個(gè)終點(diǎn)
我們現(xiàn)在很多人每天每時(shí)每刻離不開(kāi)手機(jī),手機(jī)一直聯(lián)著網(wǎng),所有的信息都通過(guò)手機(jī)查看。我自己已經(jīng)把微信的提醒關(guān)掉,因?yàn)槲腋緵](méi)有辦法掌握這些信息,(因?yàn)樗o(wú)時(shí)無(wú)刻充斥著我的生活。我的生活在于移動(dòng)的生活和每時(shí)每刻手機(jī)端跟萬(wàn)物互聯(lián)的過(guò)程。
那么,我們將走向什么地方,或者我們認(rèn)為人工智能、深度學(xué)習(xí)、大數(shù)據(jù),在我們身邊成為基礎(chǔ)建設(shè),像水電煤一樣鋪設(shè)以后,我們會(huì)走向什么樣的階段。
上一個(gè)時(shí)代是移動(dòng)和互聯(lián),下一個(gè)時(shí)代我們將面臨的是無(wú)處不在的計(jì)算。我們將面臨是所有萬(wàn)物都被智能化的過(guò)程,可能我身邊的一杯水、一個(gè)投影儀、身邊的沙發(fā)就變成了一個(gè)機(jī)器人。
這里面存在非常大的挑戰(zhàn)。我們這家公司為什么現(xiàn)在成立來(lái)做(人工智能)這件事情。我之前花很多的時(shí)間在企業(yè)的研究院做了非常多的技術(shù)研發(fā),當(dāng)時(shí)微軟是5-10年的研發(fā),百度IDL(Institute of deep Learning 深度學(xué)習(xí)實(shí)驗(yàn)室)是1-3年的技術(shù)研發(fā),嘗試找到對(duì)深度學(xué)習(xí)領(lǐng)域的邊界,然后突破。
我們新做的公司希望看到什么使命?我們希望創(chuàng)造人機(jī)共生的世界,制造具有靈性的產(chǎn)品。
今天有很多很多所謂的機(jī)器人產(chǎn)品,要不就是兩個(gè)腳的、會(huì)跳舞的機(jī)器人,要不就是長(zhǎng)得像蛋一樣的等著講話的機(jī)器人,它們背后用的都是科大訊飛等幾家的語(yǔ)音技術(shù),效果方面就會(huì)令人非常非常不滿意。我們希望創(chuàng)造有靈性的產(chǎn)品,讓人和靈性世界中的機(jī)器人共生共存,成為非常好的人機(jī)融合的世界。
人工智能未來(lái)有兩個(gè)終點(diǎn),一個(gè)終點(diǎn)是賈維斯那樣的、像《Her》電影里的Samantha 這樣的OS操作系統(tǒng),可以幫助人解決很多問(wèn)題,可以理解為雇了助理,可以幫你解決身邊所有的事情。第二個(gè)終點(diǎn)是寵物,或者在身邊可以陪伴你的情感機(jī)器人。這兩類的東西不一樣,我們?cè)诼窂街型七M(jìn)的時(shí)候做的方法也是不一樣的。
技術(shù)如何適應(yīng)人類?
今天手機(jī)發(fā)展到這個(gè)階段會(huì)帶來(lái)非常不好的東西,人需要適應(yīng)它,低著頭看,越來(lái)越多地錯(cuò)過(guò)了你與身邊人的交流。
是不是真的應(yīng)該讓人適應(yīng)技術(shù),讓人適應(yīng)科技呢?我們應(yīng)該做的是,努力讓技術(shù)適應(yīng)人,或者說(shuō)讓技術(shù)隱藏在背后。
原來(lái)在之前的兩家公司很多行業(yè)分享會(huì)講了很多Deep Learning的東西,但我覺(jué)得大部分的大眾不在意或者說(shuō)不喜歡聽(tīng)這些東西。他們可能更想獲得是,人工智能到底解決什么問(wèn)題,能帶來(lái)什么快樂(lè),幫我們賺了什么錢。
那能不能讓技術(shù)藏在背后,用戶可以獲得的是靈性的體驗(yàn)和有價(jià)值的產(chǎn)品?
科技沒(méi)有很好的隱藏在背后,而是暴露在人面前,讓人適應(yīng)它。為什么有今天的狀態(tài),回顧過(guò)去這段時(shí)間人機(jī)交互的發(fā)展,最早是基于PC時(shí)代的交互;70年代普及,所有人都有電腦以后,人們進(jìn)入GUI(Graphical User Interface,圖形用戶界面)的時(shí)代。2006年,喬布斯把人們從固定的狀態(tài)帶到了mobile時(shí)代,人與人的交互變成了人對(duì)玻璃屏幕交互的過(guò)程,你的信息再生動(dòng)、再有情感,都是通過(guò)冷冰冰的屏幕交互的。
我印象很深的是,在微軟的四年時(shí)間里,一直在努力找的新方式就是NUI(Natural User Interface),自然的人機(jī)交互的方式。我們通過(guò)語(yǔ)音、手勢(shì)、觸覺(jué)反饋,去創(chuàng)造。你自己就是一個(gè)界面,創(chuàng)造自然交互。
現(xiàn)在,語(yǔ)音形式或?qū)υ捫问降慕换?,逐漸成為我們這波技術(shù)突破最大的領(lǐng)域。但光有語(yǔ)音是不夠的,雙向的多模態(tài)交互非常重要,你需要糅合計(jì)算機(jī)視覺(jué)和語(yǔ)音技術(shù)等做多模態(tài)的、跟物體和身邊已經(jīng)變成機(jī)器人的設(shè)備進(jìn)行對(duì)話的方式。
錯(cuò)過(guò)了移動(dòng)互聯(lián)網(wǎng),不能錯(cuò)過(guò)人工智能創(chuàng)業(yè)
從我個(gè)人講,我錯(cuò)過(guò)了移動(dòng)互聯(lián)網(wǎng)時(shí)代最好的時(shí)光。我畢業(yè)后直接去了微軟研究院,做5-10年的技術(shù)儲(chǔ)備,做了非常多的專利和論文。相反,我有個(gè)清華的室友,他畢業(yè)了以后去了盛大,現(xiàn)在做了一個(gè)有9億用戶的產(chǎn)品,市值20億美金。
我錯(cuò)過(guò)了移動(dòng)互聯(lián)網(wǎng),但我發(fā)現(xiàn)這一波新的機(jī)會(huì)在過(guò)去的幾年時(shí)間里有積淀,帶來(lái)了新的價(jià)值。以前人和信息世界、和物理世界的交互通過(guò)中間的媒介,大部分來(lái)自屏幕,冷冰冰的玻璃。這里面連接的無(wú)非就是信息和服務(wù)。
人工智能起來(lái)之后,新的這波機(jī)會(huì)我認(rèn)為有三大塊機(jī)會(huì),也是超越App的方式。已經(jīng)有很多人分享說(shuō)移動(dòng)互聯(lián)網(wǎng)的創(chuàng)業(yè)機(jī)會(huì)是非常有限的,人口紅利已經(jīng)過(guò)去。以前是通過(guò)提高效率和商業(yè)模式的顛覆去創(chuàng)造移動(dòng)互聯(lián)網(wǎng)的創(chuàng)業(yè)機(jī)會(huì),下一波來(lái)自智能行業(yè)的機(jī)會(huì)一定是由技術(shù)革新帶來(lái)的,包括三大類:第一類是可穿戴設(shè)備,像《Her》電影里的Samantha OS那樣,成為一種無(wú)處不在、伴隨的功能性助理,它有計(jì)算機(jī)視覺(jué);第二類就是中間所有的硬件都變成機(jī)器人;第三類就是裝著四個(gè)輪子的機(jī)器人——無(wú)人車。
這個(gè)時(shí)代我們看到的機(jī)會(huì),可能與信息的互動(dòng)不只是停留在玻璃框中,這是第一個(gè)很明顯的趨勢(shì)。第二個(gè)趨勢(shì)是,越來(lái)越多的基于情境型的對(duì)話,基于場(chǎng)景的理解之后,讓機(jī)器主動(dòng)跟你互動(dòng),而不是人要先跟它講話喚醒它、發(fā)起對(duì)話。第三個(gè)趨勢(shì)是,當(dāng)無(wú)處不在的計(jì)算發(fā)生后,技術(shù)會(huì)隱藏在背后,人享受到的服務(wù)會(huì)更不經(jīng)意,而不是一定要拿手機(jī)解鎖去看信息。第四個(gè)大家都很清楚,可能會(huì)帶來(lái)安全隱患,身邊這么多的監(jiān)控?cái)z像頭,對(duì)個(gè)人數(shù)據(jù)獲得后一定會(huì)有負(fù)面的東西,怎么讓公司做數(shù)據(jù)源的處理,非常重要。
我們看到的IOT,從萬(wàn)物互聯(lián)到萬(wàn)物智能,我們認(rèn)為AI還是弱人工智能階段的時(shí)候,用現(xiàn)在傳統(tǒng)的深度學(xué)習(xí)方法做的AI算法,很難完成人們預(yù)期的智能交互。
人工智能商業(yè)化將落在產(chǎn)品經(jīng)理身上
雖然現(xiàn)在很多人高舉AI旗幟,但真正做AI行業(yè)的人很清楚,媒體人眼中有個(gè)AI,AI科學(xué)家眼中也有個(gè)AI,怎么做商業(yè)化最終還是落在產(chǎn)品經(jīng)理的能力上?,F(xiàn)在很多的投資機(jī)構(gòu)投的都是科學(xué)家,下一波可能真的像java被替代一樣,會(huì)變成產(chǎn)品經(jīng)理驅(qū)導(dǎo)的新行業(yè)。
有一個(gè)很好的案例——亞馬遜Echo,Echo的本質(zhì)不是簡(jiǎn)單的用語(yǔ)音做音響。像iPad當(dāng)年的火爆,在于它顛覆了人們連接音樂(lè)數(shù)字的服務(wù),不需要買整張專輯下歌就可以不斷刷新獲得新的數(shù)字服務(wù)。而是,當(dāng)我們花149美金買到一個(gè)音箱后,發(fā)現(xiàn)不僅可以語(yǔ)音,后面還可以(用它)買東西。這種用戶預(yù)期控制得很好的初期,不斷提升用戶預(yù)期的過(guò)程,才是好的產(chǎn)品經(jīng)理應(yīng)該把握的。
Echo很像當(dāng)年的功能手機(jī),我們有一個(gè)產(chǎn)品叫Jibo,是我們?nèi)ツ晖顿Y的一家公司,我們物靈(科技)的母體公司是東方網(wǎng)力Netposa。我們希望通過(guò)投資布局和自研,共同找到我們認(rèn)為最有靈性的產(chǎn)品矩陣。
Jibo是我們認(rèn)為比Echo更像智能手機(jī)的IOT Hub,它會(huì)成為家庭當(dāng)中的成員,它會(huì)主動(dòng)地察言觀色、勤于思考,可以插科打諢講笑話,你在點(diǎn)歌的時(shí)候可能會(huì)給你講這首歌背后的故事。人工智能在做商業(yè)化的過(guò)程里,確實(shí)有非常多不確定性因素,這比當(dāng)年做移動(dòng)互聯(lián)網(wǎng)的時(shí)候機(jī)會(huì)雖然更大,但挑戰(zhàn)會(huì)更大。
Jibo是物聯(lián)網(wǎng)的入口,可以知道場(chǎng)景的環(huán)境變化,像信息交互界面的接口一樣主動(dòng)講話。舉個(gè)例子,當(dāng)你今天生病回到房間,可以自動(dòng)與家居連通,但是人的多動(dòng)性很復(fù)雜,需要一個(gè)溫情的方式與你互動(dòng),讓你重新拿到?jīng)Q策的權(quán)限然后控制它。怎么把這個(gè)體驗(yàn)做得更加有靈性,從消費(fèi)升級(jí)到體驗(yàn)升級(jí),這樣的產(chǎn)品就有機(jī)會(huì)了。
我們希望把人們從萬(wàn)物互聯(lián)、無(wú)時(shí)無(wú)刻聯(lián)網(wǎng)的狀態(tài)脫離出來(lái),讓身邊的每一個(gè)硬件都有耳朵、有嘴巴、有眼睛,不止會(huì)講話,能夠跟人進(jìn)行雙向互動(dòng),更希望去創(chuàng)造一個(gè)人機(jī)融合的新的靈性世界。
現(xiàn)在,你在谷歌和百度上搜AI,你會(huì)發(fā)現(xiàn)非常多負(fù)面的東西,媒體經(jīng)常會(huì)把這些東西過(guò)度炒作。比如說(shuō),一個(gè)掃地機(jī)器人吃了女人的頭發(fā),特斯拉把人撞死了……實(shí)際上,AI本質(zhì)在于解決問(wèn)題,看誰(shuí)怎么用。真正在用這些商業(yè)化AI的人,或者說(shuō)當(dāng)AI變成水電煤、成為移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)建設(shè)的時(shí)候,應(yīng)該思考的是怎樣很好地讓人的世界觀和價(jià)值觀與產(chǎn)品結(jié)合。
我們希望通過(guò)我們的點(diǎn)物賦靈,對(duì)靈性的理解,來(lái)自萬(wàn)物有靈的感知,轉(zhuǎn)化成我們的靈性理解、靈性互動(dòng),放在產(chǎn)品中去,首先夯實(shí)技術(shù)。我們也希望同行業(yè)小伙們一起努力,改造身邊那些人工智障機(jī)器人,打造有靈性的人工智能產(chǎn)品。