
2016年3月份AlphaGo與李世石的人機大戰(zhàn)比賽前幾個月,搜狗王小川就已經(jīng)預料到AlphaGo會贏,他早就看明白了人工智能在未來的力量,因而非常篤定。技術(shù)的力量不容小覷,中學的時候,王小川就迷戀用算法來解決游戲的博弈問題,比如下象棋或是跳棋。雖然他已經(jīng)不再寫程序敲代碼,專注于公司管理,但他依然保持著對這個世界最大的好奇。
搜索引擎公司是人工智能基因最足的模式,王小川相信,在數(shù)據(jù)技術(shù)沒有成熟的時候,垂直領(lǐng)域的直接切入才會使得系統(tǒng)更實用。搜狗語音糾錯功能很快就會發(fā)布,接下來是“讀圖”功能,還有一些搜狗正在研發(fā)的技術(shù)他沒有展示,比如跟駕駛相關(guān)的。“無人駕駛或者類似的場景下需要流暢自由地對話,所以語音最大的場景不在手機上,而是在其他設(shè)備上的交互”。
2016年4月底,搜狗給清華捐贈了1.8億,成立清華大學天工智能計算研究院,開展人工智能領(lǐng)域的前沿技術(shù)研究,王小川出任聯(lián)席院長。“判斷人工智能技術(shù)力量只看一個原則,背后有沒有跟高校連接在一塊。”王小川說,國外的經(jīng)驗就是不斷從高校引進教授,來參與人工智能企業(yè)的研發(fā)。
以下內(nèi)容根據(jù)王小川口述整理:
這次做天工研究院,我們會公開開放大量的數(shù)據(jù),因為人工智能時代到來之后,你會發(fā)現(xiàn)沒有數(shù)據(jù)沒法做研究。搜索引擎公司是人工智能基因最足的模式,不光是我們,百度、谷歌都是,天生就是大數(shù)據(jù)產(chǎn)品,容易獲得用戶交互的行為,從而幫助做判斷和選擇,所以數(shù)據(jù)本身對于推動整個人工智能研究會有巨大的幫助。研究院把數(shù)據(jù)開放之后,基于數(shù)據(jù)去設(shè)立研究的題目。研究不是企業(yè)界或是高校單方面的事,而是由我們來推動數(shù)據(jù)和題目的設(shè)立。
另外我們想嘗試,做一些具有重大突破性,而且大眾能夠理解的實用性的理論研究。因為有企業(yè)的介入,希望研究院既在選題上有大的突破,又能夠跟應用走得更近,兩方面都兼顧。就像AlphaGo,兩頭都有,一頭在理論上是有進展的,代表著怎么把游戲問題解決得更好,比如用卷積神經(jīng)網(wǎng)絡(luò),能夠試圖理解棋盤,用連接主義而不是符號主義去解決游戲問題,這是它的一個突破。而且還要懂得把深度學習能力跟搜索理性能力合一。這里有很多創(chuàng)新,創(chuàng)新又變成大眾能夠理解的產(chǎn)出。
很多人會說為什么不把1.8億用在公司內(nèi)部做創(chuàng)新,其實搜狗走到今天,我們開始需要理論上的創(chuàng)新突破來支撐發(fā)展了,不只是應用層面上的。在國內(nèi)市場中,跟搜索的競爭對手做對抗,從能力或動力上我們有所欠缺,所以需要有前沿的技術(shù)去突破它。我自己是兼任天工研究院的院長,公司里面設(shè)研究院和外面設(shè)研究院我們執(zhí)行力是一樣的,實際都會參與運營。有了一個叫天工的獨立品牌,巨大的好處就是能夠跟國內(nèi)外人工智能方面第一流的學者專家共振起來。在想象力上脫離了搜狗品牌的束縛,反而能幫我們打開空間。
這1.8億研究費用,我們傾向于在圖像理解和語義理解方向去進行研究,讓機器能夠讀懂人。今天的搜索引擎還是用簡單原理做的,機器只是為了排序,并不懂得你真正需要什么。如果我們促使機器對語義理解深了,它就能夠真的獲取知識,所以未來我認為這種對視覺和語言的理解,一方面會讓你在表達上更容易跟它溝通,第二方面它也能夠更直接給出結(jié)果,這個結(jié)果真的是你自己想要的答案。
輸入法最早是用鍵盤的,現(xiàn)在可以語音輸入,以后你的表情,你的手勢,甚至通過數(shù)據(jù)分析都能夠讓機器懂得你要什么,而不單純依靠打字的方式了,甚至腦電波都有可能,因此我們的輸入交互層面今天是很不夠的,想象空間還很大。另外,輸入層面還有一個智慧的要點,就是把填空題變成選擇題或者判斷題,人工智慧的輸入會反饋說主人你是不是要輸這個,如果選定,它就幫你傳輸出去,它理解你到底想要說什么。另外,我們說今天搜索引擎在獲取答案的時候,其實只是通過若干引導把你帶到不同的鏈接里去,不是真的幫你解決問題,未來人工智能的搜索一定懂你要什么,根據(jù)你的需求,幫你做推理、做判斷,給你的就是你要的答案。就像你的秘書一樣,他幫你完成一件事,而不只是給了你一個鏈接。在表達和獲取信息里,人工智能未來有很大的改進空間。
2016年6月份,我要去英國跟AlphaGo的研究團隊DeepMind進行一次學習交流。其實早在2013年,我已經(jīng)意識到了深度學習技術(shù)是可以用來做圍棋的事,但是很遺憾我們錯過了,搜狗那時候利潤也不多,我當時的能力不足以推動這件事。
Nature雜志上關(guān)于AlphaGo的論文我讀了兩遍,第一次是在2016年2月份,谷歌宣布要跟李世石比賽,比賽完了我又讀了一次,對我啟發(fā)很大。你真的看到了一個既有技術(shù)突破又真正實用的東西,因為有時候成功案例往那一放,會激發(fā)你把科研和最后應用都做透的決心。
除了論文以外,我還很敬佩AlphaGo研究團隊。之前說先拿人類的數(shù)據(jù)來訓練機器,他們內(nèi)部有一個實驗,嘗試讓AlphaGo自己跟自己下,看看最后演化出什么棋來。這個東西的好奇不只在贏棋,而是你從不同路徑學到不同的東西究竟最后會有什么樣的表現(xiàn)。就好像進化論,如果人重來一次進化,會生成什么樣的生命?這些人是這樣思考問題的,他們的視角值得我們學習,不是個人加功利的噱頭,而是思考更深層次的問題。
從生活層面來說,實用語音交互最多的場景是在汽車導航和駕駛上。之于無人駕駛,我是比較相信輔助駕駛,漸進式的,而不是谷歌所代表的全自動駕駛,這是兩個流派。特斯拉比較靠譜,就是不斷地改進,就像洗衣機從半自動到全自動一樣,升級就行了,而不是一開始就設(shè)立把人給取代了,這是對技術(shù)的第一個理解。第二,無人駕駛跟自動駕駛都是大的系統(tǒng)性的工程,我比較傾向于有創(chuàng)新精神的汽車廠商做這個事,而不是互聯(lián)網(wǎng)公司。如果互聯(lián)網(wǎng)公司要做這件事,我反而比較看好像Uber這樣的公司去做,就是幫你帶路,能夠讓你更好地出行,最開始讓司機來開,慢慢也可以往人工智能方向上走,Uber和特斯拉兩個更接近無人駕駛,這技術(shù)在他們的產(chǎn)業(yè)鏈條里面,而不是孤立的一個技術(shù)。
人工智能是面對未來的問題,未來的問題一定要有想象力,所以我覺得科幻作品能夠打開人的視角。最近剛讀到阿西莫夫?qū)懙摹蹲詈蟮膯栴}》,這個作品很短但很經(jīng)典,把人工智能和未來人的終極趨勢講得很透。
最難忘的影視作品還是1999年,我還在清華讀本科,看到了電影《黑客帝國》,這部電影對我震撼很大,至今我還會偶爾在家翻出來看。當年大家喜歡具有科技感、燒腦的片子,它確實能夠代表科幻里邊很高的境界。《黑客帝國》講了意識脫離人之后,到了更新迭代的狀態(tài)。人死了,意識存下來了。電影里有很多思想內(nèi)涵,比如關(guān)于“異常”,在一個有序系統(tǒng)里一定會存在一種例外,這甚至跟佛經(jīng)里的概念相通,暗含著深度的哲學思考?!逗诳偷蹏防锩孀隽艘粋€假設(shè),說人是能當電池用,給機器供電。在所有你能夠論證的事情里這是最不靠譜的事,人能當電池,給了我們更大的哲學物載,否則你一點用都沒有了。你越看越會覺得這個片子博大精深。以至于后來我有點恍惚,覺得我們在思想上不斷要自我提升,在技術(shù)上要不斷提升,但是人家早已經(jīng)想到甚至已經(jīng)把人工智能的未來拍成了電影,《黑客帝國》很難被超越。