国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機(jī)器人  機(jī)器人  ABB  機(jī)器人產(chǎn)業(yè)聯(lián)盟  發(fā)那科  庫(kù)卡  碼垛機(jī)器人  機(jī)械手 

財(cái)報(bào)發(fā)布后,搜狗王小川談了談百度、人工智能和上市

   日期:2017-02-22     來(lái)源:鳳凰科技    作者:WYF     評(píng)論:0    
標(biāo)簽:
 

  昨天下午看到王小川時(shí),第一個(gè)感覺(jué)是他變得更清秀了。一位接近搜狗的人士告訴我,王小川在這幾個(gè)月內(nèi)“瘦了十幾斤”。
 
  昨天剛出的搜狐財(cái)報(bào),在廣告業(yè)務(wù)、在線游戲的一片虧損中,只有搜狗還在堅(jiān)挺著相對(duì)平穩(wěn)的增長(zhǎng)趨勢(shì)。2016年全年,搜狗營(yíng)收44億元人民幣,同比增長(zhǎng)19%,非美國(guó)會(huì)計(jì)準(zhǔn)則下的凈利潤(rùn)達(dá)6.4億元人民幣,根據(jù)最新匯率約合9300萬(wàn)美元,相比2015年1億美元凈利潤(rùn),同比下滑7%。其中,2016年第四季度,搜狗營(yíng)收11.7億元人民幣,同比增長(zhǎng)11%。
 
  去年中國(guó)的搜索市場(chǎng)上風(fēng)波不斷。“魏則西事件”后,對(duì)于搜索引擎內(nèi)容推廣是否應(yīng)定性為廣告的爭(zhēng)議引起了廣泛討論。《互聯(lián)網(wǎng)廣告管理暫行辦法》的出臺(tái)不僅規(guī)范了搜索廣告的定義,也對(duì)搜狗的利潤(rùn)造成了一定的影響。這是本季度有點(diǎn)下滑的主要原因。但王小川對(duì)下個(gè)季度的財(cái)報(bào)保持樂(lè)觀的態(tài)度,認(rèn)為會(huì)有一定的增長(zhǎng)。
 
  今年年初,微軟“華人第一高管”陸奇空降百度,百度人工智能“小度”參加電視節(jié)目《最強(qiáng)大腦》也吸引了不少人的目光。與此同時(shí),搜狗的人工智能“汪仔”也開(kāi)始亮相在公眾視野當(dāng)中,第一站也是一個(gè)與人類爭(zhēng)鋒的電視節(jié)目--《一站到底》。
 
  同處于搜索行業(yè),王小川如何看待現(xiàn)在的百度與搜狗的區(qū)別?百度將人工智能定為核心戰(zhàn)略,搜狗又達(dá)到了什么樣的成就?推出英文搜索后,搜狗怎么進(jìn)一步尋求搜索份額的突破?這些都成為了亟待王小川解答的疑問(wèn)。
 
  以下是搜狗CEO王小川與搜狗首席科學(xué)家許靜芳在記者溝通會(huì)上的全文速記,我們疏通了一下文字,劃了重點(diǎn):
 
  王小川:挺高興有機(jī)會(huì)和大家面對(duì)面談,有段時(shí)間我們和媒體沒(méi)有親密的接受任何一個(gè)這樣的訪問(wèn)?;仡檹?013年到2016年,13年搜狗與搜搜合并,到現(xiàn)在已經(jīng)三年的時(shí)間。
 
  我第一個(gè)感慨是,搜狗搜索活下來(lái)了,2013年合并時(shí),360的一些言論,說(shuō)中國(guó)搜索市場(chǎng)只能容納兩家,沒(méi)有第三家的事情,表達(dá)第二家是他,現(xiàn)在看起來(lái),在中國(guó)百度依然還是很大,此外搜狗是唯一一家既有PC搜索也有無(wú)線搜索,市場(chǎng)份額、收入利潤(rùn)在上升的公司。這也是我們活下來(lái),而且不斷地有更多競(jìng)爭(zhēng)力的原因。2016年利潤(rùn)是6.4億人民幣,其中投入到很多領(lǐng)域去,在搜索行業(yè)算是活下來(lái)的。
 
  具體看量,我們可以號(hào)稱叫全球第三大搜索引擎,雖然只做中國(guó)市場(chǎng),因?yàn)镚oogle最大,百度第二,我們第三,從搜索量排是在第四,后面才是其他家引擎,想說(shuō)量上中國(guó)市場(chǎng)是最大的,在國(guó)內(nèi)第二,在全球排第三的位置。
 
  2015年,我們發(fā)布了微信搜索和知乎搜索,2016年,我們發(fā)布了明醫(yī)搜索和英文搜索,慢慢開(kāi)始和百度走向不同的道路。大家用微信會(huì)用一些。我認(rèn)為,醫(yī)療搜索和英文搜索是通向未來(lái)兩個(gè)很重要,可以展開(kāi)無(wú)限想象力的事情,通過(guò)微信搜索和知乎搜索基本固定了形態(tài),在醫(yī)療往下出現(xiàn)自助診斷甚至分診,能夠讓用戶真正明明白白看醫(yī)生?,F(xiàn)在大家拿著化驗(yàn)單可能不知道什么意思,給你個(gè)診斷方向你不知道怎么辦,或者發(fā)生頭痛感冒不知道怎么辦。這是借助大數(shù)據(jù)下,在AI分析里逐步走向輔助醫(yī)生或者讓用戶和醫(yī)生之間建立更多信任的工具。我們知道,國(guó)內(nèi)之前有很多做醫(yī)療的創(chuàng)業(yè)公司,基本覺(jué)得把這個(gè)市場(chǎng)做壞了,把醫(yī)院醫(yī)生搞得很疲憊,因?yàn)榇蠖鄶?shù)邏輯,是希望醫(yī)生脫離醫(yī)院出來(lái)在線做診斷,他要形成對(duì)用戶的吸引力,也要建立后面的商業(yè)模式,這是原來(lái)的一點(diǎn)。
 
  但是我們沒(méi)有這個(gè)需求,因?yàn)槲覀儽旧碛杏脩簦脩粜枰鉀Q診斷的問(wèn)題。我看到一些醫(yī)療機(jī)構(gòu),大部分來(lái)講,上不接用戶,下不接醫(yī)院,就是醫(yī)院不是他的,用戶也不是他的,在中間是沒(méi)有競(jìng)爭(zhēng)力,他想把醫(yī)院拉到自己這邊,吸引用戶,醫(yī)生是沒(méi)有辦法獨(dú)立于醫(yī)院的,這是之前創(chuàng)業(yè)者出現(xiàn)的問(wèn)題。但是我們有用戶,我們代表用戶找到醫(yī)院,找到醫(yī)生,這樣的模式能夠真正有機(jī)會(huì)成立。而且我們?cè)卺t(yī)療上也沒(méi)有創(chuàng)業(yè)公司賺錢的壓力,因?yàn)閷?duì)我們而言,只要用戶認(rèn)可搜狗搜索,有足夠大的搜索量,搜狗搜索有良好的商業(yè)模式,只要量大,給用戶搜索產(chǎn)品就行了,而其他創(chuàng)業(yè)公司會(huì)面臨壓力,第一是沒(méi)用戶,第二是基于資本壓力創(chuàng)造賺錢的模式,這也使得搜索引擎公司在醫(yī)療服務(wù)里能找到自己更好的位置。
 
  我會(huì)認(rèn)為百度會(huì)變得更難,因?yàn)榘俣痊F(xiàn)在畢竟市場(chǎng)份額大,他會(huì)把廣告模式轉(zhuǎn)成免費(fèi)為用戶提供多種咨詢的模式,收入會(huì)下滑,我們沒(méi)有這方面的壓力,這是關(guān)于醫(yī)療上的思考。
 
  另外,我們從英文搜索走向海外搜索,這周內(nèi)我們會(huì)有兩個(gè)升級(jí),一是英文搜索升級(jí)成海外搜索,最后搜索的結(jié)果也是用中文呈現(xiàn),以前我們大家談到的事情是,去年有幾十個(gè)院士跑去給習(xí)近平寫(xiě)聯(lián)名信,希望能對(duì)谷歌網(wǎng)開(kāi)一面,如果科技工作人員不能用谷歌搜索海外科技信息,中國(guó)和世界是脫節(jié)的,國(guó)內(nèi)的科技發(fā)展就會(huì)受制約,我們可以不看國(guó)外的美劇、韓劇,但在國(guó)外科技、信息層面不能落后。但我認(rèn)為不夠,即便開(kāi)放的Google,但大部分人是用中文的,而世界上非常多有益的信息,包括醫(yī)療信息、科技信息,甚至大家言論上的討論都發(fā)生在英語(yǔ)世界里。
 
  在這種情況下,把英文變成中文以后,我相信,98%的中國(guó)人才能更好享受全球的內(nèi)容,因?yàn)槲覀冏顝?qiáng)的是語(yǔ)言部分。正好這個(gè)時(shí)代到了,去年在AI爆發(fā)一年到年底時(shí),翻譯技術(shù)是突飛猛進(jìn)的,比原來(lái)的翻譯有快速的發(fā)展,就像語(yǔ)音和圖像突破,翻譯技術(shù)突破了。因此,我們有機(jī)會(huì)把翻譯和搜索做一個(gè)聯(lián)動(dòng),因此我們說(shuō)搜索全世界。一個(gè)中文輸進(jìn)去我們現(xiàn)在開(kāi)始搜索的是全球的英文,然后我們未來(lái)考慮把全球的日文或其他文字的信息都搜索到,這樣會(huì)構(gòu)成一個(gè)獨(dú)有的競(jìng)爭(zhēng)力,這是Google并不care的東西,因?yàn)橛⑽氖撬麄兊哪刚Z(yǔ)。這種情況下,在翻譯上更多是秀研究的肌肉,Google秀8國(guó)語(yǔ)言的互譯,秀的是如果沒(méi)有語(yǔ)料,沒(méi)有中文到德文的,只有中文到英文,英文到德文,我是不是能做中文到德文的翻譯,他們是在做這樣的事情,和我們的目標(biāo)不一樣。我們是實(shí)實(shí)在在希望通過(guò)翻譯技術(shù)把搜索做得更好,海外搜索也會(huì)成為搜索競(jìng)爭(zhēng)中的差異化。
 
  第一次從微信內(nèi)容開(kāi)始,我們開(kāi)始和百度不一樣,開(kāi)始有了知乎、明醫(yī)和海外,這周升級(jí)完之后就可以完全用中文完全瀏覽世界的網(wǎng)頁(yè),不僅是搜索的詞用中文搜索,結(jié)果也用中文呈現(xiàn),點(diǎn)出去的鏈接也全用中文來(lái)看,在一些場(chǎng)景里應(yīng)用也更加方便。我們內(nèi)心對(duì)這個(gè)事情有蠻高的理想,先不說(shuō)賺錢的問(wèn)題,因?yàn)榈厍蛏现袊?guó)人是最多的,但是我們很不幸,在200年來(lái)發(fā)生的變化,英語(yǔ)成為世界主要溝通的語(yǔ)言。這么大的人群和世界主要語(yǔ)言有隔閡,使得用中文搜索世界,我認(rèn)為,對(duì)中國(guó)整個(gè)大的復(fù)興、成為世界主旋律的一部分是有歷史意義的,我們內(nèi)部叫重寫(xiě)《通天塔》的故事?!锻ㄌ焖肪褪侵v語(yǔ)言不通,使得各個(gè)國(guó)家的人沒(méi)法聯(lián)合起來(lái)做事情,語(yǔ)言通暢了之后會(huì)帶來(lái)一個(gè)新文明,就像發(fā)明火、發(fā)明電一樣,所以我們2016年在搜索做了很多的工作,從AI也是武裝到牙齒。
 
  去年有個(gè)很著名的AI媒體負(fù)責(zé)人跟我聊,中國(guó)現(xiàn)在有兩家是在AI上最努力做報(bào)道的自媒體,其中一家問(wèn),搜狗要轉(zhuǎn)型做AI了,我聽(tīng)了一肚子火。因?yàn)樗阉髌鋵?shí)就是AI,它就是讓機(jī)器像人一樣去思考,搜索引擎變得很聰明,能夠幫我們選擇出更好的頁(yè)面來(lái)。陸奇剛剛?cè)グ俣?,放出一句話,說(shuō)搜索是AI最好的場(chǎng)景,搜索和AI是天生在一塊兒的。今天在做AI的很多公司,大規(guī)模做機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方面,人才方面也都是找搜索公司去要人。因?yàn)橛辛松疃葘W(xué)習(xí)之后,會(huì)使得搜索場(chǎng)景有更好的武器來(lái)滿足,甚至升級(jí)這樣的能力,而我們內(nèi)部的員工大部分受過(guò)正統(tǒng)的訓(xùn)練,怎么用這種數(shù)據(jù)和方法,大家都知道怎么讀論文去提升,我們沒(méi)有Google或者DeepMind那種能力里面,屬于開(kāi)創(chuàng)出新的算法出來(lái),但基于上面的算法去改良的能力是足夠的。
 
  AI里,我們?cè)诜g里面是往前在走,輸入法之前也是很容易地開(kāi)始做語(yǔ)音輸入、圖像輸入,我們現(xiàn)在語(yǔ)音輸入量是全中國(guó)最大的,而且比其他家加起來(lái)還要多的份額,1天2億多次語(yǔ)音識(shí)別請(qǐng)求。在AI時(shí)代里,大家的理解不只是語(yǔ)音和圖像,AI里面最難的地方是人的思想和知識(shí)的學(xué)習(xí),不僅是圖像的識(shí)別,語(yǔ)音的識(shí)別,人最寶貴的不是圖像和聲音,人的難點(diǎn)在于知識(shí)的理解和推理能力,而這種能力是靠語(yǔ)言體系來(lái)支撐的,靠語(yǔ)言來(lái)支撐對(duì)知識(shí)和思考的表達(dá)。搜狗在這里面天生是兩個(gè)場(chǎng)景,一是輸入場(chǎng)景,讓大家用語(yǔ)言表達(dá),二是用語(yǔ)言獲取信息。因此,我們?cè)贏I場(chǎng)景里細(xì)的分類是分在自然語(yǔ)言里,自然語(yǔ)言代表了對(duì)知識(shí)和思想在這里面的人工智能,這里面是人工智能最難的一塊。
 
  往下的思考是幾個(gè)事兒,通過(guò)語(yǔ)言將搜索升級(jí)到對(duì)話系統(tǒng)、問(wèn)答系統(tǒng)以及翻譯系統(tǒng),這是我們核心能力的三部分。包括《一站到底》,可以認(rèn)為是搜索對(duì)未來(lái)的模式,就是提問(wèn)題,不是給你10條鏈接,而是給你1個(gè)答案,實(shí)際上《一站到底》的場(chǎng)景相對(duì)比較窄,我們?cè)趩?wèn)答處理能力上是比較寬泛的,不僅能找到實(shí)體,能在里面做更多的運(yùn)算,《一站到底》是演示下一代技術(shù)中間的場(chǎng)景。對(duì)話系統(tǒng)也是今年的一個(gè)重心,翻譯系統(tǒng),我們會(huì)把這種能力不僅用到移動(dòng)互聯(lián)網(wǎng),未來(lái)在智能硬件里也會(huì)大量地使用我們的一些能力。以自然語(yǔ)言為核心,我們做語(yǔ)音也是把它翻譯成語(yǔ)言,語(yǔ)音識(shí)別是從語(yǔ)音到語(yǔ)言,合成是從語(yǔ)言回到語(yǔ)音,但處理的核心是語(yǔ)言,我們要把語(yǔ)言的能力,結(jié)合語(yǔ)音、圖像和其他方式放到手機(jī)之外的硬件里。所以,我們AI的邏輯不僅是放在輸入法和搜索里,產(chǎn)品形態(tài)里有幾個(gè)關(guān)鍵詞:輸入法,搜索,自然語(yǔ)言的計(jì)算,自然的交互。他們支撐的地方是對(duì)話的問(wèn)題,問(wèn)答的問(wèn)題以及翻譯的問(wèn)題。我們希望在這幾個(gè)場(chǎng)景里,大家都能看到搜狗的聲音,尤其硬件、IoT到來(lái)的時(shí)代,無(wú)處不在會(huì)有交互和機(jī)器智能,這是對(duì)未來(lái)的判斷。
 
  以上是搜狗過(guò)去所做的事情,以及往下對(duì)人工智能和業(yè)務(wù)發(fā)展方向的理解。
 
  記者:川總,您剛才也提到,當(dāng)百度把陸奇招過(guò)去這個(gè)事兒你怎么看?有壓力嗎?剛才你講到搜狗這么多細(xì)分領(lǐng)域的技術(shù),語(yǔ)音識(shí)別領(lǐng)域有科大訊飛等,感覺(jué)你進(jìn)入的領(lǐng)域很多,競(jìng)爭(zhēng)對(duì)手也有很多,這方面你是怎么來(lái)看的?
 
  王小川:一來(lái)就提兩個(gè)競(jìng)爭(zhēng)的問(wèn)題,一個(gè)看百度,一個(gè)看訊飛。首先陸奇,我比較多跟他打交道,搜狗之前做海外搜索,英文海外檢索部分是和bing合作,也是和陸奇談的。陸奇有兩個(gè)很大的優(yōu)點(diǎn),一是技術(shù)理想主義,和他聊天能看到他一談到新的算法就兩眼放光,半夜兩三點(diǎn)去讀論文,是個(gè)很好的技術(shù)人。二是也不官僚,跟他談東西,也不會(huì)擺在全球華人最高職位上,而是非常平易和我們?nèi)フ劦?。這是他的兩個(gè)特質(zhì),對(duì)他蠻尊重的。
 
  關(guān)于科大訊飛,我認(rèn)為要明確,科大訊飛是to B的公司,基因是做企業(yè)的事情,我們是做toC的公司,是和消費(fèi)者、網(wǎng)民能產(chǎn)生一種連接,大家基礎(chǔ)的技術(shù)競(jìng)爭(zhēng)力方向是不一樣的。
 
  搜狗的技術(shù)是全能力的技術(shù),語(yǔ)音識(shí)別大家聽(tīng)科大訊飛比較多。但目前語(yǔ)音識(shí)別里,用戶使用量最大的,是搜狗,遠(yuǎn)遠(yuǎn)大于科大訊飛,在輸入法里已經(jīng)用到了。做技術(shù)現(xiàn)在需要兩件事兒,一是有數(shù)據(jù),二是有研發(fā)AI的能力。數(shù)據(jù)能力上,我們是有優(yōu)勢(shì)的,研發(fā)能力我覺(jué)得搜狗也沒(méi)有弱的地方,尤其深處北京。從我們的應(yīng)用場(chǎng)景到數(shù)據(jù)積累、技術(shù)能力,我自己評(píng)估一下我們都占優(yōu)勢(shì)的位置。
 
  去年我們已經(jīng)開(kāi)始領(lǐng)跑了,在烏鎮(zhèn)大會(huì)上做同聲傳譯?,F(xiàn)在和搜索產(chǎn)品結(jié)合,也上線了fanyi.sogou.com或者translate,現(xiàn)在已經(jīng)公開(kāi)了。和訊飛的比較里已經(jīng)不是關(guān)鍵問(wèn)題,我們現(xiàn)在明確和兩家公司作對(duì)比,一家百度,一家Google做對(duì)比,我們有信心比他們要好,直接線上能看的。無(wú)論是語(yǔ)音識(shí)別還是在線的翻譯,我們都比他們好。而這幾家我認(rèn)為,訊飛發(fā)出來(lái)同聲傳譯的系統(tǒng)來(lái),其他家還沒(méi)有。們是更早使用這個(gè)產(chǎn)品,發(fā)布的場(chǎng)面也是更加官方的(烏鎮(zhèn)互聯(lián)網(wǎng)大會(huì)),今年會(huì)有更多的場(chǎng)合會(huì)用到。馬上就到十九大了,我們?cè)诟鼑?yán)肅場(chǎng)合是敢去用我們產(chǎn)品的,搜狗的語(yǔ)言和翻譯已經(jīng)處于領(lǐng)跑的位置。
 
  記者:剛才聽(tīng)了王總的介紹說(shuō),海外搜索有升級(jí),請(qǐng)問(wèn)這里面有什么樣的技術(shù)?
 
  許靜芳:5月份發(fā)了英文搜索,2017年1月份發(fā)的是由英文搜索升級(jí)為海外搜索,剛才川總介紹過(guò),英文搜索的背景是,世界上有更多更好的優(yōu)質(zhì)信息在英文世界,中國(guó)用戶因?yàn)楦鞣N各樣的原因接觸、觸達(dá)到英文信息并沒(méi)有那么便捷,所以我們和bing也有合作,在國(guó)內(nèi)發(fā)了一款非常好的英文搜索。但大部分中國(guó)人在消費(fèi)英文內(nèi)容時(shí)比中文還是要困難一些,便捷性沒(méi)那么強(qiáng),速度沒(méi)那么快。5月份上線時(shí),我們就有一個(gè)功能,把中文query翻譯成英文query再找英文結(jié)果。5月份魏澤西事件比較熱,關(guān)于滑膜肉瘤,有很多醫(yī)學(xué)的術(shù)語(yǔ),你也不知道,中國(guó)的信息不一定全,不一定對(duì),我想去看國(guó)外的。那問(wèn)題來(lái)了,滑膜肉瘤怎么搜,怎么拼,很多用戶是這樣的反饋,一個(gè)常見(jiàn)的路徑是先翻譯后搜索。當(dāng)時(shí)我們發(fā)布英文搜素時(shí)就有這樣的功能,自動(dòng)把query翻譯成英文query。我們自己也發(fā)現(xiàn),搜索中文結(jié)果非???,掃一眼就知道哪條是你想要的,然后點(diǎn)開(kāi)詳細(xì)去閱讀,當(dāng)看到英文或不熟悉的領(lǐng)域時(shí)就會(huì)慢下來(lái)。
 
  我們這次升級(jí)為海外搜索的時(shí)候,就希望把這套系統(tǒng)做成一個(gè)閉環(huán),引用中文query翻譯成英文query,搜到英文內(nèi)容之后再翻譯成中文結(jié)果。這是目前唯一商業(yè)系統(tǒng)能夠把翻譯和搜索真正結(jié)合起來(lái)的系統(tǒng),翻譯用的是搜狗神經(jīng)翻譯技術(shù),在檢索部分是搜狗和bing一起合作的。這里面會(huì)出現(xiàn)很多新的問(wèn)題,查詢?cè)~是很簡(jiǎn)短的,會(huì)有歧義,英文查詢?cè)~還好。會(huì)發(fā)現(xiàn),搜索結(jié)果出來(lái)以后,搜索結(jié)果有標(biāo)題,有摘要,里面有很多省略和專有名詞、細(xì)節(jié)去處理,包括很多開(kāi)放域的翻譯,十條結(jié)果一起翻譯出來(lái),內(nèi)容寬廣性和實(shí)時(shí)性上都提出了比較大的挑戰(zhàn)。
 
  王小川:我補(bǔ)充兩個(gè)場(chǎng)景,用戶也用在線翻譯,在線翻譯之前的品質(zhì)是不夠的,以前用起來(lái)翻譯,覺(jué)得比我自己翻譯的差,但現(xiàn)在發(fā)現(xiàn)機(jī)器比我翻譯得好,這已經(jīng)過(guò)了一個(gè)門檻,是很重要的變化,翻譯的技術(shù)現(xiàn)在做到是能夠可用了。第二,也有清晰使用的場(chǎng)景,我們兩個(gè)場(chǎng)景在做,比較重點(diǎn)的是搜索里面去用。
 
  記者:搜狗面臨一個(gè)問(wèn)題,不知道你輸入時(shí)問(wèn)題會(huì)面臨各種各樣的可能。
 
  王小川:是的,第一讓翻譯可用,第二讓翻譯找到可用真正的場(chǎng)景,這件事情都是在全球首次做到的事情,以前在線翻譯總覺(jué)得離人的使用始終是有距離的,現(xiàn)在我們已經(jīng)做到了。所以,我還是蠻興奮的,現(xiàn)在我們的翻譯品質(zhì)已經(jīng)到達(dá)了相當(dāng)?shù)母叨取V虚g有些技術(shù)的細(xì)節(jié),學(xué)術(shù)界一直在講“跨語(yǔ)言檢索”,研究界是屬于“葉公好龍”一般的,龍沒(méi)找到就在那兒做研究。我們這次真把龍給捅下來(lái)了,發(fā)現(xiàn)里面的問(wèn)題比學(xué)術(shù)界想的多得多,以前有大量研究里沒(méi)有考慮的問(wèn)題,龍比我們之前想的還難,我們做了很多解決的工作。
 
  許靜芳:搜索是開(kāi)放的,對(duì)翻譯的要求,對(duì)適應(yīng)的領(lǐng)域非常多,同時(shí)它非常簡(jiǎn)短,是有歧義的。曾經(jīng)有一個(gè)case叫寶姿,寶姿翻譯成英文是PORTS,你拿PORTS檢索就發(fā)現(xiàn),PORTS除了寶姿還有計(jì)算機(jī)端口,真實(shí)世界物理港口得意思,這樣搜索結(jié)果就會(huì)發(fā)現(xiàn)多樣性變化,搜索結(jié)果就不一定能直接滿足用戶。還有搜索結(jié)果的翻譯,每條結(jié)果里都有個(gè)PORTS,哪些結(jié)果應(yīng)該翻譯成港口,哪些應(yīng)該翻譯成端口,哪些應(yīng)該翻譯成品牌?都是問(wèn)題,所以在研發(fā)過(guò)程中有一些非常有意思的問(wèn)題存在。
 
  王小川:現(xiàn)在拿到英文摘要,整句翻譯成中文大家知道經(jīng)常翻譯的是不準(zhǔn)的,現(xiàn)在大家經(jīng)常拿整句和縮略的句子拿過(guò)來(lái)翻譯,讓我們的產(chǎn)品來(lái)干這種活。
 
  記者:之前有消息稱搜狗將在今年IPO,請(qǐng)問(wèn)現(xiàn)在搜狗投資方之間是否達(dá)成了一致的一件?上市計(jì)劃進(jìn)展到哪一步了?
 
  王小川:搜狗目前有兩個(gè)戰(zhàn)略投資人,一個(gè)是搜狐,一個(gè)是騰訊。戰(zhàn)略投資人與財(cái)務(wù)投資人不同,他們并不追求上市之后收益的最大化。對(duì)于搜狗上市問(wèn)題,投資方之間已經(jīng)達(dá)成了初步的共識(shí):搜狗現(xiàn)在上市是階段性的成功。但是中間還有大量的權(quán)益問(wèn)題的討論,所以現(xiàn)在并沒(méi)有一個(gè)時(shí)間表。但是現(xiàn)在多方在溝通當(dāng)中,這是和去年最大的不同。這是變化。
 
  許靜芳:現(xiàn)在產(chǎn)品的摘要和縮略是按字節(jié)數(shù)的,有可能單詞是不完整的,只能看到一半。人結(jié)合上下文是可以理解的,如果拿之前的機(jī)器翻譯系統(tǒng)來(lái)說(shuō)一定是不認(rèn)識(shí)的,我們借助最新的神經(jīng)翻譯技術(shù),單詞你只看到一半,它可以也具有人的特點(diǎn),它能結(jié)合上下文能猜出內(nèi)容,也能夠翻譯對(duì)。當(dāng)然這個(gè)階段以后也會(huì)帶來(lái)新的問(wèn)題,很有意思。
 
  記者:跨語(yǔ)言翻譯,翻墻之間一字之差,我們?cè)趺磪^(qū)分?我們刊是國(guó)外的刊,有大量的英文,我們組織了很多翻譯者在其中,每個(gè)月都會(huì)翻譯那邊的英文,如果用了搜狗的產(chǎn)品,是不是就意味著這些翻譯者不用存在了,直接到美國(guó)的網(wǎng)站翻譯過(guò)來(lái)就可以了。
 
  許靜芳:翻譯并沒(méi)有跨過(guò)那道墻,還是要符合中國(guó)政策法規(guī)。
 
  王小川:舉兩個(gè)例子,用傳統(tǒng)的過(guò)濾方法或監(jiān)管方法,沒(méi)法處理的東西,沒(méi)法展現(xiàn)一個(gè)系統(tǒng),可以舉幾個(gè)例子。
 
  許靜芳:墻我們是幫你翻的,如果我們做的技術(shù)還有缺陷的地方,會(huì)發(fā)現(xiàn)這個(gè)結(jié)果在墻外依然是打不開(kāi)的,不會(huì)借助搜狗搜索就把通常不能打開(kāi)的打開(kāi)了。如果老有墻外的東西展現(xiàn)在搜索結(jié)果里,用戶又打不開(kāi),這個(gè)體驗(yàn)非常不好。我們做的工作分兩個(gè)方面,一是把墻外的結(jié)果去掉,不展現(xiàn)在結(jié)果了。所以,哪些結(jié)果在墻外,哪些結(jié)果在墻里,我們有很多服務(wù)器,機(jī)器可以幫你自動(dòng)探測(cè)哪些頁(yè)面可以打開(kāi),哪些頁(yè)面不能打開(kāi),不能打開(kāi)的在墻外在結(jié)果中直接給過(guò)濾掉。二是有少量能打開(kāi),但有一些敏感信息是不符合政策法規(guī)的。政府有指定的詞,不一定該讓中國(guó)網(wǎng)民搜到,但這種詞符合中國(guó)規(guī)定時(shí)都基本用的英文,我們上線時(shí)做了很多細(xì)致的工作,翻譯成拼音,翻譯成英文。翻譯成拼音時(shí)就可以有很多的技巧,比如一個(gè)人名,每一個(gè)字單獨(dú)有空格,怎么寫(xiě),姓和名哪個(gè)在前,有很多種寫(xiě)法,我們用能想到的各種情況去預(yù)防這件事情,包括搜索結(jié)果里敏感詞的翻譯,中文詞和英文詞匹配的方法,盡量把大家不應(yīng)該看的東西不在搜索結(jié)果里展示。
 
  記者:現(xiàn)在搜狗有知乎、微信以及海外垂直類產(chǎn)品,我們往往會(huì)把它當(dāng)成垂直類搜索平臺(tái),但在通用搜索這塊,是不是意味著我們不太做了,發(fā)搜狗力點(diǎn)沒(méi)有在通用搜索上?而是直接通用類型的垂直類搜索。
 
  王小川:可以理解為三點(diǎn):第一,用戶用垂直搜索時(shí),這種垂直搜索是最明顯產(chǎn)生區(qū)別的地方;第二,我們會(huì)把這種垂直的內(nèi)容也融合到網(wǎng)頁(yè)搜索里,讓搜索用戶更加方便,這像當(dāng)年百度做音樂(lè)mp3搜索,得到用戶的認(rèn)可。我們是做文本信息的,不管是醫(yī)療信息、還是知乎信息,還是海外信息,能更容易和網(wǎng)頁(yè)結(jié)合,能帶動(dòng)網(wǎng)頁(yè)搜索本身品質(zhì)的提升,網(wǎng)頁(yè)搜索也會(huì)帶來(lái)這種差異化;第三,我們專注在往問(wèn)答邁進(jìn),今天搜索引擎的使用方式是關(guān)鍵詞,給你10條結(jié)果。給關(guān)鍵詞最早不是網(wǎng)民的第一選擇,1999年,網(wǎng)民是愿意用句子的,比如“我長(zhǎng)的好看嗎?”這樣去搜索東西,但以前發(fā)現(xiàn)不靈,機(jī)器聽(tīng)不懂。所以,網(wǎng)民被培養(yǎng)著怎么琢磨用關(guān)鍵詞搜索,這是人適應(yīng)機(jī)器的過(guò)程。就像用鍵盤(pán)和鼠標(biāo),沒(méi)有自然的交互方式,人要學(xué)者用鍵盤(pán),打拼音,打五筆。今天大家用搜索的方式也是關(guān)鍵詞進(jìn)去,是被迫的,往下的方向是讓你用完整的句子來(lái)表達(dá)。
 
  接下來(lái)不管是手機(jī)場(chǎng)景還是更多IOT時(shí)代未來(lái)場(chǎng)景里,我們會(huì)恢復(fù)到更多用自然語(yǔ)言與機(jī)器溝通,做完整的提問(wèn),這需要我們用技術(shù)對(duì)用戶做更深層分析的,這個(gè)邏輯關(guān)系是怎樣的。這是四個(gè)垂直以外在研發(fā)里重點(diǎn)的工作,逐步還原,讓用戶的語(yǔ)言更加自然。
 
  Google之前提到,未來(lái)70%的query是用問(wèn)答,即給answer的方式,不是給你10條鏈接。這樣用戶會(huì)變得更加方便。這是我們研發(fā)的重點(diǎn),我們也投入蠻多的技術(shù)力量來(lái)做,也有很多家(公司)在做,我們應(yīng)該是最認(rèn)真的一家公司。今年在江蘇衛(wèi)視節(jié)目里有《最強(qiáng)大腦》和《一戰(zhàn)到底》,《最強(qiáng)大腦》相對(duì)火一點(diǎn),我們當(dāng)時(shí)做選擇。最后百度選擇的是《最強(qiáng)大腦》,里面演示的是聽(tīng)覺(jué)和視覺(jué)的識(shí)別,走向識(shí)別的功能;而我們選擇和《一戰(zhàn)到底》合作,走向問(wèn)答、是自然語(yǔ)言的處理,一年時(shí)間里有52期,一年中不斷升級(jí)。我們做的是搜索里的問(wèn)答系統(tǒng),里面有子集,這個(gè)子集產(chǎn)品會(huì)放到《一戰(zhàn)到底》里去做,會(huì)以問(wèn)答形式進(jìn)行。但帶動(dòng)我們?cè)趩?wèn)答里繼續(xù)往下進(jìn)行,所以,垂直引擎有用,垂直引擎可以放到網(wǎng)頁(yè)里用,同時(shí)我們自己也在升級(jí)。
 
  記者:百度現(xiàn)在也在做人工智能,但他們做的人工智能和搜狗做的不太一樣。搜狗是圍繞搜索去做,百度更多強(qiáng)調(diào)圖片,讓它承擔(dān)更多的功能。我比較感興趣的一點(diǎn),搜狗的唯一結(jié)果什么時(shí)候能夠出現(xiàn)?2017年,搜狗人工智能上都有哪些大的動(dòng)作?
 
  王小川:我希望,10%的搜索結(jié)果會(huì)直接給你一個(gè)搜索結(jié)果,我會(huì)給其他條目,但你只看一條就夠了,這種結(jié)果在比例上是不斷提升的,這是我們內(nèi)部的思考。你也看到大家人工智能選擇不一樣。我們不叫以搜索為核心,而是以自然語(yǔ)言處理和自然交互為核心,交互的目的是為了回到語(yǔ)言里,這是我們的選擇,而不是圖像和語(yǔ)音。戰(zhàn)略選擇確實(shí)有不同。但我認(rèn)為百度是沒(méi)戰(zhàn)略的公司。
 
  記者:剛才您提到汪仔,汪仔用到了哪些前沿的技術(shù),接下來(lái)和《一戰(zhàn)到底》還要進(jìn)行哪些內(nèi)容合作。剛才提到海外搜索英文資料,現(xiàn)在國(guó)外旅游的人比較多,有沒(méi)有用搜狗搜索和導(dǎo)航軟件結(jié)合的設(shè)想和海外應(yīng)用的設(shè)想。包括地圖,有時(shí)候在海外我看地圖也要看半天,這方面搜狗有沒(méi)有考慮?
 
  許靜芳:關(guān)于《一站到底》的問(wèn)題,大家看了節(jié)目以后,汪仔是對(duì)搜狗AI技術(shù)綜合的體現(xiàn),大的方面和公司本身的理念是非常一致的。兩方面,一是交互,也有很多資深的媒體人把汪仔,Watson當(dāng)時(shí)去參加《Jeopardy!》這樣的活動(dòng)去做對(duì)比。一個(gè)非常大不同是在交互上,《Jeopardy!》節(jié)目里是單獨(dú)給Watson一個(gè)輸入,是文字輸入,當(dāng)時(shí)Watson和人的輸入方式就不一樣。
 
  這次我們?nèi)⒓印兑粦?zhàn)到底》,機(jī)器狗汪仔靠什么?靠聽(tīng)靠看,和人一模一樣,非常自然的交互方式,通過(guò)語(yǔ)音識(shí)別,圖像識(shí)別,把搜到的信號(hào)轉(zhuǎn)換成文字,這就是知識(shí)計(jì)算,然后做問(wèn)答,交互層面上就會(huì)涉及到語(yǔ)言識(shí)別、圖像識(shí)別,從問(wèn)答變成文字以后涉及到搜索語(yǔ)義的理解,自然語(yǔ)言的理解,答案的抽取,語(yǔ)義的匹配,深度學(xué)習(xí)在文本上的應(yīng)用,在汪仔身上都有很具體的體現(xiàn)。
 
  剛剛說(shuō)大的層面是符合交互和計(jì)算方面的,如果要把《一戰(zhàn)到底》的汪仔和Watson去做對(duì)比有幾個(gè)方面:
 
  第一,語(yǔ)言。Watson當(dāng)時(shí)用的是英文,我們是用中文實(shí)現(xiàn)。做語(yǔ)言的理解,不同的語(yǔ)言有不同的文法、語(yǔ)法在里面,代表著完全不同的技術(shù)。
 
  第二,輸入方法。當(dāng)時(shí)大家看到Watson的軟件形象,顯示板上圖像,背后是單獨(dú)給他特殊的文本輸入,我們通過(guò)圖像識(shí)別、語(yǔ)音識(shí)別去做的。
 
  第三,比賽賽制題目設(shè)置也不太一樣,當(dāng)時(shí)沃森對(duì)每個(gè)問(wèn)題有明確的類,這個(gè)題目叫歷史題、娛樂(lè)題、科技題,類似大概有6個(gè)類別。其實(shí)問(wèn)題的類別在《一戰(zhàn)到底》時(shí)也是中間非常關(guān)鍵的環(huán)節(jié),但這不是《一戰(zhàn)到底》題目中明確指定的,而是靠機(jī)器分析這個(gè)問(wèn)題,文字里的語(yǔ)義代表的是,這個(gè)題目問(wèn)的是詩(shī)人還是國(guó)家,還是某一種植物,都是靠機(jī)器自動(dòng)分析出來(lái)。而Watson的設(shè)置題目本身就帶著內(nèi)容。
 
  第四,搶答的時(shí)機(jī)不一樣。當(dāng)時(shí)Watson有個(gè)規(guī)則,題目一定是說(shuō)完了才能答,雖然機(jī)器和選手之間也有誰(shuí)先搶到誰(shuí)答,也等問(wèn)題問(wèn)完了再答,看誰(shuí)快?!兑粦?zhàn)到底》里有個(gè)非常大的不同,只要主持人開(kāi)始念題,在任何時(shí)間點(diǎn)都可以去答,自己答對(duì)了可以加分,答錯(cuò)了對(duì)方加分。這代表高手可以預(yù)測(cè)題,只聽(tīng)題干一部分或一小部分就能推理出來(lái)你在問(wèn)什么然后我直接給答了。這個(gè)能力非常難。剛開(kāi)始我們研發(fā)時(shí),汪仔是不具備這個(gè)能力的,我們只能問(wèn)答,我們是給一個(gè)完整題目,怎么樣能夠答的題目越多,每一題答的盡量打得準(zhǔn),這是我們剛開(kāi)始研發(fā)的重心,等到后面準(zhǔn)確率和人類頂尖選手接近甚至超過(guò)他時(shí),整個(gè)搶答賽制里機(jī)器處于劣勢(shì),之后我們花很長(zhǎng)時(shí)間去做搶答。搶答有兩方面,一是速度上,爭(zhēng)分奪秒,我們幾毫秒地去摳,中間有語(yǔ)義識(shí)別,搜索、知識(shí)庫(kù)和檢索。
 
  整個(gè)過(guò)程中,剛開(kāi)始上來(lái)就是100毫秒、500毫秒,盡量比人搶得更快,每個(gè)模塊都從速度、效率上往極致走,每個(gè)模塊上速度到最后提升了好幾倍,但這不是最重要的環(huán)節(jié)。大家知道,人的語(yǔ)速是很快的,一秒鐘人就念了好幾個(gè)字,早5個(gè)字答,就能提前很多時(shí)間答題。所以,首先在速度上和人接近。另外,人的推理能力機(jī)器也需要有,機(jī)器也做到拿到不完整的,到目前為止所有的題目信息就是不完整的,機(jī)器首先要去預(yù)測(cè),完整的題目要問(wèn)什么,我們應(yīng)該怎么答,這塊花了非常多的時(shí)間,Watson完全不具備這樣的能力,當(dāng)時(shí)比賽的賽制就告訴你,讓你答才能答。
 
  我舉個(gè)例子,但是節(jié)目組拍了頂尖選手來(lái)做測(cè)試,像徐圣明到我們這里測(cè)試。機(jī)器出現(xiàn)一個(gè)問(wèn)題,一個(gè)題目說(shuō)《鹿鼎記》中哪一種毒藥?提到這個(gè)問(wèn)題的時(shí)候,人已經(jīng)答了,還沒(méi)問(wèn)完題呢。后來(lái)徐圣明說(shuō)鹿鼎記就哪一種藥,人會(huì)推理的。大布什、小布什的教育,大家知道要考慮是不是畢業(yè)于同一所學(xué)校?人會(huì)瞬間思能考的。機(jī)器聽(tīng)到大布什、小布什在琢磨問(wèn)學(xué)校的事兒就有一定的難度,搶答背后有對(duì)知識(shí)更復(fù)雜的理解,不像Google Instant Search說(shuō),幫你把后面的東西補(bǔ)完。搶答里會(huì)變得很難。另外一方面,我們?yōu)榱怂俣瓤欤€做了很多的工作,比如光纖,發(fā)現(xiàn)賽場(chǎng)里是沒(méi)有網(wǎng)絡(luò)的,我們拿4G網(wǎng)絡(luò)過(guò)去不夠,所以專門拉個(gè)光纖過(guò)去,就為了省時(shí)間。
 
  語(yǔ)言識(shí)別,以前語(yǔ)音識(shí)別,說(shuō)一句話,停了0.3秒,他認(rèn)為你已經(jīng)說(shuō)完了?,F(xiàn)在不是,要判斷什么時(shí)間他已經(jīng)說(shuō)完話的,把500毫秒、300毫秒變成50毫秒,這背后要做更多分析的工作。甚至當(dāng)你說(shuō)一半的時(shí)候要開(kāi)始計(jì)算,圖片、文字進(jìn)行到一半就做計(jì)算,而不是像原來(lái)那樣等結(jié)束說(shuō)話再做。Watson對(duì)于歷史題或人名,一旦限定子課題時(shí)叫封閉域,機(jī)器人會(huì)變得很多?,F(xiàn)在是屬于開(kāi)放域,雖然有大的框框,問(wèn)題在這個(gè)范圍里隨便問(wèn)的,機(jī)器的知識(shí)在里面越變?cè)酱?,越難確定。這是更難的事情。Waston做對(duì)比大家會(huì)更容易理解,汪仔背后是有綜合的技術(shù)挑戰(zhàn)。
 
  許靜芳:因?yàn)槲覀兏敿膺x手確實(shí)切磋過(guò)好幾次,拿這個(gè)測(cè)試數(shù)據(jù)來(lái)看,覺(jué)得蠻有意思的,我最近也認(rèn)真地把Watson當(dāng)時(shí)發(fā)表一些論文翻了一下,從測(cè)試結(jié)果來(lái)看,咱們《一站到底》的頂尖選手達(dá)到了當(dāng)時(shí)Watson的水平,但是我們機(jī)器狗汪仔比Watson要更好。所以說(shuō)我們會(huì)發(fā)現(xiàn)人過(guò)了幾年的以后水平?jīng)]有變化,美國(guó)的頂尖選手和中國(guó)頂尖選手具有相同的水平,不一樣的地方是,機(jī)器經(jīng)過(guò)幾年的技術(shù)發(fā)展已經(jīng)發(fā)生非常大的變化,機(jī)器在不斷地提升,人相比頂尖水平就比較固定了。
 
  王小川:大家可能都想看百度小度跟搜狗汪仔比幾場(chǎng),這是不可避免的事,這個(gè)場(chǎng)景也是挺好的。
 
  記者:去年花了1.8億投資了天工智能計(jì)算研究院,今年咱們還不會(huì)持續(xù)這么大的能力去投?
 
  王小川:1.8億是一次性的投入,但實(shí)驗(yàn)室會(huì)有一些額外的費(fèi)用產(chǎn)生,會(huì)小一些,不會(huì)這么顯著,但足夠使得我們聯(lián)合研究有這樣的成績(jī)。
 
  記者:和智能硬件的結(jié)合能說(shuō)一下嗎?
 
  王小川:智能硬件有三種場(chǎng)景,一種場(chǎng)景是客廳場(chǎng)景或家庭場(chǎng)景,一種是車載場(chǎng)景,一種是移動(dòng)場(chǎng)景,這三個(gè)場(chǎng)景里我們都有切入的方式,有的是自研,有的靠合作、合資,有的是提供API,讓別人來(lái)調(diào)用。這三種情況都會(huì)發(fā)生。
 
  記者:有更詳細(xì)的東西可以透露嗎?比如客廳具體和什么合作?因?yàn)榇蠹姨岬街悄苡布褪沁@三大場(chǎng)景。
 
  王小川:客廳場(chǎng)景方面我們?cè)谕顿Y里面已經(jīng)推動(dòng)了,跟國(guó)內(nèi)資源互補(bǔ)、優(yōu)勢(shì)互補(bǔ)的公司正在往前走。自研像我們之前有糖貓,比較早,我們有供應(yīng)鏈,有大量的銷售點(diǎn),內(nèi)部的管理團(tuán)隊(duì)也建起來(lái)了,不過(guò)它不是我心目中典型的智能硬件。我對(duì)智能硬件是希望它能做判斷,能夠像人做自然的交互和后面的知識(shí)計(jì)算,它的連接工具和糖貓本身是給沒(méi)手機(jī)的孩子用的,它相當(dāng)于一個(gè)試探的過(guò)程。今年我們會(huì)投入到智能硬件的自研。剛才我們講了三件事,問(wèn)答、對(duì)話、翻譯,是從這幾個(gè)場(chǎng)景切入的。
 
  記者:這次咱們財(cái)報(bào)使用人民幣單位,以前都是美元,什么原因?
 
  王小川:兩個(gè)原因,一是美元升值,人民幣貶值了,這時(shí)候再用美元計(jì)價(jià)大家容易產(chǎn)生誤導(dǎo),因?yàn)橹懊涝腿嗣駧胚€是相對(duì)比較穩(wěn)定的,最近這幾年有大的變動(dòng),我們用人民幣更能反映我們的競(jìng)爭(zhēng)力和變化。
 
  記者:我對(duì)比了去年的數(shù)據(jù),去年我們收入和盈利增長(zhǎng)差不多50%多,是因?yàn)樗压方衲曜隽撕艽蟮耐度雴幔?/div>
 
  王小川:兩個(gè)原因,一個(gè)是投入很大,另外,大家知道搜索從推廣改成廣告了,就是國(guó)家把搜索的收入性質(zhì)定義改了,改了之后,這個(gè)就嚴(yán)格了很多,還有稅收等,所以有一定的政策上的影響。
 
  記者:我們今年的投入、投資,包括在AI方面,包括明醫(yī)方面的投入會(huì)相對(duì)減少嗎?對(duì)下一個(gè)季度財(cái)報(bào)的預(yù)計(jì)會(huì)怎么樣?
 
  王小川:我們預(yù)計(jì)比2016年多。
 
  記者:這個(gè)問(wèn)題還是想問(wèn)您一個(gè)規(guī)劃,就是咱們之前的增長(zhǎng)速度非常快,但是不可能永遠(yuǎn)都是這么一個(gè)高速,因?yàn)樵贏I方面的投資會(huì)越來(lái)越大,不知道你有沒(méi)有什么計(jì)劃和節(jié)奏?
 
  王小川:我們收入本身的規(guī)??梢哉f(shuō)明問(wèn)題,利潤(rùn)不是關(guān)鍵的事兒,只要能做長(zhǎng)遠(yuǎn)投資,而不是計(jì)劃出來(lái)的,這只能當(dāng)成中間的一個(gè)結(jié)果。
 
  記者:去年和今年有一個(gè)特別大的不同,就是去年,您最開(kāi)始做財(cái)報(bào)講解時(shí),提到了很多新的概念和思路,但是今年我感覺(jué)把那些思路逐步地變現(xiàn),一步步地落地,把一些功能再升級(jí)的過(guò)程,今年有沒(méi)有特別大的爆炸性的、突破性的想法?
 
  王小川:我們開(kāi)始在努力提硬件這個(gè)詞,還想多爆炸呢?
 
  記者:?jiǎn)栆幌翧I這個(gè)事,我記得大概是您說(shuō)2015年AI其實(shí)沒(méi)有什么突破,到了2016年,AI是有一點(diǎn)遇挫,您到海外跟AlphaGo團(tuán)隊(duì)做交流,聊第四盤(pán)棋是怎么回事,聊深度學(xué)習(xí),深度學(xué)習(xí)遇到什么瓶頸?您怎么看待AI這件事?其實(shí)咱們跟大的AI趨勢(shì)有一些不一樣,大的方向是說(shuō)AI有一點(diǎn)遇挫,但是今年搜狗在AI方面對(duì)外宣講、產(chǎn)品研發(fā)和推廣都會(huì)更高調(diào)一些。
 
  王小川:最開(kāi)始在AI方面談AlphaGo的時(shí)候大家都是比較悲觀的,不管是傳統(tǒng)媒體人還是IT界的人都說(shuō)AlphaGo不行時(shí),我說(shuō)AlphaGo能行,還寫(xiě)在知乎上。后來(lái)AlphaGo贏了,大家就開(kāi)始過(guò)于高調(diào)了,覺(jué)得這個(gè)機(jī)器可能馬上把人都干掉了,講了深度學(xué)習(xí)要統(tǒng)治世界等等,當(dāng)時(shí)我們內(nèi)部還在不斷往前走,但是對(duì)外我們會(huì)負(fù)責(zé)任地去發(fā)聲,我說(shuō)深度學(xué)習(xí)就有一個(gè)瓶頸的,不要把它想的什么都能干,即便做無(wú)人駕駛都沒(méi)到那么靠譜的階段,而且機(jī)器現(xiàn)在對(duì)語(yǔ)言的處理能力很弱。
 
  那時(shí)候行業(yè)投資很瘋狂,大家會(huì)幻想,投資人會(huì)有一種情結(jié),看不懂的東西就覺(jué)得特別美。創(chuàng)業(yè)者本來(lái)就很瘋狂,在投資方的推動(dòng)下,最后想出的事兒可能和現(xiàn)實(shí)就有差距。比如做圖像的一些公司,很多公司都在虧損,最后都賣掉。在這里面,大家對(duì)技術(shù)的可行性和商業(yè)模式?jīng)]有深度思考。深度學(xué)習(xí)有很多瓶頸,即便能做事情也要分(著看),如果只做識(shí)別、合成、生成,可能商業(yè)價(jià)值是小的。機(jī)器用來(lái)做判斷,making decision這個(gè)事情才有很大的意義。在商業(yè)價(jià)值里面我們可以想,這個(gè)事(做判斷)才是有意義的,確實(shí)有些“坑”大家都進(jìn)去,但最后技術(shù)做不到或技術(shù)做到了但沒(méi)有商業(yè)上的應(yīng)用場(chǎng)景或商業(yè)上的收入。
 
  現(xiàn)在為止,我發(fā)現(xiàn)行業(yè)中一部分的東西過(guò)于低迷,覺(jué)得這個(gè)東西不行或者(泡沫破滅)。但是我們知道,當(dāng)機(jī)器開(kāi)始能做判斷的時(shí)候,本身能夠產(chǎn)生商業(yè)智慧,它有服務(wù)上的價(jià)值和變現(xiàn)能力的,而做合成、生成和識(shí)別,是能改進(jìn)交互的,而改進(jìn)交互最受益的公司就是搜索類公司。所以,搜索類公司在AI行業(yè)里是受益的,而且就用它提高自然交互和知識(shí)計(jì)算,那相對(duì)是穩(wěn)健的。
 
  記者:所以你會(huì)敲敲代碼來(lái)感受一下嗎?
 
  王小川:我會(huì)試一下,至少我會(huì)知道,包括并行度上機(jī)器多了并行到底能不能實(shí)現(xiàn),新的算法里面怎么用,這些都是能和團(tuán)隊(duì)進(jìn)行討論的。我們是真正知道,已經(jīng)不恐懼,不會(huì)從恐懼轉(zhuǎn)化為幻想,我們沒(méi)有這種幻想。所以,我們可以平穩(wěn)地往前走。我們公司基因里,是一步一步開(kāi)始去做的。搜狗目前盈利了,到了一個(gè)規(guī)模盈利的狀態(tài)。所以,其實(shí)我們有一種天生的東西,叫避免不靠譜的事情發(fā)生,如果技術(shù)上走錯(cuò)路是非??尚Φ囊患?。
 
  記者:就是技術(shù)上走通的可能性還是有的?
 
  王小川:你會(huì)覺(jué)得有這種可能性,但是我們會(huì)小,有的公司就會(huì)大,對(duì)戰(zhàn)略不了解的公司。
 
  記者:去年,我問(wèn)您對(duì)搜索整個(gè)未來(lái)的格局是怎么看的,當(dāng)時(shí)您大概提了兩個(gè)關(guān)鍵詞:?jiǎn)柎鸷头?wù)。今年過(guò)去一整年了,而且今年咱們很多東西落地了,您認(rèn)為對(duì)未來(lái)的格局有沒(méi)有更細(xì)化或有一些差異、變化的地方?;蛘呶磥?lái)在那些關(guān)鍵的時(shí)間點(diǎn)是不是能看得更清楚一點(diǎn)。
 
  王小川:?jiǎn)柎鹗且粋€(gè)漸變的過(guò)程,所以我們今年說(shuō)10%的搜索能夠走問(wèn)答,它不能做到在短期里面突然就把這個(gè)事情顛覆了,我們只能說(shuō)是慢慢地成長(zhǎng)。它的好處在于,它可以使得你公司本身有一塊收入或者利潤(rùn)支持你良性發(fā)展,讓你有機(jī)會(huì),有更多的時(shí)間向未來(lái)布局,這是我們現(xiàn)在一個(gè)好的狀態(tài)。
 
  但如果假設(shè)搜索引擎做到頂了,收入往下掉,你可能著急要趕緊找個(gè)大數(shù)來(lái)填它,這種壓力在戰(zhàn)略上可能會(huì)帶來(lái)很大的困難?,F(xiàn)在搜狗在AI技術(shù)能力里面,在綜合的掌握里也是最TOP的公司之一。在產(chǎn)品上,我們有自己產(chǎn)品的積累,包括硬件上,我們比其它公司更有能力去在未來(lái)布局,或者在路線里面走穩(wěn),因?yàn)锳I不是一個(gè)創(chuàng)業(yè)公司、小公司就能玩得動(dòng)的東西。需要數(shù)據(jù)和大量研發(fā)投入。搜索再往前走,但我們公司已經(jīng)開(kāi)始對(duì)未來(lái)進(jìn)行投資。
 
  記者:搜索這塊咱們排名很清晰的,在AI這塊我們給自己怎么排名的?
 
  王小川:搜索排名第二,這很清楚。AI方面,如果非要讓我數(shù),我覺(jué)得我們應(yīng)該在前三的位置。
 
  記者:您覺(jué)得現(xiàn)在汪仔,您所說(shuō)的NLU自然語(yǔ)言的理解,你覺(jué)得它達(dá)到你想象的程度了嗎?汪仔在整個(gè)搜索里的角色是什么?它只是展示品還是最后成為產(chǎn)品?就是汪仔過(guò)了《一站到底》之后,它的走向會(huì)是什么?
 
  許靜芳:我認(rèn)為,通用NLU沒(méi)有達(dá)到,或者現(xiàn)在也沒(méi)有系統(tǒng)能夠達(dá)到。如果我們聚焦在《一站到底》這樣的特定設(shè)計(jì)下,它是足夠好,不管是它回答的準(zhǔn)確度,還是它回答的問(wèn)題,它回答的時(shí)間點(diǎn)已經(jīng)足夠靠前,在這樣的設(shè)計(jì)下面談已經(jīng)不錯(cuò)了。
 
  《一站到底》在公司是個(gè)什么樣的地位?其實(shí)我們是先做問(wèn)答然后才有《一站到底》,《一站到底》其實(shí)是問(wèn)答里非常特殊甚至相對(duì)偏簡(jiǎn)單的類別,它就問(wèn)的是實(shí)體,所有的答案都是實(shí)體的一種。但是回到搜索每天面對(duì)的問(wèn)答,有問(wèn)實(shí)體的,也有問(wèn)經(jīng)驗(yàn)型的,比如“我怎么燒紅燒肉”,也有原因這種“天空為什么是藍(lán)的?”也有“范冰冰漂亮還是李冰冰漂亮”這種比較型的,或者“孕婦能不能吃螃蟹”,其實(shí)問(wèn)答有很多種類別,實(shí)體是其中一種相對(duì)比較特殊的類別,在實(shí)體類別里我們把關(guān)于實(shí)體型問(wèn)答應(yīng)用到《一站到底》這個(gè)特殊環(huán)境里。當(dāng)然,為了參加比賽取得成績(jī),打敗人,那又對(duì)《一站到底》做了很多特殊的優(yōu)化。所以,問(wèn)答是我們未來(lái)發(fā)展的方向,《一站到底》是我們展示和挑戰(zhàn)自己的一個(gè)平臺(tái)。
 
  記者:你覺(jué)得汪仔好看嗎?
 
  王小川:汪仔代表的是一個(gè)形象,不管是虛擬的形象,還是對(duì)問(wèn)答對(duì)技術(shù)形象的展示,這就是在整個(gè)大局里面的一種位置。往下它也會(huì)更加聰明,能力也會(huì)有人用,不限于這個(gè)事情,這是好的積累,但是能不能把它變成智能硬件類的玩具是需要論證的。
 
  記者:今天聽(tīng)您提到硬件這個(gè)詞頻率還蠻高的。我記得三年前智能手機(jī)非常好的時(shí)候已經(jīng)有人提出,智能硬件未來(lái)是取代iPhone的趨勢(shì),從最近一兩年來(lái),有越來(lái)越多唱衰它的聲音,所以想問(wèn)下您,為什么會(huì)在現(xiàn)在來(lái)提這個(gè)詞。
 
  王小川:好像其他幾年我一直唱衰硬件,那時(shí)候硬件特別火,因?yàn)榇_實(shí)死了一堆公司。硬件為核心的時(shí)候是資本驅(qū)動(dòng)的,是用到一個(gè)概念里去,為了硬件而硬件。如果做個(gè)體重秤踩一腳就能夠輕一兩肉,賣8000元也有人買。回到智能硬件的意義里面去,比如做智能插座我覺(jué)得不是個(gè)關(guān)鍵的問(wèn)題,是資本推動(dòng)的?,F(xiàn)在智能硬件核心的東西,是把自然交互和做判斷的能力放進(jìn)去,機(jī)器在里面能做交互和判斷。微軟的手表一直賣得不太好,因?yàn)樗聊恍。锩鍭I不夠聰明沒(méi)有辦法取代手機(jī)。比如天氣預(yù)報(bào),手機(jī)上可以顯示出今天明天后天、刮風(fēng)、下雨、PM2.5指數(shù)。手表上信息量是不夠的,如果它不夠聰明,不知道你要什么。當(dāng)然現(xiàn)在沒(méi)法排這么多,因?yàn)椴粚?shí)用。如果AI足夠好了,“你問(wèn)他明天要不要洗車嗎?”它會(huì)給你一個(gè)答復(fù),這個(gè)時(shí)候智能硬件足夠聰明,交互足夠簡(jiǎn)單,就能跑起來(lái)了,智能硬件要看交互能力和判斷能力是否夠強(qiáng),以這個(gè)少屏幕甚至沒(méi)有屏幕的方式就能夠做這樣的承載,否則就沒(méi)有這個(gè)智能硬件的意義。一個(gè)新硬件做成必須讓比手機(jī)更便捷,讓它在數(shù)據(jù)處理能力上更強(qiáng)才行。以前智能硬件數(shù)據(jù)處理能力也沒(méi)更強(qiáng),也沒(méi)法更便攜,那就是為硬件而硬件的事情。
 
  記者:剛才您說(shuō)在智能硬件上會(huì)找合作伙伴,這個(gè)事情也在推進(jìn)當(dāng)中。您要找合作伙伴的話,標(biāo)準(zhǔn)是什么?
 
  王小川:在硬件領(lǐng)域里,第一,是很有靈性的市場(chǎng)敏感度,把智能硬件做好,我開(kāi)放能力給你,開(kāi)放API給你,你在里面跑硬件,以合作伙伴為主。第二,對(duì)方有平臺(tái)級(jí)的能力,有大規(guī)模開(kāi)模、建模、設(shè)計(jì)能力、供應(yīng)鏈管理能力,它也有戰(zhàn)略的意義在,我們可以用一種合資的模式去進(jìn)行,當(dāng)然也會(huì)對(duì)它開(kāi)放能力。第三,就是偏向于我們自己的能力,比如翻譯,也有可能自己就干了。
 
  記者:您提到國(guó)家廣告法的調(diào)整,對(duì)搜狗有一定的影響。過(guò)去來(lái)看,這個(gè)影響的幅度或規(guī)模大概在什么樣的區(qū)間?
 
  王小川:舉個(gè)例子,廣告法就是收入里面減3%的稅,利潤(rùn)里就更多了,比如有的是20%,那就是減掉3/20,就可能15%的利潤(rùn)就沒(méi)了,在利潤(rùn)中會(huì)放大的。還有廣告知識(shí)的監(jiān)管和行業(yè)的限制,有的行業(yè)就不讓你投廣告了,我不是指醫(yī)療,其他行業(yè)都開(kāi)始限制。
 
  記者:您剛才說(shuō)糖貓,2015年、2016年還是挺火的,后來(lái)覺(jué)得它不是你理想中的智能硬件,去年的聲音很小。但我看360推它的兒童手表還是挺火的。
 
  王小川:糖貓從戰(zhàn)略意義上來(lái)說(shuō)對(duì)我們是入門,我們通過(guò)智能硬件建立了分銷渠道和供應(yīng)鏈管理。更多為了我們跟這些設(shè)備公司對(duì)話的時(shí)候不外行,我們達(dá)到了這樣的目的,之后我們往下AI多走一走,這股力量就會(huì)跟上。糖貓我們會(huì)做好,這是我們硬件戰(zhàn)略中間的一部分。糖貓做的好不好,和搜狗并沒(méi)有直接的干系。
 
  記者:百度也在做自動(dòng)駕駛的東西,車載畢竟是比較好的場(chǎng)景,您有什么樣的考慮?
 
  王小川:無(wú)人駕駛有兩個(gè)事,一個(gè)是無(wú)人駕駛里的輔助系統(tǒng)、導(dǎo)航系統(tǒng),這個(gè)事情是有意義的;但開(kāi)車目前還無(wú)法完全實(shí)現(xiàn)。
 
  記者:我們?cè)谲囕d這塊合作是不是B端的合作,與汽車廠商進(jìn)行合作?
 
  王小川:會(huì)在里面做一些東西,但不是無(wú)人駕駛這個(gè)事情,開(kāi)車這事兒不是搜索公司該干的。
 
  記者:聚焦在語(yǔ)言導(dǎo)航是嗎?
 
  王小川:對(duì),自然交互和實(shí)時(shí)計(jì)算,導(dǎo)航在這個(gè)范圍里。
 
  記者:搜索引擎,我看您對(duì)它核心競(jìng)爭(zhēng)力的描述,一是自然語(yǔ)言的交互,二是知識(shí)計(jì)算,因?yàn)榍皟赡晡铱吹剿压吠顿Y了知乎。今天聽(tīng)您說(shuō)會(huì)在醫(yī)療和海外方面,其實(shí)這都是一個(gè)知識(shí)的體系。為什么不是信息,而是做知識(shí)方面的東西。
 
  王小川:語(yǔ)言是一種載體,像我們搜圖片的時(shí)候,只關(guān)注圖片周邊的文字其實(shí)沒(méi)有理解圖片本身。這種載體要往人工智能做更深是需要對(duì)信息的內(nèi)容有更多的理解,如果文字或叫Language這個(gè)詞比較淺層,要挖Language背后的東西叫knowledge,背后的信息在這兒,叫知識(shí)。
 
  記者:今年跟知乎有沒(méi)有比較大的合作?
 
  王小川:知乎在搜狗投資之后,搜索已經(jīng)漲了6倍,流量也漲了很多,在我們看來(lái),這個(gè)合作是在穩(wěn)健的模式里,知乎成長(zhǎng)得特別快。
 
  記者:今年跟他們高管團(tuán)隊(duì)有沒(méi)有做一些比較大的溝通?
 
  王小川:喝酒算嗎?
 
  記者:還是談?wù)?jīng)業(yè)務(wù)的事吧。
 
  王小川:我們?cè)黾恿送顿Y額,提升在知乎的投資額。
 
  記者:小度在《最強(qiáng)大腦》上所完成的項(xiàng)目汪仔也能完成嗎?這兩個(gè)產(chǎn)品在您看來(lái),它體現(xiàn)的兩個(gè)公司,比如在人工智能的技術(shù)和產(chǎn)品路線上有什么不同?現(xiàn)在做汪仔,是不是意味著搜狗下一步在人工智能繼續(xù)在商用上做的是家用機(jī)器人或者教學(xué)類機(jī)器人?
 
  王小川:我沒(méi)有表達(dá)要做家用機(jī)器人或者教育機(jī)器人,只是說(shuō)我們要做智能硬件。從能力上講,雙方的不同點(diǎn),我們強(qiáng)調(diào)的是語(yǔ)言,即便我們有圖像和聲音,但是更多回到語(yǔ)言上,而小度的研發(fā)是圖像識(shí)別方面。
 
  記者:語(yǔ)音這塊百度也在做。
 
  王小川:語(yǔ)音大家都做,但是語(yǔ)音的品質(zhì)我們是最好的,語(yǔ)料規(guī)模我們也是最大的。
 
  記者:其實(shí)去年注意到咱們有很多的場(chǎng)景,尤其輸入法,O2O也在里面,這里面會(huì)不會(huì)衍生出一些新的商業(yè)模式,您的摸索上有沒(méi)有一些經(jīng)驗(yàn)和試錯(cuò)?各個(gè)AI平臺(tái)都在努力爭(zhēng)取跟廠商合作,包括訊飛主要是偏B端的。你們會(huì)著力于哪些點(diǎn)去吸引它?現(xiàn)在各家都會(huì)在垂直領(lǐng)域突破,訊飛是教育,我們側(cè)重于醫(yī)療,所以在這個(gè)垂直領(lǐng)域上,你們以什么路徑實(shí)現(xiàn)?去年AI開(kāi)始在中國(guó)大熱,人才薪水也不斷提高,有的人才成本占50%都有,您怎么看這個(gè)問(wèn)題?搜狗在人才積累上有什么樣的做法?
 
  王小川:第一個(gè)問(wèn)題,輸入法一直在試探的地方是從工具到服務(wù),已經(jīng)有一些變化在做了,像輸入法有花鍵,點(diǎn)了觸碰,幫你找圖片,幫你做翻譯,幫你做音樂(lè)的分享,從聯(lián)想的分享里我們做嘗試,我們大的邏輯是從工具變成幫用戶做選擇的事情,沒(méi)有變過(guò),產(chǎn)品上也在做升級(jí),對(duì)于新產(chǎn)品是可以期待的。
 
  記者:盈利模式上會(huì)有一些推進(jìn)嗎?
 
  王小川:現(xiàn)在我們主要產(chǎn)品上能夠接受,只要能夠被接受,能夠幫用戶做選擇,就能夠有商業(yè)模式,用戶端上用戶也會(huì)感興趣。
 
  關(guān)于AI廠商的優(yōu)勢(shì),比如我們做導(dǎo)航,不僅有語(yǔ)音識(shí)別、語(yǔ)音合成,還有自然交互對(duì)話系統(tǒng),背后其實(shí)有更多的知識(shí),比如搜狗有地圖,在產(chǎn)品里如果不把地圖的能力穿透,最后你分成兩個(gè)公司做的效果不好。我們有服務(wù)的能力,比如去機(jī)場(chǎng),問(wèn)你航班號(hào),你知道飛機(jī)什么時(shí)候起飛,可以把這種能力帶到對(duì)話或用戶交互里,知乎做語(yǔ)音、自然語(yǔ)言,做不到這個(gè)事情的,這就是服務(wù)能力跟著一塊就出去了。是這樣的區(qū)別,搜狗2C里面積累了大量對(duì)用戶服務(wù)能力。
 
  垂直領(lǐng)域里面,做醫(yī)療,我本身沒(méi)有把它當(dāng)成是新的業(yè)務(wù)來(lái)看,我認(rèn)為,它是搜索下的一個(gè)延展,訊飛做教育是行業(yè)開(kāi)拓,和我們的性質(zhì)不太一樣,不是想不斷到不同的行業(yè)里去,我們還是想在信息獲取、信息表達(dá)、自然語(yǔ)言交互里做,這方面我們更聚焦的。但我們可以輸出能力,教育機(jī)構(gòu)要用這個(gè)能力的我們會(huì)輸送給別人去干,我們并不求在這里面占據(jù)多大的市場(chǎng)份額或規(guī)模性的收入利潤(rùn)。
 
  關(guān)于AI人才,需要我們更多的投入,搜狗今天的狀態(tài),這個(gè)公司大概也有兩千多人,算上兼職學(xué)生加起來(lái)也有小三千人,當(dāng)然這里面我們自己培養(yǎng)的人會(huì)非常多。我們?nèi)フ腥耍?0個(gè)人進(jìn)來(lái),就是10/3000,和創(chuàng)業(yè)公司相比起來(lái)已經(jīng)沒(méi)有不是什么大的壓力。
 
 
 
更多>相關(guān)資訊
0相關(guān)評(píng)論

推薦圖文
推薦資訊
點(diǎn)擊排行