今天,第四范式發(fā)布了一款人工智能開發(fā)平臺(tái)“先知”,這是AI領(lǐng)域首個(gè)面向開發(fā)者的開發(fā)平臺(tái)。第四范式對(duì)先知設(shè)置了參數(shù)自動(dòng)化的算法,并搭建了比Spark快數(shù)百倍的機(jī)器學(xué)習(xí)的基礎(chǔ)架構(gòu),它降低了人工參與的特征工程和模型訓(xùn)練過(guò)程,還能提供自動(dòng)或半自動(dòng)的特征工程、模型選擇調(diào)參工具,降低了對(duì)數(shù)據(jù)科學(xué)家的依賴。
先知面向?qū)嶋H問(wèn)題能提供更好的應(yīng)用型解決方案,從業(yè)人員利用這個(gè)平臺(tái),1-2個(gè)月就能成為數(shù)據(jù)科學(xué)家。創(chuàng)始人戴文淵因此開玩笑說(shuō):“我們的愿景就是讓我們自己的科學(xué)家失業(yè)。”
第四范式號(hào)召“AI for everyone”,想要打破AI小圈子的限制。戴文淵說(shuō):“我們不是要成立一個(gè)小圈子,我們這些人在這個(gè)小圈子里面玩AI,而是我們要讓AI的門檻降低,讓每個(gè)人都能夠參與進(jìn)來(lái)。”而第四范式首席科學(xué)家楊強(qiáng)也把““規(guī)避人工智能被某些集團(tuán)壟斷、引導(dǎo)人工智能走向大眾”當(dāng)成自己作為一個(gè)科學(xué)家的使命。
在今天的發(fā)布會(huì)上,第四范式請(qǐng)來(lái)了創(chuàng)新工場(chǎng)創(chuàng)始人李開復(fù)、第一財(cái)經(jīng)首席執(zhí)行官周健工,紅杉資本創(chuàng)始合伙人沈南鵬因?yàn)閻毫犹鞖獾⒄`了航班,但也在發(fā)布會(huì)進(jìn)行到一半時(shí)趕到了會(huì)場(chǎng),每個(gè)嘉賓都有備而來(lái),各自做了主題演講。加上戴文淵和楊強(qiáng)兩人,這次發(fā)布會(huì)的規(guī)格撐得起四分之一場(chǎng)人工智能峰會(huì)了。

發(fā)布會(huì)結(jié)束后,記者和第四范式首席科學(xué)家楊強(qiáng)教授聊了更多關(guān)于“先知”和遷移學(xué)習(xí)的問(wèn)題。楊強(qiáng)教授是香港科技大學(xué)計(jì)算機(jī)與工程系主任,首位美國(guó)人工智能協(xié)會(huì)(AAAI)華人Fellow,唯一AAAI華人Councilor, 國(guó)際頂級(jí)學(xué)術(shù)會(huì)議KDD、IJCAI等大會(huì)主席,曾創(chuàng)建華為諾亞方舟實(shí)驗(yàn)室并任主任科學(xué)家。
記者:楊教授你說(shuō)數(shù)據(jù)是資本是石油,有數(shù)據(jù)的人能提供越來(lái)越多的服務(wù),這句話是不是意味著在AI領(lǐng)域平臺(tái)性的公司還是留給大公司?
楊強(qiáng):其實(shí)任何成功的人工智能應(yīng)用離不開自學(xué)習(xí),有足夠多的數(shù)據(jù)、有足夠多的需求、龐大的計(jì)算資源,同時(shí)要有頂尖的數(shù)據(jù)科學(xué)家來(lái)建立系統(tǒng),這些都是必要條件,是必不可少的。如果我們這樣走下去,沒(méi)有任何新的措施、技術(shù)和平臺(tái),我們就會(huì)看到富人越來(lái)越富。富是什么意思?科學(xué)家越來(lái)越多;像現(xiàn)在大學(xué)教授不斷地辭職去哪里?去Google;數(shù)據(jù)也不斷地積累,積累到哪里?Google、百度;就形成了這樣“富者愈富”的局面。
現(xiàn)階段是這樣的,因?yàn)橹挥写蠊静庞心芰κ占@些數(shù)據(jù),而且這個(gè)現(xiàn)象會(huì)越來(lái)越嚴(yán)重。他有能力收數(shù)據(jù),他的數(shù)據(jù)越來(lái)越多,他通過(guò)數(shù)據(jù)又可以產(chǎn)生新的服務(wù),反過(guò)來(lái)這些數(shù)據(jù)又可以吸引更多的數(shù)據(jù),所以雪球越滾越大,這不是很健康的事情。我們也想突破這一點(diǎn),使得那些不是大公司的、沒(méi)有具有那么大的財(cái)力的公司也可以享受到人工智能的益處,這個(gè)我們叫AI for someone,對(duì)某些人來(lái)說(shuō)AI是可以產(chǎn)生盈利的,這個(gè)比以前的AI for no one還是有進(jìn)步的,我們的理念是AI for everyone。
記者:這個(gè)領(lǐng)域有希望出現(xiàn)獨(dú)角獸么?
楊強(qiáng):我覺(jué)得獨(dú)角獸基本已經(jīng)出現(xiàn)了,下面要看獨(dú)角獸是不是會(huì)持續(xù)出現(xiàn),比如說(shuō)Google就是一家獨(dú)角獸,因?yàn)樗阉鞅旧砭褪谴髷?shù)據(jù)和人工智能的結(jié)合,包括Google現(xiàn)在眾多的產(chǎn)品都是大數(shù)據(jù)在驅(qū)動(dòng)的,另外我們看到的滴滴打車也是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的公司,因?yàn)橹挥袛?shù)據(jù)他們才能更好地協(xié)調(diào)和調(diào)度。像阿里巴巴也是一個(gè)人工智能的獨(dú)角獸公司,因?yàn)樗抢昧舜罅康碾娚虜?shù)據(jù)去做更好的推薦平臺(tái)和運(yùn)輸平臺(tái)。這樣的話它的服務(wù)就會(huì)越來(lái)越好,越來(lái)越有效率。
記者:剛剛在臺(tái)上戴總提到深度學(xué)習(xí)現(xiàn)在存在一些局限,局限表現(xiàn)在什么地方?
楊強(qiáng):說(shuō)深度學(xué)習(xí)有一些局限這個(gè)觀點(diǎn)是成立的。它的局限來(lái)自于幾個(gè)方面,因?yàn)橐粋€(gè)模型畢竟是一個(gè)現(xiàn)實(shí)的反映,等于是現(xiàn)實(shí)的鏡像,它能夠描述現(xiàn)實(shí)的能力越強(qiáng)就越準(zhǔn)確。但是我們看到深度學(xué)習(xí)有一個(gè)限制,因?yàn)闄C(jī)器學(xué)習(xí)都是用變量來(lái)描述世界的,深度學(xué)習(xí)能handle的變量數(shù)是有限的,深度也是有限的,另外它對(duì)數(shù)據(jù)的需求量隨著模型的增大而增大,我們現(xiàn)實(shí)中有那么大、那么質(zhì)量高的數(shù)據(jù)的情況還不多。實(shí)際上一方面是數(shù)據(jù)量,一方面是數(shù)據(jù)里面的變量,深度學(xué)習(xí)來(lái)描述數(shù)據(jù)的復(fù)雜度還不夠復(fù)雜,所以這方面還是有局限性的。
記者:但深度學(xué)習(xí)它是不是目前最好的機(jī)器學(xué)習(xí)的方法?
楊強(qiáng):應(yīng)該說(shuō)目前對(duì)某些問(wèn)題是最好的,比方說(shuō)人臉識(shí)別、語(yǔ)音識(shí)別,但是對(duì)其他的問(wèn)題并不是最好的,比方說(shuō)對(duì)于有延遲的反饋,比如機(jī)器人的行動(dòng)。AlphaGo下圍棋也不是深度學(xué)期包打所有的,它還有強(qiáng)化學(xué)習(xí)的一部分,反饋是直到最后那一步才知道你的輸贏。還有很多其他的學(xué)習(xí)任務(wù)都不一定是深度學(xué)習(xí)才能來(lái)完成的。
記者:就現(xiàn)在的數(shù)據(jù)分析的水平,能不能準(zhǔn)確地預(yù)測(cè)出世界杯或者是歐洲杯的結(jié)果?我之前看到有團(tuán)隊(duì)預(yù)測(cè)歐洲杯結(jié)果,覺(jué)得似乎缺了一些科學(xué)性。
楊強(qiáng):如果這些球員還有他們的對(duì)手還有裁判已經(jīng)掌握了大量的數(shù)據(jù)的話,還是可以預(yù)測(cè)的,但是對(duì)于每一個(gè)球隊(duì)來(lái)說(shuō)我們掌握的數(shù)據(jù)還是比較少的,我們只能做一些推測(cè)比如說(shuō)和巴西隊(duì)很相近的是阿根廷隊(duì),跟德國(guó)隊(duì)很接近的可能是荷蘭隊(duì),這種推測(cè)本身可能就有不準(zhǔn)的地方。再乘以十幾年的數(shù)據(jù)積累,可能十幾年前的德國(guó)隊(duì)和現(xiàn)在的德國(guó)隊(duì)也有大的不同,另外他們遇到不同的裁判和教練,也許他們的表現(xiàn)就不一樣了,所以你說(shuō)的科學(xué)性不夠還是因?yàn)閿?shù)據(jù)不夠的原因。
記者:您剛剛在臺(tái)上也對(duì)無(wú)監(jiān)督學(xué)習(xí)做了一個(gè)判斷,現(xiàn)在有很多的科學(xué)家在致力于做這方面的研究,你說(shuō)實(shí)際上有成功案例的不太多?
楊強(qiáng):無(wú)監(jiān)督學(xué)習(xí)應(yīng)該說(shuō)是在學(xué)術(shù)界很高的目標(biāo),但是在工業(yè)界成功的案例還不多,可是在工業(yè)界不多并不表明在學(xué)術(shù)界不應(yīng)該做,相反學(xué)術(shù)界正應(yīng)該去做,攻工業(yè)界沒(méi)有做的東西。但現(xiàn)階段來(lái)說(shuō),我們?cè)诤芏嗟纳疃葘W(xué)習(xí)的領(lǐng)域還是有監(jiān)督的情況下任務(wù)完成得就好很多,無(wú)監(jiān)督的成功的案例還是比較少的。
記者:我知道您在做讓AI有情緒的研究,您介紹一下您的研究進(jìn)展么?
楊強(qiáng):我們現(xiàn)在跟人機(jī)交互的一些教授,我們那邊有一個(gè)人機(jī)交互的實(shí)驗(yàn)室,有一些教授在研究說(shuō)怎么樣去識(shí)別人的情緒,比如說(shuō)通過(guò)計(jì)算機(jī)圖像、語(yǔ)音和人的姿態(tài)可以識(shí)別這個(gè)人是高興還是累了還是厭倦了,同時(shí)也可以通過(guò)規(guī)則和機(jī)器學(xué)習(xí)的方法讓機(jī)器人針對(duì)人的感情疏解他的煩惱,或者是增強(qiáng)他的快樂(lè),我們?cè)谧鲞@些方面的研究,然后應(yīng)用在機(jī)器人尤其是對(duì)話系統(tǒng)上。
記者:其實(shí)AI本身是不可能具備情感的是么?
楊強(qiáng):對(duì),它本身是沒(méi)有情感的,它的情感是我們?nèi)嗽O(shè)計(jì)進(jìn)去的,所以在別人看來(lái)它好象有情感,可是我們?cè)O(shè)計(jì)者只有它是沒(méi)有的,我們是自己一個(gè)數(shù)學(xué)公式放進(jìn)去的。
記者:這個(gè)情感識(shí)別技術(shù)現(xiàn)在成熟么?
楊強(qiáng):我覺(jué)得這個(gè)還不夠成熟,是因?yàn)檫@方面的數(shù)據(jù)收集不夠多,可能有一些小的例子,在這些例子上成功地展示有情緒、有情感的機(jī)器人,但是通用的我覺(jué)得我們還有待時(shí)日來(lái)收集這些數(shù)據(jù)。
記者:關(guān)于知識(shí)遷移我在網(wǎng)上找到的信息不大多,應(yīng)該是英文的資料比較多一些,(非專業(yè)的人理解起來(lái)有些困難),您能簡(jiǎn)單介紹一下它主要是解決哪些問(wèn)題的么?
楊強(qiáng):它主要解決兩個(gè)問(wèn)題,比方說(shuō)我們新開一個(gè)網(wǎng)店,我們賣一種新的糕點(diǎn),可能我們沒(méi)有任何的數(shù)據(jù),這樣的話我們就沒(méi)有辦法對(duì)用戶進(jìn)行推薦。但如果我們知道用戶在另外一個(gè)領(lǐng)域比方說(shuō)飲料,已經(jīng)有了很多很多的數(shù)據(jù),我們利用這個(gè)數(shù)據(jù)建了一個(gè)模型,我們就知道用戶飲料的習(xí)慣和糕點(diǎn)的習(xí)慣可能是有關(guān)聯(lián)的,我們就可以把飲料的推薦模型給成功地遷移到糕點(diǎn)的領(lǐng)域,使得對(duì)于糕點(diǎn)隨著數(shù)據(jù)不多,但是可以成功的推薦一些用戶可能喜歡的糕點(diǎn)。
一個(gè)領(lǐng)域已經(jīng)有很多的數(shù)據(jù),能成功地建一個(gè)模型,另一個(gè)領(lǐng)域數(shù)據(jù)不多,但是和前面那個(gè)領(lǐng)域是關(guān)聯(lián)的,我們就可以把那個(gè)模型給遷移過(guò)來(lái)。這個(gè)解決的問(wèn)題是數(shù)據(jù)少的問(wèn)題。
第二個(gè)能解決的問(wèn)題是個(gè)性化的問(wèn)題,我們每個(gè)人都希望自己的手機(jī)能夠記住我們的一些習(xí)慣,這樣不用我們每次都去設(shè)定它,我們?cè)趺床拍茏屖謾C(jī)記住這一點(diǎn)呢?其實(shí)可以通過(guò)遷移學(xué)習(xí)把一個(gè)通用用戶的使用手機(jī)的模型遷移到個(gè)性化的數(shù)據(jù)上面。這個(gè)以后會(huì)用得越來(lái)越多。
楊強(qiáng)教授是我們下個(gè)月在深圳舉辦的CCF-GAIR人工智能與機(jī)器人峰會(huì)的主講嘉賓,關(guān)于遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、情感識(shí)別等等更多的研究進(jìn)展和應(yīng)用狀況,我們留待大會(huì)透露?,F(xiàn)在購(gòu)票參會(huì)將立享7折優(yōu)惠;如果能夠湊齊5人參會(huì),還可以選擇更多優(yōu)惠的5折團(tuán)體票。