
本來我們這領域步調(diào)就快,因為雜志論文的內(nèi)容滯后,大家都看會議論文,一年兩三個頂會,半年一年的研究周期。
但因為是雙盲評審,就算有別人和自己做得相近,投稿時也是兩不知曉,大不了同時中稿同時發(fā)文。Arxiv的出現(xiàn),允許任何人將自己的工作發(fā)表在網(wǎng)上,讓同行們即時看到,讓這一領域的競爭變本加厲。一個例行的功課是每周甚至每天都要刷一下Arxiv看看有沒有好文章,更重要的是看看有沒有工作和自己目前正在做的重合。每當有一個新想法新思路,必須得馬上做完,只要拖一兩個月就不再是你的了,因為別人已經(jīng)捷足先登,直接放篇文章出來把你一悶棍打死,叫也叫不出來。之前的計算機圍棋已經(jīng)血淋淋地展示了這一點,一切在幾個月內(nèi)發(fā)生,我們讓其它做圍棋的同行們郁悶,然后AlphaGo又讓我們郁悶,昨天還是眾星捧月,今日便少人問津,雖說是世態(tài)炎涼,卻正是人之常情。
程序和框架的開源也加劇了這一過程,本來重現(xiàn)別人的方法不僅痛苦更是耗時,但現(xiàn)在都是拿來即用,各項成本為零。而想要保持領先優(yōu)勢,隱藏自己的小技巧小把戲那是沒有意義的,一年發(fā)表的文章多如過江之鯽,誰不開源或者晚開源,誰就被遺忘在歷史的角落里了。去年NIPS大家都在談論ResNet,我們組在ResNet出來的24小時之內(nèi)寫完了程序并且已經(jīng)開始了在ImageNet上的訓練,并且很快確認了它的效果。TensorFlow剛剛開源,組里的骨干就忙到凌晨三點半完成了評測。大凡說自己的工作厲害卻不發(fā)布程序的,除非像AlphaGo那樣動用大量硬件資源的系統(tǒng),不然自會有人評判,而且速度飛快。有一次有一篇Arxiv報告了CIFAR更好的結(jié)果,馬上在Reddit上被人質(zhì)疑,然后公開代碼,被人發(fā)現(xiàn)在測試集上訓練的低級錯誤,只得黯然撤稿。
接鍾而來的是開會的味道也發(fā)生了變化。開會的原意,是去領略最新進展的,現(xiàn)在去開會則是懷舊,滿眼都是半年一年前的老文章,有一種穿越回去的即視感和莫名喜感。大家談論的往往不是目力所及的演講或是海報,而是剛剛在Arxiv上冒出來的新作,這個“剛剛”,可能指上周,可能指昨天,也可能指幾小時之前,方才還為小小的成果而沾沾自喜,轉(zhuǎn)眼間就如一桶冰水當頭澆下,魂不守舍,夜不能寐,食不知味。相比其它方向動輒半年一年的審稿周期,迭代之快,更新之速,史無前例。我有時候在想,以后除了餓醒胖醒春夢醒,還要加個Arxiv醒,夢見自己的神思路被別人做了,或是夢見投稿前幾天遭遇當頭棒喝,大汗淋漓之下猛然醒來,而后抹一把臉謝天謝地。
在這樣的壓力下,人的思維方式也發(fā)生了改變。目前為止,我們還沒有對深度學習有深層次的本質(zhì)理解,大量的研究思路都是簡單粗暴的,在計算資源極大豐富的今天,對于它們質(zhì)量的主觀判斷,經(jīng)常遠不及寫代碼上機實驗來得快與準。很多想法不論對錯,不論它看起來有多離譜荒謬,先試一下再說,往往蒙得比想得快,動手比動腦快。和我們每天刷手機類似,思維方式的這種轉(zhuǎn)變是好是壞,目前還無從評判。這樣的做法,完全可以歸入浮躁和急功近利之流,與傳統(tǒng)學術(shù)做法背道而馳——但與口舌之爭相比,這樣的方案還在不斷地出成果,推動著技術(shù)的進步,做成更好的系統(tǒng)。我們可以一邊抱怨谷歌機器太多調(diào)參太猛,另一邊還在準備著大量GPU雄心勃勃地上戰(zhàn)場。不管怎樣,可以預計的是,憑一人一紙一筆去戰(zhàn)勝難題,令人敬仰卻鮮有效率;而讓計算機參與推理過程和判斷,終會成為每個人生來的必修課。
從這個趨勢上來看,能快速利用各種工具達成目標的,能快速閱讀及寫出代碼的,有強大工程能力的,在就業(yè)市場上都有巨大優(yōu)勢;若是再有基礎扎實,能快速讀懂文章,從中獲取新知識并舉一反三,經(jīng)驗豐富,看文能抓住要點痛點下手,從紛繁想法中修剪思路,那就是老手了;再上一層,有戰(zhàn)略眼光,能從萬千文章中看出大勢遠景,巧妙定題,以最小代價獲取最大收益,那就是一流高手,能站在前沿火線,直接推動領域的發(fā)展。然而要做到這一步,需要在這樣的快速迭代中靜下心來積累經(jīng)驗,日久方能見效。
人工智能火爆的背后,是多少天才你來我往的戰(zhàn)斗,在這個高維空間里攻城拔寨,刺刀見紅。雖然累點苦點,卻正是這個領域的誘人之處和希望所在。與苦與累相比更可怕的,是舒適安逸時卻因技能陳舊而被解職,徘徊天地間,無處可去。我無法想像那種絕望感,所以還是緊追時代的腳步吧,至少我們還能看見技術(shù)發(fā)展的軌跡,為它出一份力。在這個領域里,只要工具運用得當,思路巧妙,每個人都有成為超人的潛質(zhì),一個好算法好框架可服務千萬人,且24小時工作,不會出錯,不會疲勞,這在以前完全不可想像。正所謂:
靈工巧技匯涓流,奔騰到今浩無垠;
誰料硅砂一捧土,更勝周郎百萬兵。