
當(dāng)Google使用16000臺機(jī)器建造了一個可以正確識別出YouTube視頻中是否有貓的仿真“大腦”時,這就標(biāo)志著人工智能(AI)技術(shù)迎來了一個轉(zhuǎn)折點(diǎn)。
這種新興的AI算法需要應(yīng)用大量的計(jì)算機(jī)數(shù)據(jù),常被稱為“深度學(xué)習(xí)”。Google仿真大腦號稱比現(xiàn)有的圖像識別系統(tǒng)的精準(zhǔn)度高出了兩倍。
紐約時報(bào)在2012年寫到,這項(xiàng)研究代表著新一代的計(jì)算機(jī)科學(xué)可以被利用來降低計(jì)算機(jī)成本以及提高了大型數(shù)據(jù)中心計(jì)算機(jī)集群的可用性。并可以給不同領(lǐng)域帶去巨大進(jìn)展,例如感知、語音識別、以及語言翻譯等方面。
事實(shí)上,在過去兩年,微軟發(fā)布了一項(xiàng)利用了深度學(xué)習(xí)實(shí)時把一種語言翻譯成另一種語言的Skype服務(wù),F(xiàn)acebook聘請了這個領(lǐng)域著名的專家改進(jìn)了它們服務(wù)的圖像識別,Twitter和Yahoo等企業(yè)也都收購了涉及深度學(xué)習(xí)的創(chuàng)業(yè)公司。
但是,在這次技術(shù)革命期間,一位名為Alex Krizhevsky的研究人員發(fā)現(xiàn),你無需大量的計(jì)算機(jī)作為服務(wù)支撐也能達(dá)到相同的目的。在同年發(fā)表的一份論文中顯示,他的方法至少在一種特定的圖像識別測試中優(yōu)于Google的16000臺計(jì)算機(jī)組成的計(jì)算機(jī)集群。而他只用了一臺電腦。
這是一臺昂貴的電腦,配備了大量的內(nèi)存、頂級的GPU以及專用的計(jì)算機(jī)芯片。但是這依然只是一臺電腦,這表明你不需要像Google一樣擁有計(jì)算機(jī)集群才能利用深度學(xué)習(xí)能力。
利用這種AI技術(shù)還需要一定的專業(yè)知識,這就是為什么互聯(lián)網(wǎng)巨頭要儲備這么多天才,也正是由于他們有大型數(shù)據(jù)中心和雄厚的財(cái)力,像Google這類公司才可以把這個技術(shù)帶到全球各地。目前許多數(shù)據(jù)科學(xué)家利用一臺計(jì)算機(jī)——就是普通消費(fèi)者可以買到的游戲本,并通過深度學(xué)習(xí)算法解決自身的問題。
在Kaggle,這是一個數(shù)據(jù)科學(xué)家競相解決其他企業(yè)和組織問題的網(wǎng)站,深度學(xué)習(xí)已成為首選的工具之一,根據(jù)Kaggle首席科學(xué)家Ben Hamner的介紹,單一的計(jì)算機(jī)已被用于解決所有事情,包括了圖像分析、語音識別甚至是化學(xué)信息學(xué)。
Richard Socher,斯坦福大學(xué)的研究人員進(jìn)一步擴(kuò)大了深度學(xué)習(xí)的使用,現(xiàn)在可以用一臺電腦達(dá)到識別自然語言的目標(biāo)。這個跡象表明這些人工智能技術(shù)可以造福一些規(guī)模較小的公司。這個系統(tǒng)非常容易部署,任何人都可以做到。
與此同時,創(chuàng)業(yè)公司都開始構(gòu)建云服務(wù),提供深層的學(xué)習(xí)工具,以及推出新的軟件和咨詢服務(wù)。這可以起到推進(jìn)技術(shù)發(fā)展使其可以更加平民化的目的。全球只有那么幾家公司的計(jì)算機(jī)集群可以達(dá)到Google、Facebook和雅虎的規(guī)模,那么單一機(jī)器的深度學(xué)習(xí)會有更加廣泛的市場。
GPU是圖形處理單元。這些芯片最初是為了快速生成代表游戲和其他高度可視化的應(yīng)用程序的圖形和圖像,但由于它們有能力處理數(shù)學(xué)計(jì)算,它們可以勝任各種各樣的任務(wù)。事實(shí)證明,在這些任務(wù)中就包括了是深度學(xué)習(xí)。
深度學(xué)習(xí)試圖模仿人類大腦的神經(jīng)網(wǎng)絡(luò)的行為。從本質(zhì)上說,它創(chuàng)造了一個多層次的軟件系統(tǒng),如果配置正確,當(dāng)他們分析的數(shù)據(jù)越來越多,它可以從中訓(xùn)練自己。而傳統(tǒng)的機(jī)器學(xué)習(xí),需要人類工程師進(jìn)行非常多的手動操作,深度學(xué)習(xí)是不需要的。
這些多層次神經(jīng)網(wǎng)絡(luò)涉及到很多計(jì)算機(jī)芯片的并行,就像Google這16000臺機(jī)器,但是你也可以通過GPU進(jìn)行這種并行處理。最頂級的GPU可以包含超過2000個處理器。
現(xiàn)在Krizhevsky供職于谷歌,他的深度學(xué)習(xí)創(chuàng)業(yè)公司最近被Google收購了,像其他互聯(lián)網(wǎng)巨頭一樣,Google正在探索在它自己的深度學(xué)習(xí)工作中使用的GPU。
在Kaggle,數(shù)據(jù)科學(xué)家們正在使用價值3000美元游戲本研究深度學(xué)習(xí)算法,其中包括一個單一的顯卡。他們正在解決圖像和語音識別的問題,而且該技術(shù)還可以在其他領(lǐng)域有所幫助。
當(dāng)然,隨著時間的推移,16,000臺計(jì)算機(jī)集群將會更為有用的。Google和Facebook這類公司可以利用集群分析大量的圖像和數(shù)字聲音來訓(xùn)練他們的系統(tǒng),有這么多集群數(shù)量的情況下,進(jìn)步速度將會非???。但是,如果你的集群數(shù)較小,單一系統(tǒng)仍然可以提供一定標(biāo)準(zhǔn)的人工智能,但是進(jìn)步空間相對而言沒有那么大。
許多深度學(xué)習(xí)算法都是開源的,這意味著任何人都可以使用它,以及各種創(chuàng)業(yè)公司。其中包括舊金山一家名為Skymind的公司,致力于培養(yǎng)在這些算法變幻莫測的數(shù)據(jù)科學(xué)家。Google和Facebook等大公司將引領(lǐng)著人工智能革命,之后會有更多的人將隨之加入這場革命。