“朝生暮死”的APP行業(yè)無(wú)異于一個(gè)造星工廠,幾乎每隔一段時(shí)間就能捧紅一款明星產(chǎn)品。而圖片處理軟件堪稱爆款A(yù)PP中最為常見的分類。

有這樣一個(gè)評(píng)論描述如今的Prisma有多火,“世界一半人在用《PokemonGO》抓精靈,另一半人在用Prisma軟件修圖。”
Prisma成功刷屏朋友圈之后,有國(guó)內(nèi)圖片處理軟件公司產(chǎn)品負(fù)責(zé)人明確向記者表示,Prisma的爆紅提醒了我們用戶對(duì)藝術(shù)類風(fēng)格特效存在巨大需求,公司會(huì)考慮開發(fā)類似Prisma的產(chǎn)品。
但與AR手游《PokemonGo》剛上線就遭遇國(guó)內(nèi)《城市精靈GO》山寨不同的是,6月上線之后就迅速地從俄羅斯風(fēng)靡至全球的Prisma在模仿、借鑒已經(jīng)足夠普及的中國(guó)市場(chǎng)一直等到最近才找到“追隨者”。8月4日,圖片處理應(yīng)用相機(jī)360在更新后的版本中添加了一個(gè)類似Prisma功能的超強(qiáng)馬賽克,稱可以讓照片一秒鐘變油畫。
為什么要等這么久?

梅德韋杰夫發(fā)布的圖片
需要耐心的AI修圖
技術(shù)達(dá)人出來(lái)發(fā)話了,雖然都是在修圖,Prisma和美圖、PicsArt等軟件在技術(shù)上走的是兩條路。能將一張普通照片變成野獸派勞爾杜飛的靜物畫風(fēng)格,也能演繹現(xiàn)代派大師畢加索的立體主義的Prisma背后是人工智能(ArtificialIntelligence,簡(jiǎn)稱AI),Prisma以藝術(shù)的名義用流行的方式把深度學(xué)習(xí)的能力展現(xiàn)給了大眾。
那么,能讓連俄羅斯總理梅德韋杰夫都“翻了它的牌子”,在Instagram上放了一張使用Prisma過濾的莫斯科風(fēng)景圖,這個(gè)由莫斯科年僅25歲的AlexeyMoiseenkov和幾個(gè)人的團(tuán)隊(duì)開發(fā)的修圖應(yīng)用到底在技術(shù)上牛在哪里?
圖普科技研發(fā)工程師Darwin告訴《第一財(cái)經(jīng)日?qǐng)?bào)》記者,在處理技術(shù)方面,美圖、PicsArt等圖像編輯軟件提供的主要功能基本上是基于底層的數(shù)字圖像處理技術(shù),如濾波、去噪,或一些稍高級(jí)的功能分割、人臉檢測(cè)等;而Prisma所做的風(fēng)格轉(zhuǎn)換使用的是完完全全的機(jī)器視覺技術(shù),實(shí)現(xiàn)紋理轉(zhuǎn)換(texturetransfer)。“繪畫、吟詩(shī)、作曲是人的高級(jí)智能的表現(xiàn),Prisma的風(fēng)格轉(zhuǎn)換讓大眾有了機(jī)器可以作畫的錯(cuò)覺,在效果上更高級(jí)、更智能。”
Prisma的產(chǎn)品由來(lái)是因?yàn)閯?chuàng)始人AlexeyMoiseenkov最初發(fā)現(xiàn)了一種開源的人工智能算法,能將照片變?yōu)榻?jīng)典藝術(shù)作品的風(fēng)格,然而這一處理過程需要幾小時(shí)時(shí)間。因此,他的團(tuán)隊(duì)開發(fā)了自主版本,能在較短時(shí)間內(nèi)返回結(jié)果,適合在移動(dòng)設(shè)備上使用。
但目前對(duì)于大多數(shù)Prisma用戶而言,最大的不滿依然來(lái)自于圖片處理的時(shí)間太長(zhǎng),一般都需要等待幾十秒才能看到預(yù)覽效果。
而這背后,Prisma的產(chǎn)品特性要求用戶在使用時(shí)一定要在有網(wǎng)絡(luò)狀態(tài)較好、網(wǎng)速較快的狀態(tài)下,因?yàn)樾枰诰€加載繪畫風(fēng)格圖像以及用戶提供的內(nèi)容圖片需要發(fā)送到遠(yuǎn)程的服務(wù)器上進(jìn)行人工智能計(jì)算后再傳回來(lái);此外,因?yàn)樗械膱D片處理都是在云端完成,所以會(huì)有少部分用戶遇到使用人數(shù)過多,服務(wù)器過載的情況。
但在人工智能技術(shù)專家們看來(lái),即使Prisma的處理速度的確超出了平常大眾一般可以忍受的App處理時(shí)間的上限,但Prisma能達(dá)到這樣的速度其實(shí)已實(shí)屬不易,里面涉及到大量的算法改進(jìn)和性能優(yōu)化。
在Prisma出現(xiàn)之前,也有過一款基于深度學(xué)習(xí)技術(shù)的修圖應(yīng)用deepart.io。deepart.io卻無(wú)法取得像Prisma一樣的成功的主要原因是一方面在于其處理一張圖片需要消耗大量的GPU時(shí)間,導(dǎo)致了很多服務(wù)器資源開銷,如果用戶愿意承擔(dān)這部分費(fèi)用,處理時(shí)間在半小時(shí)左右,如果不付費(fèi)的話,需要6個(gè)小時(shí)左右;而另一方面,deepart主要是由大學(xué)的研究員做的技術(shù)性實(shí)驗(yàn),并不會(huì)投入過多的精力,在風(fēng)格圖像類型、品牌推廣和商業(yè)化應(yīng)用上考慮較少。
在圖普科技研發(fā)工程師Darwin看來(lái),使用深度學(xué)習(xí)的方式進(jìn)行風(fēng)格轉(zhuǎn)換在技術(shù)層面上看屬于從0到1的創(chuàng)舉,將這種無(wú)與倫比風(fēng)格轉(zhuǎn)換效果工程化、落地化最終展現(xiàn)給大眾從產(chǎn)品層面上看也是從0到1的進(jìn)步,之后越來(lái)越好的效果,越來(lái)越快的速度只是不斷地在1后面添0,在如今極速發(fā)展的AI技術(shù)面前,相信速度的問題會(huì)很快就得以解決。

爆紅過后的困境
即使有AI技術(shù)做背書,業(yè)界對(duì)于Prisma的未來(lái)依然存在擔(dān)憂。Prisma如此驚人的風(fēng)格轉(zhuǎn)換的效果暫時(shí)掩蓋了其產(chǎn)品單薄的缺陷,但當(dāng)熱度退去,Prisma是否會(huì)像之前眾多爆款的App一樣稍縱即逝,取決于Prisma之后采取的商業(yè)策略。
在中國(guó)市場(chǎng)上,從魔漫相機(jī)、臉萌、足記到現(xiàn)在的Prisma,似乎每過一段時(shí)間就會(huì)出現(xiàn)一個(gè)爆款圖片應(yīng)用產(chǎn)品。然而,這些滿足一部分需求的圖片工具類產(chǎn)品在爆紅之后往往并不能走得特別長(zhǎng)遠(yuǎn)。
一位不愿意透露姓名的圖片處理工程師坦言,因?yàn)镻risma是強(qiáng)風(fēng)格的濾鏡,用戶容易產(chǎn)生厭倦心理,未來(lái)要考慮的優(yōu)化方向是開發(fā)更多新奇效果,或者做產(chǎn)品定位的轉(zhuǎn)型上。爆發(fā)力超強(qiáng)的產(chǎn)品,都會(huì)存在持久力不足的特點(diǎn)。新鮮勁兒過去以后,如何把用戶留住,是重要的課題。
如果沒有考慮清楚這一步,迅速地變現(xiàn)也是個(gè)好方法。AlexeyMoiseenkov7月份來(lái)到Facebook總部參加了一次FacebookLive的直播的消息也被業(yè)界解讀為Facebook可能有意收購(gòu)Prisma。
而這背后,被大平臺(tái)收購(gòu)是創(chuàng)意工具類應(yīng)用普遍的發(fā)展思路。在此之前,Snapchat先后以1.5億美元和1億美元收購(gòu)了可動(dòng)自拍應(yīng)用Looksery和自定義頭像制作應(yīng)用Bitmoji,而Facebook此前也收購(gòu)了提供類似于Looksery的臉部識(shí)別自拍應(yīng)用MSQRD。
此外,AI技術(shù)背后是Prisma使用的是昂貴的云端服務(wù)器去處理請(qǐng)求,這一方面體現(xiàn)出了其使用的深度學(xué)習(xí)計(jì)算的復(fù)雜度,另一方面更是暴露了其巨大的成本消耗,使用GPU等計(jì)算設(shè)備去處理一張圖片的成本并不低。
值得一提的是,此前有消息稱Facebook可能會(huì)將Prisma整合到FacebookLive,以此鼓勵(lì)更多用戶嘗試直播。此舉將有助于消除用戶面對(duì)鏡頭時(shí)的緊張感,因?yàn)镻risma的濾鏡可以掩蓋用戶皮膚和環(huán)境燈光的問題。
盡管Prisma團(tuán)隊(duì)此前表示正在開發(fā)視頻濾鏡功能,但在AI技術(shù)工程師們看來(lái),圖像是一個(gè)二維的信號(hào),而視頻多了一個(gè)時(shí)間的維度,對(duì)時(shí)間提供的信息的利用決定了視頻的處理在面臨更大計(jì)算量的同時(shí)也擁有更多的可用的信息量。
“Prisma的‘視頻濾鏡’一方面要處理計(jì)算量的問題,保證‘快’,另一方面也要考慮如何利用好時(shí)間的信息,進(jìn)一步提升‘質(zhì)’。用圖片的方式對(duì)視頻每一幀進(jìn)行處理是可行的,但由于如今的風(fēng)格轉(zhuǎn)換算法還不是特別的穩(wěn)定,所以用這種處理方式生成的視頻會(huì)閃爍和出現(xiàn)假的不連續(xù)性(falsediscontinuities)。”在Darwin看來(lái),從圖像的處理到視頻的處理,其中牽涉到大量算法,并不是一件看起來(lái)很容易的事,而他的判斷是最終這項(xiàng)視頻功能可能還是以用云端離線的方式處理短視頻呈現(xiàn)給大眾。
另外的擔(dān)憂是,類似Prisma的視頻濾鏡會(huì)增加直播的趣味性。但從產(chǎn)生影響的角度,可能不像對(duì)圖片的影響這么大。“直播的重點(diǎn)是內(nèi)容和互動(dòng),對(duì)于大多數(shù)用戶而言,美顏、濾鏡只是輔助性的手段。”上述圖片處理工程師解釋道。
而這背后,除了Prisma和未來(lái)的視頻濾鏡,AI技術(shù)尤其是深度學(xué)習(xí)僅僅在機(jī)器視覺領(lǐng)域,已經(jīng)在人臉識(shí)別、OCR(光學(xué)字符識(shí)別)、車輛檢測(cè)、圖像檢索等領(lǐng)域得到一定的成功的應(yīng)用。
記者了解到,在圖像內(nèi)容審核上,如今可以使用深度學(xué)習(xí)技術(shù)成功地將圖像智能鑒黃交給了AI機(jī)器,使得大量不良內(nèi)容被阻擋免于流向大眾,從而解放了更多的人力去做更有意義的事。此外,也能在人臉識(shí)別應(yīng)用上,完成包括人臉?biāo)阉?、定位、識(shí)別、智能美化等功能。