“朝生暮死”的APP行業(yè)無異于一個造星工廠,幾乎每隔一段時間就能捧紅一款明星產品。而圖片處理軟件堪稱爆款APP中最為常見的分類。

有這樣一個評論描述如今的Prisma有多火,“世界一半人在用《PokemonGO》抓精靈,另一半人在用Prisma軟件修圖。”
Prisma成功刷屏朋友圈之后,有國內圖片處理軟件公司產品負責人明確向記者表示,Prisma的爆紅提醒了我們用戶對藝術類風格特效存在巨大需求,公司會考慮開發(fā)類似Prisma的產品。
但與AR手游《PokemonGo》剛上線就遭遇國內《城市精靈GO》山寨不同的是,6月上線之后就迅速地從俄羅斯風靡至全球的Prisma在模仿、借鑒已經足夠普及的中國市場一直等到最近才找到“追隨者”。8月4日,圖片處理應用相機360在更新后的版本中添加了一個類似Prisma功能的超強馬賽克,稱可以讓照片一秒鐘變油畫。
為什么要等這么久?

梅德韋杰夫發(fā)布的圖片
需要耐心的AI修圖
技術達人出來發(fā)話了,雖然都是在修圖,Prisma和美圖、PicsArt等軟件在技術上走的是兩條路。能將一張普通照片變成野獸派勞爾杜飛的靜物畫風格,也能演繹現(xiàn)代派大師畢加索的立體主義的Prisma背后是人工智能(ArtificialIntelligence,簡稱AI),Prisma以藝術的名義用流行的方式把深度學習的能力展現(xiàn)給了大眾。
那么,能讓連俄羅斯總理梅德韋杰夫都“翻了它的牌子”,在Instagram上放了一張使用Prisma過濾的莫斯科風景圖,這個由莫斯科年僅25歲的AlexeyMoiseenkov和幾個人的團隊開發(fā)的修圖應用到底在技術上牛在哪里?
圖普科技研發(fā)工程師Darwin告訴《第一財經日報》記者,在處理技術方面,美圖、PicsArt等圖像編輯軟件提供的主要功能基本上是基于底層的數(shù)字圖像處理技術,如濾波、去噪,或一些稍高級的功能分割、人臉檢測等;而Prisma所做的風格轉換使用的是完完全全的機器視覺技術,實現(xiàn)紋理轉換(texturetransfer)。“繪畫、吟詩、作曲是人的高級智能的表現(xiàn),Prisma的風格轉換讓大眾有了機器可以作畫的錯覺,在效果上更高級、更智能。”
Prisma的產品由來是因為創(chuàng)始人AlexeyMoiseenkov最初發(fā)現(xiàn)了一種開源的人工智能算法,能將照片變?yōu)榻浀渌囆g作品的風格,然而這一處理過程需要幾小時時間。因此,他的團隊開發(fā)了自主版本,能在較短時間內返回結果,適合在移動設備上使用。
但目前對于大多數(shù)Prisma用戶而言,最大的不滿依然來自于圖片處理的時間太長,一般都需要等待幾十秒才能看到預覽效果。
而這背后,Prisma的產品特性要求用戶在使用時一定要在有網(wǎng)絡狀態(tài)較好、網(wǎng)速較快的狀態(tài)下,因為需要在線加載繪畫風格圖像以及用戶提供的內容圖片需要發(fā)送到遠程的服務器上進行人工智能計算后再傳回來;此外,因為所有的圖片處理都是在云端完成,所以會有少部分用戶遇到使用人數(shù)過多,服務器過載的情況。
但在人工智能技術專家們看來,即使Prisma的處理速度的確超出了平常大眾一般可以忍受的App處理時間的上限,但Prisma能達到這樣的速度其實已實屬不易,里面涉及到大量的算法改進和性能優(yōu)化。
在Prisma出現(xiàn)之前,也有過一款基于深度學習技術的修圖應用deepart.io。deepart.io卻無法取得像Prisma一樣的成功的主要原因是一方面在于其處理一張圖片需要消耗大量的GPU時間,導致了很多服務器資源開銷,如果用戶愿意承擔這部分費用,處理時間在半小時左右,如果不付費的話,需要6個小時左右;而另一方面,deepart主要是由大學的研究員做的技術性實驗,并不會投入過多的精力,在風格圖像類型、品牌推廣和商業(yè)化應用上考慮較少。
在圖普科技研發(fā)工程師Darwin看來,使用深度學習的方式進行風格轉換在技術層面上看屬于從0到1的創(chuàng)舉,將這種無與倫比風格轉換效果工程化、落地化最終展現(xiàn)給大眾從產品層面上看也是從0到1的進步,之后越來越好的效果,越來越快的速度只是不斷地在1后面添0,在如今極速發(fā)展的AI技術面前,相信速度的問題會很快就得以解決。

爆紅過后的困境
即使有AI技術做背書,業(yè)界對于Prisma的未來依然存在擔憂。Prisma如此驚人的風格轉換的效果暫時掩蓋了其產品單薄的缺陷,但當熱度退去,Prisma是否會像之前眾多爆款的App一樣稍縱即逝,取決于Prisma之后采取的商業(yè)策略。
在中國市場上,從魔漫相機、臉萌、足記到現(xiàn)在的Prisma,似乎每過一段時間就會出現(xiàn)一個爆款圖片應用產品。然而,這些滿足一部分需求的圖片工具類產品在爆紅之后往往并不能走得特別長遠。
一位不愿意透露姓名的圖片處理工程師坦言,因為Prisma是強風格的濾鏡,用戶容易產生厭倦心理,未來要考慮的優(yōu)化方向是開發(fā)更多新奇效果,或者做產品定位的轉型上。爆發(fā)力超強的產品,都會存在持久力不足的特點。新鮮勁兒過去以后,如何把用戶留住,是重要的課題。
如果沒有考慮清楚這一步,迅速地變現(xiàn)也是個好方法。AlexeyMoiseenkov7月份來到Facebook總部參加了一次FacebookLive的直播的消息也被業(yè)界解讀為Facebook可能有意收購Prisma。
而這背后,被大平臺收購是創(chuàng)意工具類應用普遍的發(fā)展思路。在此之前,Snapchat先后以1.5億美元和1億美元收購了可動自拍應用Looksery和自定義頭像制作應用Bitmoji,而Facebook此前也收購了提供類似于Looksery的臉部識別自拍應用MSQRD。
此外,AI技術背后是Prisma使用的是昂貴的云端服務器去處理請求,這一方面體現(xiàn)出了其使用的深度學習計算的復雜度,另一方面更是暴露了其巨大的成本消耗,使用GPU等計算設備去處理一張圖片的成本并不低。
值得一提的是,此前有消息稱Facebook可能會將Prisma整合到FacebookLive,以此鼓勵更多用戶嘗試直播。此舉將有助于消除用戶面對鏡頭時的緊張感,因為Prisma的濾鏡可以掩蓋用戶皮膚和環(huán)境燈光的問題。
盡管Prisma團隊此前表示正在開發(fā)視頻濾鏡功能,但在AI技術工程師們看來,圖像是一個二維的信號,而視頻多了一個時間的維度,對時間提供的信息的利用決定了視頻的處理在面臨更大計算量的同時也擁有更多的可用的信息量。
“Prisma的‘視頻濾鏡’一方面要處理計算量的問題,保證‘快’,另一方面也要考慮如何利用好時間的信息,進一步提升‘質’。用圖片的方式對視頻每一幀進行處理是可行的,但由于如今的風格轉換算法還不是特別的穩(wěn)定,所以用這種處理方式生成的視頻會閃爍和出現(xiàn)假的不連續(xù)性(falsediscontinuities)。”在Darwin看來,從圖像的處理到視頻的處理,其中牽涉到大量算法,并不是一件看起來很容易的事,而他的判斷是最終這項視頻功能可能還是以用云端離線的方式處理短視頻呈現(xiàn)給大眾。
另外的擔憂是,類似Prisma的視頻濾鏡會增加直播的趣味性。但從產生影響的角度,可能不像對圖片的影響這么大。“直播的重點是內容和互動,對于大多數(shù)用戶而言,美顏、濾鏡只是輔助性的手段。”上述圖片處理工程師解釋道。
而這背后,除了Prisma和未來的視頻濾鏡,AI技術尤其是深度學習僅僅在機器視覺領域,已經在人臉識別、OCR(光學字符識別)、車輛檢測、圖像檢索等領域得到一定的成功的應用。
記者了解到,在圖像內容審核上,如今可以使用深度學習技術成功地將圖像智能鑒黃交給了AI機器,使得大量不良內容被阻擋免于流向大眾,從而解放了更多的人力去做更有意義的事。此外,也能在人臉識別應用上,完成包括人臉搜索、定位、識別、智能美化等功能。