近日,支付寶也策劃了一次人機(jī)大戰(zhàn),只不過這次比的是人臉識(shí)別。代表人類出戰(zhàn)的是人稱“鬼才之眼”的水哥王昱珩,他的對(duì)手是支付寶旗下的人工智能生物識(shí)別機(jī)器人“螞可”(Mark),他們的識(shí)別對(duì)象是數(shù)百名網(wǎng)紅,根據(jù)選定的網(wǎng)紅照片找出對(duì)應(yīng)的網(wǎng)紅。
網(wǎng)紅的特征就是美得千篇一律,而這無疑增加了識(shí)別的難度。當(dāng)然,這是對(duì)于人類選手而言,對(duì)于機(jī)器人“螞可”來說,面對(duì)網(wǎng)紅是否也會(huì)面臨臉盲的尷尬。

左為王昱珩,右邊工作人員手中機(jī)器為螞可
機(jī)器人如何識(shí)別人臉
螞可由螞蟻金服生物識(shí)別技術(shù)小組與Face++合作研發(fā)。Face++市場(chǎng)負(fù)責(zé)人謝憶楠賽后接受媒體采訪時(shí)對(duì)人臉識(shí)別技術(shù)進(jìn)行了簡(jiǎn)單的解釋,即通過臉上不同關(guān)鍵點(diǎn)之間的距離,通過算法算出人臉在不同角度下關(guān)鍵點(diǎn)的變化。螞可每次識(shí)別都會(huì)從人臉上提取600多個(gè)關(guān)鍵點(diǎn),進(jìn)行交叉驗(yàn)證和動(dòng)態(tài)識(shí)別。
“算法的原理,簡(jiǎn)單點(diǎn)是可以這么理解,就是計(jì)算各個(gè)關(guān)鍵點(diǎn)的距離關(guān)系等。在這個(gè)方法上,關(guān)鍵點(diǎn)的位置識(shí)別就非常的重要。關(guān)鍵點(diǎn)是通過深度學(xué)習(xí)而來的,其實(shí)也非常符合人臉的視覺分析能力,就算是同一張人臉,稍微偏移一點(diǎn)角度,關(guān)鍵點(diǎn)都完全不一樣。”某人臉識(shí)別從業(yè)者向雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號(hào)關(guān)注)表示。
人臉識(shí)別技術(shù)的關(guān)鍵在于通過不同臉部圖像上眼睛、眉毛、鼻子、嘴巴、臉頰輪廓特征關(guān)鍵點(diǎn)和面部表情網(wǎng),找出彼此之間的關(guān)聯(lián),最終判定這些圖像是否為同一個(gè)人。但是人臉是變化的,不同角度不同妝容都能影響特征關(guān)鍵點(diǎn)的抓取。
該從業(yè)者表示,如果只是簡(jiǎn)單的化妝,僅改變一些色彩,是不會(huì)對(duì)識(shí)別結(jié)果有很大影響。 如果化妝太過度,以至于人眼都覺得化妝后變了樣,那機(jī)器也會(huì)產(chǎn)生誤差。
人臉識(shí)別最重要的是樣本庫(kù),樣本庫(kù)的大小影響識(shí)別精準(zhǔn)度。如果樣本庫(kù)中只有一個(gè)樣本,那么就是1:1的對(duì)比,精準(zhǔn)度可以達(dá)到100%,但如果是1:N的對(duì)比, 就會(huì)難很多,N的數(shù)值越大,難度系數(shù)越高,同時(shí)需要巨大的運(yùn)算性能支持。
雖然才幾個(gè)月大,但據(jù)螞蟻金服透露,螞可已經(jīng)“閱人無數(shù)”,它識(shí)別過的人臉超過500萬張,“看”過的照片超過1.2億,人臉識(shí)別精度達(dá)到99.6%。
網(wǎng)紅臉是否影響人臉識(shí)別結(jié)果
化妝對(duì)于機(jī)器來說,只要不是濃妝并不會(huì)大的影響人臉識(shí)別結(jié)果,那么面部特征重疊度很高的網(wǎng)紅臉,又會(huì)有怎樣的影響。

“這個(gè)難度應(yīng)該叫人臉比對(duì)精度的準(zhǔn)確性。這個(gè)精度要看兩個(gè)情況,1是算法水平,2是比對(duì)樣本的質(zhì)量。
對(duì)于網(wǎng)紅比對(duì)來說,得看比對(duì)使用的注冊(cè)人臉是什么情況,比對(duì)輸入人臉是什么情況。比如他們拿一個(gè)網(wǎng)紅的童年照片,比如10歲的照片作為注冊(cè)人臉。 然后拿這個(gè)網(wǎng)紅的20歲的照片,作為輸入人臉。由于人臉成長(zhǎng)過程,肌肉骨骼本身就有稍微的變化,所以要認(rèn)出是同一個(gè)人,也就是相似度足夠高,難度是挺大的。 但目前的人臉比對(duì)技術(shù)可以滿足這個(gè)需求,就是跨年齡的比對(duì)。
另外就是PS 的情況。比如拿一個(gè)網(wǎng)紅素顏的人臉作為注冊(cè)人臉, 然后拿PS 后的照片作為輸入人臉,進(jìn)行比對(duì)。 如果PS 只處理臉部的顏色,比如美白、锃亮,并不對(duì)形狀(骨骼形狀)進(jìn)行處理的話,比對(duì)精度是非常高的。 但如果PS進(jìn)行了類似削股,拉長(zhǎng)的處理,那精度就會(huì)降低。
綜合以上兩個(gè)情況,就會(huì)得出比對(duì)精度跟跨年齡+PS程度,成反比。
其實(shí)螞可跟水哥的比賽,水哥是占優(yōu)勢(shì)的。因?yàn)閷?duì)于水哥來說,他的注冊(cè)人臉是來自于現(xiàn)場(chǎng)網(wǎng)紅本人,水哥從人眼的各個(gè)角度,可以說是3D的將這個(gè)人臉注冊(cè)進(jìn)人腦系統(tǒng)。而對(duì)于螞可來說,它可能只拿到幾張人臉作為注冊(cè),可供分別的數(shù)據(jù)采集上,少于人類。”上述從業(yè)者表示。
在這場(chǎng)網(wǎng)紅臉識(shí)別的人機(jī)大戰(zhàn)中,水哥王昱珩以3:2的優(yōu)勢(shì)勝出。在前兩輪從上百?gòu)堈掌姓页鲭S機(jī)選出的到場(chǎng)網(wǎng)紅中,水哥王昱珩和螞可均全部選對(duì)。在螞可輸?shù)舻牡谌龍?chǎng),從80張幼年照片中找出2名隨機(jī)選出的到場(chǎng)網(wǎng)紅,水哥王昱珩選對(duì)一人,螞可均未選對(duì)。由此可見,臉型的變化對(duì)于機(jī)器識(shí)別來說,難度系數(shù)更大。
人臉識(shí)別精準(zhǔn)度到什么水平了
華盛頓大學(xué)的研究團(tuán)隊(duì)最近開發(fā)了一個(gè)有一百萬相冊(cè)圖片的數(shù)據(jù)集,圖片來自于全世界并且可公開提供創(chuàng)意共享許可證,代表著690572個(gè)獨(dú)特的個(gè)人。隨后他們考驗(yàn)人臉識(shí)別團(tuán)隊(duì),讓他們下載數(shù)據(jù)庫(kù)然后觀察當(dāng)必須區(qū)分有一百萬種可能性的匹配時(shí)他們算法的運(yùn)行效率。

Google的臉部網(wǎng)絡(luò)在其中一項(xiàng)測(cè)試中展現(xiàn)出了非常高的性能,當(dāng)面對(duì)更小的圖片集時(shí),達(dá)到了近乎完美的精準(zhǔn)度,在百萬人測(cè)試中精準(zhǔn)度達(dá)到了75%。一個(gè)來自于俄羅斯N-TechLab的團(tuán)隊(duì)在另一個(gè)測(cè)試中脫穎而出,降到73%。
同樣的,在這個(gè)測(cè)試中,從不同的年齡階段中識(shí)別出同一個(gè)人依然是最難以克服的問題。
其實(shí)精準(zhǔn)度得看各家廠商的設(shè)定,還有各項(xiàng)業(yè)務(wù)的要求。1:1的認(rèn)證上,一般都要達(dá)到99%以上的相似度,尤其是在金融領(lǐng)域。1:N,比較復(fù)雜,可以設(shè)置高準(zhǔn)確率,但漏檢率會(huì)增加,一般也要求95%以上。雖然人臉識(shí)別離我們的生活還是有些遙遠(yuǎn),但是正在向我們走近。
“人臉識(shí)別從跟自己比對(duì),到跟很多人比對(duì),最終是為了服務(wù)快速簡(jiǎn)便的ID識(shí)別的場(chǎng)景上。因?yàn)槿四樂砰_了雙手,也同時(shí)脫離了手機(jī)、電腦等媒介。等于人臉就是你的隨時(shí)身份認(rèn)證標(biāo)志,可以作為身份、會(huì)員、甚至是貨幣的代替品。 在未來科技生活中,會(huì)有非常大的想象空間,你看阿里在支付寶里面的概念視頻演示,證明支付寶一直想借助人臉來打通人跟人、人跟系統(tǒng)的聯(lián)系。從電腦,到手提電腦,到智能手機(jī),到穿戴智能,到生物認(rèn)證。放到日常生活中,確實(shí)挺遠(yuǎn)。但是在一些特殊的場(chǎng)景下,正在不斷的嘗試,比如招行的人臉取款,醫(yī)院的人臉掛號(hào)等。能真正服務(wù)我們生活,減輕我們的溝通成本的場(chǎng)景,應(yīng)該會(huì)首先用起來。”上述從業(yè)者表示。
早在去年3月,馬云便在漢諾威消費(fèi)電子、信息及通信博覽會(huì)(CeBIT)的開幕式上,向德國(guó)總理默克爾與中國(guó)副總理馬凱演示了螞蟻金服的Smile to Pay掃臉技術(shù),為嘉賓從淘寶網(wǎng)上購(gòu)買了1948年漢諾威紀(jì)念郵票。這次比賽雖然螞可輸了,但支付寶的目的其實(shí)也只是向外界展示其人臉識(shí)別技術(shù)。而這個(gè)比賽,其實(shí)并不能代表目前人臉識(shí)別與計(jì)算機(jī)性能的實(shí)際情況。螞可未來需要面對(duì)的是,不經(jīng)意的人臉圖像,各種角度模糊眨眼動(dòng)作的情況下,從千萬張數(shù)量級(jí)上識(shí)別出正確的身份,并且是實(shí)時(shí)識(shí)別的,這才是螞可以及阿里未來需要的人臉識(shí)別。當(dāng)然,希望支付寶下次別讓螞可去識(shí)別網(wǎng)紅臉了,看得人尷尬癥都犯了。