
王昱珩在“尋找網(wǎng)紅童年照”環(huán)節(jié)進(jìn)行觀察。
人臉識(shí)別機(jī)器人“螞可”。
6月30日下午5時(shí)許,杭州西湖區(qū)鳳凰創(chuàng)意園一會(huì)場(chǎng),一場(chǎng)人機(jī)識(shí)別極限對(duì)抗大賽正在進(jìn)行。決戰(zhàn)雙方是有著超強(qiáng)微觀識(shí)物能力、人稱“鬼才之眼”的王昱珩和人臉識(shí)別機(jī)器人“螞可”。雙方挑戰(zhàn)的“道具”———50名青春靚麗的網(wǎng)絡(luò)紅人身著統(tǒng)一的服裝站在舞臺(tái)一邊,舞臺(tái)另一側(cè)大墻上密密麻麻地貼著數(shù)百?gòu)埞媚飩兊淖耘恼铡?/div>
在公證員的見(jiàn)證下,觀眾從現(xiàn)場(chǎng)網(wǎng)紅中隨機(jī)抽取數(shù)位。對(duì)戰(zhàn)雙方需要對(duì)被選中者進(jìn)行觀察后,再?gòu)恼掌瑝χ刑舫鰧?duì)應(yīng)的照片。比賽共分三場(chǎng)且難度依次遞進(jìn),前兩個(gè)回合,雙方打成平手。第三輪的“尋找網(wǎng)紅童年照”卻將人機(jī)雙方置于極限挑戰(zhàn)之中:十多年的成長(zhǎng)脫變足以讓人的容貌發(fā)生巨大改變,辨識(shí)難度巨大。21分48秒,王昱珩率先按下按鈕,提交答案。7分鐘后,機(jī)器人“螞可”也完成了識(shí)別。答案揭曉:王昱珩成功認(rèn)出一位網(wǎng)紅的童年照,并放棄辨認(rèn)另一位,而此輪“螞可”辨識(shí)的兩位網(wǎng)紅照片都出現(xiàn)差錯(cuò)。
賽后,王昱珩笑稱事先并不知道比賽內(nèi)容也未經(jīng)彩排,“她們(網(wǎng)紅們)的變化真的太大了。”人臉識(shí)別機(jī)器人“螞可”的研發(fā)團(tuán)隊(duì)負(fù)責(zé)人陳繼東則說(shuō),人和機(jī)器各有所長(zhǎng),此次和人類最強(qiáng)大腦的P K,說(shuō)明機(jī)器學(xué)習(xí)人類的大腦,“還有一段路要走。”
歷史
利用人臉識(shí)別身份從“找規(guī)律”到“對(duì)號(hào)入座”
“利用人臉識(shí)別身份”,人類的這個(gè)想法其實(shí)早在百年以前就已經(jīng)出現(xiàn)。早在1888年,達(dá)爾文的表弟、英國(guó)科學(xué)家弗朗西斯·高爾頓,在發(fā)表于《自然》雜志上的文章《對(duì)于人的識(shí)別與描述》就提出,用一組數(shù)字代表不同的人臉側(cè)面特征,并且還對(duì)人類自身的人臉識(shí)別能力進(jìn)行了分析。有關(guān)“自動(dòng)人臉識(shí)別”最早的研究論文,至今也有五十年的歷史。
直到上世紀(jì)九十年代,人臉識(shí)別一直都未能突破最初的瓶頸。這項(xiàng)技術(shù)在一開(kāi)始被研究者們認(rèn)為是一個(gè)一般性的模式識(shí)別問(wèn)題,通俗地說(shuō)就是“找規(guī)律”。不過(guò),最初的這三十余年間,研究者們并沒(méi)能取得多少非常重要的成果,更不要說(shuō)“投入應(yīng)用”了。
進(jìn)入20世紀(jì)90年代,麻省理工學(xué)院人工智能實(shí)驗(yàn)室的一次實(shí)驗(yàn),在對(duì)比了基于結(jié)構(gòu)特征和基于模板匹配兩種方法的識(shí)別性能之后,得出模板匹配的方法。其識(shí)別性能,要優(yōu)于此前“基于特征”的方法。這次試驗(yàn),基本終止了此前研究者們“找規(guī)律”的研究思路。
從1991年到1997年,基于“模板匹配”方法,誕生了若干具有代表性的人臉識(shí)別算法。最負(fù)盛名的當(dāng)屬麻省理工學(xué)院特克(T urk)和潘特(Pentland)提出的“特征臉”。這一方法的思路,是將許多張人臉圖像變換到另一個(gè)子空間,將圖像“降維”,用向量的形式表現(xiàn)出來(lái),并在平均后得到平均向量,也就是一張“平均臉”。進(jìn)而再通過(guò)計(jì)算得到“特征向量”即“特征臉”,并通過(guò)對(duì)每張人臉與“特征臉”相似性的計(jì)算,來(lái)實(shí)現(xiàn)最終的“識(shí)別”。和之前“找規(guī)律”的思路相比,這種思維更酷似于“對(duì)號(hào)入座”。
學(xué)習(xí)
“訓(xùn)練”機(jī)器人讓人臉識(shí)別真正“落地”
與此同時(shí),人工智能的發(fā)展也進(jìn)入了新的階段。人們不再滿足于將計(jì)算機(jī)僅僅當(dāng)成一種工具,而是在思考能否建立、模擬出人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),讓機(jī)器能夠模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù)。通俗地說(shuō),人們想讓機(jī)器具備思維的能力,如同Google資深院士Jeff Dean所言,“我們現(xiàn)在最需要從機(jī)器學(xué)習(xí)中取得的是‘理解力’”。
2006年,基于這種想法,英國(guó)科學(xué)家H inton以自己此前對(duì)“人工神經(jīng)網(wǎng)絡(luò)”的研究為基礎(chǔ),提出了“深度學(xué)習(xí)”的概念。此后的幾年里,H inton和他的N CA P團(tuán)隊(duì)逐漸建立了有效的深度學(xué)習(xí)算法,并且在2012年的Im ageN et比賽中完勝其他參賽團(tuán)隊(duì)。利用深度模型在競(jìng)賽中學(xué)習(xí)得到的特征,可以被廣泛應(yīng)用到其它數(shù)據(jù)集和各種計(jì)算機(jī)視覺(jué)的問(wèn)題。而由Im ageN et訓(xùn)練得到的深度學(xué)習(xí)模型,更是推動(dòng)計(jì)算機(jī)視覺(jué)領(lǐng)域發(fā)展的強(qiáng)大引擎。
2013年,Im ageN et大規(guī)模物體檢測(cè)任務(wù)挑戰(zhàn)中最高的檢測(cè)率只有22.6%。目前,香港中文大學(xué)由歐陽(yáng)萬(wàn)里、王曉剛和湯曉鷗教授帶領(lǐng)的D eepID團(tuán)隊(duì),將此項(xiàng)成績(jī)大幅提高至50 。3%,達(dá)到全球最高。而在此之前,D eepID團(tuán)隊(duì)還在LFW人臉識(shí)別挑戰(zhàn)上戰(zhàn)勝了Facebook,并在全世界范圍內(nèi)首次實(shí)現(xiàn)了機(jī)器人臉識(shí)別算法超越人眼,獲得了高達(dá)99.15%的識(shí)別率。
一旦具備“深度學(xué)習(xí)”這種能力,機(jī)器的人臉識(shí)別功能就可以變得無(wú)比強(qiáng)大。機(jī)器不再需要人為輸入算法來(lái)指示它進(jìn)行對(duì)圖像的判別,而是在一種更高階的體系下,讓機(jī)器更加自主地完成這項(xiàng)工作。學(xué)界廣泛認(rèn)為,深度學(xué)習(xí)是過(guò)去十年中人工智能領(lǐng)域的最大突破,在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)音處理等領(lǐng)域有許多應(yīng)用。《麻省理工科技評(píng)論》還將其列入2013年10項(xiàng)最具突破性技術(shù)。
應(yīng)用
從實(shí)驗(yàn)室進(jìn)入商用刷臉需降低錯(cuò)誤率
近兩年,深度學(xué)習(xí)和大數(shù)據(jù)兩項(xiàng)技術(shù)的相互作用,大大提高了人臉識(shí)別的準(zhǔn)確率。生物識(shí)別智能開(kāi)始進(jìn)入商用,尤其是金融領(lǐng)域,成為數(shù)家互聯(lián)網(wǎng)公司競(jìng)相追捧的香餑餑。在不久的將來(lái),人臉識(shí)別技術(shù)或?qū)⒅鸩娇梢匀〈艽a和手機(jī)短信校驗(yàn)碼,用于互聯(lián)網(wǎng)金融的身份驗(yàn)證基礎(chǔ)平臺(tái)。
資深專家陳繼東表示,人臉識(shí)別的互聯(lián)網(wǎng)級(jí)應(yīng)用和金融級(jí)應(yīng)用存在很大區(qū)別。“身份被盜用,直接導(dǎo)致財(cái)產(chǎn)的損失。”他指出,在金融行業(yè),對(duì)人臉識(shí)別技術(shù)的誤識(shí)率要求非常高。“人臉識(shí)別的現(xiàn)實(shí)應(yīng)用,不僅要做到在一堆照片中將同一個(gè)人識(shí)別出來(lái),也需要將不同的人也能區(qū)分出來(lái),這才是最難的一點(diǎn)。”陳繼東強(qiáng)調(diào),識(shí)別率和誤識(shí)率應(yīng)該綜合起來(lái)看,尤其是在金融行業(yè),必須把錯(cuò)誤率設(shè)低。
這一點(diǎn),絕非危言聳聽(tīng)。人臉識(shí)別從實(shí)驗(yàn)室進(jìn)入商用,尤其是金融領(lǐng)域,一個(gè)大的技術(shù)難點(diǎn),就是如何防偽造,比如用照片或者視頻來(lái)代替真人。不過(guò),大量圖片數(shù)據(jù)被抓取,也讓人擔(dān)心用戶的隱私信息是否會(huì)遭到泄露。對(duì)此,與陳繼東團(tuán)隊(duì)合作研發(fā)人工智能機(jī)器人的曠視F ace+ +市場(chǎng)負(fù)責(zé)人謝憶楠解釋稱,人臉數(shù)據(jù)的存儲(chǔ)是經(jīng)過(guò)加密處理的。即使泄露,被人拿走的圖片也是焦的,黑乎乎的一片,只有算法才能還原,普通人根本看不懂。同時(shí),數(shù)據(jù)源也在國(guó)家的有效控制之下,一般只有具備經(jīng)營(yíng)資質(zhì)的企業(yè)才能開(kāi)通此項(xiàng)業(yè)務(wù)。他認(rèn)為,生物識(shí)別智能進(jìn)入商用,尤其是金融領(lǐng)域,很有必要運(yùn)用多種生物特征交叉比對(duì)驗(yàn)證。也就是說(shuō),除了人臉識(shí)別,還要綜合運(yùn)用指紋識(shí)別、聲紋識(shí)別、眼紋識(shí)別等多因子生物特征,更好、更安全地服務(wù)用戶。
揭秘
如何訓(xùn)練人工智能機(jī)器人
謝憶楠介紹,所謂深度學(xué)習(xí),打個(gè)形象的比喻就像是在“教小孩兒”。在深度學(xué)習(xí)的程序中,第一個(gè)步驟是人臉檢測(cè),即在一張照片中把人臉結(jié)構(gòu)勾畫出來(lái)。隨后就要在人臉上進(jìn)行關(guān)鍵點(diǎn)標(biāo)注,這一步相當(dāng)于“訓(xùn)練”程序?qū)W習(xí)觀察人臉部特征。“這相當(dāng)于一個(gè)監(jiān)督式學(xué)習(xí),我們會(huì)告訴機(jī)器人這個(gè)人到底是不是一個(gè)人。”久而久之,機(jī)器人會(huì)得出一些關(guān)鍵點(diǎn)參數(shù)。
謝憶楠向南都記者舉例,人的兩個(gè)瞳孔就是兩個(gè)關(guān)鍵點(diǎn),瞳距在判斷人臉是否為同一人的過(guò)程中所占權(quán)重較高。眾多關(guān)鍵點(diǎn)之間相互聯(lián)系,形成一個(gè)統(tǒng)一的函數(shù),該函數(shù)再對(duì)應(yīng)不同人臉形成一個(gè)獨(dú)有的數(shù)值。“每個(gè)人臉都有屬于自己的數(shù)值”,謝憶楠說(shuō)。以螞可為例,它識(shí)別用戶人臉是從二維圖片中提取600多個(gè)關(guān)鍵點(diǎn),進(jìn)行交叉驗(yàn)證和動(dòng)態(tài)識(shí)別。
更多>相關(guān)資訊
0 條相關(guān)評(píng)論