微軟研究院學(xué)者與中科院植物學(xué)家使用機(jī)器學(xué)習(xí)來開發(fā)花卉識(shí)別系統(tǒng)
你是否遇到過這種情況?——外出與小孩散步,TA發(fā)現(xiàn)一朵很漂亮的花,跑過來問你是什么,但是你突然愣住了—因?yàn)槟悴⒉恢浪鞘裁椿ā?/div>

目前世界上至少存在250000種花,即便是經(jīng)驗(yàn)豐富的植物學(xué)者也很難全部認(rèn)識(shí)它們。如果現(xiàn)在告訴你以后不用尷尬對(duì)小孩承認(rèn)你并不知道它是什么花,不久之后你就能在無論什么時(shí)候都能馬上認(rèn)出任何一種花卉或者任何植物的品種,會(huì)不會(huì)很期待?
鑒于目前圖像識(shí)別的強(qiáng)大能力以及使用智能手機(jī)隨手拍照的便利,普通人通過使用工具也能輕松的識(shí)別各種花卉。這個(gè)工具叫做智能花卉識(shí)別系統(tǒng)(Smart Flower Recognition System),說起來這個(gè)系統(tǒng)也是在微軟研究院學(xué)者與中國科學(xué)院植物研究所(Institute of Botany, Chinese Academy of Sciences,IBCAS)偶然促成的。

微軟亞洲研究院常務(wù)副院長(zhǎng)芮勇在一次研討會(huì)上介紹了微軟的圖像識(shí)別技術(shù),在場(chǎng)的中國科學(xué)院植物研究所的植物學(xué)家大為高興,因?yàn)橹八麄兏冻隽舜罅颗硎占瘏^(qū)域花卉分布數(shù)據(jù),但效果并不好。植物學(xué)家們馬上意識(shí)到微軟亞洲研究院(MSRA)的圖像識(shí)別技術(shù)在這方面擁有巨大的潛力,同時(shí)芮勇也發(fā)現(xiàn)他也找到用來提升圖像識(shí)別在解決真實(shí)問題方面的最佳試驗(yàn)工具。
這項(xiàng)合作幫助中國科學(xué)院植物研究所加速累積了260萬的圖像數(shù)據(jù),鑒于全世界任何人都能將任意花卉圖片上傳到這個(gè)數(shù)據(jù)庫中,且沒有人能對(duì)這個(gè)上傳進(jìn)行監(jiān)督分類,微軟亞洲研究院團(tuán)隊(duì)必須創(chuàng)造一個(gè)算法來過濾掉“不合格”的圖片。但這還只是研究員Jianlong Fu和他的團(tuán)隊(duì)建立這個(gè)能夠在許多不同種類的花卉中識(shí)別微小差異的工具中所面臨的第一個(gè)問題。
為了實(shí)現(xiàn)這個(gè)目標(biāo)他們訓(xùn)練了超過20層的卷積神經(jīng)網(wǎng)絡(luò),用來識(shí)別使用了一系列可以學(xué)習(xí)的過濾器的圖像。概括來說,它的工作方式是這樣的:
在向前傳導(dǎo)的過程中,每個(gè)過濾器對(duì)于輸入容量的寬度和高度來說都是卷曲的,且在過濾器和輸入中間計(jì)算點(diǎn)積。對(duì)于過濾器來說這樣產(chǎn)生了一個(gè)二維的激活圖,結(jié)果是神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)了在輸入?yún)^(qū)給定空間位置激活每一種特定特性種類的過濾器。
在輸入80萬張圖片到Caffe深度學(xué)習(xí)框架中后,微軟亞洲研究院(MSRA)的研究人員逐漸讓機(jī)器實(shí)現(xiàn)了在圖片識(shí)別上超過90%的的準(zhǔn)確率,這個(gè)令人震驚的結(jié)果遠(yuǎn)遠(yuǎn)超過人類的識(shí)別正確率。

Caffe框架簡(jiǎn)介:
Caffe由加州大學(xué)伯克利的PHD賈揚(yáng)清開發(fā),全稱Convolutional Architecture for Fast Feature Embedding,是一個(gè)清晰而高效的開源深度學(xué)習(xí)框架,目前由伯克利視覺學(xué)中心(Berkeley Vision and Learning Center,BVLC)進(jìn)行維護(hù)。賈揚(yáng)清曾就職于MSRA、NEC、Google Brain,他也是TensorFlow的作者之一,目前任職于Facebook FAIR實(shí)驗(yàn)室。
同時(shí)這個(gè)計(jì)劃也大大幫助了中科院的植物學(xué)家們接近他們的目標(biāo),中科院植物所的Zheping Xu說到這個(gè)花卉識(shí)別系統(tǒng)不僅讓業(yè)內(nèi)專家有效地掌握中國植物分布的情況,還幫助對(duì)花卉非常有興趣的普通人學(xué)到更多的知識(shí)。

一張圖片經(jīng)過神經(jīng)網(wǎng)絡(luò)層層分析之后,機(jī)器學(xué)習(xí)能夠識(shí)別出其為“雛菊”。
從目前公布的結(jié)果來看,智能花卉識(shí)別系統(tǒng)(Smart Flower Recognition System)的識(shí)別準(zhǔn)確率還是非常不錯(cuò)的。據(jù)微軟公布的消息,不久之后開發(fā)者將基于這個(gè)花卉識(shí)別系統(tǒng)開服出相關(guān)的應(yīng)用,植物學(xué)家們能更加深入他們的研究,家長(zhǎng)們?cè)诿媾R孩子類似的問題前能不再尷尬,與此同時(shí)普通人也能更深入得欣賞花卉的美。
聽起來似乎很不錯(cuò),但是這個(gè)智能花卉識(shí)別系統(tǒng)(Smart Flower Recognition System)不免讓人想起之前微軟推出后火遍全球的how-old.net(測(cè)測(cè)你的年齡)。

How-old.net是微軟在Azure上用新發(fā)布的人臉識(shí)別APIs為2015年微軟開發(fā)者大會(huì)的展示搭建的,借助人臉識(shí)別API這個(gè)網(wǎng)站可以分析用戶上傳的照片中人物的性別和年齡。How-old.net它使用了包括機(jī)器學(xué)習(xí)在內(nèi)的各種最新技術(shù),具體實(shí)現(xiàn)過程如下:
檢測(cè):檢測(cè)圖片中人臉的位置
圖像對(duì)準(zhǔn):確定一些關(guān)鍵的點(diǎn)的位置,比如眉毛、睛、子、角等,確定這些點(diǎn)之后可以確定人臉區(qū)域。
特征提?。河辛藞D像區(qū)域之后,開始提取形狀、紋理、幾何信息是比較關(guān)鍵的特征。
訓(xùn)練:有了大量特征數(shù)據(jù)以及對(duì)應(yīng)的年齡數(shù)據(jù),建立一個(gè)模型開始訓(xùn)練。
估計(jì)年齡:新來一張圖片,獲取特征,根據(jù)訓(xùn)練獲取的訓(xùn)練參數(shù),估計(jì)年齡。
How-old.net主要是靠三個(gè)技術(shù)來完成的,它們分別是人臉檢測(cè)、性別分類和年齡檢測(cè)。其中人臉檢測(cè)是其他兩個(gè)技術(shù)的基礎(chǔ),而年齡檢測(cè)和性別檢測(cè),它們只是在機(jī)器學(xué)習(xí)的過程中解決了分類的問題。這個(gè)涉及到人臉特征的畫像、收集可學(xué)習(xí)的數(shù)據(jù),建立一個(gè)分類模型以及模型優(yōu)化。How-old.net的人臉定位功能及性別識(shí)別功能大致準(zhǔn)確,然而年齡預(yù)測(cè)結(jié)果并不是每次都準(zhǔn)確,如下圖中加拿大流行歌手Justin Bieber的實(shí)際年齡只有22歲(和選取的圖片也有部分關(guān)系)。

林志穎與郭德綱同齡,吳奇隆比他倆都大,但是測(cè)出來的結(jié)果卻是

使用機(jī)器學(xué)習(xí)的How-old.net雖然大部分測(cè)試結(jié)果都是準(zhǔn)確的,但是也存在各種識(shí)別出錯(cuò)的情況(也是How-old.net爆紅的因素之一)。號(hào)稱能達(dá)到90%的的準(zhǔn)確率,同樣使用機(jī)器學(xué)習(xí)的智能花卉識(shí)別系統(tǒng)(Smart Flower Recognition System)是否會(huì)出現(xiàn)類似的錯(cuò)誤,這也是不由得令人好奇。
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑,請(qǐng)立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
電話:021-39553798-8007
更多>相關(guān)專題
0 條相關(guān)評(píng)論