国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機器人  機器人  ABB  機器人產(chǎn)業(yè)聯(lián)盟  發(fā)那科  庫卡  碼垛機器人  機械手 

圖普科技工程師:Mask R-CNN的理論創(chuàng)新會帶來怎樣的可能性?

   日期:2017-04-01     來源:雷鋒網(wǎng)    作者:LLY     評論:0    
標簽:
    Facebook 實驗室出爐的新論文《Mask R-CNN》,第一作者何愷明帶領團隊提出了一種名為「Mask R-CNN」的目標實例分割框架。研究顯示,該框架相比傳統(tǒng)的操作方法更佳簡單靈活。
  如果對物體識別和分割技術有所了解的讀者們,可能對這個流程并不陌生。傳統(tǒng)的物體識別和圖像語義分割技術目前集中于運用 Fast/Faster R-CNN 和全卷積網(wǎng)絡(FCN)框架等方法,上述概念的優(yōu)點非常明顯:
 
  1. 直觀
 
  2. 訓練和推斷速度快
 
  3. 靈活性和魯棒性好
 
  不過在此前文章中提及的一樣,目標分割的難點在于涉及兩個任務:
 
  1. 用物體識別技術識別物體,并用邊界框表示出物體邊界;
 
  2. 用語義分割給像素分類,但不區(qū)分不同的對象實例。
 
  「本篇論文的創(chuàng)新點在于作者在 Faster R-CNN 的基礎上,只增加了一條對計算資源要求很小的分支,就把原來只用在物體檢測任務上的技術應用到物體分割技術上。」
  圖普科技工程師:Mask R-CNN的理論創(chuàng)新會帶來怎樣的可能性?
 
  Mask R-CNN 框架
 
  Mask R-CNN 作為 Faster R-CNN 的擴展形式,主要的任務流程如下:
 
  1. 首先檢測出圖片中可能存在物體的區(qū)間,得到多個候選框;
 
  2. 用一條子神經(jīng)網(wǎng)絡分支預測:
 
  每個框內(nèi)的物體類別
 
  物體在候選框里的矩形范圍(橫坐標縱坐標,寬,高)
 
  3. 用另外一條神經(jīng)網(wǎng)絡分支對每個候選框預測候選框中哪些像素是屬于該物體的。
 
  那么,這樣的改進能夠起到怎樣的作用呢?好處自然非常明顯。
 
  首先是適用性強。Mask R-CNN 的框架非常通用靈活,只需要經(jīng)過少量修改,便能夠推廣到很多的任務上。
 
  其次是更好地利用不同任務的監(jiān)督數(shù)據(jù)。圖普科技工程師表示,「以前是檢測任務只能利用檢測的數(shù)據(jù),分割任務只能利用到分割的數(shù)據(jù),現(xiàn)在 Mask R-CNN 能同時用上檢測,分割等數(shù)據(jù),同時訓練檢測,分割等任務,」AI 科技評論從論文的實驗中了解到,任務都能達到業(yè)界標桿的效果。
 
  在論文中,Mask R-CNN 在 COCO 數(shù)據(jù)集上表現(xiàn)良好,具體實驗結果可以參考AI科技評論的此前文章。那么它是否能延展到更大的范圍呢?圖普科技工程師對此則一分為二地看待,他認為短期內(nèi)在個人領域還無法看到直接應用,不過在云端廠商和科研工作上,由于它良好的表現(xiàn)性能和實用性,的確可以在很多地方獲得大規(guī)模應用。
 
  既然是 Facebook 研究院提出的新成果,根據(jù)圖普科技工程師的設想,可能會有以下三個方向:
 
  首先是圖片自動打標簽的功能?;?Facebook 的社交屬性,它識別人臉的能力已經(jīng)越來越強,但「讀懂圖片」的能力還在不斷探索中。Mask R-CNN 兼具物體識別并用語義分割給像素分類的能力,的確很有可能先在自家的社交網(wǎng)絡上獲得大范圍應用。
 
  其次是 AR 技術。比如說,在鏡頭中的沙發(fā)上顯示一個 3D 虛擬美女,那么如何判斷沙發(fā)的位置和角度,并據(jù)此調(diào)整美女的坐姿,如果要做到「毫無違和感」,同樣需要對圖像的邊界進行界定。
 
  還有一點是 VR 技術?!冈谟螒蝾I域,可以采用 Mask R-CNN 精確捕捉人的動作,讓玩家在能在虛擬世界自由扮演角色?!?/div>
 
  雖然現(xiàn)在討論應用還有些早,不過 AI 科技評論依然期待 FAIR 在未來能有更多的理論創(chuàng)新,并能夠早日應用于我們的生活當中。
 
 
更多>相關資訊
0相關評論

推薦圖文
推薦資訊
點擊排行