国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機(jī)器人  機(jī)器人  ABB  機(jī)器人產(chǎn)業(yè)聯(lián)盟  發(fā)那科  庫(kù)卡  碼垛機(jī)器人  機(jī)械手 

三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例

   日期:2017-08-24     來(lái)源:36氪    作者:dc136     評(píng)論:0    
   本文將介紹定義問題的方式,以及我解決問題的方式。
 
  目錄
 
  為什么選擇“椅子問題”?
 
  問題簡(jiǎn)單化:在清晰的圖像中進(jìn)行“椅子識(shí)別”
 
  進(jìn)一步的挑戰(zhàn):找到椅子的位置
 
  一個(gè)先進(jìn)的“對(duì)象識(shí)別”技術(shù)——YOLO概述
 
  將YOLO應(yīng)用于“椅子識(shí)別”
 
  面臨的挑戰(zhàn)以及未來(lái)將采取的步驟
 
     為什么選擇“椅子問題”?
 
  首先我將闡述我為什么想要在一張照片中“數(shù)椅子”。
 
  在Analytics Vidhya的辦公室里,通常會(huì)有10到15個(gè)人。但到了夏天,實(shí)習(xí)生們就會(huì)“涌入”我們的辦公室。所以,如果我們要在夏天開全員大會(huì),我們就必須要從其他房間里拉出所有空的椅子。
 
  我是一個(gè)特別懶的人,所以我想,有沒有一種算法能夠直接告訴我們哪間房間有空閑的椅子。這樣一來(lái),我們就不用挨個(gè)房間找椅子了,省時(shí)又省力。
 
  這看上去是個(gè)再簡(jiǎn)單不過的問題,但我可以用它來(lái)嘗試我獲得的新技能。深度學(xué)習(xí)能夠解決這個(gè)問題嗎?老實(shí)說(shuō),我也不確定深度學(xué)習(xí)究竟能不能用來(lái)解決這一問題,但是試一下總沒有壞處,不是嗎?
 
  問題中需完成的任務(wù)
 
  既然你已經(jīng)了解了我們需要解決的問題,那么接下來(lái)我會(huì)向你介紹我解決問題的過程。我會(huì)把這個(gè)問題分解為四個(gè)不同的任務(wù)——
 
  假如我們有一個(gè)房間的視頻資源,那么在視頻中有沒有出現(xiàn)一把椅子?
 
  如果視頻中出現(xiàn)了椅子,那么這把椅子在房間的什么位置呢?
 
  這把椅子是否被占用了?如果有未被占用的椅子,那么未被占用的椅子數(shù)量是多少呢?
 
  我們應(yīng)該從哪間房間里搬空椅子?
 
  我決定先解決一個(gè)相對(duì)簡(jiǎn)單的問題,然后再嘗試解決更復(fù)雜的問題。循序漸進(jìn),一步步達(dá)到我的目標(biāo)。這也是我將這個(gè)問題分解為四個(gè)不同的任務(wù)的原因。在本文,我將詳細(xì)介紹前兩個(gè)任務(wù)的完成過程;在后續(xù)文章中,我會(huì)繼續(xù)介紹后兩個(gè)任務(wù)的完成過程。
 
  問題簡(jiǎn)單化:在清晰的圖像中進(jìn)行“椅子識(shí)別”
 
  解決“椅子問題”的第一步,也是最簡(jiǎn)單的一步,就是判斷圖片中的房間內(nèi)是否有椅子?,F(xiàn)在,我將這個(gè)問題進(jìn)一步簡(jiǎn)化——我將網(wǎng)絡(luò)對(duì)視頻資源的需求忽略,給網(wǎng)絡(luò)輸入了我拍攝的幾張照片。
 
  假設(shè)我給你兩張照片,你能告訴我哪一張照片中有椅子嗎?
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
 
  答案是第一張,而你究竟是怎么知道的呢?
 
  因?yàn)槟阋娺^椅子很多很多次了,所以對(duì)你來(lái)說(shuō)判斷圖片里有沒有椅子并不難。換言之,你對(duì)于現(xiàn)實(shí)中的椅子長(zhǎng)什么樣已經(jīng)有了了解。同樣的,我們可以訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),讓網(wǎng)絡(luò)幫我們完成這個(gè)識(shí)別的工作。
 
  順便提一下,我們之所以使用神經(jīng)網(wǎng)絡(luò)而不用其他的算法,是因?yàn)樯窠?jīng)網(wǎng)絡(luò)是在圖像處理問題方面最強(qiáng)大、最先進(jìn)的技術(shù)。
 
  所以,我將一個(gè)經(jīng)過ImageNet數(shù)據(jù)集預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)應(yīng)用到這些圖像上。
 
  但是當(dāng)我讓模型識(shí)別圖像中的對(duì)象時(shí),出現(xiàn)了一個(gè)問題——它不能準(zhǔn)確地分別圖像中的對(duì)象。例如,下圖是模型針對(duì)圖像的輸出結(jié)果。
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
  [[('n03179701', 'desk', 0.56483036), ('n03337140', 'file', 0.14689149), ('n04550184', 'wardrobe', 0.03918023)]]
 
  它將圖片中的“椅子”錯(cuò)誤地判斷成了“書桌”。這樣的結(jié)果實(shí)在令人很失望,因?yàn)闀篮鸵巫拥南嗨贫炔桓撸蠢韥?lái)說(shuō)是非常容易區(qū)分的。
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
  解決“椅子還是書桌”的問題
 
  正如我在之前的文章中提到的,每當(dāng)我在建立神經(jīng)網(wǎng)絡(luò)時(shí)遇到問題,我就會(huì)逐步解決這個(gè)問題。我會(huì)將每個(gè)步驟列成一個(gè)清單:
 
  第一步:檢查網(wǎng)絡(luò)架構(gòu)
 
  第二步:檢查神經(jīng)網(wǎng)絡(luò)的超參數(shù)
 
  第三步:檢查網(wǎng)絡(luò)的復(fù)雜性
 
  第四步:檢查輸入數(shù)據(jù)的結(jié)構(gòu)
 
  第五步:檢查數(shù)據(jù)的分布
 
  在一番檢查評(píng)估之后,我發(fā)現(xiàn)模型的圖像輸入是不正確的,因?yàn)槲覜]有正確地處理圖像的縱橫比例。所以,為了解決這個(gè)問題,我添加了一個(gè)自定義代碼,該自定義代碼之前在GitHub上的一個(gè)keras問題中出現(xiàn)過。更新的圖像如下圖:
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
  [[('n02791124', 'barber_chair', 0.77817303), ('n03179701', 'desk', 0.090379775), ('n03337140', 'file', 0.033129346)]]
 
  處理完這個(gè)問題以后,模型就能開始正常地工作,輸出正確的結(jié)果了。
 
  進(jìn)一步的挑戰(zhàn):找到椅子的位置
 
  現(xiàn)在,我們已經(jīng)判斷出了圖像中有一把椅子,那么接下來(lái)我們就要識(shí)別這把椅子在什么位置。除了這把椅子,我們還要識(shí)別出圖像中的人。我們需要通過識(shí)別這個(gè)人來(lái)判斷這把椅子是否被占用了。這兩個(gè)任務(wù)(任務(wù)二和任務(wù)三)將有助于我們解決和處理更大的任務(wù),判斷作這把椅子是否被占用了。
 
  與前面的任務(wù)一樣,我們將使用一個(gè)預(yù)訓(xùn)練的網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)將給我們提供一個(gè)可接受的分?jǐn)?shù)。目前,YOLO網(wǎng)絡(luò)是“對(duì)象檢測(cè)”的最佳模型,它能夠?qū)崟r(shí)地展示相當(dāng)不錯(cuò)的性能。在本文,我對(duì)YOLO網(wǎng)絡(luò)做了簡(jiǎn)單的介紹。下面,我們來(lái)看看如何利用YOLO解決這個(gè)問題。
 
  使用YOLO進(jìn)行“椅子檢測(cè)”
 
  在系統(tǒng)中設(shè)置YOLO網(wǎng)絡(luò),我們可以按照以下簡(jiǎn)單的步驟:
 
  第一步:
 
  git clone https://github.com/pjreddie/darknet
 
  cd darknet
 
  make
 
  第二步:
 
  wget https://pjreddie.com/media/files/yolo.weights
 
  用YOLO來(lái)解決我們的問題,你需要輸入以下指令,并且提供你自己圖像的位置
 
  ./darknet detect cfg/yolo.cfg yolo.weights //data/image.jpg
 
  在我們的圖像上應(yīng)用了YOLO之后,我發(fā)現(xiàn)其結(jié)果非常不錯(cuò)。下面是一些例子:
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
  面臨的挑戰(zhàn)以及未來(lái)將采取的步驟
 
  雖然開端進(jìn)展得非常順利,但是仍然有問題會(huì)阻礙這個(gè)項(xiàng)目的發(fā)展。以下是其中一些問題:
 
  問題一:這個(gè)YOLO模型還是會(huì)出現(xiàn)一些錯(cuò)誤,它并不是一個(gè)100%正確的模型。比如,在下面的這張圖片中,一個(gè)垃圾桶竟然被錯(cuò)誤地識(shí)別成了一個(gè)人!
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
  問題二:如果在一張圖像中,一把椅子擋住了另外一把椅子,算法還能識(shí)別出這把被擋住的椅子嗎?這是個(gè)值得思考的問題。
三分鐘搞懂深度學(xué)習(xí):物體的識(shí)別和檢測(cè),以“找椅子”為例
  除了這些可能出現(xiàn)的問題之外,還有一些更加實(shí)際的細(xì)節(jié)需要考慮,比如說(shuō),算法推薦一個(gè)解決方案需要多長(zhǎng)時(shí)間?算法需要運(yùn)行什么類型的硬件?等等。這些都是在把算法作為商品出售之前需要考慮和解決的問題。
 
  同樣,像之前所說(shuō)的,在這篇文章中只討論前面兩個(gè)任務(wù),還沒有涉及到后面兩個(gè)任務(wù)。那么,接下來(lái)的任務(wù)就是計(jì)算出房間內(nèi)的椅子數(shù)量,然后建立起一個(gè)“端到端”的產(chǎn)品。
 
  尾注
 
  本文內(nèi)容涵蓋了圖像中的“物體檢測(cè)和識(shí)別”,其中的物體就是“椅子”。針對(duì)物體識(shí)別,我們用了一個(gè)簡(jiǎn)單的預(yù)訓(xùn)練的模型來(lái)識(shí)別圖像中的物體。另一方面,針對(duì)物體檢測(cè),我們使用了YOLO網(wǎng)絡(luò)——一項(xiàng)非常先進(jìn)的對(duì)象實(shí)時(shí)檢測(cè)技術(shù)。
 
 
更多>相關(guān)資訊
0相關(guān)評(píng)論

推薦圖文
推薦資訊
點(diǎn)擊排行