国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)

2019-03-11 07:29鄔亞男,李君君,張彬彬
關(guān)鍵詞:目標(biāo)檢測(cè)卷積神經(jīng)網(wǎng)絡(luò)

鄔亞男,李君君,張彬彬

摘要:目標(biāo)檢測(cè)問題一直是計(jì)算機(jī)視覺以及機(jī)器學(xué)習(xí)領(lǐng)域非常重要的研究課題,并且在交通監(jiān)控、醫(yī)學(xué)影像、輔助駕駛等方面有著廣泛的應(yīng)用。由于現(xiàn)實(shí)任務(wù)對(duì)于檢測(cè)速度和精度的要求,目標(biāo)檢測(cè)一直是計(jì)算機(jī)視覺領(lǐng)域具有挑戰(zhàn)性的任務(wù)。語(yǔ)境信息可以作為推理的關(guān)鍵證據(jù)應(yīng)用于多目標(biāo)識(shí)別領(lǐng)域。由此,提出語(yǔ)境信息約束下的直接預(yù)測(cè)目標(biāo)類別和目標(biāo)位置的多目標(biāo)檢測(cè)網(wǎng)絡(luò)。該網(wǎng)絡(luò)采取端對(duì)端的訓(xùn)練方式,分層提取特征,并利用語(yǔ)境信息微調(diào)網(wǎng)絡(luò)的輸出結(jié)果以更好地進(jìn)行實(shí)時(shí)預(yù)測(cè)。在PASCAL VOC 2007數(shù)據(jù)集上的定性及定量實(shí)驗(yàn)結(jié)果,證明了深度語(yǔ)境網(wǎng)絡(luò)下的目標(biāo)檢測(cè)模型具有顯著的目標(biāo)檢測(cè)性能,優(yōu)于當(dāng)前先進(jìn)的方法。實(shí)驗(yàn)證明,利用語(yǔ)境信息可以為目標(biāo)檢測(cè)提供有效的判定依據(jù),提高檢測(cè)的準(zhǔn)確率。

關(guān)鍵詞:目標(biāo)檢測(cè);語(yǔ)境信息;實(shí)時(shí)檢測(cè);卷積神經(jīng)網(wǎng)絡(luò)

0引言

目標(biāo)檢測(cè)的任務(wù)是集目標(biāo)分類、目標(biāo)定位兩者之所長(zhǎng),檢測(cè)輸入圖像中所有感興趣的目標(biāo)的類別屬性和位置屬性,輸出相對(duì)應(yīng)的概率標(biāo)簽,表明將目標(biāo)分類為該類別的概率,明確輸入圖像中感興趣物體的位置和范圍,以矩形框表示物體的所在。目標(biāo)檢測(cè)問題一直是計(jì)算機(jī)視覺以及機(jī)器學(xué)習(xí)領(lǐng)域非常重要的研究課題,并且在視頻監(jiān)控、行人檢測(cè)、行為識(shí)別、場(chǎng)景理解等方面有著廣泛的應(yīng)用。

傳統(tǒng)目標(biāo)檢測(cè)模型主要由人工設(shè)計(jì)特征以及分類決策構(gòu)成。通過人工設(shè)計(jì)特征表達(dá),然后設(shè)計(jì)相應(yīng)的分類器對(duì)目標(biāo)進(jìn)行檢測(cè)。雖然這些手工制作的方法取得了令人矚目的成功,但其在實(shí)踐中不能靈活捕獲圖片信息,這可能會(huì)阻礙性能進(jìn)一步提高。隨著機(jī)器學(xué)習(xí)理論逐步完善以及深度學(xué)習(xí)技術(shù)的日益發(fā)展,深度網(wǎng)絡(luò)模型不斷發(fā)展壯大,對(duì)于特征的表達(dá)能力日益增強(qiáng),檢測(cè)精度也得以提升。目標(biāo)檢測(cè)任務(wù)從傳統(tǒng)模型逐漸向基于深度學(xué)習(xí)的模型研究,涌現(xiàn)了一大批深度網(wǎng)絡(luò)下的目標(biāo)檢測(cè)模型。盡管如此,由于現(xiàn)實(shí)任務(wù)高精度、高速度的目標(biāo)檢測(cè)需求,當(dāng)前的目標(biāo)檢測(cè)結(jié)果仍然差強(qiáng)人意。因此,深度檢測(cè)模型設(shè)計(jì)仍然面臨著巨大的壓力,仍然是亟待優(yōu)化和解決的具有挑戰(zhàn)性的研究課題。

語(yǔ)境線索在搜索和檢測(cè)物體中有著重要作用,并且在計(jì)算機(jī)視覺和認(rèn)知神經(jīng)科學(xué)等方面有著重要的應(yīng)用。語(yǔ)境有助于圖像理解,符合現(xiàn)實(shí)世界的客觀規(guī)律,語(yǔ)境信息對(duì)于人類識(shí)別物體也至關(guān)重要,計(jì)算機(jī)視覺的許多研究證明,通過適當(dāng)?shù)恼Z(yǔ)境建模能夠有效改進(jìn)識(shí)別算法。由于視覺對(duì)象在其外觀、動(dòng)作等方面變化很大,通常難以僅使用局部線索來學(xué)習(xí)魯棒模型。同時(shí),由于物體幾乎不是孤立地發(fā)生的,其語(yǔ)境信息,可以用來評(píng)估目標(biāo)檢測(cè)模型的輸出并提高檢測(cè)性能。本文的主要貢獻(xiàn)如下:

(1)在SSD模型基礎(chǔ)上,提出語(yǔ)境信息約束下的直接預(yù)測(cè)目標(biāo)類別和目標(biāo)位置的多目標(biāo)檢測(cè)網(wǎng)絡(luò),該網(wǎng)絡(luò)采取端對(duì)端的訓(xùn)練方式,分層提取特征并進(jìn)行實(shí)時(shí)的目標(biāo)檢測(cè)。

(2)采用語(yǔ)境信息作為約束條件,預(yù)測(cè)目標(biāo)類別和目標(biāo)位置,利用語(yǔ)境信息微調(diào)網(wǎng)絡(luò)的輸出結(jié)果,以更好地進(jìn)行實(shí)時(shí)預(yù)測(cè)。

(3)在PASCAL VOC 2007數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,證明了本文方法在公開數(shù)據(jù)集測(cè)試中具有顯著的目標(biāo)檢測(cè)性能,優(yōu)于當(dāng)前先進(jìn)的方法。

1相關(guān)工作

針對(duì)圖像目標(biāo)檢測(cè)問題,通常有兩種常見的目標(biāo)檢測(cè)模型,一種為基于滑動(dòng)窗口的目標(biāo)檢測(cè)模型,另一種為基于區(qū)域提議的目標(biāo)檢測(cè)模型。在卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前,DPM和選擇性搜索受到了許多的關(guān)注。在R-CNN結(jié)合選擇性搜索、區(qū)域提議以及卷積神經(jīng)網(wǎng)絡(luò)帶來顯著改進(jìn)后,基于區(qū)域提議的目標(biāo)檢測(cè)方法變得流行。

SPPnet顯著加快了原有的R-CNN方法,其引入了一個(gè)空間金字塔池化層,對(duì)區(qū)域大小和尺度更加魯棒,并允許分類層重用多個(gè)圖像分辨率下生成的特征映射上計(jì)算的特征。Fast R-CNN擴(kuò)展了SPPnet.使得其可以通過最小化置信度和邊界框回歸的損失,來對(duì)所有層進(jìn)行端到端的微調(diào),并初次利用MuhiBox學(xué)習(xí)目標(biāo)信息。然而,F(xiàn)ast R-CNN仍然選擇使用選擇性搜索進(jìn)行區(qū)域提議,浪費(fèi)了太多的檢測(cè)時(shí)間。據(jù)此,F(xiàn)aster R-CNN提出區(qū)域提議網(wǎng)絡(luò)進(jìn)行區(qū)域提議,并引入了一種方法,通過微調(diào)共享卷積層和預(yù)測(cè)層將區(qū)域提議網(wǎng)絡(luò)和Fast R-CNN結(jié)合在一起,使用區(qū)域提議網(wǎng)絡(luò)池化中級(jí)特征,提升了檢測(cè)速度。

基于滑動(dòng)窗口的目標(biāo)檢測(cè)模型完全跳過提出步驟,直接預(yù)測(cè)多個(gè)類別的邊界框和置信度。OverFeat是首先利用滑動(dòng)窗口進(jìn)行目標(biāo)檢測(cè)的方法,在知道了底層目標(biāo)類別的置信度之后,直接從最頂層的特征映射的每個(gè)位置預(yù)測(cè)邊界框。之前常見的檢測(cè)方法都將檢測(cè)轉(zhuǎn)換為分類問題,而YOLO另辟蹊徑,僅僅經(jīng)過一個(gè)神經(jīng)網(wǎng)絡(luò),將檢測(cè)轉(zhuǎn)換為回歸問題,從而實(shí)現(xiàn)端對(duì)端優(yōu)化。YOLO使用整個(gè)最頂層的特征映射來預(yù)測(cè)多個(gè)類別和邊界框(這些類別共享)的置信度。YOLO經(jīng)過不斷更新多次優(yōu)化升級(jí)得到目前的YOLOv3.并在設(shè)計(jì)上進(jìn)行了一定的改進(jìn):首先融合先前的Darknet-19網(wǎng)絡(luò)以及殘差網(wǎng)絡(luò),設(shè)計(jì)出DarkNet-53網(wǎng)絡(luò)進(jìn)行特征提取,功能更加強(qiáng)大。此外,YOLOv3還能夠進(jìn)行跨尺度預(yù)測(cè),利用金字塔網(wǎng)絡(luò)的概念預(yù)測(cè)出三個(gè)不同的尺度上邊界框。

語(yǔ)境信息可以作為推理的關(guān)鍵證據(jù)應(yīng)用于多目標(biāo)識(shí)別領(lǐng)域。然而,上述研究忽略了語(yǔ)境信息的重要作用,僅僅利用設(shè)計(jì)的目標(biāo)檢測(cè)器檢測(cè)對(duì)象類別及位置,結(jié)果可能會(huì)違反現(xiàn)實(shí)世界中的規(guī)律。在考慮語(yǔ)境信息之后,準(zhǔn)確性得到了很大改善。在傳統(tǒng)模型中,檢測(cè)算法由人工設(shè)計(jì)特征及淺層分類器構(gòu)成。語(yǔ)境信息可作為正則化約束條件,調(diào)整檢測(cè)結(jié)果以提高性能,也可以約束深度學(xué)習(xí)模型,利用這種豐富的且有區(qū)別的語(yǔ)境信息有助于機(jī)器獲取行為發(fā)生時(shí)相應(yīng)的場(chǎng)景信息,獲得圖像內(nèi)容的理解,提高檢測(cè)的準(zhǔn)確度。例如,Bell等人也分別對(duì)語(yǔ)境和外部場(chǎng)景進(jìn)行了建模。利用空間循環(huán)神經(jīng)網(wǎng)絡(luò)分別對(duì)感興趣區(qū)域的外部環(huán)境整合了多尺度語(yǔ)境,有助于特定的小目標(biāo)檢測(cè)。Zhe等人通過可學(xué)習(xí)的直方圖層在端到端訓(xùn)練中學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)中的統(tǒng)計(jì)語(yǔ)境特征,將可學(xué)習(xí)的直方圖層集成到深層網(wǎng)絡(luò)中,探索了語(yǔ)義分割和目標(biāo)檢測(cè)兩個(gè)視覺問題。Heilbron等人提出語(yǔ)境級(jí)聯(lián)模型,通過采用與人類活動(dòng)相關(guān)的語(yǔ)義先驗(yàn),語(yǔ)境級(jí)聯(lián)模型產(chǎn)生高質(zhì)量的特定類別的行動(dòng)提議,并通過級(jí)聯(lián)的方式抑制無關(guān)的活動(dòng)提議。

2語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)

利用語(yǔ)境信息作為約束條件,能夠準(zhǔn)確且有效地捕捉圖片中除了目標(biāo)物本身之外的所有信息(包括其它目標(biāo)信息和背景信息)。語(yǔ)境信息作為目標(biāo)檢測(cè)推理過程的關(guān)鍵證據(jù),具有重要的作用及意義。以此作為切入點(diǎn),構(gòu)建語(yǔ)境信息約束下實(shí)時(shí)的多目標(biāo)檢測(cè)網(wǎng)絡(luò),如圖l所示。該網(wǎng)絡(luò)分層提取特征并依次進(jìn)行邊框回歸和分類,從而得到圖像中所有感興趣的目標(biāo)類別屬性和位置屬性。

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)的主要貢獻(xiàn)如下:

(1)在SSD模型基礎(chǔ)上進(jìn)行改進(jìn),提出語(yǔ)境信息約束下能夠端對(duì)端訓(xùn)練的多目標(biāo)檢測(cè)網(wǎng)絡(luò),并依次進(jìn)行邊框回歸和分類。

(2)采用語(yǔ)境信息約束網(wǎng)絡(luò)輸出結(jié)果,微調(diào)網(wǎng)絡(luò)的輸出結(jié)果以更好地進(jìn)行實(shí)時(shí)預(yù)測(cè)。

2.1語(yǔ)境約束

多目標(biāo)檢測(cè)網(wǎng)絡(luò)經(jīng)過初步訓(xùn)練,將得到訓(xùn)練集圖像所有候選框中目標(biāo)的語(yǔ)義類別、標(biāo)簽以及所有候選框的位置坐標(biāo)。由此,可以計(jì)算出候選框中心位置點(diǎn)的坐標(biāo)。已知語(yǔ)義類別集合,可得候選目標(biāo)O的位置屬性v.以及候選目標(biāo)的語(yǔ)義屬性a。定義語(yǔ)義存在矩陣,統(tǒng)計(jì)每一幅圖像中出現(xiàn)的類別,語(yǔ)義存在矩陣,統(tǒng)計(jì)所有訓(xùn)練集圖像中同時(shí)出現(xiàn)的類別,對(duì)即可得語(yǔ)義類別共現(xiàn)頻率矩陣,統(tǒng)計(jì)訓(xùn)練集圖像中同時(shí)出現(xiàn)的類別頻率。由候選目標(biāo)的語(yǔ)義屬性以及語(yǔ)義類別共現(xiàn)頻率矩陣作為語(yǔ)義信息獲取目標(biāo)類別關(guān)系。目標(biāo)類別之間語(yǔ)義約束置信度獲取方法如下:

其中,I表示訓(xùn)練集圖像I(n)∈Itrain;a表示語(yǔ)義類別集合am,an∈a;v表示候選框vi,vj∈ v;o候選框中目標(biāo)的語(yǔ)義類別標(biāo)簽;I表示計(jì)數(shù)函數(shù)。

由目標(biāo)對(duì)的位置信息可計(jì)算類別間的相對(duì)位置信息。該信息是一個(gè)向量,包含兩個(gè)類別間的距離和角度信息,由目標(biāo)對(duì)的相對(duì)位置信息可計(jì)算類別間相對(duì)位置,分別作為位置信息獲取目標(biāo)類別關(guān)系。目標(biāo)類別之間位置約束置信度獲取方法如下:

其中,[xi,yi]表示候選框的中心位置坐標(biāo);[△xij,△yij]表示屬于兩個(gè)類別am,an之間的候選框vi,vj相對(duì)位置;v為目標(biāo)對(duì)的相對(duì)位置均值;σ2為目標(biāo)對(duì)的相對(duì)位置方差;f為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。

根據(jù)捕獲的目標(biāo)類別關(guān)系,微調(diào)候選目標(biāo)框的類別得分。通過語(yǔ)境約束Csemantic以及Clocation判斷后,對(duì)于每張圖片的每個(gè)目標(biāo),考慮所有與之相關(guān)的候選框類別,得到最終類別置信度c。

2.2網(wǎng)絡(luò)模型

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)與Faster R-CNN中的區(qū)域提議網(wǎng)絡(luò)非常相似,也使用了一組固定的邊界框進(jìn)行預(yù)測(cè),類似于RPN中的錨邊界框。但并不是使用這些來池化特征并評(píng)估另一個(gè)分類器,而是為每個(gè)目標(biāo)類別在每個(gè)邊界框中同時(shí)生成一個(gè)分?jǐn)?shù)。因此,本文的方法避免了將區(qū)域提議網(wǎng)絡(luò)與Fast R-CNN合并的復(fù)雜性,并且更容易訓(xùn)練,更快且更直接地集成到其它任務(wù)中。語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)使用默認(rèn)邊界框,方法比現(xiàn)有方法更靈活,可以在不同尺度的多個(gè)特征映射的每個(gè)特征位置上使用不同長(zhǎng)寬比的默認(rèn)邊界框。如果只從最頂層的特征映射的每個(gè)位置使用一個(gè)默認(rèn)框,語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)將具有與OverFeat相似的架構(gòu),若使用整個(gè)最頂層的特征映射,并添加一個(gè)全連接層進(jìn)行預(yù)測(cè)來代替卷積預(yù)測(cè)器,并且沒有明確地考慮多個(gè)長(zhǎng)寬比,將近似地再現(xiàn)YOLO。

利用在ILSVRC CLS-LOC數(shù)據(jù)集上已經(jīng)預(yù)先訓(xùn)練好的VGG16網(wǎng)絡(luò),作為基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。通過多層卷積分層提取特征,直接檢測(cè)圖像中的目標(biāo),最終獲得固定尺度的邊界框以及對(duì)象的類別。將多個(gè)卷積層添加到VGG16第五個(gè)卷積層之后,VGG第六、七層原本為全連接層,將其替換為卷積層,從其中重采樣參數(shù)。然后繼續(xù)增加4個(gè)卷積層,所以總共含有6種尺度的卷積層,尺寸逐漸減小,每種尺度的卷積層都能學(xué)習(xí)到一個(gè)特征圖,將6種尺度卷積層學(xué)習(xí)的多個(gè)特征圖預(yù)測(cè)組合在一起,以便于針對(duì)不同尺度的目標(biāo)檢測(cè)問題。SSD模型訓(xùn)練一開始,需要將真實(shí)信息分配給固定的檢測(cè)器,輸出集合中的特定輸出,一旦確定了這個(gè)分配,損失函數(shù)和反向傳播就可以應(yīng)用端到端了。通過計(jì)算交疊面積,保證唯一的默認(rèn)框與真實(shí)標(biāo)簽一一對(duì)應(yīng),之后只要交疊面積大于設(shè)定的閾值就將默認(rèn)框與真實(shí)標(biāo)簽進(jìn)行隨機(jī)匹配,使網(wǎng)絡(luò)可以預(yù)測(cè)同個(gè)位置的多個(gè)框。測(cè)試時(shí),根據(jù)訓(xùn)練好的模型得到每個(gè)候選框中的目標(biāo)類別的預(yù)測(cè)分?jǐn)?shù),同時(shí)對(duì)候選框進(jìn)行調(diào)整以便于更好地匹配目標(biāo)形狀。使用隨機(jī)梯度下降,對(duì)得到的語(yǔ)境信息約束下的實(shí)時(shí)多目標(biāo)檢測(cè)網(wǎng)絡(luò)模型進(jìn)行微調(diào),初始學(xué)習(xí)率為10-3,動(dòng)量為0.9.權(quán)重衰減為0.0005.批處理數(shù)據(jù)大小為32。針對(duì)每個(gè)數(shù)據(jù)集的學(xué)習(xí)速率衰減策略略有不同,本文使用Caffe框架,實(shí)驗(yàn)環(huán)境硬件平臺(tái)配置為CoreX i7-6800k 6核、3.4GHz CPU、2塊NIVDIA GTX10808GB顯卡。整個(gè)語(yǔ)境信息約束下的實(shí)時(shí)多目標(biāo)檢測(cè)網(wǎng)絡(luò)訓(xùn)練過程的損失函數(shù)為:

其中,x為網(wǎng)絡(luò)輸入;c為類別置信度;l和g分別為預(yù)測(cè)框和真實(shí)標(biāo)簽;Lconf代表置信損失,置信度損失是在多類別置信度上的softmax損失;Lloc代表定位損失,定位損失是預(yù)測(cè)框與真實(shí)框參數(shù)之間的Smooth L1損失,

3實(shí)驗(yàn)結(jié)果與分析

3.1數(shù)據(jù)集與評(píng)價(jià)標(biāo)準(zhǔn)

由于PASCAL VOC 2007數(shù)據(jù)集是一個(gè)有著明顯層級(jí)結(jié)構(gòu)的多類別、多目標(biāo)類型的數(shù)據(jù)集,類別、目標(biāo)之間具有明顯的共生關(guān)系。所以本文選擇在PASCAL VOC 2007數(shù)據(jù)集上評(píng)估DCN方法。該數(shù)據(jù)集包括20個(gè)對(duì)象類別,9963張高質(zhì)量圖片。其中5011張訓(xùn)練和驗(yàn)證集圖像,4952張測(cè)試圖像,包含24640個(gè)已標(biāo)注的目標(biāo),該數(shù)據(jù)集為圖像分割、目標(biāo)識(shí)別和目標(biāo)檢測(cè)提供標(biāo)準(zhǔn)。為了證明DCN方法的檢測(cè)精度,本文采用類別平均精準(zhǔn)度(Ap.Average Precision)值和平均AP(mean AP)值進(jìn)行評(píng)測(cè)。

其中,N(TruePositives)ci為正確預(yù)測(cè)的數(shù)量;N(TotalObjects)ci該圖像中給定類別ci的實(shí)際目標(biāo)的數(shù)量;Precisionci為類ci的精度。平均AP值即為所有類別的平均精度求和除以所有類別。

實(shí)驗(yàn)方法中,如果預(yù)測(cè)窗口與數(shù)據(jù)集標(biāo)定的ground-truth窗口面積IoU重疊大于50%(mAP@IoU=0.5),則認(rèn)為此提議窗口的檢測(cè)是正確的,否則是錯(cuò)誤的,

3.2實(shí)驗(yàn)結(jié)果分析

本文在PASCAL VOC 2007數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)驗(yàn)證,并與當(dāng)前先進(jìn)檢測(cè)方法R-CNN、Fast R-CNN、Faster R-CNN、G-CNN、OHEM、SSD進(jìn)行對(duì)比,以驗(yàn)證語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)方法的目標(biāo)檢測(cè)效果。

表1給出了不同線索下語(yǔ)境信息約束下,多目標(biāo)檢測(cè)網(wǎng)絡(luò)在PASCAL VOC 2007數(shù)據(jù)集上得到平均準(zhǔn)確率值,以證明不同線索對(duì)檢測(cè)結(jié)果的影響。其中semantic代表語(yǔ)義約束,location代表位置約束。由表1可得,語(yǔ)境信息約束分別作用以及共同作用下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)對(duì)于檢測(cè)精度的提升效果。

表2給出了語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)與對(duì)比方法,分別在PASCAL VOC 2007數(shù)據(jù)集上的平均AP值以及20個(gè)類別條件下得到平均準(zhǔn)確率值。由表2可得,在PASCAL VOC 2007數(shù)據(jù)集下以及20個(gè)類別條件下得到的平均準(zhǔn)確率,總體優(yōu)于當(dāng)前先進(jìn)方法。

語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)能夠在一定程度上處理漏檢(chair、bird)、誤檢(potted plant、sofa)等問題,針對(duì)檢測(cè)錯(cuò)誤以及不準(zhǔn)確等問題進(jìn)行修正,提升檢測(cè)的精準(zhǔn)度,具有更好的檢測(cè)效果,如圖2所示。

圖3給出了PASCAL VOC 2007數(shù)據(jù)集上6個(gè)示例類別的平均精準(zhǔn)度柱狀圖結(jié)果,驗(yàn)證了利用語(yǔ)境信息約束能夠提升多目標(biāo)檢測(cè)網(wǎng)絡(luò)的檢測(cè)效果,語(yǔ)義約束和位置約束對(duì)于目標(biāo)檢測(cè)有著重要的作用。

4結(jié)束語(yǔ)

本文介紹了語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò),是一種快速的單次多類別目標(biāo)檢測(cè)器,模型的關(guān)鍵特性是使用網(wǎng)絡(luò)頂部多個(gè)特征映射的多尺度卷積邊界框輸出,這種表示能夠高效地建模可能的邊界框形狀空間。語(yǔ)境信息約束下的多目標(biāo)檢測(cè)網(wǎng)絡(luò)在準(zhǔn)確性和速度方面與其對(duì)應(yīng)的最先進(jìn)的目標(biāo)檢測(cè)器相比毫不遜色。在PASCAL VOC 2007數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明了本文方法在公開數(shù)據(jù)集測(cè)試中具有顯著的目標(biāo)檢測(cè)性能,提高了檢測(cè)精度,優(yōu)于當(dāng)前先進(jìn)的方法,在此基礎(chǔ)上仍然存在許多可以深入研究的方向,其中有前景的未來方向是探索其作為系統(tǒng)的一部分,使該模型作為目標(biāo)檢測(cè)組件的大型系統(tǒng)有用的構(gòu)建模塊,同時(shí)檢測(cè)和跟蹤視頻中的目標(biāo)。

猜你喜歡
目標(biāo)檢測(cè)卷積神經(jīng)網(wǎng)絡(luò)
基于卷積神經(jīng)網(wǎng)絡(luò)溫室智能大棚監(jiān)控系統(tǒng)的研究
視頻中目標(biāo)檢測(cè)算法研究
基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
行為識(shí)別中的人體運(yùn)動(dòng)目標(biāo)檢測(cè)方法
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
移動(dòng)機(jī)器人圖像目標(biāo)識(shí)別
基于卷積神經(jīng)網(wǎng)絡(luò)的樹葉識(shí)別的算法的研究
基于背景建模法的運(yùn)動(dòng)目標(biāo)檢測(cè)
基于P3電位的目標(biāo)檢測(cè)研究
民权县| 西盟| 海淀区| 洛隆县| 临邑县| 和田县| 崇仁县| 临漳县| 富民县| 饶河县| 河北区| 武义县| 大田县| 三门峡市| 临夏市| 普陀区| 北宁市| 亳州市| 桐城市| 盱眙县| 阿巴嘎旗| 特克斯县| 通辽市| 巍山| 洪湖市| 泽州县| 沾益县| 茶陵县| 乌拉特后旗| 大兴区| 罗田县| 嫩江县| 武冈市| 四子王旗| 江陵县| 重庆市| 阿克陶县| 长治县| 巴彦县| 平定县| 龙胜|