国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征重用和語義聚合的SAR圖像艦船目標(biāo)檢測

2019-02-16 07:11:32李建偉張玉婷
關(guān)鍵詞:錨框艦船個(gè)數(shù)

江 源,李建偉,張玉婷

(1.海軍研究院特種勤務(wù)研究所,北京102400;2.海軍參謀部機(jī)要局,北京100841)

隨著卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺任務(wù)中取得極大的成功[1-5],SAR圖像中目標(biāo)檢測也急須引入此類方法。文獻(xiàn)[6]雙階段檢測算法Faster R-CNN 用于SAR圖像艦船目標(biāo)檢測,并進(jìn)行了適應(yīng)性的改進(jìn)。相比于雙階段檢測算法,單階段檢測算法速度更快,但精度會(huì)稍差。

2016 年12 月,LIU WEI 等 提 出 了SSD(Single Shot Detector)[7]檢測算法,將回歸思想和錨框機(jī)制結(jié)合,通過在不同卷積層的特征圖上預(yù)測目標(biāo)區(qū)域,生成離散化的多尺度、多比例的錨框坐標(biāo)。同時(shí),利用小卷積核預(yù)測一系列候選框的坐標(biāo)和每個(gè)類別的置信度,既保持了快速性,又保證了邊框定位效果。

SSD對(duì)輸入圖像數(shù)據(jù)的處理流程如圖1所示。圖中包括骨干網(wǎng)絡(luò)(采用了16 層的VGG-Net[8]模型,即VGG-16)、前端網(wǎng)絡(luò)(預(yù)測層)和后處理(通過NMS實(shí)現(xiàn))3部分。骨干網(wǎng)絡(luò)用于特征提取,一般需要加載分類任務(wù)中訓(xùn)練好的參數(shù)。之后,根據(jù)具體任務(wù)進(jìn)行微調(diào);前端網(wǎng)絡(luò)用于目標(biāo)預(yù)測,一般需要初始化之后從頭進(jìn)行訓(xùn)練;后處理用于去除多余的邊框。

圖1 SSD處理流程Fig.1 Processing flows of the SSD

圖2 SSD前端網(wǎng)絡(luò)原理示意圖Fig.2 Sketch map of the SSD front end network

多尺度特征圖包括conv3(表示VGG-16的第4個(gè)卷積層得到的特征圖,其尺寸為38×38,通道數(shù)為512)、conv7(表示SSD 算法中第7 個(gè)卷積層得到的特征圖,其尺寸為19×19,通道數(shù)為1 024)、conv8-2(表示SSD 算法中第8 個(gè)卷積層得到的特征圖,其尺寸為10×10,通道數(shù)為512)、conv9-2(表示SSD 算法中第9個(gè)卷積層得到的特征圖,其尺寸為5×5,通道數(shù)為256)、conv10-2(表示SSD 算法中第10 個(gè)卷積層得到的特征圖,其尺寸為3×3,通道數(shù)為256)和conv11-2(表示SSD 算法中第11 個(gè)卷積層得到的特征圖,其尺寸為1×1,通道數(shù)為256)6 種尺度。在每個(gè)尺度的特征圖上,產(chǎn)生類似于Faster R-CNN的錨框。原論文中conv3、conv10-2 和conv11-2 有 長 寬 比1、2 和1/2,conv7、conv8-2 和conv9-2 有長寬比1、2、1/2、3 和1/3。SSD 給不同的邊框設(shè)置不同的長寬比,對(duì)于為1 的長寬比,會(huì)增加一個(gè)尺寸。因此,SSD一共有8 732 個(gè)錨框(38×38×4+19×19×6+10×10×6+5×5×6+3×3×4+1×1×4=8732)。

圖2 中的預(yù)測部分用于預(yù)測物體類別的置信度,并通過在特征圖上使用小尺寸的卷積核(1×1 和3×3的卷積核)來直接預(yù)測物體的邊框坐標(biāo)。由于預(yù)測是在6 種不同的尺度進(jìn)行,且每種尺度具有不同長寬比的錨框,所以能夠提高目標(biāo)檢測的精度,而且整個(gè)算法可以進(jìn)行端到端的訓(xùn)練,在速度上也有較大的優(yōu)勢。

在訓(xùn)練之前,需要用匹配策略將錨框分成正負(fù)樣本。對(duì)于訓(xùn)練數(shù)據(jù)圖像產(chǎn)生的每一個(gè)真實(shí)邊框,從各種位置、長寬比和尺度來選擇錨框;然后,把與錨框具有最大交并比的和與任意錨框的交并比大于0.5的看成正例進(jìn)行訓(xùn)練,其余當(dāng)作負(fù)例,之后進(jìn)行訓(xùn)練。

SAR 圖像首先輸入到VGG-16 提取特征,形成特征圖;接著,通過多個(gè)卷積生成6種尺度的額外的特征圖,并在這6 種尺度的特征圖上生成錨框;之后,預(yù)測部分通過在對(duì)錨框上使用小尺寸的卷積核(1×1和3×3的卷積核)來直接預(yù)測物體的邊框坐標(biāo)和類別的置信度,得到目標(biāo)位置和類別的預(yù)測值;目標(biāo)位置和類別的預(yù)測值送入到損失函數(shù),損失函數(shù)根據(jù)目標(biāo)位置和類別的預(yù)測值與真實(shí)值的誤差,分別計(jì)算相應(yīng)的損失,并用損失最小調(diào)整神經(jīng)元參數(shù),使檢測達(dá)到最優(yōu)。

為了實(shí)現(xiàn)對(duì)目標(biāo)快速準(zhǔn)確地檢測,本文對(duì)經(jīng)典的單階段檢測算法SSD進(jìn)行了改進(jìn),在前端網(wǎng)絡(luò)中對(duì)卷積特征進(jìn)行重用,將高低層語義(類別)信息進(jìn)行聚合,提高了對(duì)特征的利用效率(所提方法對(duì)SSD 檢測算法提取的特征進(jìn)行了進(jìn)一步的處理,包括特征和語義聚合,提高了特征利用率)。在通用目標(biāo)檢測數(shù)據(jù)集PASCAL VOC[9]和SSDD上證明了改進(jìn)的效果。此外,還根據(jù)艦船目標(biāo)在數(shù)據(jù)集SSDD 上尺寸和長寬比的分布情況對(duì)錨框進(jìn)行了針對(duì)性的設(shè)計(jì)。所提出的方法能提高對(duì)艦船目標(biāo)的檢測效果,且計(jì)算量不會(huì)增加很多。

本文針對(duì)SSD 的前端網(wǎng)絡(luò)對(duì)特征利用不充分的問題,對(duì)前端網(wǎng)絡(luò)進(jìn)行了改進(jìn),包括特征重用和語義聚合算法。特征重用算法對(duì)前端網(wǎng)絡(luò)的特征圖按照通道分成2部分,分別進(jìn)行卷積處理和重新利用(通過與下一層聚合實(shí)現(xiàn)),可在進(jìn)行學(xué)習(xí)的同時(shí),減小了參數(shù)量。語義聚合算法將高層語義信息融入到底層,提高對(duì)不同尺寸目標(biāo)的檢測能力。設(shè)計(jì)了2種新的錨框來適應(yīng)SSDD 數(shù)據(jù)集中、艦船目標(biāo)尺寸小和長寬比大的特點(diǎn)。

1 總體結(jié)構(gòu)

基于特征重用與語義(類別信息)聚合的特征融合算法是對(duì)圖1 中的前端網(wǎng)絡(luò)進(jìn)行的改進(jìn),算法結(jié)構(gòu)圖如圖3所示,包括特征重用(從特征重用1到特征重用4的4個(gè)階段)和語義聚合(語義聚合1到語義聚合5的5個(gè)階段)2部分。特征重用通過對(duì)特征圖的高效利用,提高了對(duì)物體檢測的準(zhǔn)確率;語義聚合算法通過融合位置信息豐富的底層特征和語義信息豐富的高層特征,提高了區(qū)分和定位艦船目標(biāo)的能力。

圖3 的特征重用算法對(duì)conv7、conv8-2、conv9-2和conv10-2的特征圖都只進(jìn)行一半的參數(shù)學(xué)習(xí),另一半改變尺寸后在下一層直接進(jìn)行聚合。相比于圖2的過程,在進(jìn)行學(xué)習(xí)的同時(shí),減小了參數(shù)量。例如,在特征重用1 中,conv7 的按通道劃分的一半特征(512×19×19)通過1×1 和3×3 卷積變成512×10×10,另一半通過池化變成512×10×10,二者通過聚合變成1 024×10×10 ,再通過1×1 卷積將特征圖變成512×10×10,如圖4所示。

圖3的語義聚合算法把語義信息較強(qiáng)且尺寸較小的特征圖進(jìn)行了采樣,與上一層的特征進(jìn)行融合(逐元素相加),如圖中語義聚合1 到語義聚合5 的過程。語義聚合通過去卷積(deconvolution)和1×1的卷積實(shí)現(xiàn)。例如,在語義聚合1 中,卷積核尺寸為3×3,零填充個(gè)數(shù)為0,步長為2,通道數(shù)為256 的去卷積層,將conv11-2 的特征圖從256×1×1 變換到256×3×3,通過逐元素相加操作與conv10-2 相拼接,得到新的特征圖,在新的特征圖上進(jìn)行預(yù)測。

圖3 特征重用和語義聚合算法(在卷積之后會(huì)有BN和ReLU)Fig.3 Feature reuse and semantic algorithm(BN and ReLU at after convolution)

圖4 SSD前端網(wǎng)絡(luò)的特征重用1Fig.4 Feature reuse 1 in the frontend network of SSD

2 特征重用算法

特征重用算法對(duì)圖1 中的前端網(wǎng)絡(luò)進(jìn)行了改進(jìn),將特征圖按照通道分成2 部分:一部分被卷積處理進(jìn)行參數(shù)學(xué)習(xí);另一部分直接輸入到下一階段通過拼接的方式重新利用,這可在進(jìn)行參數(shù)學(xué)習(xí)的同時(shí),減小參數(shù)量和計(jì)算量。

特征重用1。圖4 描述的是特征重用1 的計(jì)算過程。按照通道個(gè)數(shù),將特征圖conv7(1024×19×19)平均分成2 部分,一部分像原始的SSD 那樣被1×1 卷積和3×3卷積處理變成512×10×10。其中,1×1的卷積將特征圖的通道數(shù)變少,3×3卷積將特征圖的尺寸減半;另一部分輸入到下一階段。通過池化,將特征圖的尺寸減半,對(duì)特征重新利用,特征圖變成512×10×10,這可以減小計(jì)算負(fù)擔(dān)。兩側(cè)得到的特征圖具有相同的尺寸和通道個(gè)數(shù)(都變成了512×10×10),輸入到聚合層進(jìn)行特征圖的拼接(得到1024×10×10),1×1卷積用于在改變通道個(gè)數(shù)的同時(shí),增加非線性操作(得到512×10×10)。特征重用算法在進(jìn)行學(xué)習(xí)的同時(shí),減小了參數(shù)量。

特征重用2。conv8-2(512×10×10)按通道劃分的一半特征(256×10×10)通過1×1和3×3卷積變成256×5×5;另一半通過池化變成256×5×5,通過聚合變成512×5×5,通過1×1 卷積將特征圖變成256×5×5,得到新的conv9-2。

特征重用3。conv9-2(256×5×5)按通道劃分的一半特征(128×5×5)通過1×1和3×3卷積變成128×3×3,另一半通過池化變成128×3×3,通過聚合變成256×3×3,得到新的特征圖conv10-2為256×3×3。

特征重用4。conv10-2(256×3×3)按通道劃分的一半特征(128×3×3)通過1×1和3×3卷積變成128×1×1;另一半通過池化變成128×1×1,通過聚合變成256×1×11,得到新的特征圖conv11-2為256×1×1。

3 語義聚合算法

語義聚合算法對(duì)圖1 中的前端網(wǎng)絡(luò)進(jìn)行了改進(jìn)。由于底層特征具有準(zhǔn)確的位置信息,高層特征具有豐富的語義信息,因而為了同時(shí)實(shí)現(xiàn)對(duì)目標(biāo)的準(zhǔn)確識(shí)別和位置定位,這里將不同層級(jí)的特征進(jìn)行語義聚合。

圖5是SSD的前端網(wǎng)絡(luò)采用語義聚合的前端網(wǎng)絡(luò)示意圖(圖中VGG-16用于特征提?。D5 a)是SSD的網(wǎng)絡(luò)結(jié)果,它構(gòu)成了一種層級(jí)的特征結(jié)構(gòu),并在各層進(jìn)行預(yù)測,利用不同層級(jí)的特征進(jìn)行預(yù)測可以提高對(duì)不同尺度目標(biāo)的適應(yīng)性。圖5 b)是基于語義聚合的SSD 的結(jié)構(gòu),它在SSD 層級(jí)結(jié)構(gòu)的基礎(chǔ)上,對(duì)不同層級(jí)的特征進(jìn)行了語義聚合,對(duì)每層引入從上到下的語義信息(類別信息),使每層能夠同時(shí)具有豐富的類別和位置信息,便于對(duì)目標(biāo)的分類和定位,底層的特征圖融入了高層語義信息的同時(shí),也會(huì)提高對(duì)小尺寸目標(biāo)的適應(yīng)能力。相比于圖像金字塔結(jié)構(gòu),這種語義聚合算法不需要大量計(jì)算量和存儲(chǔ)量去保持中間特征,只需簡單的聚合操作即可實(shí)現(xiàn)。

a)SSD的前端網(wǎng)絡(luò)a)Front end network for SSD

圖5 SSD和基于語義聚合的SSDFig.5 SSD and SSD based on semantic aggregation

語義聚合算法包括5個(gè)階段,如圖3所示。

語義聚合1。卷積核尺寸為3×3,零填充個(gè)數(shù)為0,步長為2,通道數(shù)為256的去卷積層將conv11-2的特征圖從256×1×1 變換到256×3×3,通過逐元素相加操作與conv10-2相聚合。

語義聚合2。卷積核尺寸為3×3,零填充個(gè)數(shù)為1,步長為2,通道數(shù)為256 的去卷積層將特征圖從256×3×3 變換到256×5×5,通過逐元素相加操作與conv9-2相聚合。

語義聚合3。卷積核尺寸為1×1,零填充個(gè)數(shù)為1,步長為2,通道數(shù)為512的卷積層將特征圖通道數(shù)從256增加到512。卷積核尺寸為3×3,零填充個(gè)數(shù)為1,步長為2通道數(shù)為256的去卷積層將特征圖從512×5×5 變換到512×10×10,通過逐元素相加操作與conv7-2相聚合。

語義聚合4。卷積核尺寸為1×1,零填充個(gè)數(shù)為1,步長為2,通道數(shù)為1024 的卷積層將特征圖通道數(shù)從512增加到1 024。卷積核尺寸為3×3,零填充個(gè)數(shù)為1,步長為2,通道數(shù)為1 024 的去卷積層將特征圖從512×10×10變換到1 024×19×19,通過逐元素相加操作與conv7相聚合。

語義聚合5。卷積核尺寸為1×1,零填充個(gè)數(shù)為1,步長為2,通道數(shù)為512的卷積層將特征圖通道數(shù)從1 024 降低到512。卷積核尺寸為4×4,零填充個(gè)數(shù)為1,步長為2,通道數(shù)為512 的去卷積層將特征圖從1 024×19×19 變換到512×38×38。通過逐元素相加操作與conv3相聚合。

4 改進(jìn)的錨框設(shè)計(jì)

SSD的前端網(wǎng)絡(luò)會(huì)在6種尺度的特征圖上分別產(chǎn)生錨框,產(chǎn)生的錨框作為默認(rèn)的候選區(qū)域,用于目標(biāo)位置和類別的預(yù)測。錨框具有多種尺寸和長寬比,但SSDD 中艦船目標(biāo)的尺寸和長寬比與PASCAL VOC中的目標(biāo)不同,所以需要統(tǒng)計(jì)SSDD 中艦船目標(biāo)包圍框的尺寸和長寬比,以針對(duì)性地改進(jìn)檢測算法的錨框。

原SSD 論文中最小尺寸為0.2,最大尺寸為0.9,0.2 和0.9 都是相對(duì)于原圖像尺寸的比例,第k個(gè)尺寸按照下式進(jìn)行平均取值:

式(1)中:smin表示最小的尺寸;smax表示最大的尺寸;m表示層數(shù),這里是6。

由SSDD數(shù)據(jù)集中艦船目標(biāo)包圍框長度和寬度統(tǒng)計(jì)結(jié)果,將最大尺度從0.9 改成0.3,最小尺度從0.2 改成0.06。長寬比最大最小值從2和0.5改成了4和0.4。

原SSD 論文中,conv3、conv10-2 和conv11-2 有長寬比1、2 和1/2。conv7、conv8-2、conv9-2 有長寬比1、2、1/2、3和1/3。因而SSD一共有8 732 錨框,如表1所示。

根據(jù)SSDD 數(shù)據(jù)集中艦船包圍框長寬統(tǒng)計(jì)結(jié)果,設(shè)計(jì)錨框見表2、3。表2 中將所有的長寬比為2 的改成3,保持總的錨框不變,個(gè)數(shù)同樣是8 732 個(gè)。

表3 將conv3 和conv7 中的長寬比為2 的改成3,在conv8-2 和conv9-2 增加長寬比4,在conv10-2 和conv11-2增加長寬比3。得到的錨框個(gè)數(shù)是38×38×4+19×19×6+10×10×9+5×5×8+3×3×6+1×1×6=9102。

通過以上改進(jìn)之后,特征圖上產(chǎn)生的錨框會(huì)更適合數(shù)據(jù)集SSDD 中的艦船目標(biāo),這會(huì)在實(shí)驗(yàn)部分進(jìn)行驗(yàn)證。錨框個(gè)數(shù)增加會(huì)提高目標(biāo)檢測的準(zhǔn)確率,但同時(shí)也會(huì)增加計(jì)算量,因而在設(shè)計(jì)錨框時(shí)需要充分權(quán)衡錨框個(gè)數(shù)與計(jì)算量之間的矛盾。

表1 原SSD論文中的錨框Tab.1 Anchor box in the original SSD

表2 改進(jìn)的錨框設(shè)計(jì)(保持錨框個(gè)數(shù)不變)Tab.2 Improved anchor designing(keep the number of anchor frames unchanged)

表3 改進(jìn)的錨框設(shè)計(jì)(增加錨框個(gè)數(shù))Tab.3 Improved anchor designing(increase the number of anchor frames)

5 實(shí)驗(yàn)及分析

5.1 在PASCAL VOC數(shù)據(jù)集上的檢測效果

本文提出了特征重用和語義聚合算法用于改進(jìn)經(jīng)典的SSD 檢測算法?,F(xiàn)對(duì)其在PASCAL VOC 數(shù)據(jù)集上檢測效果進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)過程中采用的是預(yù)訓(xùn)練之后的VGG-16 模型,用NVIDA 1080 GPU 進(jìn)行訓(xùn)練,初始學(xué)習(xí)率為0.001,最大迭代次數(shù)120 000,學(xué)習(xí)策略在[80 000,100 000,1 200 000]多步下降,采用動(dòng)量為0.9 的SGD 優(yōu)化,其他參數(shù)與原SSD 論文一致。圖6是訓(xùn)練損失曲線,可看到算法收斂的很好。

圖6 基于特征重用和語義聚合的SSD的訓(xùn)練損失曲線Fig.6 SSD training loss curve based on feature reuse and semantic aggregation

對(duì)于300×300 像素的圖像,在數(shù)據(jù)集PASCAL VOC 2007 和2012 的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,在VOC2007的測試集進(jìn)行測試,結(jié)果達(dá)到了79.0%的mAP,速度達(dá)到了51.5FPS(在單個(gè)GTX1080顯卡)。通過實(shí)驗(yàn)發(fā)現(xiàn),它能提升對(duì)小尺寸目標(biāo)的檢測效果,并有較好的定位精度。結(jié)果顯示,改進(jìn)之后的檢測算法能夠在精度與速度之間進(jìn)行較好的權(quán)衡,它比其他改進(jìn)版本的SSD效果都要好,例如FSSD、DSSD和StairNet[10-15]。

圖7是3種不同檢測算法在訓(xùn)練過程中的精度對(duì)比。圖中SSD 是指最新版本的代碼實(shí)現(xiàn)的結(jié)果,F(xiàn)SSD 是文獻(xiàn)[13]提出的改進(jìn)算法。從圖7 中可以看到,改進(jìn)方法能夠快速的收斂,且最終mAP 也是3 種檢測算法中最高的。

圖7 檢測算法性能對(duì)比Fig.7 Performance comparison of detection algorithm

表4、5是相關(guān)檢測算法的檢測結(jié)果。“07+12”代表訓(xùn)練和驗(yàn)證數(shù)據(jù)集是VOC2007和VOC2012組合而成的,F(xiàn)aster 代表Faster R-CNN 檢測算法,R-101 代表ResNet-101。從表4、5 發(fā)現(xiàn),所提的方法相比于SSD及其改進(jìn)版本具有最高的mAP,它還會(huì)比一些雙階段的檢測算法(如表中的Faster R-CNN)效果都要好。

表6 是不同檢測算法在PASCAL VOC2007 測試集上的結(jié)果。從表6 可以看出,所提出的檢測算法準(zhǔn)確率和速度上能夠得到較好的權(quán)衡,它在VOC2007測試數(shù)據(jù)集上能夠達(dá)到79.0%的mAP且速度是51.5FPS(單個(gè)GTX 1080 顯卡),這是特征重用和語義聚合算法所起到的作用。

表4 PASCAL VOC2007測試集上的結(jié)果(第1部分)Tab.4 PASCAL VOC2007 results in detail(part 1)

表5 PASCAL VOC2007測試集上的結(jié)果(第2部分)Tab.5 PASCAL VOC2007 results in detail(part 2)

表6 不同檢測算法PASCAL VOC2007測試集上的結(jié)果Tab.6 PASCAL VOC2007 test detection results of different detectors

5.2 在SSDD數(shù)據(jù)集檢測效果

表7是所提出的改進(jìn)算法(特征重用和語義聚合)在數(shù)據(jù)集SSDD上的效果。其中,SSD1代表只使用語義聚合不使用特征重用,SSD2 代表只使用特征重用不使用語義聚合,Proposed 代表特征重用和語義聚合都使用,表中用的都是表1的錨框配置。

從表7可發(fā)現(xiàn),SSD在SSDD上的AP為77.81%,當(dāng)只使用語義聚合不使用特征重用時(shí),AP 提升了1.24%,當(dāng)只使用特征重用不使用語義聚合時(shí),AP 提升了1.77%,二者都用時(shí),AP 提升了2.11%。通過統(tǒng)計(jì)單張圖像處理時(shí)間發(fā)現(xiàn)沒有得到顯著的提高,平均每幅圖像處理時(shí)間從17 ms(SSD)增加到了23 ms(本文所提方法)。

表7 在數(shù)據(jù)集SSDD上特征重用和語義聚合的效果Tab.7 SSDD effect of feature reuse and semantic aggregation

SSD在不同錨框下的檢測性能見表8。從表中可以看到,通過改進(jìn)錨框,檢測性能也到了提升,尤其是利用了表3 中的錨框配置,不過在增加錨框數(shù)量的同時(shí)也會(huì)增加算法的計(jì)算量,這是須要做好權(quán)衡的。所提的特征重用和語義聚合算法和表3的組合可以得到81.43%的AP,檢測的準(zhǔn)確率得到了較大提升。

表8 不同錨框下檢測效果Tab.8 Effect of different anchors frames

5.3 實(shí)驗(yàn)結(jié)果分析

圖8是給出的改進(jìn)算法(包括特征重用、語義聚合和表3 的錨框)的檢測效果,從圖中可以看出相比于Faster R-CNN,SSD更加適合檢測大尺寸的目標(biāo),對(duì)于靠岸的艦船基本上都能檢測到,如圖8 a)、b)所示,密集排列在碼頭的艦船目標(biāo)都能區(qū)分開來,如圖8 c)所示,甚至是一些在船塢上不是在海里的艦船目標(biāo),如圖8 d)所示,都能成功的檢測到。這對(duì)于以CFAR 為主的傳統(tǒng)檢測方法是較難實(shí)現(xiàn)的,因?yàn)槿绻脗鹘y(tǒng)方法進(jìn)行檢測,在進(jìn)行海陸分割的過程中極易把艦船目標(biāo)看成陸地而漏檢,即使不漏掉,在對(duì)圖像進(jìn)行建模時(shí),也難以建立準(zhǔn)確的模型擬合所有的圖像像素分布,這也會(huì)導(dǎo)致出現(xiàn)很多漏警和虛警。而SSD算法能夠端到端的對(duì)這些復(fù)雜背景的目標(biāo)進(jìn)行訓(xùn)練和檢測,能夠適應(yīng)這些復(fù)雜場景,表現(xiàn)出了較大的優(yōu)勢[18]。但SSD檢測算法對(duì)小尺寸的目標(biāo)檢測效果要比Faster RCNN要差一些,如圖8 e)、f)所示。

為了進(jìn)一步研究檢測算法在數(shù)據(jù)集SSDD上的表現(xiàn),這里給出了一些檢測的失敗案例,如圖9所示。從圖中可以看出SSD對(duì)小尺寸目標(biāo)的檢測效果較差(如圖9 a)、b)、e)所示),甚至是一些在大片海域里的小尺寸艦船目標(biāo)SSD都無法檢測到,如圖9 c)、d)所示,此時(shí)小尺寸目標(biāo)全部漏掉,這說明SSD算法相對(duì)于Faster R-CNN 對(duì)小尺寸目標(biāo)的檢測能力特別差。當(dāng)目標(biāo)尺寸小,且所處環(huán)境背景復(fù)雜時(shí)也很難檢測到目標(biāo),如圖9 e)、f)所示,這是因?yàn)閺?qiáng)散射目標(biāo)對(duì)小尺寸目標(biāo)有干擾作用。

之所以SSD 相比于Faster R-CNN 對(duì)小尺寸目標(biāo)檢測效果差,是因?yàn)橐訤aster R-CNN為代表的雙階段檢測算法包括候選區(qū)域生成和邊框分類及調(diào)整2個(gè)過程。

圖8 SSD部分檢測結(jié)果示例Fig.8 Some results of SSD

圖9 SSD在數(shù)據(jù)集SSDD上的部分檢測失敗案例Fig.9 Some failure cases of SSD on SSDD

Faster R-CNN經(jīng)過第2個(gè)過程使對(duì)邊框的分類和定位更加準(zhǔn)確,而SSD 只有一個(gè)過程,而且這個(gè)過程只相當(dāng)于Faster R-CNN的第1步RPN。SSD的預(yù)測結(jié)果是從特征圖的錨框?qū)?yīng)的特征直接得到的,而Faster R-CNN 會(huì)對(duì)上面步驟得到的特征圖進(jìn)過RoI 池化之后進(jìn)一步的處理。所以,對(duì)小尺寸的目標(biāo)檢測的更準(zhǔn)確。另一方面,如果SSD檢測算法中所有的錨框都沒覆蓋某個(gè)艦船,這時(shí)候它就不會(huì)被檢測到,而當(dāng)較大的錨框包含了某個(gè)艦船,這樣就會(huì)使目標(biāo)特征微弱,其包含目標(biāo)的概率也不高。Faster R-CNN檢測算法的RoI池化會(huì)對(duì)艦船的候選框進(jìn)行多個(gè)子區(qū)域的劃分,這樣小尺寸的目標(biāo)的特征會(huì)被放大,其特征會(huì)更明顯,所以對(duì)小目標(biāo)的效果會(huì)更好。SSD在計(jì)算速度上具有較大的優(yōu)勢,同時(shí)還能適應(yīng)較多的復(fù)雜背景[19]。

6 結(jié)論

本文首先介紹了SSD 檢測算法的原理和檢測流程;然后,針對(duì)SSD 檢測算法在SAR 圖像艦船目標(biāo)檢測時(shí)對(duì)前端網(wǎng)絡(luò)特征利用不充分的問題,提出了基于特征重用和語義聚合的SAR 圖像艦船目標(biāo)檢測算法。特征重用算法將特征圖按照通道分成2 部分:一部分被卷積處理進(jìn)行參數(shù)學(xué)習(xí),另一部分直接輸入到下一階段通過拼接的方式重新利用,這可在進(jìn)行參數(shù)學(xué)習(xí)的同時(shí)減小參數(shù)量和計(jì)算量。語義聚合算法通過融合位置信息豐富的底層特征和語義信息豐富的高層特征,提高了區(qū)分和定位艦船目標(biāo)的能力;之后,根據(jù)SSDD 中艦船目標(biāo)尺寸和長寬比的不同,將錨框的尺寸減小,長寬比增大,提升了對(duì)SSDD中艦船目標(biāo)的適應(yīng)性;最后,在以上方法和策略的基礎(chǔ)上,提出了基于特征重用和語義聚合的SAR 圖像艦船目標(biāo)檢測算法,通過CNN 網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建、網(wǎng)絡(luò)模型的訓(xùn)練,SAR圖像艦船目標(biāo)檢測3個(gè)步驟,完成對(duì)實(shí)測SAR圖像艦船目標(biāo)的檢測。在數(shù)據(jù)集PASCAL VOC 和SSDD中分別達(dá)到79.0%和81.43%的檢測準(zhǔn)確率。

猜你喜歡
錨框艦船個(gè)數(shù)
基于YOLOv3錨框優(yōu)化的側(cè)掃聲吶圖像目標(biāo)檢測
艦船通信中的噪聲消除研究
錨框策略匹配的SSD飛機(jī)遙感圖像目標(biāo)檢測
基于SSD算法的輕量化儀器表盤檢測算法*
基于GA-RoI Transformer的遙感圖像任意方向目標(biāo)檢測
怎樣數(shù)出小正方體的個(gè)數(shù)
艦船測風(fēng)傳感器安裝位置數(shù)值仿真
等腰三角形個(gè)數(shù)探索
怎樣數(shù)出小木塊的個(gè)數(shù)
怎樣數(shù)出小正方體的個(gè)數(shù)
九龙县| 修文县| 高尔夫| 台东市| 叙永县| 垦利县| 新巴尔虎左旗| 定南县| 贵德县| 九台市| 合山市| 林口县| 怀化市| 咸宁市| 长宁县| 景谷| 留坝县| 麻阳| 临夏县| 于田县| 克拉玛依市| 台湾省| 神木县| 武城县| 海门市| 永平县| 东辽县| 惠水县| 古田县| 伊吾县| 龙南县| 三原县| 龙井市| 阿克苏市| 莱西市| 德江县| 油尖旺区| 祁连县| 林芝县| 炎陵县| 唐河县|