国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

尺度敏感損失與特征融合的快速小目標(biāo)檢測(cè)方法

2022-11-09 07:13琚長瑞秦曉燕袁廣林
電子學(xué)報(bào) 2022年9期
關(guān)鍵詞:尺度精度損失

琚長瑞,秦曉燕,袁廣林,李 豪,朱 虹

(中國人民解放軍陸軍炮兵防空兵學(xué)院計(jì)算機(jī)教研室,安徽合肥 230031)

1 引言

目標(biāo)檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究分支,其目的是預(yù)測(cè)圖像中每個(gè)感興趣的實(shí)例的邊界框位置和類別標(biāo)簽.目標(biāo)檢測(cè)在工業(yè)、農(nóng)業(yè)、醫(yī)學(xué)和軍事等領(lǐng)域有著廣泛的應(yīng)用前景,具有較高的研究價(jià)值.近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)框架下的目標(biāo)檢測(cè)取得了重大進(jìn)展[1~5].雖然基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)器在各種具有挑戰(zhàn)性的數(shù)據(jù)庫上取得了系列的成果,但是其仍然面臨目標(biāo)尺度小、數(shù)據(jù)不平衡和數(shù)據(jù)標(biāo)注昂貴等諸多困難.小目標(biāo)只有十幾到幾十個(gè)像素,在圖像中的信息量有限,通用檢測(cè)器對(duì)其檢測(cè)難度較大.另外,現(xiàn)有目標(biāo)檢測(cè)數(shù)據(jù)集中包含小目標(biāo)的圖片數(shù)量也相對(duì)較少.因此,小目標(biāo)檢測(cè)一直是一個(gè)難點(diǎn)、熱點(diǎn)問題.為提升小目標(biāo)的檢測(cè)效果,目前主要有多尺度建模以及數(shù)據(jù)增強(qiáng)兩大類方法.

多尺度方法的基本思想是利用網(wǎng)絡(luò)不同層特征檢測(cè)不同尺度的目標(biāo).基于不同尺度目標(biāo)的語義特征所在特征層次的差異性,2016年Yang[6]等人提出尺度相關(guān)池化并從不同尺度的特征層中檢測(cè)目標(biāo),提升了小目標(biāo)的檢測(cè)精度.基于相同的思路,劉偉[7]等人提出的SSD(Single Shot MultiBox Detector)引入了多參考和多分辨率檢測(cè)技術(shù),利用淺層特征檢測(cè)小目標(biāo),利用深層特征檢測(cè)大的目標(biāo),其小目標(biāo)檢測(cè)效果有了大的提升.針對(duì)小目標(biāo)檢測(cè),2016年Cai[8]等人提出在不同尺度特征圖上鋪設(shè)錨框(Anchor),同樣實(shí)現(xiàn)了在不同尺度的特征圖上檢測(cè)不同大小的目標(biāo).由于目標(biāo)檢測(cè)任務(wù)同時(shí)需要物體的“語義和位置”特征,語義特征在深層特征圖中,因此分層預(yù)測(cè)的網(wǎng)絡(luò)結(jié)構(gòu)難以兼顧小目標(biāo)的語義和位置特征.針對(duì)該問題,2017年Lin[9]等人提出了特征金字塔網(wǎng)絡(luò)(Feature Pyramid Networks,F(xiàn)PN),用自頂向下的方法將深層特征圖上采樣后與淺層特征圖融合,利用融合后的特征圖做多尺度目標(biāo)檢測(cè).為了提高小目標(biāo)檢測(cè)的精度,2018年,Liang[10]等人提出一種兩階段的目標(biāo)檢測(cè)方法,該方法在區(qū)域建議階段,采用橫向連接的特征金字塔網(wǎng)絡(luò),使得小目標(biāo)的語義特征更加突出,同時(shí),為小目標(biāo)設(shè)計(jì)了專門的Anchor,提升了小目標(biāo)檢測(cè)效果.2019年G.Ghiasi[11]等人基于神經(jīng)網(wǎng)絡(luò)搜索技術(shù),利用強(qiáng)化學(xué)習(xí)自動(dòng)搜索對(duì)當(dāng)前任務(wù)最優(yōu)的FPN(Feature Pyramid Networks),進(jìn)一步提升了小目標(biāo)檢測(cè)的精度.2020年Wu[12]等人提出的多尺度正樣本訓(xùn)練方法對(duì)小目標(biāo)檢測(cè)效果也有一定提升.針對(duì)小目標(biāo)檢測(cè)難題,在FPN的基礎(chǔ)上,2020年Li[13]等人提出一種提取并融合多尺度特征的目標(biāo)檢測(cè)網(wǎng)絡(luò),提高了對(duì)目標(biāo)尺度變化的魯棒性.上述多尺度檢測(cè)方法雖然對(duì)小目標(biāo)檢測(cè)精度有提升,但也存在網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜和速度較慢等不足.解決小目標(biāo)檢測(cè)問題的另一類思路是數(shù)據(jù)增強(qiáng).對(duì)基于錨框(anchor-based)的目標(biāo)檢測(cè)方法而言,通過增加檢測(cè)小目標(biāo)的anchor數(shù)量可以達(dá)到數(shù)據(jù)增強(qiáng)的目的.2017年Zhang[14]等人提出的S3FD(Single Shot Scale-invariant Face Detector)通過調(diào)整候選框的生成步長產(chǎn)生更稠密的anchor增加小目標(biāo)樣本數(shù)量,使得小目標(biāo)得到充分訓(xùn)練從而提升小目標(biāo)的檢測(cè)精度.2019年Kisantal[15]等人對(duì)包含小目標(biāo)的圖像進(jìn)行過采樣和對(duì)小目標(biāo)隨機(jī)變換后復(fù)制到新位置的方式增加小目標(biāo)數(shù)量.為了解決數(shù)據(jù)集中小物體數(shù)量不足的問題,2021年Chen[16]等人使用圖像拼接技術(shù)動(dòng)態(tài)地生成拼接圖像提升小目標(biāo)數(shù)量,從而增強(qiáng)小目標(biāo)的檢測(cè)精度.

綜上所述,現(xiàn)有針對(duì)小目標(biāo)的檢測(cè)方法存在網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜和速度較慢等不足.為了提高基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法對(duì)小目標(biāo)的檢測(cè)精度和速度,同時(shí)對(duì)中、大目標(biāo)也有較高的檢測(cè)性能,在CenterNet[18]的啟發(fā)下,本文提出一種基于尺度敏感損失與特征融合的單階段無錨框小目標(biāo)檢測(cè)方法(Scale-Sensitivity Loss and Feature Fusion Detector,SSLFF-Det).該方法利用尺度敏感損失訓(xùn)練分類熱圖,提高小目標(biāo)對(duì)網(wǎng)絡(luò)模型參數(shù)學(xué)習(xí)的影響,利用反卷積和可變形卷積自上而下融合特征,獲得高分辨率、強(qiáng)語義的特征圖來檢測(cè)目標(biāo).在PASCAL VOC數(shù)據(jù)集上,對(duì)提出的方法進(jìn)行了實(shí)驗(yàn)驗(yàn)證與分析,實(shí)驗(yàn)結(jié)果表明:本文方法達(dá)到了預(yù)期效果,即提升了小目標(biāo)檢測(cè)的精度和速度,同時(shí)對(duì)中、大目標(biāo)也具有較優(yōu)的性能.

2 尺度敏感損失

目前,常用的目標(biāo)檢測(cè)數(shù)據(jù)集有PASCAL VOC和MS COCO(Microsoft Common Objects in Context).文獻(xiàn)[15]對(duì)MS COCO數(shù)據(jù)集進(jìn)行統(tǒng)計(jì)分析發(fā)現(xiàn):MS COCO數(shù)據(jù)集中小目標(biāo)、中目標(biāo)和大目標(biāo)的占比分別是41.43%、34.32%和24.24%,但是只有51.82%的圖像包含小目標(biāo),包含中、大目標(biāo)的圖像分別占70.07%和82.28%.雖然MS COCO數(shù)據(jù)集中小目標(biāo)總數(shù)量較多,但包含小目標(biāo)的圖像占比較低.本文參考MS COCO數(shù)據(jù)集對(duì)小、中、大目標(biāo)的劃分標(biāo)準(zhǔn),對(duì)PASCAL VOC數(shù)據(jù)集進(jìn)行了數(shù)據(jù)統(tǒng)計(jì),VOC 2007訓(xùn)練集中小目標(biāo)、中目標(biāo)和大目標(biāo)的占比分別為11.20%、34.49%和54.31%,包含小目標(biāo)的圖像僅占12.67%,而包含中、大目標(biāo)的圖像分別占39.45%和90.52%.可以看出:在PASCAL VOC數(shù)據(jù)集中,小目標(biāo)的數(shù)量占比以及包含小目標(biāo)的圖像數(shù)量占比均較低.PASCAL VOC中的部分圖像樣例如圖1所示,其中多數(shù)圖像只標(biāo)注了中、大目標(biāo),而小目標(biāo)未標(biāo)注,這樣會(huì)導(dǎo)致小目標(biāo)訓(xùn)練樣本較少.在現(xiàn)實(shí)應(yīng)用中,小目標(biāo)標(biāo)注難度大等原因也會(huì)造成小目標(biāo)訓(xùn)練樣本較少的情況.

圖1 PASCAL VOC數(shù)據(jù)圖像(其中黃色框?yàn)闃?biāo)注目標(biāo),紅色框內(nèi)是未標(biāo)注的小目標(biāo))

眾所周知,目標(biāo)檢測(cè)網(wǎng)絡(luò)的訓(xùn)練,是隨機(jī)取一批圖像計(jì)算其中標(biāo)注樣本的損失進(jìn)行網(wǎng)絡(luò)參數(shù)的訓(xùn)練.由于訓(xùn)練數(shù)據(jù)中包含小目標(biāo)的圖像較少,這會(huì)導(dǎo)致每一批圖像中包含的小目標(biāo)樣本較少.這種尺度上的樣本不平衡使得小目標(biāo)對(duì)模型訓(xùn)練的影響相對(duì)中、大目標(biāo)較小,導(dǎo)致模型對(duì)小目標(biāo)的學(xué)習(xí)不充分.另外,目標(biāo)在特征圖上的信息量大小與目標(biāo)尺度存在正相關(guān)關(guān)系,因此小目標(biāo)在特征圖上的信息較少,對(duì)模型訓(xùn)練的影響也較小.上述兩個(gè)方面是導(dǎo)致小目標(biāo)檢測(cè)精度低的重要原因.為解決難易樣本不平衡問題,何愷明等人提出Focal Loss[19],在分類損失中加入一種與樣本難易度正相關(guān)的損失權(quán)重,有效提高了網(wǎng)絡(luò)訓(xùn)練對(duì)難樣本的關(guān)注度,提升了目標(biāo)檢測(cè)的性能.受此啟發(fā),為提高小目標(biāo)對(duì)模型的影響,本文提出尺度敏感損失函數(shù)用于目標(biāo)檢測(cè)網(wǎng)絡(luò)的訓(xùn)練,其義定義如下:

其中,Yxyc和分別表示類別熱圖中(x,y)處c類的標(biāo)注值和預(yù)測(cè)值,N是標(biāo)注的樣本個(gè)數(shù),α、β為超參數(shù),實(shí)驗(yàn)中分別設(shè)置為2和4,s是與目標(biāo)尺度負(fù)相關(guān)的變量.

(1)式中k1-s定義為損失權(quán)重,其中s為目標(biāo)面積與圖像面積的比值,即目標(biāo)的相對(duì)尺度.對(duì)于s的取值,如果一張圖像中包含多個(gè)目標(biāo),則取其中尺度最小的目標(biāo)計(jì)算s的值,以保證每張包含小目標(biāo)的圖像可以有較大的訓(xùn)練權(quán)重,在訓(xùn)練中受到更多關(guān)注.k為超參數(shù),用來調(diào)節(jié)尺度敏感權(quán)重的大小.圖2給出了損失權(quán)重k1-s的函數(shù)圖,從圖2可以看出,s能保證k1-s的取值在1到k之間,這確保目標(biāo)尺度對(duì)網(wǎng)絡(luò)訓(xùn)練產(chǎn)生的影響在一定范圍.從函數(shù)性質(zhì)上看,k1-s是指數(shù)函數(shù),它對(duì)自變量s的變化比較敏感,這使得包含不同尺度目標(biāo)的損失權(quán)重產(chǎn)生差別.

圖2 尺度敏感權(quán)重函數(shù)圖像

基于上述分析,設(shè)計(jì)一批訓(xùn)練數(shù)據(jù)的損失計(jì)算方法,見算法1.

算法1中,woi,j和hoi,j分別是Ibatch中第i個(gè)訓(xùn)練圖像中第j個(gè)目標(biāo)的寬和高;W iI和H iI分別是Ibatch中第i個(gè)訓(xùn)練圖像的寬和高為第i個(gè)訓(xùn)練圖像中最小目標(biāo)的面積,s2i為第i個(gè)訓(xùn)練圖像的面積;Ni是第i個(gè)訓(xùn)練圖像中的目標(biāo)數(shù).

3 反卷積與可變形卷積特征融合網(wǎng)絡(luò)

算法1一批數(shù)據(jù)損失計(jì)算方法輸入:一批訓(xùn)練圖像Ibatch={I1,I2,…,IM},超參數(shù)k、α和β.輸出:Lossbatch Lossbatch=0;FOR i=1 to M s1i =min(wo i,1×hoi,1,…,wo i,j×ho i,j,…,wo i,Ni×ho i,Ni); =W I i×H I i;si=s1i/s2 i;s2i SSLi class=k1-si -1 1-Y?xyc ( )αlog()Y?xyc, Yxyc=1 Ni∑xyc■ ■ ■■■■ ■■■;( )1-Yxyc β()Y?xyc αlog( )1-Y?xyc, 其他Lossbatch=Lossbatch+SSLi class;END

現(xiàn)有文獻(xiàn)[6~13]表明:在特征提取網(wǎng)絡(luò)中,深層特征感受野較大,包含豐富的語義信息,淺層特征感受野較小,具有更多邊緣和紋理等細(xì)節(jié)信息.目標(biāo)檢測(cè)的兩個(gè)核心組件是分類和回歸,語義信息的分類能力強(qiáng),細(xì)節(jié)信息的定位能力大.小目標(biāo)的語義信息在深層特征中能量小甚至消失,其細(xì)節(jié)信息主要在淺層特征中.中大目標(biāo)的語義信息在深層特征中具有較高能量,其細(xì)節(jié)信息在淺層特征中更加豐富.為了提升小目標(biāo)的檢測(cè)性能,根據(jù)深層和淺層特征的上述特點(diǎn),本文提出一種基于反卷積與可變形卷積的特征融合模塊,其結(jié)構(gòu)如圖3所示.該模塊首先對(duì)待融合特征圖f-map2進(jìn)行3×3的2倍上采樣反卷積,得到與融合特征圖f-map1相同大小的特征圖;然后再通過一個(gè)可變形卷積,來緩解上采樣帶來的混疊效應(yīng)和棋盤效應(yīng),并增強(qiáng)模型的擬合能力;最后將得到的特征圖與f-map1相加得到本模塊的融合特征圖ff-map.該模塊可以根據(jù)網(wǎng)絡(luò)深度及實(shí)際需求增加或減少,以達(dá)到最優(yōu)效果.實(shí)驗(yàn)發(fā)現(xiàn):在ResNet-18與ResNet-50上分別加入2個(gè)模塊效果較好,而ResNet-101上使用3個(gè)效果更佳.

圖3 特征融合模塊

利用提出的特征融合網(wǎng)絡(luò)模塊設(shè)計(jì)小目標(biāo)檢測(cè)網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,包括自底向上和自頂向下兩個(gè)通路.自底向上通路是骨干網(wǎng)絡(luò)用于特征提取,本文利用ResNet-50構(gòu)建自底向上通路.為獲得高分辨率的特征圖,刪除了ResNet-50第一個(gè)池化層,利用其block1~block4得到尺度大小為原圖的1/2、1/4、1/8和1/16的特征圖.自頂向下通路用于特征融合,包括2個(gè)串聯(lián)的特征融合模塊,先將block4與block3的輸出特征進(jìn)行融合;然后再將得到的融合特征與block2的輸出特征進(jìn)行融合,從而得到高分辨率、強(qiáng)語義的融合特征圖用于目標(biāo)檢測(cè).網(wǎng)絡(luò)的輸出是目標(biāo)類別、尺度和中心偏移量.

圖4 征融合網(wǎng)絡(luò)結(jié)構(gòu)

圖5(a)給出了PASCAL VOC數(shù)據(jù)集中一張圖像,圖5(b)~(e)顯示了圖4(a)在特征融合網(wǎng)絡(luò)中block1~block4的輸出特征圖,圖5(f)是其最終融合特征圖.對(duì)比圖5(b)~(f)各特征圖可以看出:在最終融合特征圖5(f)中,小鳥的融合特征既包含了深層特征的語義信息,又具有淺層的紋理邊緣信息,大目標(biāo)汽車的融合特征也同時(shí)包含深層語義信息和淺層紋理邊緣信息.

圖5 目標(biāo)圖像與特征圖

4 網(wǎng)絡(luò)訓(xùn)練與實(shí)現(xiàn)細(xì)節(jié)

本文用多任務(wù)損失函數(shù)訓(xùn)練網(wǎng)絡(luò),其定義如下:

其中,SSLclass是式(1)所示的尺度敏感分類損失;λsize和λoff是超參數(shù),本文λsize取0.1,λoff取1.0;Lsize是尺度損失,其定義如式(3)所示;Loff是中心偏移損失,其定義如式(4)所示.

式(3)中,N是樣本個(gè)數(shù),和sk分別是目標(biāo)k的尺度預(yù)測(cè)值和標(biāo)注值.

式(4)中,N是樣本個(gè)數(shù),是目標(biāo)k的中心偏移預(yù)測(cè)值,p是目標(biāo)k的位置標(biāo)注值,R是下采樣倍數(shù),本文R=4.

網(wǎng)絡(luò)訓(xùn)練時(shí)輸入圖像的大小歸一化為512×512,因此網(wǎng)絡(luò)輸出的目標(biāo)類別熱圖、尺度熱圖和偏移量熱圖大小均是128×128.目標(biāo)類別熱圖的通道數(shù)與數(shù)據(jù)有關(guān),對(duì)于PASCAL VOC數(shù)據(jù)集類別熱圖的通道數(shù)是20,對(duì)于MS COCO數(shù)據(jù)集其類別通道數(shù)是80,尺度熱圖的通道數(shù)和偏移量的熱圖通道數(shù)均是2.模型的初始化權(quán)重是由ResNet-50在ImageNet上預(yù)訓(xùn)練得到,并使用4張GPU對(duì)ResNet-50網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練批次大小(batchsize)設(shè)置為32,共訓(xùn)練100個(gè)輪次(epoch).初始學(xué)習(xí)率設(shè)置為2.5e-4,并在第50及75個(gè)輪次分別衰減至2.5e-5及2.5e-6.

5 實(shí)驗(yàn)結(jié)果與分析

5.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集

在SYS-7048GR-TR臺(tái)式機(jī)(CPU型號(hào)為Intel Xeon(R)ES-2630v4@2.20 GHz×20,內(nèi)存為64 GB,GPU為RTX2070S 8G)上實(shí)現(xiàn)了本文方法,軟件環(huán)境是:Ubuntu 18.04、Python 3.6、torch 1.4.0、cuda10.1和cudnn7.5.為了驗(yàn)證本文方法的有效性,使用PASCAL VOC數(shù)據(jù)集對(duì)本文方法進(jìn)行消融實(shí)驗(yàn),并與現(xiàn)有優(yōu)秀方法進(jìn)行了對(duì)比分析.

5.2 消融實(shí)驗(yàn)

針對(duì)本文的兩個(gè)改進(jìn)方面進(jìn)行消融實(shí)驗(yàn),以驗(yàn)證尺度敏感損失和特征融合兩方面對(duì)小目標(biāo)檢測(cè)性能的提升作用.

5.2.1 尺度敏感損失實(shí)驗(yàn)分析

首先,為驗(yàn)證尺度敏感損失和不同超參數(shù)對(duì)目標(biāo)檢測(cè)精度的影響,對(duì)取不同k值的本文方法進(jìn)行實(shí)驗(yàn)驗(yàn)證與分析,實(shí)驗(yàn)結(jié)果如表1所示.從表1可以看出:尺度敏感損失明顯提升了小目標(biāo)的檢測(cè)精度,表明尺度敏感損失在訓(xùn)練時(shí)提高了網(wǎng)絡(luò)對(duì)小目標(biāo)的關(guān)注程度,有效提高了小目標(biāo)對(duì)網(wǎng)絡(luò)學(xué)習(xí)的影響力.隨著k值的增加,小目標(biāo)的檢測(cè)精度逐漸提升.從表1也可以看出:k值為4時(shí),小目標(biāo)的精度已經(jīng)提升不大,而中、大目標(biāo)的檢測(cè)精度有一定的下降,導(dǎo)致總體精度下降.主要原因是當(dāng)k值設(shè)置過大時(shí),尺度敏感損失對(duì)網(wǎng)絡(luò)訓(xùn)練的影響已經(jīng)超出正常范圍,對(duì)網(wǎng)絡(luò)模型的學(xué)習(xí)有負(fù)面影響,因此尺度敏感損失對(duì)目標(biāo)檢測(cè)精度的提升存在上限.從表1中的實(shí)驗(yàn)結(jié)果可以看出:k值設(shè)置為2時(shí),尺度敏感損失的綜合性能最佳.

表1 不同k值的檢測(cè)結(jié)果

5.2.2 特征融合實(shí)驗(yàn)分析

為驗(yàn)證特征融合對(duì)小目標(biāo)檢測(cè)的性能的影響,對(duì)使用不同深度ResNet的本文方法進(jìn)行實(shí)驗(yàn)驗(yàn)證與分析,實(shí)驗(yàn)結(jié)果如表2所示.從表2可以看出:對(duì)不同深度的ResNet進(jìn)行特征融合后,小目標(biāo)的檢測(cè)精度均有不同程度的提升,并且網(wǎng)絡(luò)越深提升效果越明顯.其中,輕量型網(wǎng)絡(luò)ResNet-18提升最小,主要原因是其下采樣倍數(shù)較低,它自身已能夠提取豐富的細(xì)節(jié)信息,因此提升效果并不明顯.ResNet-101的小目標(biāo)檢測(cè)精度最低,特征融合后ResNet-101的小目標(biāo)檢測(cè)精度提升最大,但是檢測(cè)速度有較大降低,這一結(jié)果表明:當(dāng)網(wǎng)絡(luò)層數(shù)超過某一閾值時(shí),網(wǎng)絡(luò)越深越不利于小目標(biāo)的檢測(cè),同時(shí)檢測(cè)速度也會(huì)明顯下降.特征融合后ResNet-50的小目標(biāo)精度提升了3.4%,整體精度mAP有少許降低,但是其檢測(cè)速度仍然較快.

表2 不同深度ResNet網(wǎng)絡(luò)特征融合檢測(cè)結(jié)果

5.2.3 綜合影響實(shí)驗(yàn)分析

為驗(yàn)證尺度敏感損失與特征融合同時(shí)加入對(duì)小目標(biāo)檢測(cè)性能的綜合影響,同時(shí)使用尺度敏感損失與特征融合網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試.其中尺度敏感損失k值設(shè)置為2,并采用不同深度的ResNet作為骨干網(wǎng)絡(luò),實(shí)驗(yàn)結(jié)果如表3所示.結(jié)合表1、表2與表3可以看出,當(dāng)尺度敏感損失與特征融合網(wǎng)絡(luò)同時(shí)加入時(shí),相比兩種策略分別加入,小目標(biāo)檢測(cè)精度得到進(jìn)一步提升,該結(jié)果表明,本文提出的兩種策略能夠協(xié)同工作,共同提升小目標(biāo)檢測(cè)精度,相互之間沒有抵消及干擾.另外,兩種策略同時(shí)作用時(shí),整體精度相比單獨(dú)采用特征融合網(wǎng)絡(luò)時(shí)有所下降,其主要原因是尺度敏感損失使得網(wǎng)絡(luò)更加關(guān)注小目標(biāo),使得中、大目標(biāo)的檢測(cè)精度受到一定影響,小目標(biāo)精度雖有所提升,但總體精度有少許下降,但是該影響依然處于可以接受的范圍.

表3 綜合影響實(shí)驗(yàn)結(jié)果

5.3 對(duì)比實(shí)驗(yàn)

5.3.1 定量實(shí)驗(yàn)

該實(shí)驗(yàn)將本文目標(biāo)檢測(cè)方法SSLFF-Det與目前先進(jìn)目標(biāo)檢測(cè)方法進(jìn)行性能對(duì)比分析,在相同軟硬件環(huán)境下,利用VOC 2007與VOC 2012合成數(shù)據(jù)集進(jìn)行訓(xùn)練、測(cè)試對(duì)比分析.為了比較的公平性,目標(biāo)檢測(cè)方法均采用ResNet-50或者與之深度相近的網(wǎng)絡(luò)作為骨干網(wǎng)絡(luò).實(shí)驗(yàn)結(jié)果如表4所示.從表4結(jié)果可以看出,本文目標(biāo)檢測(cè)方法SSLFF-Det對(duì)小目標(biāo)的檢測(cè)最優(yōu),在檢測(cè)速度方面,SSLFF-Det的檢測(cè)速度處于較高水平,能夠達(dá)到50FPS.

表4 本文方法與各類方法對(duì)比

5.3.2 定性實(shí)驗(yàn)

圖6給出 了 本文 方法、CenterNet[18]、SSD513[7]和YOLOv4[23]對(duì)PASCAL VOC數(shù)據(jù)集中4張圖像的檢測(cè)結(jié)果,其中圖6(a)是CenterNet的檢測(cè)結(jié)果,圖6(b)為SSD513的檢測(cè)結(jié)果,圖6(c)為YOLOv4的檢測(cè)結(jié)果,圖6(d)為本文方法的檢測(cè)結(jié)果.可以看出,本文方法對(duì)小目標(biāo)檢測(cè)具有更高召回率.

圖6 不同檢測(cè)方法檢測(cè)結(jié)果

6 結(jié)論

針對(duì)現(xiàn)有基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法對(duì)小目標(biāo)檢測(cè)的不足,本文提出一種基于尺度敏感損失與特征融合的通用快速小目標(biāo)檢測(cè)方法.本文方法的主要?jiǎng)?chuàng)新點(diǎn)有兩個(gè)方面:一是提出尺度敏感分類損失,使小目標(biāo)在訓(xùn)練中更受關(guān)注,從而提升網(wǎng)絡(luò)對(duì)小目標(biāo)的學(xué)習(xí)能力;二是在anchor-free檢測(cè)框架下加入了特征融合,從而得到融合深度語義和淺層細(xì)節(jié)的特征圖進(jìn)行目標(biāo)檢測(cè).對(duì)提出的目標(biāo)檢測(cè)方法進(jìn)行了實(shí)驗(yàn)驗(yàn)證和分析,實(shí)驗(yàn)結(jié)果表明:本文提出的目標(biāo)檢測(cè)方法對(duì)小目標(biāo)檢測(cè)效果提升明顯,且檢測(cè)速度較快.

猜你喜歡
尺度精度損失
基于不同快速星歷的GAMIT解算精度分析
數(shù)字化無模鑄造五軸精密成形機(jī)精度檢驗(yàn)項(xiàng)目分析與研究
洪澇造成孟加拉損失25.4萬噸大米
環(huán)境史衰敗論敘事的正誤及其評(píng)判尺度
兩敗俱傷
近似邊界精度信息熵的屬性約簡
損失
以長時(shí)間尺度看世界
9
那些損失上百萬的演員
泸州市| 康定县| 崇明县| 天台县| 富锦市| 久治县| 仁布县| 乐业县| 怀来县| 绩溪县| 若尔盖县| 北票市| 定陶县| 壶关县| 绥棱县| 安徽省| 建湖县| 静乐县| 调兵山市| 顺昌县| 桓台县| 榆树市| 邢台县| 淳化县| 临桂县| 南京市| 三门县| 拜泉县| 舞钢市| 巨鹿县| 南丹县| 乐清市| 平安县| 太康县| 翼城县| 防城港市| 大同市| 三门峡市| 织金县| 蒲江县| 琼海市|