国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于殘差網(wǎng)絡(luò)和改進(jìn)特征金字塔的油田作業(yè)現(xiàn)場目標(biāo)檢測算法

2020-06-04 02:01:14邵明文李傳秀張兆雷
科學(xué)技術(shù)與工程 2020年11期
關(guān)鍵詞:殘差準(zhǔn)確率卷積

梁 鴻, 李 洋, 邵明文, 李傳秀, 張兆雷

(中國石油大學(xué)(華東)計算機(jī)科學(xué)與技術(shù)學(xué)院,青島 266000)

目前油田生產(chǎn)過程中主要依靠人工對生產(chǎn)現(xiàn)場進(jìn)行監(jiān)控,攝像頭路數(shù)眾多,監(jiān)督成本高且無法保證質(zhì)量。為了快速查找作業(yè)現(xiàn)場,減少違規(guī)作業(yè)并保證生產(chǎn)安全,將人工智能應(yīng)用于油田安防之中。以單點多盒檢測器(single shot multibox detector, SSD)算法[1]為基礎(chǔ)并結(jié)合油田現(xiàn)場對SSD算法進(jìn)行改進(jìn)。油田現(xiàn)場攝像頭懸掛較高,距離物體遠(yuǎn),因此提高SSD算法對小目標(biāo)識別的精度是關(guān)鍵問題。

Krizhevsky等[2]在ImageNet視覺識別挑戰(zhàn)賽中使用卷積神經(jīng)網(wǎng)絡(luò)對物體進(jìn)行識別,并取得很高的準(zhǔn)確率,這使得人們重新認(rèn)識到神經(jīng)網(wǎng)絡(luò)的強(qiáng)大之處,開啟了研究神經(jīng)網(wǎng)絡(luò)的熱潮。目前基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法主要有以R-CNN(Region-CNN)[3]為代表的兩步檢測算法和以YOLO[4]為代表的一步檢測算法。

Girshick等[3]提出R-CNN算法,該算法首次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于目標(biāo)檢測領(lǐng)域。R-CNN算法的精確度超過了傳統(tǒng)算法,但R-CNN算法計算量大,檢測圖片的速度較慢。Girshick[5]提出了Faste R-CNN算法。對于R-CNN存在計算量大的問題,Faste R-CNN采用共享感興趣區(qū)域池化的方式減少計算量,從而提高檢測速度。Ren等[6]提出Faster R-CNN算法,該算法使用RPN(region proposal network)網(wǎng)絡(luò)代替了SearchSelective算法[3],提高了檢測速度。He等[7]提出空間金字塔池化網(wǎng)絡(luò)(spatial pyramid pooling net, SPP-Net),該網(wǎng)絡(luò)可以自適應(yīng)圖片大小,很大程度上提高了檢測速度。R-CNN系列算法雖然準(zhǔn)確率較高,但檢測速度依然很慢。Redmon等[4]提出了YOLO(you only look once)算法,該算法采用端到端的設(shè)計思路,將區(qū)域提取和預(yù)測統(tǒng)一到一個網(wǎng)絡(luò)中,極大地提高了檢測速度。YOLO算法從最后一個特征層進(jìn)行預(yù)測,對小目標(biāo)的預(yù)測不理想。Liu等[1]提出SSD算法,它同樣采用端到端的設(shè)計思路。SSD算法采用從多層進(jìn)行預(yù)測,一定程度上提高了對小目標(biāo)識別的準(zhǔn)確率。由于較低的卷積層缺乏語義信息,從而導(dǎo)致對小目標(biāo)的檢測不夠準(zhǔn)確。

針對小目標(biāo)的問題,Cai等[8]提出Cascade R-CNN算法。該算法是一種多階段的結(jié)構(gòu),每階段都相繼提高交并比(intersection over union,IOU)的閾值,通過控制IOU閾值提高小目標(biāo)的準(zhǔn)確率。Fu等[9]提出DSSD(deconvolutional single shot detecter)算法,該算法使用反卷積進(jìn)行上采樣,同時使用ResNet-101[10]代替SSD結(jié)構(gòu)中的VGG(visual geometry group)-16[11]。DSSD提高了小目標(biāo)檢測準(zhǔn)確率的同時降低了檢測速度,DSSD321[9]在TitanX上測試的速度為9.5 fps[9]。Lin等[12]提出FPN算法,該算法通過將上采樣和下采樣特征圖相結(jié)合的方式,來提高對小目標(biāo)識別的準(zhǔn)確率。Bell等[13]提出兩個網(wǎng)絡(luò)的結(jié)構(gòu),通過SkipPooling和IRNN(spatial recurrent neural network)將內(nèi)網(wǎng)和外網(wǎng)相互結(jié)合的方式提高準(zhǔn)確率。Cao等[14]通過融合底層特征的方式提高小目標(biāo)的準(zhǔn)確率。Shen等[15]使用卷積神經(jīng)網(wǎng)絡(luò)中間層的不同尺度來動態(tài)地調(diào)整監(jiān)督強(qiáng)度,以此來提高小目標(biāo)檢測的準(zhǔn)確率。文獻(xiàn)[16]通過注意力機(jī)制提高識別準(zhǔn)確率。文獻(xiàn)[17]通過均值漂移濾波平移算法改善對中小目標(biāo)的識別效果。

針對SSD算法對小目標(biāo)識別不夠準(zhǔn)確的問題,使用改進(jìn)的FPN融合高層和底層語義信息,以此來提高對小目標(biāo)檢測的準(zhǔn)確率。較低的卷積層感受野小,采用空洞卷積進(jìn)行處理以得到較大的感受野[18]。在融合后的特征圖之上添加預(yù)測模塊[5],進(jìn)一步提高網(wǎng)絡(luò)對目標(biāo)語義信息的提取和融合。

1 改進(jìn)SSD

SSD算法是繼YOLO之后另一單步目標(biāo)檢測算法。相比較Faster R-CNN這種兩步目標(biāo)檢測算法,單步算法速度更快同時精度較高[4,6],在工業(yè)上有著廣泛的應(yīng)用。SSD借鑒YOLO的設(shè)計思路,其速度和準(zhǔn)確率都超過了YOLO v1[4]。相比較YOLO算法,SSD利用前面特征層中信息損失較少的特點對小目標(biāo)進(jìn)行預(yù)測,但前面語義信息不深,對小目標(biāo)識別依然不理想。針對SSD算法對小目標(biāo)檢測精度低的問題進(jìn)行改進(jìn),改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 RP-SSD網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 RP-SSD of network structure

1.1 改進(jìn)特征金字塔

1.1.1 上采樣模塊

FPN網(wǎng)絡(luò)有兩條路徑,一條自底向上,另一條自頂向下[12]。自底向上的網(wǎng)絡(luò)不斷下采樣提取物體的特征。自頂向下的網(wǎng)絡(luò)通過雙線性插值法[19]進(jìn)行上采樣。FPN將基礎(chǔ)網(wǎng)絡(luò)提取的特征圖經(jīng)過卷積核為1×1的卷積層進(jìn)行卷積,之后與上采樣得到特征圖的對應(yīng)元素相加進(jìn)行融合。FPN算法將融合后的特征圖使用步長為1、卷積核大小為3×3的卷積層進(jìn)行卷積,以此來減少相加后的特征圖的通道數(shù)。

首先按照FPN的方法構(gòu)造自頂向下的路徑,如圖2所示。對基礎(chǔ)網(wǎng)絡(luò)提取的特征圖進(jìn)行上采樣,之后與基礎(chǔ)網(wǎng)絡(luò)提取的特征圖相加,最后將相加的結(jié)果經(jīng)過一個卷積核為3×3的卷積層進(jìn)行卷積。由于基礎(chǔ)網(wǎng)絡(luò)前面卷積層的語義不深,所以直接與上采樣的卷積層相加會產(chǎn)生負(fù)面干擾。改進(jìn)后的算法在PASCAL VOC[20]2007測試的mAP為74.7%,相比現(xiàn)有SSD的77.2%[1]下降了2.5%。

圖2 直接按照FPN的方式改進(jìn)SSD網(wǎng)絡(luò)Fig.2 Improving SSD network directly according to FPN

為了更好地融合上采樣和下采樣產(chǎn)生的特征圖,對FPN的上采樣過程重新構(gòu)造,如圖3所示。使用雙線性插值法進(jìn)行上采樣,并將VGG-16的Conv4_3[11]所產(chǎn)生的特征圖使用空洞卷積進(jìn)行卷積,擴(kuò)大感受野。對于使用雙線性差值法得到的特征圖,首先輸入到卷積核為1×1、輸出通道為256的卷積層中進(jìn)行卷積。使用1×1的卷積核目的是為了減少特征圖的通道數(shù),從而減少模型的參數(shù)。之后將卷積后的特征圖輸入BN(batch normalization,批量歸一化)層中,進(jìn)行歸一化處理加速網(wǎng)絡(luò)的收斂。對于基礎(chǔ)網(wǎng)絡(luò)提取的特征圖放到兩個卷積層中進(jìn)行卷積,每個卷積層后設(shè)置一個BN層。并在兩個卷積層中間加入非線性激活函數(shù)relu,增加模型的表達(dá)能力。同時relu函數(shù)可以隨機(jī)使神經(jīng)元失活,在一定程度上避免卷積神經(jīng)網(wǎng)絡(luò)的過擬合現(xiàn)象。最后將上采樣和下采樣結(jié)果的對應(yīng)元素相加進(jìn)行融合。本文所設(shè)計的上采樣模塊適用于整個SSD網(wǎng)絡(luò)。

由于Conv4_3在卷積神經(jīng)網(wǎng)絡(luò)的淺層感受野不足,將它直接與上采樣后的卷積層相加會造成負(fù)面影響。使用池化層進(jìn)行下采樣雖然可以增大感受野,但是會造成像素信息的損失。空洞卷積優(yōu)點就是在不進(jìn)行池化層處理的情況下,增大特征圖的感受野,使每個卷積層輸出都有較大信息范圍??斩淳矸e將原有的卷積核以一定比例進(jìn)行擴(kuò)大,但實際的卷積核和原卷積核的大小相同,并不會增加計算量。采用擴(kuò)張率[18]為2的空洞卷積對Conv4_3輸出的特征圖進(jìn)行卷積,增大感受野。

圖3 上采樣模塊Fig.3 Up sampling module

1.1.2 預(yù)測模塊

為了得到更多的語義信息,在上采樣模塊之后增加預(yù)測模塊[9],如圖4所示。預(yù)測模塊a由一個殘差塊組成,預(yù)測模塊b由兩個殘差塊組成。每個殘差塊由3個卷積層構(gòu)成,卷積層的輸出通道數(shù)依次為256、256、1 024,卷積核大小為1×1,步長為1,跳層連接處卷積核為1×1,網(wǎng)絡(luò)最終得到的特征圖如式(1)所示。對比兩種預(yù)測模塊,預(yù)測模塊b的準(zhǔn)確率要好于預(yù)測模塊a。這主要因為VGG-16的卷積層要少,使用卷積層較多的預(yù)測模塊可以獲得更多的語義信息[10]。

Y=Cp(Fd⊕Fu)

(1)

式(1)中:Y表示最終得到的特征圖;Cp表示對特征圖使用預(yù)測模塊進(jìn)行卷積;Fd表示基礎(chǔ)網(wǎng)絡(luò)提取的特征圖;Fu表示上采樣得到的特征圖;⊕表示將特征圖對應(yīng)的像素值相加。

圖5 使用跳層連接改進(jìn)基礎(chǔ)網(wǎng)絡(luò)Fig.5 Improves the back bone network with a jump-layer connection

圖4 預(yù)測模塊Fig.4 Prediction module

1.2 改進(jìn)基礎(chǔ)網(wǎng)絡(luò)

VGG-16由牛津大學(xué)提出,該網(wǎng)絡(luò)的優(yōu)點是簡潔實用,缺點是與近些年提出的ResNet-101相比,VGG-16的卷積層較少,這意味著VGG-16所提取的語義少。VGG-16由13個卷積層、3個全連接層、5個池化層組成。SSD的基礎(chǔ)網(wǎng)絡(luò)為改進(jìn)后的VGG-16。去掉了VGG-16的一個全連接層,將剩下的兩個全連接層變?yōu)榫矸e層,之后添加8個額外的卷積層。

為提高網(wǎng)絡(luò)對小目標(biāo)識別的準(zhǔn)確率,在基礎(chǔ)網(wǎng)絡(luò)中添加上采樣模塊和6個卷積層組成的預(yù)測模塊。雖然可以提升卷積神經(jīng)網(wǎng)絡(luò)對語義信息的提取,提高物體的識別率,但同時也給網(wǎng)絡(luò)帶來了梯度爆炸或梯度消失[10]的問題,使得網(wǎng)絡(luò)難以訓(xùn)練。

He等[10]發(fā)現(xiàn)隨著網(wǎng)絡(luò)層數(shù)的加深,網(wǎng)絡(luò)的準(zhǔn)確率會越來越高,但是加深到一定的程度后網(wǎng)絡(luò)的精度會立刻下降,反而不如淺層網(wǎng)絡(luò)預(yù)測的精度高。深層網(wǎng)絡(luò)的準(zhǔn)確率比淺層的準(zhǔn)確率低的主要原因是梯度消失和梯度爆炸。為了解決梯度問題,文獻(xiàn)[10]采用跳層連接卷積層的方式構(gòu)造殘差塊。本文同樣采用跳層連接的方式在SSD的基礎(chǔ)網(wǎng)絡(luò)中構(gòu)造殘差塊,以此來解決梯度問題,網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。

以VGG-16的卷積段[11]作為一個殘差單元,殘差單元之間使用短線進(jìn)行跳層連接。每個短線由卷積層和BN層組成。以VGG-16的卷積段作為一個殘差單元,VGG-16共含有5個卷積段,在此處構(gòu)造5個殘差塊。在額外卷積層處,每兩個卷積層作為一個殘差單元。在額外卷積層處共構(gòu)造4個殘差塊,本文一共設(shè)計9個殘差塊。每個跳層連接的卷積層參數(shù)如表1所示。

表1 跳層連接處的卷積層參數(shù)

2 實驗

2.1 實驗環(huán)境與參數(shù)設(shè)置

SSD512在Titan X測試的速度為19 fps[9],考慮到油田安防中的實時性,針對SSD300[1]進(jìn)行改進(jìn)實驗。實驗使用3種數(shù)據(jù)集驗證模型的有效性,分別為PASCAL VOC 2007加PASCAL VOC 2012、COCO 2014以及從勝利油田所采集的視頻圖像并按照PASCAL VOC制作的數(shù)據(jù)集。從油田采集的數(shù)據(jù)集一共有9個類別,分別為 no-hat (不戴安全帽)、auto-cr (汽車吊)、truck-cr (隨車吊)、excavator(挖掘機(jī))、oxy-ace(用火設(shè)備)、tractor(拖拉機(jī))、 person (人)、cr-arm (起重臂)、 gr-anchor(地錨機(jī))。

實驗的評價標(biāo)準(zhǔn)主要使用準(zhǔn)確率mAP,它是目標(biāo)檢測領(lǐng)域公認(rèn)的評價標(biāo)準(zhǔn),計算方式如公式(2)所示。本實驗同時借助mAP曲線、P-R(precision-recall,精確率-召回率)曲線來分析所改進(jìn)算法的性能。

(2)

式(2)中:Pii表示真正;Pij表示假正。一共有k+1個類別。

實驗使用的操作系統(tǒng)為Ubuntu16.04,顯卡為GTX 1080Ti,其顯存為11 G,處理器為酷睿i7-7700。本實驗學(xué)習(xí)率初始值設(shè)置為1×10-4,動量為0.9,權(quán)重衰減率為5×10-4。利用ImageNet數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,得到的權(quán)重對VGG-16網(wǎng)絡(luò)進(jìn)行初始化。網(wǎng)絡(luò)其余卷積層的參數(shù)使用“xavier”方法[21]進(jìn)行初始化。所有訓(xùn)練和測試代碼均在pytorch框架中編寫。

2.2 PASCAL VOC 2007

實驗使用PASCAL VOC 2012和PASCAL VOC 2007的訓(xùn)練集和驗證集進(jìn)行訓(xùn)練,使用PASCAL VOC 2007的測試集進(jìn)行測試。同時選取了SSD、Faster R-CNN以及DSSD作為本實驗的對照算法。數(shù)據(jù)集共有20個類,分別為aero (飛機(jī))、bike (自行車)、bird (鳥)、boat (船)、bottle (瓶子)、bus (公共汽車)、car (汽車)、cat(貓)、chair(椅子)、cow(牛)、tabble(桌子)、dog(狗)、horse(馬)、mbike(摩托車)、person(人)、plant(盆栽植物)、sheep(羊)、sofa(沙發(fā))、train(火車)、tv(電視)。實驗結(jié)果如表2所示,表中列出了3種算法的mAP以及20個類的平均精度(average precision,AP)。

實驗一共訓(xùn)練12萬輪。為了得到更好的結(jié)果,在8萬輪和10萬輪時通過式(3)調(diào)整學(xué)習(xí)率。其中Lr為調(diào)整后的學(xué)習(xí)率,Init_Lr為初始的學(xué)習(xí)率,gamma為動量,step為迭代的輪數(shù)。

Lr=Init-Lr×gammastep

(3)

實驗使用pytorch框架復(fù)現(xiàn)SSD算法,它在PASCAL VOC 2007中測試的mAP最高為76.7%,相比文獻(xiàn)[1]中的77.2%低0.5%。從表中可以看出,改進(jìn)算法優(yōu)于SSD和DSSD算法,RP-SSD比文獻(xiàn)[1]中的SSD的準(zhǔn)確率提高了1.7%。RP-SSD相比使用pytorch復(fù)現(xiàn)的SSD,準(zhǔn)確率提高了2.2%。改進(jìn)算法對小目標(biāo)提高顯著,其中bird類提高了4.4%,bottle類提高了8.9%,plant類提高了5.2%,chair類提高了4.8%。RP-SSD比DSSD提高了0.3%,其中bottle類提高了4.5%,chair類提高了4.1%,plant類提高了3.1%。RP-SSD比FasterR-CNN的準(zhǔn)確率提高了5.7%,其中bird類提高了7.5%,table類提高了12.1%,plant類提高了16%。

表2 PASCAL VOC 2007測試結(jié)果

圖6展示了SSD和RP-SSD的檢測效果。從圖中可以看出,圖6(a)的置信度高于圖6(b)的置信度。在小物體的檢測中,圖6(a)的漏檢率低于圖6(b)的漏檢率,同時圖6(b)錯檢率大于圖6(a)。

召回率(recall)和精確率(precision)是分析目標(biāo)檢測算法性能的重要指標(biāo),本文繪制了SSD和RP-SSD算法的P-R曲線,如圖7所示。從圖中可以看出RP-SSD算法的召回率和精確率都大于SSD算法的召回率和精確率。由RP-SSD的P-R曲線與Precision軸、Recall軸圍成的面積完全大于P-R曲線與Precision軸、Recall軸圍成的面積,可得RP-SSD的性能完全優(yōu)于SSD的性能。

實驗共迭代12萬輪,從圖8中可以看出RP-SSD的mAP高于SSD的mAP,1到8萬輪大約高1%,8萬輪到12萬輪大約高2%。從圖中可以看出,通過式(3)調(diào)整學(xué)習(xí)率的有效性,從8萬輪開始SSD和RP-SSD的mAP值開始顯著提高。

2.3 石油數(shù)據(jù)集

實驗使用從勝利油田現(xiàn)場采集的數(shù)據(jù)對改進(jìn)算法進(jìn)行驗證。油田數(shù)據(jù)集中共有4 001張圖片,其中訓(xùn)練集加驗證集的數(shù)量為3 200張,測試集的數(shù)據(jù)量為801張,每張圖片分辨率為640×480。圖片的主要來源為包含油田各種施工場景的視頻圖像。為了增加網(wǎng)絡(luò)的魯棒性,從百度搜索189張圖片加入數(shù)據(jù)集中。從百度搜索的圖片中包含了數(shù)據(jù)集的各個類別。制作數(shù)據(jù)集時,首先將油田視頻裁剪成圖片,然后挑選差異比較大的圖片進(jìn)行人工標(biāo)注,如圖9所示。制作的數(shù)據(jù)集中一共標(biāo)注10 099個目標(biāo),其中不戴安全帽標(biāo)注509個,汽車吊標(biāo)注1 717個、隨車吊標(biāo)注986個、起重臂標(biāo)注2 514個、挖掘機(jī)標(biāo)注804個、切割用的氧氣瓶和乙炔瓶標(biāo)注509個、拖拉機(jī)標(biāo)注416個、人標(biāo)注2514個、地錨機(jī)標(biāo)注130個,標(biāo)注后的圖片按照PASCAL VOC的格式進(jìn)行制作數(shù)據(jù)集。

圖6 RP-SSD和SSD檢測效果對比Fig.6 Comparison of RP-SSD and SSD detection results

圖7 SSD和RP-SSD的P-R曲線Fig.7 P-R curves of SSD and RP-SSD

圖8 RP-SSD和SSD的mAP曲線Fig.8 mAP curves of RP-SSD and SSD

東營勝利油田現(xiàn)場所部署攝像頭的焦距為4.7~94 mm,其放大倍數(shù)為20倍。實驗設(shè)置的參數(shù)與VOC 2007相同,實驗結(jié)果如表3所示,演示效果如圖10所示。實驗對比了SSD、RP-SSD和DSSD在油田數(shù)據(jù)集的準(zhǔn)確率,SSD的mAP為75.8%,RP-SSD的mAP為78.4%。通過實驗發(fā)現(xiàn),本文改進(jìn)算法的準(zhǔn)確率比現(xiàn)有SSD算法的準(zhǔn)確率提高了2.6%。其中小目標(biāo)類別提高顯著,切割用的氧氣瓶和乙炔瓶類提高了8.7%,人類提高3.6%,不戴安全帽類提高了4.4%。RP-SSD比DSSD的mAP提高了0.9%。

2.4 COCO數(shù)據(jù)集

COCO數(shù)據(jù)集標(biāo)注的物體中小目標(biāo)數(shù)量眾多,為了進(jìn)一步驗證改進(jìn)的模型,從COCO數(shù)據(jù)集中抽取實際物體較小的20個類別進(jìn)行驗證。抽取的20個類分別為person(人)、bic(bicycle,自行車)、fhyd(firehydrant,消防栓)、bird(鳥)、cat(貓)、dog(狗)、umb(umbrella,雨傘)、hanb(handbag,手提包)、tie(領(lǐng)帶)、skis(滑雪板)、bbat(baseballbat,棒球)、tenr(tennisracket,網(wǎng)球)、cup(水杯)、fork(叉子)、bowl(碗)、banana(香蕉)、apple(蘋果)、mouse(鼠標(biāo))、cellp(cellphone,手機(jī))、toob(toothbrush,牙刷)。

實驗使用COCO 2014的訓(xùn)練集對模型進(jìn)行訓(xùn)練,使用COCO 2014的驗證集進(jìn)行測試。該數(shù)據(jù)集中測試圖片數(shù)量為28 738張,訓(xùn)練圖片數(shù)量為59 207張,訓(xùn)練集中共標(biāo)定284 670個目標(biāo),測試集中共標(biāo)定136 199個目標(biāo)。在訓(xùn)練集中標(biāo)定目標(biāo)的像素值小于32×32的占42.4%,在測試集中標(biāo)定目標(biāo)的像素值小于32×32的占42.2%。檢測結(jié)果如表4所示。

從表4中可以看出,RP-SSD比現(xiàn)有SSD算法的mAP提高了2.3%,其中cat類提高了3%,dog類提高了4.5%,umbrella類提高了3.1%,baseball bat類提高了5.8%,tennis racket類提高了5.1%,forck類提高了4.9%。RP-SSD比DSSD的mAP提高了1.2%。從實驗結(jié)果可以看出,RP-SSD算法在小目標(biāo)的檢測中表現(xiàn)優(yōu)異。

圖9 油田數(shù)據(jù)集展示Fig.9 Oilfield data set display

表3 石油數(shù)據(jù)集上的檢測結(jié)果

圖10 SSD和RP-SSD檢測結(jié)果對比Fig.10 Comparison of RP-SSD and SSD detection results

表4 COCO數(shù)據(jù)集檢測結(jié)果

2.5 改進(jìn)算法有效性的驗證

為了驗證改進(jìn)策略的有效性,對改進(jìn)方法分別在PASCAL VOC數(shù)據(jù)集上逐一驗證。首先將SSD算法記為F0。在F0的基礎(chǔ)上只添加上采樣模塊,記為F1。在F1的基礎(chǔ)上添加預(yù)測模塊a,記為F2-a。在F1的基礎(chǔ)上添加預(yù)測模塊b,記為F2-b。在F2-b基礎(chǔ)上采用殘差思想改進(jìn)VGG-16,記為F3。準(zhǔn)確率如表5所示。

表5 驗證各改進(jìn)方法

UL表示上采樣模塊,如圖3所示;PM(a)表示預(yù)測模塊a,如圖4(a)所示;PM(b)表示上采樣模塊b,如圖4(b)所示;Res表示使用殘差思想改進(jìn)基礎(chǔ)網(wǎng)絡(luò),如圖5所示。

2.6 速度

表6對比了各種檢測算法的速度。從表中看出RP-SSD的速度為32 fps,相比SSD下降了14 fps。雖然RP-SSD的速度有所下降,但可以達(dá)到實時檢測的目的。同時RP-SSD相比DSSD的速度提高了22.5 fps。

表6 檢測算法的速度對比

3 結(jié)論

為了避免上采樣和下采樣融合時產(chǎn)生負(fù)面干擾,在FPN中增加上采樣模塊來更好地融合特征。為了得到更多的語義信息在上采樣模塊之后添加預(yù)測模塊,并使用跳層連接的方式,解決反向傳播過程中的梯度問題。實驗表明,改進(jìn)的SSD算法對小目標(biāo)的檢測效果顯著提高。改進(jìn)的算法在1080Ti上的速度為32 fps,可以達(dá)到實時檢測的要求。改進(jìn)的算法較FasterR-CNN、SSD、DSSD有較大的優(yōu)勢。

猜你喜歡
殘差準(zhǔn)確率卷積
基于雙向GRU與殘差擬合的車輛跟馳建模
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
基于殘差學(xué)習(xí)的自適應(yīng)無人機(jī)目標(biāo)跟蹤算法
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
罗江县| 民丰县| 金门县| 望城县| 竹溪县| 昌黎县| 祥云县| 太仓市| 天长市| 绥江县| 寿宁县| 壶关县| 湛江市| 洱源县| 朝阳县| 桐柏县| 龙州县| 正安县| 延川县| 平遥县| 兴隆县| 苏尼特左旗| 青阳县| 宜都市| 崇左市| 隆回县| 上蔡县| 沅陵县| 商河县| 内黄县| 长丰县| 阿克苏市| 普宁市| 沙洋县| 桓仁| 合阳县| 兰西县| 南漳县| 南澳县| 宣恩县| 油尖旺区|