国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征融合的輕量級(jí)SSD目標(biāo)檢測(cè)方法

2021-10-15 07:18:04吳天成王曉荃蔡藝軍荊有波陳鋮穎
液晶與顯示 2021年10期
關(guān)鍵詞:殘差嵌入式卷積

吳天成, 王曉荃, 蔡藝軍, 荊有波, 陳鋮穎

(1. 廈門理工學(xué)院 光電與通信工程學(xué)院,福建 廈門 361024; 2. 中國(guó)科學(xué)院 微電子研究所,北京 100029)

1 引 言

邊防指的是維護(hù)國(guó)家領(lǐng)土主權(quán)和邊疆的安定與發(fā)展,由邊防武裝力量在邊境地區(qū)實(shí)施的武裝防御和保衛(wèi)活動(dòng)[1]。隨著信息技術(shù)發(fā)展的快速發(fā)展,邊防管控技術(shù)的重心也逐漸向信息技術(shù)領(lǐng)域轉(zhuǎn)移。本文依托中國(guó)科學(xué)院微電子研究所的邊緣計(jì)算終端項(xiàng)目,針對(duì)邊防監(jiān)控中目標(biāo)尺度較小、檢測(cè)難度高等問(wèn)題,主要研究提升目標(biāo)檢測(cè)算法的檢測(cè)精度和小目標(biāo)物體的檢測(cè)能力,設(shè)計(jì)了應(yīng)用于網(wǎng)絡(luò)邊緣嵌入式設(shè)備的目標(biāo)檢測(cè)算法,協(xié)助邊防管控。

傳統(tǒng)目標(biāo)檢測(cè)算法通過(guò)手工設(shè)計(jì)特征的方法并結(jié)合SVM[2]、Adaboost[3]等分類器的方法獲得檢測(cè)結(jié)果,但是該類方法在精度和速度上都不理想。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,依靠大量的訓(xùn)練數(shù)據(jù),自動(dòng)獲取特征的目標(biāo)檢測(cè)技術(shù)已經(jīng)代替了傳統(tǒng)的目標(biāo)檢測(cè)方法[4-6]?;谏疃葘W(xué)習(xí)的目標(biāo)檢測(cè)算法主要分為有兩大類:一是雙階段目標(biāo)檢測(cè)算法,包括R-CNN[7]、Fast R-CNN[8]和Faster R-CNN[9]。上述幾種方法的檢測(cè)精度高,但耗時(shí)較大,且對(duì)硬件設(shè)備要求較高,部署到移動(dòng)端設(shè)備上也存在較大困難;二是單階段目標(biāo)檢測(cè)算法,單階段算法直接在圖片的多個(gè)位置進(jìn)行分類和回歸,從而大幅度提高算法的檢測(cè)速度。包括YOLO[10]、 SSD[11]。SSD算法在整體回歸的思想上,借鑒了YOLO,同時(shí)參考了Faster-RCNN的錨點(diǎn)框設(shè)計(jì),在運(yùn)行速度與檢測(cè)精度上有了較好的平衡。

邊緣計(jì)算終端主要由嵌入式設(shè)備構(gòu)成,執(zhí)行邊防管控任務(wù)。針對(duì)嵌入式設(shè)備中的目標(biāo)檢測(cè)任務(wù),MobileNetV2是Google提出的優(yōu)秀的輕量級(jí)神經(jīng)網(wǎng)絡(luò)[12]。使用MobileNetV2對(duì)SSD網(wǎng)絡(luò)進(jìn)行優(yōu)化,在犧牲部分檢測(cè)精度的情況下大幅優(yōu)化了其計(jì)算量和參數(shù)量,實(shí)現(xiàn)了在嵌入式設(shè)備中執(zhí)行目標(biāo)檢測(cè)任務(wù)。本文在MobileNetV2-SSD的基礎(chǔ)上,使用特征融合的概念對(duì)該模型對(duì)各個(gè)尺度目標(biāo)的檢測(cè)精度進(jìn)行優(yōu)化,并在邊緣計(jì)算終端中的Jetson AGX Xavier設(shè)備中對(duì)模型進(jìn)行測(cè)試。

2 理論基礎(chǔ)

2.1 MobileNetV2

2.1.1 深度可分離卷積

使用深度可分離卷積減小模型參數(shù)量是輕量化網(wǎng)絡(luò)MobileNet的核心思想[13]。深度可分離卷積標(biāo)準(zhǔn)卷積分為深度卷積和逐點(diǎn)卷積兩個(gè)過(guò)程,在輸出和標(biāo)準(zhǔn)卷積一致的情況下,大幅減小了參數(shù)量。

圖1所示為標(biāo)準(zhǔn)卷積過(guò)程。圖2和圖3分別為深度卷積和逐點(diǎn)卷積過(guò)程。

圖1 標(biāo)準(zhǔn)卷積Fig.1 Standard convolution

圖2 深度卷積 Fig.2 Depthwise convolution

圖3 逐點(diǎn)卷積Fig.3 Pointwise convolution

圖中D為卷積大小,M是卷積通道數(shù),N表示卷積的個(gè)數(shù),M為卷積核的個(gè)數(shù)。假設(shè)輸入F的大小為(DF,DF,M),采用的傳統(tǒng)卷積核K的大小為(DK,DK,M,N)。

深度卷積和逐點(diǎn)卷積的參數(shù)量相加為深度可分離卷積的參數(shù)量,其結(jié)果與標(biāo)準(zhǔn)卷積參數(shù)量相比如式(1)所示:

(1)

由公式(1)比較發(fā)現(xiàn),MobileNet網(wǎng)絡(luò)模型參數(shù)數(shù)量大幅減少,降低了計(jì)算開銷。由此,深度可分離卷積方法改進(jìn)了采用傳統(tǒng)卷積的YOLO、SSD網(wǎng)絡(luò)的參數(shù)冗余等問(wèn)題,更適合部署至嵌入式設(shè)備。

2.1.2 線性瓶頸層

線性瓶頸層是MobileNetV2相對(duì)于MobileNetV1做出的改進(jìn)[12]。MobileNetV2中在深度分解卷積之前使用逐點(diǎn)卷積用于擴(kuò)張輸入數(shù)據(jù)的維度,使得網(wǎng)絡(luò)后續(xù)的卷積操作可以在高維空間提取更多特征信息。引入線性瓶頸層將低維度信息映射到高緯度中,避免了MobileNetV1中由于ReLU非線性激活函數(shù)造成的特征信息損失。

2.1.3 倒殘差塊

倒殘差塊結(jié)構(gòu)是基于ResNet中殘差塊所提出的一種操作方法[12]。ResNet殘差塊和 MobileNetV2的倒殘差塊結(jié)構(gòu)圖如圖4所示。

圖4中 MobileNet V2的倒殘差塊使特征圖的維度先升后降,與殘差塊的功能正好相反,因此后者被稱為倒殘差結(jié)構(gòu)。倒殘差塊結(jié)構(gòu)可以使深度分離卷積在高維度空間上提取更多的特征,以此來(lái)獲取更多語(yǔ)義特征。

圖4 Residual Block和Inverted Residual Block結(jié)構(gòu)對(duì)比Fig.4 Comparison between Residual Block and Inverted Residual Block

2.2 SSD算法

SSD算法采用VGG-16網(wǎng)絡(luò)結(jié)構(gòu)為特征提取網(wǎng)絡(luò),并在ⅤGG-16后接入多個(gè)大小依次減小的特征提取層,生成不同尺寸特征金字塔以檢測(cè)不同大小的目標(biāo)。尺寸較大的特征圖檢測(cè)體積比較小的目標(biāo)物,尺寸較小的特征圖檢測(cè)體積較大的目標(biāo)物[14]。SSD還使用了不同寬高比錨點(diǎn)框,使其能夠高效地檢測(cè)不同尺度的目標(biāo)。SSD的結(jié)構(gòu)圖如圖5所示。

圖5 SSD結(jié)構(gòu)圖[14]Fig.5 Structure map of SSD[14]

SSD舍棄了VGG16最后的全局池化部分和全連接層(FC6、FC7)并且分別用3×3×1 024的conv6卷積層和1×1×1 024的conv7卷積層替代VGG-16中的FC6和FC7作為基礎(chǔ)分類網(wǎng)絡(luò)的最終特征抽取部分。通過(guò)不同尺度的卷積層在圖像上做特征提取,然后回歸得到錨點(diǎn)框的具體位置以及各類型分類的置信度,最終通過(guò)非極大值抑制算法得到最終結(jié)果。

2.3 FPN

Tsung-Yi Lin等人提出了特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network, FPN)的概念,F(xiàn)PN的原理是融合不同尺寸的特征圖,并在融合后的特征圖上進(jìn)行預(yù)測(cè)[15]。FPN能夠很好地利用卷積神經(jīng)網(wǎng)絡(luò)中不同層級(jí)的語(yǔ)義特征和特征細(xì)節(jié),對(duì)特征圖自上到下進(jìn)行連接,將帶有更多局部特征細(xì)節(jié)的高分辨率特征圖和帶語(yǔ)義信息較強(qiáng)的低分辨率特征圖連接起來(lái)。圖6是FPN的結(jié)構(gòu)示意圖。

圖6 FPN框架[15]Fig.6 Frame of FPN

2.4 MobileNetV2-SSD分析

MobileNetV2-SSD以300×300×3尺寸的圖像作為輸入,使用MobileNetV2提取特征圖,然后使用SSD模型中的6個(gè)檢測(cè)層對(duì)不同尺度的目標(biāo)進(jìn)行多尺度的檢測(cè)。其中在步長(zhǎng)為1的卷積層之間均采用了shortcut結(jié)構(gòu)來(lái)加快訓(xùn)練。該網(wǎng)絡(luò)采用了Inverted Residual Block結(jié)構(gòu)使卷積層能夠在更高維度獲取更多的語(yǔ)義信息。使用Linear線性激活函數(shù)避免了MobileNetV1中非線性激活函數(shù)對(duì)特征圖信息的破壞。刪去了MobilenetV2全連接層,以4組倒殘差塊結(jié)構(gòu)作為替換,即bottleneck。并使用主干網(wǎng)絡(luò)中的Conv13_expand、Conv16_pw以及在Conv19_2、Conv19_3、Conv19_4和Conv19_5這4層進(jìn)行多尺度的目標(biāo)檢測(cè)。其中expand代表對(duì)特征通道的擴(kuò)張,擴(kuò)張可以在特征信息不損失和參數(shù)量不增加的前提下加大卷積層的感受野范圍,pw代表逐點(diǎn)卷積。MobileNetV2-SSD網(wǎng)絡(luò)結(jié)構(gòu)圖如圖7所示。

圖7 MobileNetV2-SSD結(jié)構(gòu)圖Fig.7 Structure map of MobileNetV2-SSD

3 算法改進(jìn)

本文基于FPN特征融合的思想,設(shè)計(jì)了一種輕量級(jí)特征融合方式,在MobileNetV2-SSD網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上實(shí)現(xiàn)特征融合,提升模型的檢測(cè)精度。

3.1 存在問(wèn)題

MobileNetV2-SSD會(huì)將輸入的圖片特征提取成不同尺度的特征圖進(jìn)行預(yù)測(cè),但是僅是在不同的特征圖上完成預(yù)測(cè),并沒(méi)有融合不同尺度的特征圖,不能充分利用深層語(yǔ)義特征和局部特征的細(xì)節(jié),對(duì)于小目標(biāo)的檢測(cè)效果并不好(小目標(biāo)指像素區(qū)域小于30×30的目標(biāo))。FPN 為逐層特征融合機(jī)制,新生成的特征金字塔上每層特征圖,將同層和高層的特征信息融合,網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,整體操作耗時(shí),加強(qiáng)了檢測(cè)精度的同時(shí)犧牲了過(guò)多的檢測(cè)速度,難以達(dá)到實(shí)時(shí)檢測(cè)的效果。

3.2 改進(jìn)策略

3.2.1 設(shè)計(jì)思路

FPN為逐層特征融合機(jī)制,同層和高層的特征信息融合,生成新的特征金字塔,整體操作耗時(shí)大且網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜。不同于FPN中的逐層融合,本文在原FPN模型的基礎(chǔ)上新增了特征融合模塊,使特征融合只在一個(gè)位置發(fā)生。

3.2.1 特征層選取

原模型采用Conv13,Conv16_pw,Conv19_2,Conv19_3,Conv19_4,Conv19_5上進(jìn)行邊框回歸和分類,其對(duì)應(yīng)的分辨率分別為38×38,19×19,10×10,5×5,3×3,1×1。Conv19_3,Conv19_4,Conv19_5這3層的特征層過(guò)小,語(yǔ)義信息不豐富,與原始上一層特征圖融合之后不會(huì)得到太多的語(yǔ)義信息,對(duì)模型精度并無(wú)提升,甚至還會(huì)降低檢測(cè)速度,因此不對(duì)這3層進(jìn)行特征融合。分別對(duì)Conv13,Conv16_pw,Conv19_2這3層網(wǎng)絡(luò)進(jìn)行特征融合。

3.2.2 特征融合

如圖8所示,分別對(duì)Conv13,Conv16_pw,Conv19_2這3層網(wǎng)絡(luò)進(jìn)行特征融合。使用1×1 卷積統(tǒng)一輸入通道,bilinear interp意為雙線性插值,實(shí)現(xiàn)上采樣操作,將不同大小的特征圖轉(zhuǎn)換成統(tǒng)一大小,融合的不同網(wǎng)絡(luò)層。

圖8 本文特征融合示意圖Fig.8 Schematic diagram of feature fusion in this paper

FPN中使用的 element操作融合不同尺度的特征圖,element要求特征圖的大小和通道數(shù)均保持統(tǒng)一,F(xiàn)PN中使用 1×1 卷積統(tǒng)一融合時(shí)的通道數(shù)。在本文模型中,1×1 卷積只負(fù)責(zé)降低通道,融合時(shí)選用了Concat操作(圖(9)),簡(jiǎn)單有效,可以不改變其原有的值,將兩張?zhí)卣鲌D的通過(guò)維度相加結(jié)合,不需要特征圖通道統(tǒng)一。

圖9 Concat操作示意圖Fig.9 Concat operation diagram

(a)原圖 (a)Original image

(b)特征融合前圖像 (b) Image before feature fusion

(c)特征融合后圖像 (c)Feature fusion image圖10 特征融合效果圖Fig.10 Feture fusion effect picture

我們輸出不同層級(jí)的特征圖使其可視化,展示特征融合前后的對(duì)比,結(jié)果如圖 10 所示。圖10中(a)為原圖,(b)分別為特征融合前Conv13,Conv16_pw,Conv19_2三層卷積層輸出的特征圖像,(c)為融合這3層后輸出的特征圖像。從圖10可以得出,低層特征層分辨率較高,包含更多圖像細(xì)節(jié),但是由于經(jīng)過(guò)的卷積更少,語(yǔ)義信息較弱,噪聲更多。高層特征更為抽象,具有更強(qiáng)的語(yǔ)義信息,但是分辨率很低,對(duì)細(xì)節(jié)的表達(dá)更差。特征融合后的特征圖像中重要的特征信息更加明顯,有助于提高目標(biāo)檢測(cè)精度。

圖11 改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)Fig.11 Improved network structure

使用BN(Batch Normalization)正則化Concat融合后的特征圖,BN層可以實(shí)現(xiàn)歸一化處理,改善網(wǎng)絡(luò)的梯度,防止梯度爆炸。完成改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)如圖11所示。當(dāng)輸入圖像的分辨率為 300×300時(shí),使用Conv13,Conv16_pw,Conv19_2三層進(jìn)行特征融合。經(jīng)過(guò)融合得到Conv20,對(duì)融合的特征圖進(jìn)行下采樣,重新生成類似SSD的多尺度金字塔型特征層,Conv20~Conv25一起用于預(yù)測(cè)。

4 實(shí)驗(yàn)結(jié)果與分析

4.1 實(shí)驗(yàn)準(zhǔn)備

為了檢驗(yàn)優(yōu)化后MobileNetV2-SSD算法的有效性,本文使用PASCAL VOC2007和VOC2012數(shù)據(jù)集共16 551張圖片對(duì)模型進(jìn)行聯(lián)合訓(xùn)練,并用VOC2007測(cè)試集共4 953張圖片進(jìn)行測(cè)試,并將測(cè)試結(jié)果與原始MobileNetV2-SSD算法結(jié)果進(jìn)行比較和分析。

4.2 評(píng)估標(biāo)準(zhǔn)

本文使用平均精度均值(mean average precision,mAP)、FPS(rames per second)、MB(MByte)這3類指標(biāo)分別評(píng)估模型的精度、速度和模型大小,以驗(yàn)證模型的性能。其中mAP是評(píng)估目標(biāo)檢測(cè)模型精度的重要指標(biāo),其計(jì)算公式如公式(2)、(3)、(4)所示。

(2)

(3)

(4)

其中:TP表示圖像中當(dāng)前類別正確檢測(cè)的次數(shù),TotalObjection表示當(dāng)前圖像中類別的實(shí)際目標(biāo)數(shù)量,TotalImg表示包含當(dāng)前類別目標(biāo)在所有圖像的數(shù)量,P表示準(zhǔn)確率,C表示需要識(shí)別目標(biāo)的總類別數(shù),AP表示單個(gè)目標(biāo)的平均精度值,最后計(jì)算出mAP為所有目標(biāo)類別的平均精度均值。

4.3 模型訓(xùn)練參數(shù)

模型訓(xùn)練時(shí)將每次迭代輸入的樣本數(shù)量batch_size設(shè)置為64。Learning _rate學(xué)習(xí)率用于控制模型訓(xùn)練速度,取值過(guò)大會(huì)導(dǎo)致參數(shù)越過(guò)最優(yōu)值,取值過(guò)小會(huì)導(dǎo)致模型收斂速度慢,將學(xué)習(xí)率初始化為0.001,權(quán)重衰減weight_decay設(shè)置為 0.000 1,防止產(chǎn)生過(guò)擬合現(xiàn)象。

4.4 實(shí)驗(yàn)結(jié)果

對(duì)模型的大小和精度進(jìn)行對(duì)比,在該部分實(shí)驗(yàn)中加入了SSD模型進(jìn)行比較,3種模型性能的比較如表1所示。

表1 目標(biāo)檢測(cè)模型性能比較Tab.1 Object detection model performance comparison

3種模型的輸入圖像大小同為300×300,本文改進(jìn)的模型大小稍大于MobileNetV2- SSD,在mAP上提升了3.6%,接近了原SSD模型。同時(shí)模型大小也遠(yuǎn)小于傳統(tǒng)的SSD模型,與MobileNetV2-SSD相差僅為8.8 MB。表2列舉了部分不同尺寸的目標(biāo),分別使用本文改進(jìn)模型和MobileNetV2- SSD的檢測(cè)精度試驗(yàn)結(jié)果。如表2所示,本文改進(jìn)模型在不同尺度目標(biāo)的檢測(cè)精度均好于MobileNetV2-SSD,尤其是sheep、bird、bottle以及potted plant等較小的目標(biāo),精度有了較大提升。這是由于改進(jìn)后的模型融合了不同尺度的特征層,能夠獲取圖像中更多小目標(biāo)的特征信息。選擇了帶有小目標(biāo)的檢測(cè)結(jié)果圖進(jìn)行對(duì)比,圖12為MobileNetV2-SSD的檢測(cè)效果,圖13為本文改進(jìn)模型的檢測(cè)效果。上述實(shí)驗(yàn)證明了特征融合的方法可以增強(qiáng)多尺度檢測(cè)模型的目標(biāo)檢測(cè)精度。

表2 不同尺寸目標(biāo)檢測(cè)性能比較Tab.2 Comparison of detection performance of different size targets (%)

圖12 MobileNetV2-SSD檢測(cè)效果Fig.12 MobileNetV2-SSD detection results

圖13 本文模型檢測(cè)效果Fig.13 Improved model detection results

將模型部署至邊緣計(jì)算終端中的Jetson AGX Xavier設(shè)備中,測(cè)試MobileNetV2-SSD和本文改進(jìn)后的模型在嵌入式設(shè)備中的檢測(cè)速度,驗(yàn)證其在嵌入式設(shè)備中執(zhí)行實(shí)時(shí)目標(biāo)檢測(cè)任務(wù)的可行性。Jetson AGX Xavier上部署了Ubuntu 18.04 LTS aarch64操作系統(tǒng),并具有512核高性能Volta GPU。測(cè)試中FPS代表模型在設(shè)備中的解析速度。

表3 目標(biāo)檢測(cè)模型性能比較Tab.3 Object detection model performance comparison

由于采取了輕量級(jí)的特征融合策略,本文改進(jìn)后的模型在FPS上相對(duì)于原模型僅下降了4幀/s左右的速率(表3)。在精度提升的同時(shí),依然可以在嵌入式設(shè)備實(shí)現(xiàn)實(shí)時(shí)檢測(cè),協(xié)助邊緣計(jì)算終端完成邊防管控。

5 結(jié) 論

本文依托邊緣計(jì)算終端項(xiàng)目,設(shè)計(jì)了一種可以部署在嵌入式設(shè)備的目標(biāo)檢測(cè)模型。介紹了輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNetV2、SSD目標(biāo)檢測(cè)模型和FPN特征金字塔網(wǎng)絡(luò),指出了MobileNetV2-SSD和FPN特征融合存在的問(wèn)題,提出了一種輕量級(jí)的特征融合方案用于改進(jìn)MobileNetV2-SSD。改進(jìn)后的模型與MobileNetV2-SSD在VOC2007測(cè)試集上進(jìn)行測(cè)試比較,獲得了更高的模型精度,相對(duì)于MobileNetV2-SSD提升了3.6%,達(dá)到了76.5%,并且,在小目標(biāo)的檢測(cè)效果上獲得了顯著提升。此外將模型部署至嵌入式設(shè)備比較檢測(cè)效果,改進(jìn)的模型在網(wǎng)絡(luò)結(jié)構(gòu)更加復(fù)雜的情況下,在檢測(cè)速度上并沒(méi)有較大損失。從而驗(yàn)證了本文方法的有效性。本文方法可以協(xié)助邊緣計(jì)算終端完成邊防管控,在嵌入式設(shè)備上實(shí)現(xiàn)更高效的目標(biāo)檢測(cè)。

猜你喜歡
殘差嵌入式卷積
基于雙向GRU與殘差擬合的車輛跟馳建模
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
基于殘差學(xué)習(xí)的自適應(yīng)無(wú)人機(jī)目標(biāo)跟蹤算法
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
搭建基于Qt的嵌入式開發(fā)平臺(tái)
嵌入式軟PLC在電鍍生產(chǎn)流程控制系統(tǒng)中的應(yīng)用
平穩(wěn)自相關(guān)過(guò)程的殘差累積和控制圖
河南科技(2015年8期)2015-03-11 16:23:52
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
涿鹿县| 广丰县| 襄垣县| 疏附县| 孟州市| 晋城| 雅安市| 辽源市| 丹江口市| 永吉县| 东阿县| 苍溪县| 西和县| 宁晋县| 张家港市| 当雄县| 调兵山市| 武冈市| 大姚县| 江源县| 锦州市| 顺义区| 凤山市| 都兰县| 壤塘县| 平和县| 景谷| 曲水县| 新乡市| 乌海市| 修文县| 平和县| 南华县| 金山区| 来宾市| 邯郸市| 庐江县| 大石桥市| 乐安县| 桦川县| 梅河口市|