国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于RB-YOLO 的生活垃圾實(shí)時(shí)檢測(cè)算法

2021-02-25 03:36董霄霄劉振國(guó)宋滕滕何益智
關(guān)鍵詞:卷積準(zhǔn)確率算法

董霄霄, 劉振國(guó), 宋滕滕, 何益智, 李 釗

(山東理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 山東 淄博 255000)

0 引 言

根據(jù)全國(guó)大、中城市固體廢物污染環(huán)境防治年報(bào)[1],2019 年196 個(gè)大中城市生活垃圾產(chǎn)生量達(dá)到2.3 億噸。 而據(jù)中國(guó)城市環(huán)境衛(wèi)生協(xié)會(huì)統(tǒng)計(jì),國(guó)內(nèi)每年產(chǎn)生近10 億噸垃圾,并且城鎮(zhèn)生活垃圾還在以每年5%~8%左右的速度遞增。 大量垃圾的堆棄造成國(guó)內(nèi)近三分之二的城市面臨垃圾圍城的危機(jī),同時(shí)導(dǎo)致土地資源匱乏和環(huán)境污染加劇等問題。 實(shí)現(xiàn)可持續(xù)發(fā)展,建立一個(gè)有效的垃圾處理體系至關(guān)重要,而垃圾檢測(cè)則是垃圾處理中的重要一環(huán)。 根據(jù)可回收物、廚余垃圾、有害垃圾、其他垃圾的分類原則對(duì)垃圾進(jìn)行識(shí)別和定位,能夠在促進(jìn)資源化管理的同時(shí)提高垃圾處理效率。

在垃圾檢測(cè)智能化的背景下,研究人員展示了各種深度學(xué)習(xí)算法在垃圾檢測(cè)方面的能力。 Sousa等人[2]分別基于形狀和材質(zhì)對(duì)食物托盤上的垃圾進(jìn)行檢測(cè)和分類,提出了一種基于Faster RCNN[3](Fast Region-based Convolutional Network method)的分層次的級(jí)聯(lián)網(wǎng)絡(luò)模型,在自制的數(shù)據(jù)集上分別達(dá)到了86%和80.9%的準(zhǔn)確率。 文燦華等人[4]從網(wǎng)絡(luò)結(jié)構(gòu)出發(fā),分析對(duì)比了3 種典型的主干網(wǎng)絡(luò)VGG-16[5]、ResNet - 101[6]、 MobileNet _ v1[7]在 Faster RCNN 上的性能,實(shí)現(xiàn)對(duì)多類別垃圾的高精度檢測(cè)。類似 地,Melinte 等 人[8]采 用SSD-MobileNetV2、SSD-InceptionV2、Faster-RCNN-InceptionV4 對(duì)城市垃圾進(jìn)行檢測(cè),研究表明目標(biāo)檢測(cè)器的性能取決于數(shù)據(jù)增強(qiáng)、CNN 模型、數(shù)據(jù)集數(shù)量、損失優(yōu)化、超參數(shù)調(diào)整、遷移學(xué)習(xí)。

以上兩階段目標(biāo)檢測(cè)算法雖然準(zhǔn)確率高,但是訓(xùn)練難度大、檢測(cè)速度慢,在實(shí)際應(yīng)用中限制了垃圾檢測(cè)的效率。 因此在檢測(cè)速度方面具有極大優(yōu)勢(shì)的YOLO[9-11](You Only Look Once)引起了廣泛研究。許偉等人[12]為了提高檢測(cè)速度提出一種改進(jìn)的MobileNetV3-YOLOv3,在YOLO 層加入GRU 結(jié)構(gòu),平均準(zhǔn)確率為90.50%,檢測(cè)速度達(dá)到18 幀/s,但實(shí)驗(yàn)數(shù)據(jù)集僅包含6 種類別約5 000 張圖片。 魏鋮磊等人[13]提出ECA_ERFB_s-YOLOv3 算法提高檢測(cè)精度,采用ResNet-50 作為特征提取網(wǎng)絡(luò),引入多尺度感受野模塊和注意力機(jī)制,最終達(dá)到了89.4%的準(zhǔn)確率、17 幀/s 的檢測(cè)速度,但是模型較大,不利于邊緣設(shè)備的部署。 同樣地,Zhao 等人[14]提出一種用于生活垃圾檢測(cè)的Skip-YOLO 模型,采用密集塊提取高維特征圖,檢測(cè)精度提高了22.5%,平均召回率提高了18.6%,但是模型復(fù)雜且實(shí)時(shí)性差。

盡管現(xiàn)有的研究已經(jīng)將垃圾圖像目標(biāo)檢測(cè)與深度學(xué)習(xí)方法相結(jié)合,以改進(jìn)垃圾圖像的識(shí)別與定位,這一領(lǐng)域依舊存在著一些問題:

(1)基于深度學(xué)習(xí)的垃圾圖像檢測(cè)的研究脫離實(shí)際。 目前研究以實(shí)驗(yàn)室背景的小數(shù)據(jù)集為主,與真實(shí)場(chǎng)景存在較大差距,難以實(shí)際應(yīng)用到工業(yè)中。

(2)現(xiàn)有的模型訓(xùn)練與預(yù)測(cè)運(yùn)算復(fù)雜、時(shí)效性差,無法滿足實(shí)際應(yīng)用的要求。

(3)生活垃圾數(shù)據(jù)集具有類內(nèi)差異性大的特點(diǎn)(例如同屬于“果皮果肉”類的香蕉和蘋果具有完全不同的顏色、形狀等特征),而目前的研究只是從一個(gè)廣泛的角度進(jìn)行,未能解決實(shí)際生活中的垃圾檢測(cè)問題。

針對(duì)上述問題,本文提出了一種基于改進(jìn)YOLOv3 的復(fù)雜場(chǎng)景下生活垃圾檢測(cè)算法RBYOLO。 以YOLOv3 算法為基礎(chǔ),采用輕量級(jí)神經(jīng)網(wǎng)絡(luò)RepVGG[15]作為骨干網(wǎng)絡(luò),通過結(jié)構(gòu)重參數(shù)化解耦模型訓(xùn)練與推理,減少了51%的參數(shù)量,提升了43%的速度。 采用加權(quán)雙向特征金字塔(Bi -directional Feature Pyramid Network,BiFPN)[16]優(yōu)化特征金字塔(Feature Pyramid Networks,F(xiàn)PN)[17]結(jié)構(gòu),通過加權(quán)特征融合使得模型能夠更好地平衡不同尺度的特征信息,加強(qiáng)低語義和高語義信息共享,提高同類垃圾相似特征的敏感性。 引入空洞空間池化金字塔ASPP (Atrous Spatial Pyramid Pooling,ASPP)[18]多尺度獲取特征信息,提高垃圾檢測(cè)復(fù)雜背景下模型特征提取能力。 最后結(jié)合遷移學(xué)習(xí),進(jìn)一步提高模型準(zhǔn)確率。

1 RB-YOLO 模型結(jié)構(gòu)

生活垃圾排列無序、形狀多變,同類垃圾的特性差別很大,這就產(chǎn)生了一定程度的數(shù)據(jù)波動(dòng),這種數(shù)據(jù)波動(dòng)使得網(wǎng)絡(luò)在學(xué)習(xí)過程中存在過擬合現(xiàn)象。 訓(xùn)練結(jié)果缺乏足夠的泛化,影響最終平均精度。 本文提出了一種用于生活垃圾實(shí)時(shí)檢測(cè)的RB-YOLO 模型,具體結(jié)構(gòu)如圖1 所示。 采用RepVGG 進(jìn)行特征提取,在訓(xùn)練和推理階段采用不同的網(wǎng)絡(luò)結(jié)構(gòu),保證模型在訓(xùn)練時(shí)的準(zhǔn)確率和推理時(shí)的速度。 特征提取網(wǎng)絡(luò)還結(jié)合了ASPP 以實(shí)現(xiàn)多重感受野,由于26×26 和52×52 的檢測(cè)器擁有足夠大的感受野,因此本文僅對(duì)13×13 的檢測(cè)器添加ASPP 模塊,在增加少量計(jì)算量的同時(shí)擴(kuò)大感受野。 完成特征提取之后,采用BiFPN 對(duì)提取到的特征信息進(jìn)行加權(quán)雙向特征融合增強(qiáng),以充分利用低層次的特征信息和高層次的語義信息。

圖1 RB-YOLO 網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Structure of RB-YOLO networks

1.1 改進(jìn)主干特征提取網(wǎng)絡(luò)

為了滿足檢測(cè)模型的實(shí)時(shí)性和準(zhǔn)確率,本文針對(duì)YOLOv3 的主干特征提取網(wǎng)絡(luò)進(jìn)行了優(yōu)化,采用輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)模型RepVGG 替換原始的DarkNet-53。 相比于DarkNet-53,RepVGG 具有以下優(yōu)點(diǎn):首先,RepVGG 全部采用3×3 卷積。 與1×1卷積和5×5 卷積相比,3×3 卷積計(jì)算密度(理論運(yùn)算量/所 用 時(shí) 間) 更 大, 計(jì) 算 速 度 更 快; 其 次,RepVGG 采用單路架構(gòu)運(yùn)算速度快且占用內(nèi)存少。

RepVGG 網(wǎng)絡(luò)由20 多層3×3 卷積堆疊而成,分成5 個(gè)stage,每個(gè)stage 的第一層是stride =2 的降采樣,每個(gè)卷積層用ReLU作為激活函數(shù)。 RepVGG 的主要特點(diǎn)是解耦了模型訓(xùn)練和推理,針對(duì)網(wǎng)絡(luò)訓(xùn)練和推理階段不同的需求采用不同的網(wǎng)絡(luò)架構(gòu)。 在訓(xùn)練階段最重要的是準(zhǔn)確率,因此RepVGG 網(wǎng)絡(luò)采用多分支結(jié)構(gòu),由3×3 卷積、1×1 卷積分支和identity 的殘差分支相結(jié)合的RepVGG Block 組成,多分支的結(jié)構(gòu)通過應(yīng)用不同的卷積核獲得不同的感受野,將不同感受野獲取到的信息進(jìn)行融合強(qiáng)化特征提取以提高模型性能。 同時(shí),具有多個(gè)分支的殘差結(jié)構(gòu)相當(dāng)于網(wǎng)絡(luò)具有多條梯度流通路徑,等同于同時(shí)訓(xùn)練多個(gè)網(wǎng)絡(luò)并進(jìn)行融合,類似于模型集成。 在推理階段更關(guān)注速度,因此RepVGG 網(wǎng)絡(luò)采用單路結(jié)構(gòu),通過結(jié)構(gòu)重參數(shù)化將訓(xùn)練階段的模型等價(jià)轉(zhuǎn)換得到類VGG 的推理模型,由3×3 卷積塊構(gòu)成極大地提高了推理速度,方便模型部署和加速。 在RepVGG 系列模型中,RepVGGA0 作為基礎(chǔ)模型參數(shù)量少且推理速度快,在獲取特征信息方面也有較好的性能。 考慮到在實(shí)際工業(yè)中的應(yīng)用,在本文中采用RepVGG-A0 作為主干網(wǎng)絡(luò)。

RepVGG 網(wǎng)絡(luò)中提出的結(jié)構(gòu)重參數(shù)化技術(shù),通過改變結(jié)構(gòu)和參數(shù)將網(wǎng)絡(luò)模型由多分支結(jié)構(gòu)轉(zhuǎn)換為單分支結(jié)構(gòu),2 種模型在數(shù)學(xué)推理上是等價(jià)的,能夠提高設(shè)備內(nèi)存利用率,同時(shí)提升模型的推理速度。 結(jié)構(gòu)重參數(shù)化具體流程如圖2 所示,主要思路包括卷積層和BN層融合(圖2(a))、卷積層合并(圖2(b))兩部分。

圖2 結(jié)構(gòu)重參數(shù)化過程Fig.2 Process of structure reparameterization

1.1.1 卷積層和BN 層融合

在卷積神經(jīng)網(wǎng)絡(luò)中,BN 層(Batch Normalization)得到了廣泛的應(yīng)用,能夠提高網(wǎng)絡(luò)泛化能力,加快收斂速度,緩解了梯度彌散問題。 在網(wǎng)絡(luò)的推理階段,將BN 層的運(yùn)算直接嵌入到卷積層中,減少運(yùn)算量,提升網(wǎng)絡(luò)的運(yùn)行速度。

卷積層輸出如公式(1)所示:

其中,x為每一層輸入;w為權(quán)重;b為偏置。

BN 層主要包括歸一化和縮放兩部分,BN 層輸出的具體計(jì)算方式如式(2)所示:

其中,γ為縮放參數(shù);β為偏移參數(shù);μ為樣本均值;σ為標(biāo)準(zhǔn)差;ε表示一個(gè)極小值(防止分母為0)。將卷積層和BN 層合并,將式(1)代入式(2)可得:

將BN 層輸出y2經(jīng)過變形可得到如下形式:

在推理階段,BN 層的樣本均值和標(biāo)準(zhǔn)差來自于訓(xùn)練樣本的數(shù)據(jù)分布,縮放參數(shù)和偏移參數(shù)是和其它模型參數(shù)一起通過梯度下降方法訓(xùn)練得到,即μ、σ、γ、β均為固定常數(shù)值。 則令得到公式(5),因此根據(jù)推導(dǎo)可知將BN 層直接合并到卷積層的計(jì)算中,相當(dāng)于將卷積核縮放一定倍數(shù),并對(duì)偏置進(jìn)行一定改變,省去了整個(gè)BN層的計(jì)算量,提高了推理速度。 數(shù)學(xué)公式具體如下:

1.1.2 卷積層合并

經(jīng)過卷積層和BN 層融合之后,可以得到3×3卷積、1×1 卷積分支和Identity 分支,以及3 個(gè)偏置向量。 假設(shè)輸入通道數(shù)等于輸出通道數(shù),且每種卷積具有相同的步長(zhǎng)。 1×1 卷積和3×3 卷積層合并過程如圖3 所示。 根據(jù)圖3 可知,1×1 卷積可轉(zhuǎn)換為中心值為1×1 卷積的權(quán)重值,其他位置值為0 的3×3 卷積,1×1 卷積和3×3 卷積層合并即將1×1 卷積核中的數(shù)值移動(dòng)到3×3 卷積核的中心。 而Identity分支可以看作是一個(gè)核為單位矩陣的1×1 卷積,進(jìn)而填充為特殊的3×3 卷積,將其與輸入的特征映射相乘之后,輸出數(shù)據(jù)保持不變。 1×1 卷積和3×3 卷積層合并過程如圖3 所示。 根據(jù)卷積的可加性,1×1 卷積分支Identity 分支進(jìn)行等價(jià)轉(zhuǎn)換后即可和3×3 卷積進(jìn)行合并。 最終的偏置向量可由3 個(gè)偏置向量相加得到。

圖3 1×1 卷積和3×3 卷積層合并Fig.3 Combination of 1×1 convolution and 3×3 convolution layer

1.2 引入空洞空間卷積金字塔池化

在進(jìn)行了主干特征提取之后,本文引入了ASPP 模 塊。 ASPP 在 SPP ( Spatial Pyramid Pooling)[19]模塊基礎(chǔ)上引入了空洞卷積[20],可以增強(qiáng)模型對(duì)不同尺度分割目標(biāo)的感知能力。 空洞卷積是在標(biāo)準(zhǔn)卷積中添加空洞來增加感受野,可以有效緩解下采樣導(dǎo)致的空間分辨率降低的問題。 對(duì)于給定的輸入,ASPP 采用多個(gè)具有不同膨脹率的并行擴(kuò)張卷積層,能夠在不降低特征圖分辨率的情況下擴(kuò)張感受野,使得計(jì)算成本不顯著增加。 ASPP 通過不同膨脹率的空洞來獲取長(zhǎng)跨度的上下文語義信息,這不僅提高了準(zhǔn)確率,而且速度更快。

針對(duì)垃圾檢測(cè)背景復(fù)雜的問題,ASPP 能夠通過不同的感受野將局部信息和全局信息進(jìn)行融合,豐富了特征圖的表達(dá)能力,提高復(fù)雜場(chǎng)景下垃圾檢測(cè)能力。 在該模型中,使用全局平均池化、一個(gè)普通卷積和3 個(gè)空洞卷積{Rate =3,5,7}(Rate為空洞率)。 圖4 展示了包含3 個(gè)空洞卷積的ASPP 結(jié)構(gòu),將圖像級(jí)特征的全局平均池化與空洞卷積的結(jié)果進(jìn)行融合得到最終結(jié)果。

圖4 ASPP 結(jié)構(gòu)圖Fig.4 ASPP structure chart

1.3 加強(qiáng)多尺度特征融合

YOLOv3 采用FPN 來檢測(cè)大小不同的物體,不同的尺度輸出特征的在融合時(shí)貢獻(xiàn)相等,對(duì)有效信息沒有特殊關(guān)注,同時(shí)FPN 獲取到的特征信息受到單向信息流的限制。 BiFPN 主要包括雙向多尺度連接和加權(quán)特征融合兩部分。 首先,以類似殘差連接的方式在輸入和輸出節(jié)點(diǎn)之間增加了一條額外的邊,在增加少量計(jì)算的代價(jià)下融合更多特征;同時(shí)借鑒PANet[21]提出的自上而下和自下而上的雙向路徑作為基礎(chǔ)層,多次重復(fù)以實(shí)現(xiàn)更有效的特征融合。其次,考慮到不同尺度特征圖重要性不同,BiFPN 使用加權(quán)融合的方法來融合不同分辨率的特征層,通過可訓(xùn)練的權(quán)重,調(diào)節(jié)特征在特征融合中的貢獻(xiàn),可以用于解決FPN 中的平等貢獻(xiàn)問題,針對(duì)多尺度的目標(biāo)細(xì)粒度檢測(cè)任務(wù)有很好的效果。

針對(duì)生活數(shù)據(jù)集同類別差異性大的問題,本文采用BiFPN 對(duì)提取到的特征進(jìn)行加強(qiáng),將主干的C3到C5 層的特征傳遞到BiFPN 作為選定的多尺度特征層。 自上而下的特征融合通過上采樣來完成,高層特征通過上采樣調(diào)整分辨率、進(jìn)而與低層特征信息進(jìn)行融合,對(duì)融合后的特征進(jìn)行3×3 卷積以消除混疊效應(yīng)。 自下而上的特征融合通過下采樣來完成,將自上而下融合得到的特征通過池化操作調(diào)整分辨率與高層特征進(jìn)行再融合,最終得到3 個(gè)尺度不同的輸出特征P3、P4、P5,具體結(jié)構(gòu)如圖5 所示。

圖5 RB-YOLO 中的BiFPN 結(jié)構(gòu)Fig.5 BiFPN structure in RB-YOLO

2 實(shí)驗(yàn)和結(jié)果

2.1 實(shí)驗(yàn)數(shù)據(jù)集

本文所采用的數(shù)據(jù)集共34 319 張圖片,主要有3 個(gè)來源。 一是2020 年深圳舉辦“華為云杯·生活垃圾圖片分類”大賽公布的VOC 格式的生活垃圾圖像數(shù)據(jù)集(以下簡(jiǎn)稱為“華為云垃圾數(shù)據(jù)集”),該數(shù)據(jù)集有4 個(gè)大類和47 個(gè)小類,總計(jì)19 655張圖像。二是由Mittal G 等人發(fā)布的COCO 格式的TACO 數(shù)據(jù)集,共由1 500張圖片和4 784個(gè)標(biāo)注。 三是通過網(wǎng)絡(luò)爬蟲、百度飛槳平臺(tái)搜集到13 164張生活垃圾圖片,大部分從百度的垃圾數(shù)據(jù)集中挑選而來,小部分來自網(wǎng)絡(luò)爬取并進(jìn)行手工標(biāo)注。 在數(shù)據(jù)處理過程中,本文發(fā)現(xiàn)華為云垃圾數(shù)據(jù)集和TACO 數(shù)據(jù)集小部分圖像存在標(biāo)注錯(cuò)誤、漏標(biāo)的問題,而百度數(shù)據(jù)集漏標(biāo)更為嚴(yán)重。 針對(duì)此,本文將問題數(shù)據(jù)通過LabelImg 重新標(biāo)注,并且對(duì)數(shù)據(jù)集的類別進(jìn)行了統(tǒng)一,最終得到了本文數(shù)據(jù)集Domestic Garbage Dataset(DGD),將原始數(shù)據(jù)集按照4:1 的比例分為訓(xùn)練集和測(cè)試集。

2.2 實(shí)驗(yàn)環(huán)境

本文實(shí)驗(yàn)在Window 系統(tǒng)上進(jìn)行評(píng)估。 實(shí)驗(yàn)使用了深度學(xué)習(xí)框架Pytorch 1.6 和編譯器Python 3.7,硬件環(huán)境為Intel(R) Core(TM) i5-10400F CPU、GTX2070s 顯卡、8 GB 顯存以及32 GB 內(nèi)存的電腦。

在網(wǎng)絡(luò)參數(shù)設(shè)置方面,訓(xùn)練時(shí)輸入圖像設(shè)置為416×416,采用Adam作為優(yōu)化函數(shù)對(duì)模型進(jìn)行訓(xùn)練。 基于遷移學(xué)習(xí)的思想采用凍結(jié)訓(xùn)練,對(duì)預(yù)訓(xùn)練網(wǎng)絡(luò)模型權(quán)重參數(shù)進(jìn)行層遷移,凍結(jié)預(yù)訓(xùn)練網(wǎng)絡(luò)模型中主干網(wǎng)絡(luò)的權(quán)重參數(shù),初始學(xué)習(xí)率為1e-3,epoch為50,Batch_Size為32;解凍后初始學(xué)習(xí)率設(shè)為1e-4,epoch為150(在凍結(jié)訓(xùn)練模型的基礎(chǔ)上再訓(xùn)練100epoch),Batch_Size為16。 為了增強(qiáng)模型的魯棒性和泛化能力,對(duì)訓(xùn)練數(shù)據(jù)集采用了簡(jiǎn)單的在線數(shù)據(jù)增強(qiáng),包括圖像縮放、圖像翻轉(zhuǎn)等。

2.3 評(píng)價(jià)指標(biāo)

本文實(shí)驗(yàn)采用了mAP((Mean average precision)、FLOPs(Floating-point Operations)、FPS(Frames Per Second)、Params(parameters)作為模型性能評(píng)價(jià)指標(biāo)。 其中,mAP指所有目標(biāo)平均準(zhǔn)確率的均值,綜合表示模型性能;FLOPs是浮點(diǎn)運(yùn)算數(shù),用來衡量模型的復(fù)雜度;FPS即每秒傳輸幀數(shù), 可以驗(yàn)證模型的實(shí)時(shí)性;Params為參數(shù)量,代表模型所需要的算力。

2.4 實(shí)驗(yàn)結(jié)果與分析

針對(duì)以上改進(jìn),本文設(shè)計(jì)了2 組實(shí)驗(yàn)進(jìn)行驗(yàn)證。一是對(duì)RB-YOLO 進(jìn)行消融實(shí)驗(yàn)以驗(yàn)證每個(gè)改進(jìn)點(diǎn)的有效性,二是與其他算法綜合對(duì)比驗(yàn)證所提出算法的可行性。

2.4.1 消融實(shí)驗(yàn)結(jié)果

為了驗(yàn)證所提出方法的可行性,在提出的DGD數(shù)據(jù)集上進(jìn)行了一系列對(duì)比實(shí)驗(yàn),見表1。 表1 中,“√”表示添加該模塊,否則為不添加。 實(shí)驗(yàn)考慮了RepVGG、BiFPN、ASPP 三個(gè)因素對(duì)實(shí)驗(yàn)結(jié)果的影響,在對(duì)比實(shí)驗(yàn)中逐個(gè)添加改進(jìn)模塊以驗(yàn)證單個(gè)變量對(duì)實(shí)驗(yàn)數(shù)據(jù)的影響。 測(cè)試集圖片大小為416×416,訓(xùn)練周期為150 個(gè)epoch。

本文實(shí)驗(yàn)將YOLOv3 作為基礎(chǔ)模型,消融實(shí)驗(yàn)結(jié)果見表1。 消融實(shí)驗(yàn)檢測(cè)的對(duì)比仿真結(jié)果如圖6所示。 圖6 中,第1、2、3 列原圖片來自數(shù)據(jù)集測(cè)試集,第4 列原圖片來自網(wǎng)絡(luò)搜索。 對(duì)比第1 組和第2 組實(shí)驗(yàn)數(shù)據(jù),結(jié)果表明相比YOLOv3,RepVGGYOLO 模型準(zhǔn)確率提升了0.88%,速度提升了27FPS,F(xiàn)LOPs減少了19.9 G,RepVGG-A0 作為特征提取網(wǎng)絡(luò)在保證準(zhǔn)確率的同時(shí)將檢測(cè)速度提升了約1.7 倍。 改進(jìn)的特征融合BiFPN 也起到了不錯(cuò)的效果,從第2 和第3 組實(shí)驗(yàn)數(shù)據(jù)可以看出對(duì)比原模型精度提升了0.85%,且參數(shù)量進(jìn)一步減少了3.64 M,有利于工業(yè)端的部署,但是增加了部分運(yùn)算量。 從圖6(c)可以看出,改進(jìn)特征融合對(duì)于發(fā)生形變的易拉罐具有更好的檢測(cè)效果,在一定程度上能夠使得檢測(cè)結(jié)果更加優(yōu)化。 第2 組和第4 組實(shí)驗(yàn)驗(yàn)證了ASPP 的可行性,對(duì)比RepVGG-YOLO,精度提升了1.31%,速度減少了8FPS。 從圖6(d)可以看出,加入ASPP 后能夠檢測(cè)出背景復(fù)雜的陶瓷器皿和被遮擋的污損用紙,而其它模型(a)、(b)、(c)均有不同程度的漏檢。 1、5 組實(shí)驗(yàn)可以看出,本文提出算法RB-YOLO 準(zhǔn)確率比YOLOv3 提升了4.31%,速度提升了16FPS,計(jì)算量減少了17.52 G,參數(shù)量減少了約51%。 由圖6(e)的檢測(cè)結(jié)果同樣可以看出,本文算法的檢測(cè)結(jié)果更加細(xì)致和全面,且對(duì)于網(wǎng)絡(luò)搜索的圖片具有良好的檢測(cè)效果,證明了本文所提出算法的可行性和魯棒性。

圖6 消融實(shí)驗(yàn)檢測(cè)結(jié)果對(duì)比Fig.6 Comparison of detection results of ablation experiments

表1 消融實(shí)驗(yàn)Tab.1 Ablation experiments

2.4.2 與其他模型對(duì)比實(shí)驗(yàn)結(jié)果

為了驗(yàn)證算法的優(yōu)越性,將RB-YOLO 與常見的目標(biāo)檢測(cè)算法YOLOv3、SSD、Faster RCNN 在DGD數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)對(duì)比,所采用的框架均為Pytorch,默認(rèn)輸入圖像大小為416×416,訓(xùn)練周期為150 個(gè)epoch。 表2 展示了RB-YOLO 算法與其他算法的對(duì)比,圖7 展示了RB-YOLO 與其他算法的檢測(cè)效果(從左到右依次為Faster RCNN、SSD、RB-YOLO檢測(cè)效果圖;第1、2 行原圖片來自數(shù)據(jù)集測(cè)試集,第3 行原圖片來自網(wǎng)絡(luò)搜索)。

從表2 和圖7 可以看出,和其他幾種算法相比,本文提出的RB-YOLO 不論在速度、還是準(zhǔn)確率上都具有巨大優(yōu)勢(shì),更好地實(shí)現(xiàn)了速度和精度的均衡。在檢測(cè)速度方面,RB-YOLO 檢測(cè)速度最快,達(dá)到了53FPS,比SSD 算法高出27FPS, 快了大約1 倍;比Faster RCNN 算法高出32FPS,快了大約1.5 倍;比YOLOv3 高出16FPS,快了大約0.4 倍。 在準(zhǔn)確率上,RB-YOLO 同樣優(yōu)于其他算法,達(dá)到73.83%,同時(shí)對(duì)圖7 進(jìn)行綜合分析也能夠看出,相比Faster RCNN 和SSD,RB-YOLO 在3 組圖片中能夠較為細(xì)致、全面地檢測(cè)出圖片中的目標(biāo),并且能夠正確分類。 Faster RCNN 雖然檢測(cè)出較多的目標(biāo),但是沒有正確分類,SSD 則沒有檢測(cè)出任何目標(biāo)。 3 組不同來源的數(shù)據(jù)證明RB-YOLO 不僅在DGD 數(shù)據(jù)集上取得了良好的效果,同時(shí)也具有良好的魯棒性,能夠被廣泛應(yīng)用。 在參數(shù)量方面,RB-YOLO 的參數(shù)量明顯小于YOLOv3 和Faster RCNN,但是比SSD 略大6.61 M,因?yàn)镽B-YOLO 中ASPP 模塊的引入增加了大量參數(shù)。 綜合分析,基于RB-YOLO 的垃圾檢測(cè)算法在快速檢測(cè)的同時(shí)保證了垃圾檢測(cè)的準(zhǔn)確率,能夠較好地完成垃圾檢測(cè)任務(wù)。

圖7 不同目標(biāo)檢測(cè)算法檢測(cè)結(jié)果對(duì)比Fig.7 Comparison of detection results of different target detection algorithms

表2 不同目標(biāo)檢測(cè)算法結(jié)果比較Tab.2 Comparison of results of different target detection algorithms

3 結(jié)束語

針對(duì)生活垃圾數(shù)據(jù)集存在的背景復(fù)雜、類內(nèi)差異大的問題,進(jìn)一步實(shí)現(xiàn)生活垃圾的快速檢測(cè),本文提出了一種基于改進(jìn)YOLOv3 的輕量級(jí)垃圾檢測(cè)算法。 該算法將特征提取網(wǎng)絡(luò)Darknet-53 替換為RepVGG,在保持精度不變的同時(shí)大幅減少計(jì)算量和提升速度;采用BiFPN 加強(qiáng)特征融合,進(jìn)一步減小網(wǎng)絡(luò)模型的參數(shù)量;引入ASPP 實(shí)現(xiàn)局部信息和全局信息的有效融合,更好地對(duì)復(fù)雜背景下的目標(biāo)進(jìn)行檢測(cè)。 在DGD 數(shù)據(jù)集上,RB-YOLO 算法的準(zhǔn)確率和速度均優(yōu)于其他算法,但是根據(jù)實(shí)際檢測(cè)效果來看,依舊存在一定的漏檢情況,因此,下一步的研究方向是在保持檢測(cè)速度的同時(shí)提高模型的準(zhǔn)確率。

猜你喜歡
卷積準(zhǔn)確率算法
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測(cè)定
基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識(shí)別
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
多層螺旋CT技術(shù)診斷急性闌尾炎的效果及準(zhǔn)確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
頸椎病患者使用X線平片和CT影像診斷的臨床準(zhǔn)確率比照觀察
基于深度卷積網(wǎng)絡(luò)與空洞卷積融合的人群計(jì)數(shù)
Travellng thg World Full—time for Rree
卷積神經(jīng)網(wǎng)絡(luò)概述
學(xué)習(xí)算法的“三種境界”