国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

結(jié)合數(shù)據(jù)增強(qiáng)和輕量化模型的YOLOv3木梁柱缺陷檢測

2021-05-19 07:18:30王寶剛楊春梅夏鵬
電機(jī)與控制學(xué)報 2021年4期
關(guān)鍵詞:輕量化木材卷積

王寶剛, 楊春梅, 夏鵬

(東北林業(yè)大學(xué) 機(jī)電工程學(xué)院,哈爾濱 150040)

0 引 言

木材缺陷的檢測對有效降低有限森林資源的消耗,提高木材產(chǎn)品的商業(yè)價值有著重大意義。但是現(xiàn)階段木材的缺陷檢測主要是人眼檢測,成功率在68%左右[1]。隨著傳感器迅速發(fā)展,X射線檢測,核磁共振技術(shù)成為木材缺陷檢測的主流,但是成本高,復(fù)用率差。21世紀(jì),出現(xiàn)了大量基于傳統(tǒng)機(jī)器視覺的木材檢測方法。Ruz等[2]利用支持向量機(jī)對各類木材缺陷進(jìn)行識別,準(zhǔn)確率達(dá)到91%;Zhang等[3]利用主成分分析和壓縮感知來識別木材缺陷;Xie等[4]針對木材本身紋理,采用灰度共生矩陣的方法來定位木材缺陷。傳統(tǒng)的機(jī)器視覺方法通常采用人工設(shè)計的特征結(jié)合神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)缺陷的檢測,但是人工設(shè)計的特征總會有不足,對于新增的缺陷優(yōu)化難以實(shí)現(xiàn)。

近年來,端到端的卷積神經(jīng)網(wǎng)絡(luò)在各種計算機(jī)視覺任務(wù)中取得了巨大的成功,包括圖像分類[5-6],目標(biāo)檢測[7-9],語義分割[10]。缺陷檢測實(shí)質(zhì)屬于目標(biāo)檢測的工業(yè)應(yīng)用,文獻(xiàn)[11]使用神經(jīng)結(jié)構(gòu)搜素(neural architecture search,NAS)和Mask-RCNN結(jié)合的模型對單板表面缺陷進(jìn)行檢測,實(shí)現(xiàn)了95.31%的平均精確度,一批50張圖片僅需2.5 s,但采用的是組合模型的方法,模型十分復(fù)雜;文獻(xiàn)[12]采用一種混合的全卷積神經(jīng)網(wǎng)絡(luò)對木材缺陷進(jìn)行檢測和定位;文獻(xiàn)[13]使用Faster RCNN和遷移學(xué)習(xí)對木材表面缺陷進(jìn)行檢測,但是檢測速度不能保證。

目前基于卷積網(wǎng)絡(luò)的木材缺陷檢測模型,往往存在模型復(fù)雜,參數(shù)計算量大,實(shí)時性差的問題,而且由于數(shù)據(jù)量的問題,模型泛化能力不能保證。YOLO(You look only once)算法由于檢測速度和精度的優(yōu)異,被廣泛應(yīng)用到水果質(zhì)檢[14],自動駕駛[15],CT圖像識別[16]等領(lǐng)域。本文在YOLOv3的模型基礎(chǔ)上,使用區(qū)域刪除和圖像混合的數(shù)據(jù)增強(qiáng)方法增強(qiáng)模型的泛化能力和魯棒性,同時使用輕量化模型MobileNetv3來替換原網(wǎng)絡(luò)的backbone,減少模型的參數(shù)量,方便工業(yè)嵌入式使用。最后采用COCO數(shù)據(jù)集上的評價指標(biāo),綜合評價模型的性能。

1 數(shù)據(jù)集制作

使用工業(yè)相機(jī)從木材加工現(xiàn)場拍攝得到木材缺陷圖像,將感興趣區(qū)域提取出來,得到結(jié)節(jié)、裂縫、蟲洞和無損圖像各300張,總計1 200張。圖像的像素為200×200,每張缺陷圖片包括一個或多個缺陷。這是一個相對小型的數(shù)據(jù)集,因此采用數(shù)據(jù)增強(qiáng)技術(shù)來增強(qiáng)模型的泛化能力。通過對數(shù)據(jù)集的分析發(fā)現(xiàn),數(shù)據(jù)集中沒有面積大于96×96的大缺陷,只有小于32×32的小缺陷和在32×32到96×96范圍的中缺陷(缺陷大小的劃分參考COCO數(shù)據(jù)集),因此木梁柱的表面缺陷大小一般都屬于小和中。所要識別的缺陷圖像和標(biāo)簽如圖1所示。

圖1 部分缺陷圖片和標(biāo)簽Fig.1 Partial defect pictures and labels

將得到的數(shù)據(jù)集使用labelImg軟件進(jìn)行標(biāo)注,得到缺陷位置的信息,然后將其制作成COCO格式的數(shù)據(jù)集。在相關(guān)研究中,往往選擇IOU=0.5時的Average Precision(AP)作為最終的評價指標(biāo),實(shí)踐表明其不能完全反映一個檢測器的性能。因此文中使用IOU=[0.5:0.05:0.95]的AP來評價模型,通過取10個IOU閾值,然后取AP的平均值,可以更全面的評價模型。

2 YOLOv3算法

YOLO[17-18]系列算法發(fā)展到現(xiàn)在被廣泛應(yīng)用的第三代YOLOv3,將目標(biāo)檢測作為一個端對端的回歸問題,直接對錨框進(jìn)行回歸和分類,得到最終結(jié)果,檢測速度有了大幅提升。YOLOv3的網(wǎng)絡(luò)結(jié)構(gòu)和多尺度預(yù)測如圖2所示。Darknet53框架中每一個卷積部分都使用Conv2D結(jié)構(gòu),即圖中的CBL部分。每次卷積后,進(jìn)行標(biāo)準(zhǔn)化(Batch Normalization,BN)和Leaky ReLu激活函數(shù)處理。使用多個殘差塊堆疊的方式構(gòu)成骨干網(wǎng)絡(luò)Darknet53,從3個尺度預(yù)測模型輸出。圖2中以輸入416×416為例,實(shí)際輸入網(wǎng)絡(luò)的大小從32×10至32×19中10個輸入中隨機(jī)選擇。

圖2 YOLOv3結(jié)構(gòu)Fig.2 Structure of YOLOv3

3 數(shù)據(jù)增強(qiáng)

在圖像數(shù)量獲取難以達(dá)到充足和完善的工業(yè)檢測領(lǐng)域,為避免卷積網(wǎng)絡(luò)的嚴(yán)重過擬合問題,數(shù)據(jù)增強(qiáng)技術(shù)是解決該問題最有效的方法。本文使用隨機(jī)亮度、隨機(jī)對比度、隨機(jī)顏色擾動、隨機(jī)翻轉(zhuǎn)、隨機(jī)旋轉(zhuǎn)、隨機(jī)裁剪和添加噪聲七種基本數(shù)據(jù)增強(qiáng)作為基本數(shù)據(jù)增強(qiáng)。同時使用基于區(qū)域刪除的數(shù)據(jù)增強(qiáng)技術(shù)GridMask[19]和基于圖像混合的數(shù)據(jù)增強(qiáng)技術(shù)MixUp[20]進(jìn)一步增強(qiáng)網(wǎng)絡(luò)的泛化能力。

3.1 GridMask數(shù)據(jù)增強(qiáng)方法

除了基本的數(shù)據(jù)增強(qiáng)方法,基于區(qū)域刪除的數(shù)據(jù)增強(qiáng)方法得到了廣范應(yīng)用。Random Erasing[21]通過隨機(jī)刪除一部分區(qū)域來達(dá)到增強(qiáng)模型泛化能力,讓模型學(xué)習(xí)到原本不敏感的信息。Cutout[22]通過刪除連續(xù)的正方塊區(qū)域,有效增加了數(shù)據(jù)集和部分被遮擋的樣本。GridMask思想和前兩種方法相同,但是前兩種方法往往容易出現(xiàn)刪除到整個目標(biāo)區(qū)域的問題,所以GridMask技術(shù)通過產(chǎn)生一個均勻分布的掩膜來刪除區(qū)域。如圖3所示,通過生成一個和原圖相同分辨率的掩膜(mask)圖像,然后將該掩膜圖與原圖相乘,得到了特定區(qū)域信息刪除的新圖像。mask圖中黑色區(qū)域值為0,表示刪除區(qū)域。虛線框部分為基本的mask單元,(x,y)表示第一個mask單元離圖像邊緣的距離,r為保留圖像的比例,d為mask單元的邊長。通過刪除均勻分布的正方形區(qū)域,既避免了過度刪除圖像中的目標(biāo)信息,又避免了沒有刪除到目標(biāo)信息而不能起到增加網(wǎng)絡(luò)泛化能力的作用。

圖3 Gridmask數(shù)據(jù)增強(qiáng)Fig.3 Gridmask data enhancement

3.2 圖像混合增強(qiáng)

文獻(xiàn)[23]中提出一種高效的圖像混合方法Sample Pairing,可以將訓(xùn)練集規(guī)模從N擴(kuò)大到N×N,將隨機(jī)兩副圖像的像素相加求平均,而樣本的標(biāo)簽不變。Mixup[20]從經(jīng)驗風(fēng)險主義最小化和鄰域風(fēng)險主義最小化的角度出發(fā),解釋了為什么混合圖像會對模型訓(xùn)練有效。Mixup使用方法如下:

x′=λxi+(1-λ)xj,y′=λyi+(1-λ)yj。

(1)

其中:x′,y′表示混合后的圖片和標(biāo)簽;xi,xj代表從一個批次隨機(jī)抽取的2種樣本;yi,yj代表對應(yīng)的標(biāo)簽信息。λ=beta(∝,∝)∈(0,1),∝為可以設(shè)定的參數(shù)。Mixup之后的圖像如圖4所示。img1、img2為批次中隨機(jī)的兩種圖片,以λ比例混合,標(biāo)簽label以同樣的方式混合。

圖4 MixUp示例Fig.4 MixUp example

4 輕量化模型設(shè)計

YOLOv3由于其Darknet53結(jié)構(gòu)多達(dá)106層的網(wǎng)絡(luò)深度和其多尺度的設(shè)計,使用大量堆疊的殘差結(jié)構(gòu),參數(shù)運(yùn)算量巨大,難以在移動端嵌入,所以對其網(wǎng)絡(luò)模型進(jìn)行輕量化是必要的。常見的輕量化方法包括網(wǎng)絡(luò)剪枝[24]、知識精餾[25]等,除此之外還包括使用高效的卷積結(jié)構(gòu)來減少模型的參數(shù)量。在MobileNetV1[26]中提出深度可分離卷積(Depthwise Separable Convolution),將傳統(tǒng)卷積分為DepthWish(DW)和PointWise(PW)兩步,同時使用ReLU6作為激活函數(shù),如圖5(b)所示。標(biāo)準(zhǔn)卷積由卷積、批歸一化和ReLu激活組成,MobileNetv1使用Depthwise Separable Convolution和ReLU6激活,MobileNetv2使用逆殘差的線性瓶頸結(jié)構(gòu),如圖5中所示。

當(dāng)卷積核尺寸為DK×DK,輸入特征圖尺寸為DF×DF,傳統(tǒng)卷積的計算量為F1=DK×DK×M×N×DF×DF(M、N表示輸入和輸出的通道數(shù)),而深度可分離卷積的計算量為F2=DK×DK×M×DF×DF+M×N×DF×DF,兩者計算量之比F2/F1可由式(2)來描述。

(2)

圖5 標(biāo)準(zhǔn)卷積、MobileNetv1、MobileNetv1v2的基本結(jié)構(gòu)Fig.5 Basic structure of standard convolution,MobileNetv1,MobileNetv1v2

MobileNetv2[27]和MobileNetv1 都是采用DW(Depth-wise)卷積搭配PW(Point-wise)卷積的方式來提取特征,但為了避免ReLU對特征的破壞。MobileNetv2在DW卷積前面加入了一個PW卷積并且在第二個PW結(jié)構(gòu)使用線性激活,即線性瓶頸(Linearbottlenecks)結(jié)構(gòu)。同時提出倒置殘差I(lǐng)nverted residuals的結(jié)構(gòu),使用1×1的卷積將feature map升維,通過一個DW結(jié)構(gòu)提取特征,最后再通過一個1×1卷積降維。先進(jìn)行擴(kuò)張再進(jìn)行壓縮如圖6(c)所示。

MobileNetV3[28]為2019年提出,結(jié)合了前兩個版本的優(yōu)點(diǎn),綜合使用V1的深度可分離卷積和V2的具有線性瓶頸的逆殘差結(jié)構(gòu),在V2的1×1卷積之后加入Squeeze-and-Excitation Networks(SE)[29]的attention模塊。同時提出使用swish激活函數(shù),可以有效地提高網(wǎng)絡(luò)的精度,其具有無上界有下界、平滑、非單調(diào)的特性。其在模型效果上優(yōu)于ReLU。Swish函數(shù)表示為:Swish[x]=x×sigmoid(βx),β為一個常量或者可訓(xùn)練的參數(shù)。由于swish的計算量太大,用圖6中所示的H-Swish函數(shù)(hard version of swish)替代Swish激活函數(shù),其描述如下:

(3)

ReLU是深度神經(jīng)網(wǎng)絡(luò)常用的激活函數(shù),將負(fù)值置0,其余值保持不變;ReLU6通過抑制最大值的方式,來實(shí)現(xiàn)移動端高精度的應(yīng)用。圖6(b)為Swish和Hard-Swish激活函數(shù)。Swish激活函數(shù)的運(yùn)算成本是非零的,所以用Hard-Swish來近似swish激活。

圖6 激活函數(shù)的表示Fig.6 Representation of activation function

從圖6(b)可以看出H-Swish無限逼近Swish函數(shù),計算量更小,速度更快。所以選擇移動端網(wǎng)絡(luò)MobileNetv3替換Backbone,達(dá)到減少模型參數(shù)量、提高模型預(yù)測速度的目的。將YOLOv3的backbone替換成MobileNetv3的結(jié)構(gòu)如圖7所示。Exp size為擴(kuò)展系數(shù),SE表示是否使用SE模塊,NL為激活函數(shù),HS為Hard-Swish,RE為ReLU激活,Bneck為MobileNetv3的botteleneck,使用MobileNetv2的線性瓶頸結(jié)構(gòu),在特定層加入SE模塊。

5 模型訓(xùn)練及實(shí)驗

5.1 模型訓(xùn)練

所設(shè)計的木梁柱缺陷檢測算法流程如圖8所示,主要包括數(shù)據(jù)增強(qiáng)、骨干網(wǎng)絡(luò)特征提取和檢測頭的檢測三部分。

圖7 backbone更換為MobileNetv3后的結(jié)構(gòu)Fig.7 Structure after the backbone is replaced with MobileNetv3

圖8 算法整體流程圖Fig.8 Algorithm overall flow chart

首先將收集到的缺陷圖像按照8∶ 1∶ 1的比例劃分訓(xùn)練集,驗證集和測試集,制作成COCO格式。從三個尺度提取特征圖像,進(jìn)行融合,提取76×76,38×38,19×19三個尺度進(jìn)行檢測,使用COCO的評價指標(biāo)來評價模型效果。采用基本的YOLOv3模型進(jìn)行訓(xùn)練,訓(xùn)練時batchsize大小為8,測試時batchsize大小為1,訓(xùn)練時模型的輸入從32×10至32×19,從10個數(shù)值中隨機(jī)選擇大小,測試時輸入大小為608×608,每個批次中圖像大小一致,使用學(xué)習(xí)率預(yù)熱的方法,在兩百次迭代后將學(xué)習(xí)率上升到初始學(xué)習(xí)率0.000 1大小,如圖9(a)所示??偟螖?shù)為10 000次,在迭代次數(shù)的2/3和11/12處分別將學(xué)習(xí)率下降1/10,使用動量項為0.9的隨機(jī)梯度下降方法。預(yù)熱時學(xué)習(xí)率較小,模型可以慢慢趨于穩(wěn)定,等模型相對穩(wěn)定后在使用預(yù)定的學(xué)習(xí)率進(jìn)行訓(xùn)練,可以使模型收斂的更快。圖9(b)為訓(xùn)練過程的損失曲線,橫軸500表示每20次迭代次數(shù)取一次數(shù)據(jù),實(shí)線為訓(xùn)練集損失,虛線為驗證集損失。從圖中可以看出,通過數(shù)據(jù)增強(qiáng)后,雖然使用的是一個相對較小的數(shù)據(jù)集,模型沒有出現(xiàn)過擬合現(xiàn)象,訓(xùn)練集和驗證集的損失都是震蕩下降。圖9(c)、圖9(d)分別為AP,AP50,在訓(xùn)練過程中的可視化,這里AP指的是選擇IOU=[0.5:0.95]時的AP,AP50指選擇IOU=0.5時的AP??梢钥闯鯵OLOv3網(wǎng)絡(luò)AP最高達(dá)到0.41,AP50為0.83。

圖9 訓(xùn)練過程的可視化Fig.9 Visualization of the training process

5.2 改進(jìn)后模型實(shí)驗

使用5.1中的基線模型作為對照,加入數(shù)據(jù)增強(qiáng)和更換backbone,在相同的實(shí)驗條件下進(jìn)行測試。使用python language來實(shí)現(xiàn),深度學(xué)習(xí)框架為PaddlePaddle 1.84,所有的實(shí)驗都是在一臺配備了16G內(nèi)存的NVIDIA Tesla V100 GPU上進(jìn)行,使用CUDA10.0和CUDNN7.4配合GPU加速。得到表現(xiàn)最好的迭代次數(shù)時結(jié)果如表1所示。COCO代表使用COCO的評價指標(biāo),表1模型中,“+”代表在YOLOv3基礎(chǔ)上使用的技術(shù),數(shù)字編號代替本行中所用技術(shù)。S代表small object,M表示meidum object,AR為IOU=[0.5:0.95]的Average Recall,Parameter為模型的參數(shù)數(shù)量。

編號1、2、3分別為加入了MixUp,GridMask和兩個同時使用時的實(shí)驗數(shù)據(jù)。設(shè)置MixUp的參數(shù)λ=beta(0.2,0.2),GridMask設(shè)置概率p為0.7,隨迭代次數(shù)的增加而變大,兩種數(shù)據(jù)增強(qiáng)方法,都只在前9 000次使用,在最后1 000次停止使用,讓網(wǎng)絡(luò)微調(diào)??梢钥闯?,加入MixUp后,AP沒有變化,AP50增加了4.8%,在召回率方面均有提高,加入GridMask后,AP提升了1.4%,AP50增加了3%,兩種數(shù)據(jù)增強(qiáng)技術(shù)同時使用時,AP增加了可觀的3%,AP50達(dá)到了0.9,在APs,APM,AR,ARs,ARM均有不錯的表現(xiàn)。

編號4為將原YOLOv3的backbone更換為MobileNetv3后的實(shí)驗數(shù)據(jù),參數(shù)數(shù)量減少了62.52%,預(yù)測速度提高了10.6FPS,同時得益于MobileNet高效的網(wǎng)絡(luò)結(jié)構(gòu)和注意力模塊,模型在8個指標(biāo)上均有不錯的提升,其中AP50達(dá)到了0.91。不僅減少了參數(shù)數(shù)量,更提升了網(wǎng)絡(luò)的性能。編號5、6是將數(shù)據(jù)增強(qiáng)技術(shù)使用到更換backbone之后的網(wǎng)絡(luò)中,加入兩種數(shù)據(jù)增強(qiáng),實(shí)現(xiàn)了最好的模型性能,AP提升了5.9%,AP50達(dá)到了0.924實(shí)現(xiàn)了精度和速度的完美融合。綜合來看,文中的改進(jìn)效果提升顯著,參數(shù)數(shù)量減少了62.52%,預(yù)測速度提高了10.6FPS,AP提升了6%,AP50提升了近10%,精度達(dá)到了92.4%。

圖10為利用改進(jìn)后的網(wǎng)絡(luò)的部分檢測結(jié)果,包括缺陷類型和缺陷位置??梢钥闯龈倪M(jìn)后的網(wǎng)絡(luò)可以準(zhǔn)確的識別出三種缺陷的類型,而且置信度都超過了90%。

表1 使用數(shù)據(jù)增強(qiáng)和更換backbone的實(shí)驗結(jié)果

圖10 部分缺陷的檢測結(jié)果Fig.10 Detection results of some defects

5.3 模型參數(shù)的確定

為了找到模型最佳時的參數(shù),在相同實(shí)驗條件下,使用5.2中編號6作為基線模型,分別控制學(xué)習(xí)率(Learning Rate,LR)、批次大小(Batch Size,BS)、動量項的大小(Momentum,M)3個變量進(jìn)行學(xué)習(xí),得出的模型檢測效果。

1)學(xué)習(xí)率(Learning Rate, LR),由于使用預(yù)訓(xùn)練模型,模型已經(jīng)收斂,所以使用較小的學(xué)習(xí)率0.000 1取得了較好的結(jié)果,AP為0.47,AP50為0.92,而且采用了學(xué)習(xí)率梯度衰減的策略,后期學(xué)習(xí)率繼續(xù)下降,以一個小的步長找到最優(yōu)解,如圖11所示(其中學(xué)習(xí)率0.000 1圖例為最佳表現(xiàn))。

2)批次大小(Batch Size, BS),一般在合理范圍內(nèi),BS越大使得下降方向更加準(zhǔn)確,但是過大的BS會出現(xiàn)局部最優(yōu)的情況,太小的BS會使模型振蕩,也不利于模型訓(xùn)練。將BS從4增加到16,在BS=4、16時模型效果明顯不如BS=8、12,說明此時的模型BS太小或太大,而BS=8、12時,檢測效果AP相同為0.47,但是BS=8時,AP50,AR相對BS=8時均表現(xiàn)更好,綜合考慮選擇BS=8作為最優(yōu)BS。當(dāng)BS=16時,模型的AP50達(dá)到了0.95,但是此時AP只有0.42,說明僅僅只以AP50作為評判標(biāo)準(zhǔn)可能是不夠準(zhǔn)確的,此時模型可能出現(xiàn)了局部最優(yōu)的情況,如圖12所示。

圖11 隨學(xué)習(xí)率變化模型的測試結(jié)果Fig.11 Test result of the model with the learning rate

圖12 隨batchsize變化模型的測試結(jié)果Fig.12 Test results of the model with batchsize

3)動量項(Momentum,M)。優(yōu)化器算法是深度學(xué)習(xí)中必不可少的一部分,其中Momentum由于有效性被廣泛采用,M越大,就越可能擺脫局部最優(yōu)的束縛。動量項從0.85上升到0.95,得到的結(jié)果如圖13所示。當(dāng)Momentum的值為0.9時,模型的性能最好,M=0.925時AP50達(dá)到了0.95,進(jìn)一步證明使用AP而不是AP50來驗證模型有效性,是很有必要的。

圖13 隨動量項的值變化模型的測試結(jié)果Fig.13 Test results of the model with the M value

5.4 不同網(wǎng)絡(luò)的對比實(shí)驗

為驗證所設(shè)計網(wǎng)絡(luò)的優(yōu)異性,選擇經(jīng)典的模型作為對照組,分別選擇Single Shot MultiBox Detector(SSD)[30],F(xiàn)aster-RCNN[7],F(xiàn)aster-RCNN+FPN[31]作為對照組。SSD和YOLO系列都是單階段算法的代表,SSD分為SSD300,SSD512,輸入分別是300×300,和512×512大小,使用VGG16作為backbone,在多層多尺度特征圖上進(jìn)行檢測同時使用默認(rèn)錨框的方式避免使用建議區(qū)域。

Faster RCNN先使用RPN(region proposal network)找到目標(biāo)區(qū)域,然后在目標(biāo)區(qū)域上進(jìn)行邊框回歸和分類,得到目標(biāo)位置和類別信息。FPN(Feature Pyramid Networks)采用金字塔結(jié)構(gòu)提取融合特征,集成在Faster RCNN上實(shí)現(xiàn)了更好的效果。使用這四種算法和改進(jìn)后的YOLOv3的測試結(jié)果如表2所示,括號里面為模型所使用的backbone。

表2給出了目標(biāo)檢測的幾個經(jīng)典網(wǎng)絡(luò)和本文模型在數(shù)據(jù)集上測試的結(jié)果以及參數(shù)數(shù)量和預(yù)測速度,其中Faster-RCNN和Faster RCNN+FPN的預(yù)測速度都為20FPS左右,不滿足工業(yè)實(shí)時檢測最低30FPS的條件,因此不適合作為木材缺陷的實(shí)時檢測算法。而SSD算法在預(yù)測速度上滿足工業(yè)實(shí)時需要,但是表現(xiàn)最好的SSD300,AP也低于本文提出的算法,因此本文的算法處于絕對優(yōu)勢。

表2 不同網(wǎng)絡(luò)的檢測結(jié)果比較

6 實(shí)驗結(jié)果分析

與使用其他方法在木梁柱表面缺陷檢測方面的識別效果的比較見表3。與其他文獻(xiàn)中的方法相比較,文中的方法在一個小型數(shù)據(jù)集上進(jìn)行檢測,使用更全面的評價指標(biāo),實(shí)現(xiàn)了46.9%的AP,92.4%的AP50,同時使用高效的輕量化模型,檢測速度更具優(yōu)勢,在一秒內(nèi)可以識別53.7張缺陷圖片,實(shí)現(xiàn)了精度和速度的完美結(jié)合。而且參數(shù)量很小,可以實(shí)現(xiàn)在工業(yè)端的在線部署。

表3 檢測結(jié)果比較

7 結(jié) 論

木梁柱表面缺陷的高效檢測是工業(yè)木材單板生產(chǎn)中不可缺少的環(huán)節(jié),只有實(shí)時準(zhǔn)確給出木材表面缺陷信息,才能進(jìn)入下一步的排樣和木材加工環(huán)節(jié)。本文提出一種結(jié)合數(shù)據(jù)增強(qiáng)和輕量化模型的木梁柱表面缺陷自動檢測和定位方法,采用數(shù)據(jù)增強(qiáng)和輕量化模型改進(jìn)YOLOv3網(wǎng)絡(luò),實(shí)現(xiàn)了木材缺陷高精度的實(shí)時檢測。使用基于區(qū)域刪除技術(shù)的數(shù)據(jù)增強(qiáng)方法GridMask和基于圖像混合的方法MixUp,來增強(qiáng)模型的泛化能力和魯棒性,在一個較小的數(shù)據(jù)集上也能實(shí)現(xiàn)很好的檢測精度。使用高效的MobileNetv3網(wǎng)絡(luò)不僅實(shí)現(xiàn)了檢測精度的進(jìn)一步提高,而且大幅減少了模型的參數(shù)數(shù)量,提高了實(shí)時性能。最終結(jié)果表明:實(shí)現(xiàn)了53.5FPS的檢測效率,AP為46.9%,AP50為92.3%,參數(shù)數(shù)量相比原模型減少了62.52%,完全滿足工業(yè)實(shí)時木材缺陷檢測的需要。此外,該方法還可以應(yīng)用于數(shù)據(jù)較為稀缺的小缺陷表面檢測領(lǐng)域。

文中的方法也為以后的工作提供了一些啟發(fā):首先使用數(shù)據(jù)增廣技術(shù)是完全可以實(shí)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)在小數(shù)據(jù)集上的識別效果,我們會繼續(xù)探索使用更高效的數(shù)據(jù)增強(qiáng)方法,以期達(dá)到更好的效果。第二,輕量化模型是未來工業(yè)端使用的主流方向,探索實(shí)現(xiàn)更加高效的輕量化模型,是以后工作的重點(diǎn)。第三,期望木材檢測方法可以直接提供缺陷的輪廓和加工方案,方便后續(xù)的缺陷處理。

猜你喜歡
輕量化木材卷積
◆ 木材及木制品
世界上最輕的木材
大自然探索(2024年1期)2024-02-29 09:10:32
汽車輕量化集成制造專題主編
橘子皮用來開發(fā)透明木材
軍事文摘(2021年16期)2021-11-05 08:49:06
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實(shí)現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
一種輕量化自卸半掛車結(jié)構(gòu)設(shè)計
智富時代(2019年2期)2019-04-18 07:44:42
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
瞄準(zhǔn)掛車輕量化 鑼響掛車正式掛牌成立
專用汽車(2016年1期)2016-03-01 04:13:19
用戶:輕量化掛車的使用體驗
專用汽車(2015年4期)2015-03-01 04:09:07
阳信县| 饶平县| 武宁县| 九江县| 樟树市| 即墨市| 台东县| 广河县| 炉霍县| 肥西县| 德昌县| 秦皇岛市| 弥渡县| 嘉定区| 湘阴县| 长寿区| 门源| 伊金霍洛旗| 咸丰县| 兴义市| 富宁县| 建水县| 济南市| 巴林左旗| 襄汾县| 洮南市| 普格县| 栖霞市| 青河县| 广汉市| 靖宇县| 仁怀市| 闵行区| 德保县| 延庆县| 孟津县| 报价| 蚌埠市| 永修县| 桐庐县| 密山市|