基于改進(jìn)YOLOv7 的液壓閥塊表面微小缺陷檢測

2023-11-18 03:33:06季娟娟陳亞杰盧道華

計(jì)算機(jī)工程 2023年11期

季娟娟，王佳，陳亞杰，盧道華，3

（1.江蘇科技大學(xué) 機(jī)械工程學(xué)院，江蘇鎮(zhèn)江 212100；2.中國船舶重工集團(tuán)公司上海船舶設(shè)備研究所，上海 200031；3.江蘇科技大學(xué) 海洋裝備研究院，江蘇鎮(zhèn)江 212003）

0 概述

液壓系統(tǒng)由于具有輸出力大、傳動(dòng)可靠、可控性高、使用壽命長等優(yōu)點(diǎn)［1］，已被廣泛應(yīng)用于汽車［2-3］、機(jī)器人［4-5］、航空航天［6］、工程機(jī)械［7-9］等領(lǐng)域。液壓閥塊是液壓系統(tǒng)中的關(guān)鍵零部件，通過控制壓力油在管路中的流動(dòng)來實(shí)現(xiàn)機(jī)械動(dòng)作，在其生產(chǎn)過程中，銑、刨等粗加工操作都會(huì)造成液壓閥塊表面出現(xiàn)劃痕、凹坑等缺陷，這些缺陷容易使液壓閥塊出現(xiàn)滲漏的情況，甚至?xí)绊懙綑C(jī)械的行駛安全。為了提前篩選出表面有缺陷的液壓閥塊，提高產(chǎn)品的合格率，研究液壓閥塊表面微小缺陷檢測方法具有重要意義。

目前，許多研究人員采用傳統(tǒng)的機(jī)器視覺技術(shù)進(jìn)行表面缺陷檢測。文獻(xiàn)［10］設(shè)計(jì)一種基于形態(tài)學(xué)的邊緣檢測方法，通過使用Otsu 閾值算法對(duì)軸承外圈表面缺陷進(jìn)行分割，可實(shí)現(xiàn)完整的缺陷邊緣提取。文獻(xiàn)［11］使用改進(jìn)的霍夫變換與新的區(qū)域劃分法，針對(duì)紋理區(qū)域與非紋理區(qū)域自動(dòng)分配不同的缺陷檢測方法，對(duì)鋁型材料表面缺陷進(jìn)行檢測。然而，當(dāng)工件表面缺陷類別多、背景復(fù)雜、各類缺陷表征形式不同、尺寸差異大時(shí)，缺陷特征很難量化，無法設(shè)定固定的規(guī)則來捕捉所有的有效特征，此時(shí)傳統(tǒng)的機(jī)器視覺技術(shù)識(shí)別精度會(huì)大幅下降。

與人工檢測的主觀性和機(jī)器視覺檢測的局限性不同，基于深度學(xué)習(xí)的缺陷檢測具有精度高、性能好、泛化程度高等優(yōu)點(diǎn)，其可通過神經(jīng)網(wǎng)絡(luò)自主地發(fā)現(xiàn)需要提取哪些特征更能適應(yīng)復(fù)雜的檢測背景。因此，近年來，基于深度學(xué)習(xí)的表面缺陷檢測方法得到了廣泛研究，并逐步應(yīng)用在產(chǎn)品缺陷檢測領(lǐng)域。YOLO（You Only Look Once）［12-14］系列算法是典型的單階段目標(biāo)檢測算法，與Faster R-CNN［15］、SSD［16］等目標(biāo)檢測算法相比，其檢測速度更快，應(yīng)用范圍更廣。為了適應(yīng)不同的應(yīng)用場景，提高不同對(duì)象的檢測精度，研究人員陸續(xù)提出了各種基于YOLO 系列算法的改進(jìn)缺陷檢測方法。文獻(xiàn)［17］提出一種基于特征增強(qiáng)YOLO 的表面缺陷檢測算法，通過改進(jìn)的特征金字塔網(wǎng)絡(luò)來增強(qiáng)多尺度檢測層的空間位置相關(guān)性，結(jié)合深度可分離卷積和密集連接來降低YOLO模型規(guī)模。文獻(xiàn)［18］針對(duì)復(fù)雜的太陽能電池圖像背景、可變的缺陷形態(tài)，提出一種基于改進(jìn)YOLOv5 的太陽能電池表面缺陷檢測方法，將可變形卷積加入CSP 模塊中，引入ECA-Net［19］注意力機(jī)制，再增加一個(gè)小缺陷預(yù)測頭，從而有效完成太陽能電池表面缺陷檢測任務(wù)。

然而，本文所研究的液壓閥塊表面缺陷尺寸非常小，以往的YOLOv3、YOLOv4、YOLOv5 算法對(duì)小目標(biāo)檢測效果較差，目前只有最新的YOLOv7［20］算法在小目標(biāo)檢測中有較好的性能表現(xiàn)。除此之外，液壓閥塊表面的劃痕與刀紋形狀非常類似，當(dāng)劃痕與邊緣的對(duì)比度較低時(shí)，容易出現(xiàn)誤檢、漏檢的情況。因此，針對(duì)液壓閥塊表面缺陷的不同特征，本文提出一種基于改進(jìn)YOLOv7 的液壓閥塊表面微小缺陷檢測算法，主要改進(jìn)有以下4 個(gè)方面：1）在多尺度特征融合模塊后引入CA［21］注意力機(jī)制，在增加較少參數(shù)的前提下增強(qiáng)對(duì)微小缺陷的特征提取能力；2）將多尺度特征融合模塊中的UpSampling 替換為改進(jìn)的UpC 多支路上采樣結(jié)構(gòu)，通過UpSampling 與反卷積的并行上采樣，在增大特征尺寸的同時(shí)豐富微小缺陷的特征信息；3）采用改進(jìn) 的ELAN（Efficient Layer Aggregation Network）-RepConv 結(jié)構(gòu)代替多尺度特征融合模塊中的ELAN_2 結(jié)構(gòu)，使算法在訓(xùn)練時(shí)能提取到更多的特征信息且不影響推理速度；4）采用K-means++［22］算法對(duì)數(shù)據(jù)集進(jìn)行聚類，聚類生成的錨框更符合本文所研究的液壓閥塊表面微小缺陷的尺寸特征，從而加快模型的收斂速度并提高微小缺陷的檢測精度。最后通過多個(gè)對(duì)比實(shí)驗(yàn)與消融實(shí)驗(yàn)來驗(yàn)證本文算法的有效性。

1 YOLOv7 算法

YOLOv7 有YOLOv7、YOLOv7-X、YOLOv7-W6、YOLOv7-E6、YOLOv7-D6、YOLOv7-E6E 這6 種變體。其中，YOLOv7 的參數(shù)量最少，檢測速度最快，能夠滿足用戶對(duì)高實(shí)時(shí)性檢測的需求。因此，本文選取YOLOv7 作為基礎(chǔ)算法進(jìn)行改進(jìn)。YOLOv7 的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。由圖1 可知，YOLOv7 的網(wǎng)絡(luò)結(jié)構(gòu)由Input、Backbone、Head 這3 個(gè)部分組成。將待檢測對(duì)象輸入Backbone 中，Backbone 部分在經(jīng)過4 個(gè)CBS（Conv+BN+SiLU）操作后，使用連續(xù)的ELAN 結(jié)構(gòu)與DownC 結(jié)構(gòu)完成特征提取與尺寸縮放；在Backbone 部分的最后一個(gè)特征層后使用SPPCSPC 結(jié)構(gòu)，增大感受野并優(yōu)化特征的提?。粚PPCSPC 結(jié)構(gòu)得到的特征層拼接成一個(gè)新的特征層，并和從Backbone 部分提取到的2 個(gè)特征層一起傳入多尺度特征融合模塊；在多尺度地融合語義信息和空間信息后，輸出3 個(gè)不同尺度的目標(biāo)特征層；將得到的3 個(gè)特征層分別通過RepConv 結(jié)構(gòu)進(jìn)行輔助訓(xùn)練；通過YOLO Head 中的卷積調(diào)整通道數(shù)以得到初步的預(yù)測結(jié)果；對(duì)初步的預(yù)測結(jié)果進(jìn)行置信度過濾、NMS（Non-Maximum Suppression）等后處理操作，得到最終的輸出結(jié)果。

圖1 YOLOv7 網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 YOLOv7 network structure

2 改進(jìn)的YOLOv7 算法

YOLOv7 相較于YOLOv4、YOLOv3 等其他一階段目標(biāo)檢測算法，對(duì)小目標(biāo)具有更好的檢測效果，但是，其在目標(biāo)物都很微小的情況下并不能得到理想的檢測結(jié)果。因此，針對(duì)液壓閥塊表面缺陷尺寸微小、對(duì)比度低等特點(diǎn)，本文對(duì)YOLOv7 進(jìn)行改進(jìn)，改進(jìn)的YOLOv7 算法網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。

圖2 改進(jìn)的YOLOv7 網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Improved YOLOv7 network structure

2.1 CA 注意力機(jī)制

液壓閥塊的表面缺陷尺寸小，在整個(gè)圖像中占有較少的信息量，背景復(fù)雜且存在過多干擾信息。為了提高小目標(biāo)檢測的準(zhǔn)確性和減少無關(guān)信息的干擾，本文采用注意力機(jī)制自適應(yīng)地聚焦與小目標(biāo)有關(guān)的細(xì)節(jié)信息，降低對(duì)其他信息的關(guān)注度。不同于SE（Squeeze-and-Excitation）［23］通道注意力機(jī)制只考慮內(nèi)部通道信息、CBAM（Convolutional Block Attention Module）［24］只考慮局部空間位置范圍內(nèi)的信息，CA 注意力機(jī)制在增加較少計(jì)算量的前提下，既考慮到不同通道之間關(guān)系的重要性，同時(shí)又考慮到空間位置間的長期依賴關(guān)系。因此，本文在多尺度特征融合模塊后添加3 個(gè)CA 注意力機(jī)制來提高模型的檢測精度。CA 注意力機(jī)制結(jié)構(gòu)如圖3 所示。為了獲取圖像寬度和高度上的注意力并對(duì)精確位置信息進(jìn)行編碼，CA 注意力機(jī)制首先將傳進(jìn)的輸入特征使用全局平均池化沿水平方向與垂直方向進(jìn)行特征編碼，獲得在寬度和高度2 個(gè)方向上的特征圖；接著將寬度方向特征圖的輸出維數(shù)調(diào)換后與高度方向特征圖進(jìn)行拼接，拼接后使用1×1 的卷積將得到的中間特征圖通道數(shù)壓縮為C/r（r為縮減因子）；隨后使用BN（Batch Normalization）批量歸一化與非線性操作對(duì)特征圖進(jìn)行特征映射，映射后使用1×1 卷積沿著空間維度將特征圖分解成2 個(gè)獨(dú)立的張量，其中，寬度方向特征圖的輸出維數(shù)恢復(fù)至輸入狀態(tài)；然后利用 Sigmoid 激活函數(shù)分別得到2 個(gè)方向上的注意力權(quán)重；最后在原始特征圖上通過乘法加權(quán)計(jì)算，得到在寬度和高度方向上帶有注意力權(quán)重的特征圖。

圖3 CA 注意力機(jī)制結(jié)構(gòu)Fig.3 CA attention mechanism structure

2.2 改進(jìn)的UpC 多支路上采樣結(jié)構(gòu)

YOLOv7 使用DownC 結(jié)構(gòu)代替原有的stride 為2 的卷積對(duì)特征層進(jìn)行尺寸減半操作。DownC 結(jié)構(gòu)使用MaxPooling 和stride 為2 的3×3 卷積對(duì) 特征層進(jìn)行同步下采樣。MaxPooling 考慮到局部區(qū)域的最大值信息，卷積操作考慮到局部區(qū)域中所有值的信息，因此，結(jié)合兩者的特性做同步下采樣并對(duì)結(jié)果進(jìn)行特征拼接，可以有效避免特征信息丟失。

參考DownC 結(jié)構(gòu)，本文提出改進(jìn)的UpC 多支路上采樣結(jié)構(gòu)，如圖4 所示。

圖4 改進(jìn)的UpC 多支路上采樣結(jié)構(gòu)Fig.4 Improved UpC multi-branch upsampling structure

2 條支路一開始都使用1×1 卷積進(jìn)行通道壓縮，減少計(jì)算量；然后分別使用UpSampling 與ConvTranspose2d 對(duì)特征圖進(jìn)行上采樣；最后在通道上進(jìn)行特征圖拼接。其中：UpSampling 通過鄰近點(diǎn)的值進(jìn)行插值上采樣，沒有參數(shù)可以學(xué)習(xí)；ConvTranspose2d 為卷積的逆過程，在訓(xùn)練過程中會(huì)自動(dòng)學(xué)習(xí)最優(yōu)參數(shù)進(jìn)行上采樣。因此，通過上述2 種方式的結(jié)合可以提取到更多的特征信息。反卷積計(jì)算公式如下：

其中：sstride為卷積步長；kkernel為卷積核大??；ppadding為邊界填充；sin_size為輸入尺寸；sout_size為輸出尺寸。

反卷積的具體步驟如下：

步驟1在輸入對(duì)象的每個(gè)元素后根據(jù)sstride-1做補(bǔ)0 擴(kuò)充操作，若sstride為1 就不補(bǔ)0。

步驟2在步驟1 的基礎(chǔ)上按照ppadding再對(duì)整體補(bǔ)0。

步驟3將步驟2 所得的結(jié)果作為真正的輸入，并使用sstride為1 的卷積對(duì)其進(jìn)行計(jì)算，獲得反卷積后的輸出結(jié)果。

2.3 改進(jìn)的ELAN-RepConv 結(jié)構(gòu)

ELAN 結(jié)構(gòu)共有2 條分支，通過2 條分支的多個(gè)特征融合，使網(wǎng)絡(luò)能夠?qū)W習(xí)到更多的特征信息。第1 條分支先使用一個(gè)1×1 卷積做通道數(shù)調(diào)整，接著使用多個(gè)3×3 卷積做特征提?。坏? 條分支使用1×1卷積減少計(jì)算量。在2 條分支的特征提取結(jié)束后，從第1 條分支引出多個(gè)特征圖，與第2 條分支的特征圖拼接在一起得到最后的特征圖。

本文提出的改進(jìn)ELAN-RepConv 結(jié)構(gòu)是將多尺度特征融合模塊中的ELAN_2 結(jié)構(gòu)中的部分3×3 卷積替換成RepConv 結(jié)構(gòu)。RepConv 結(jié)構(gòu)可以在訓(xùn)練時(shí)通過多分支的特征提取學(xué)習(xí)到更多特征；在推理時(shí)可通過結(jié)構(gòu)重參化將其轉(zhuǎn)換成卷積核為3×3 的Conv+BN+SiLU+BN 單路結(jié)構(gòu)，此時(shí)，ELAN-RepConv結(jié)構(gòu)與原來的ELAN_2 結(jié)構(gòu)基本一致。因此，改進(jìn)的ELAN-RepConv 結(jié)構(gòu)能夠在不增加過多計(jì)算量的前提下進(jìn)一步提升模型的特征學(xué)習(xí)能力。改進(jìn)的ELAN-RepConv 結(jié)構(gòu)如圖5 所示。

圖5 改進(jìn)的ELAN-RepConv 結(jié)構(gòu)Fig.5 Improved ELAN-RepConv structure

2.4 K-means++錨框聚類

YOLOv7 使用的先驗(yàn)框尺寸是通過K-means［25］算法在MS COCO 數(shù)據(jù)集上聚類而得到的。MS COCO數(shù)據(jù)集大約包含41%的小目標(biāo)（area<32×32），其余都是中等目標(biāo)與大目標(biāo)。而液壓閥塊的表面缺陷基本都為微小缺陷，面積約占整個(gè)圖像的0.05%，沒有大目標(biāo)的存在，原先設(shè)定的先驗(yàn)框不符合本文研究對(duì)象的尺寸特性。因此，需要采用聚類算法針對(duì)本文所研究的數(shù)據(jù)集重新生成更利于模型收斂的先驗(yàn)框尺寸。聚類算法中最常用的是K-means 算法和K-means++算法，聚類中心初始值設(shè)定的好壞對(duì)聚類結(jié)果有著一定的影響。K-means 算法隨機(jī)選取數(shù)據(jù)集中的K個(gè)點(diǎn)作為初始聚類中心，其聚類中心的隨機(jī)初始化可能使聚類結(jié)果陷入局部最優(yōu)狀態(tài)［26］，從而產(chǎn)生錯(cuò)誤的收斂結(jié)果。而K-means++算法的聚類中心是在選擇過程中自動(dòng)調(diào)優(yōu)的，在K-means 算法的基礎(chǔ)上解決了聚類中心的初始化問題，可以有效地避免局部最優(yōu)問題。因此，本文采用K-means++算法對(duì)數(shù)據(jù)集進(jìn)行聚類，聚類結(jié)果如圖6 所示（彩色效果見《計(jì)算機(jī)工程》官網(wǎng)HTML 版）。

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)

本文所研究的液壓閥塊圖像是從工廠實(shí)際生產(chǎn)線上所采集到的，共有325 張，圖像大小為2 464×2 056，含有凹坑（pit）缺陷的圖片有226 張，含有劃痕（scratch）缺陷的圖片有99 張。為了避免過擬合并提高網(wǎng)絡(luò)的魯棒性，降低各方面外界因素對(duì)檢測結(jié)果的影響，本文結(jié)合離線數(shù)據(jù)增強(qiáng)與Mosaic 數(shù)據(jù)增強(qiáng)操作對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充。

考慮到工場實(shí)際生產(chǎn)環(huán)境中可能會(huì)出現(xiàn)光照不均、對(duì)比度變化等情況，為了貼合真實(shí)場景可能出現(xiàn)的問題，隨機(jī)融合上下翻轉(zhuǎn)、亮度調(diào)節(jié)、高斯平滑、對(duì)比度調(diào)整、添加高斯噪聲這5 種數(shù)據(jù)增強(qiáng)操作將原有的數(shù)據(jù)集擴(kuò)充到1 950 張。其中，含有凹坑缺陷的圖片有1 356 張，含有劃痕缺陷的圖片有594 張。擴(kuò)充完畢后使用LabelImg 圖像標(biāo)注工具對(duì)數(shù)據(jù)集進(jìn)行標(biāo)注，手動(dòng)框選出圖像中缺陷的具體位置并標(biāo)注出對(duì)應(yīng)的類別，標(biāo)注結(jié)束后，缺陷的位置與類別信息會(huì)自動(dòng)地保存在相應(yīng)的PASCAL VOC 格式的xml 文件中。根據(jù)缺陷類別將數(shù)據(jù)集按照8∶2 的比例隨機(jī)分為1 560 張圖像（訓(xùn)練集）和390 張圖像（測試集）。

3.2 評(píng)價(jià)指標(biāo)

本次實(shí)驗(yàn)主要研究的是工業(yè)生產(chǎn)環(huán)境下的表面缺陷，既要滿足實(shí)時(shí)性又要獲得較好的檢測性能，因此，采用檢測速度FPS（Frames Per Second）與平均精度均值（mean Average Precision，mAP）作為評(píng)價(jià)指標(biāo)來比較各算法。FPS 是每秒可檢測完的圖片數(shù)量，mAP 是各類缺陷檢測精度的平均值。mAP 的計(jì)算公式如式（2）所示：

其中：n為缺陷類別數(shù)；AAP為每類缺陷的平均精度值，可由P-R 曲線下的陰影面積獲得。

3.3 實(shí)驗(yàn)結(jié)果

本次實(shí)驗(yàn)是在ubuntu20.04 操作系統(tǒng)下基于PyTorch 深度學(xué)習(xí)框架實(shí)現(xiàn)的，GPU 選用顯存大小為24 GB 的NVIDIA GeForce RTX 3090，CPU 配置是8 核的AMD EPYC 7601，CUDNN 版本為11.1，PyTorch 版本是1.8.0，Python 語言環(huán)境是3.8.10。

實(shí)驗(yàn)的超參數(shù)配置如下：在模型訓(xùn)練階段，參數(shù)調(diào)整使用SGD 優(yōu)化器，初始學(xué)習(xí)率設(shè)為0.01，動(dòng)量為0.937，使用warm up 學(xué)習(xí)率衰減，權(quán)重衰減系數(shù)設(shè)置為0.000 5。此外，批量大小設(shè)置為1，總共訓(xùn)練150 個(gè)輪數(shù)。本文算法檢測得到的P-R 曲線如圖7 所示。

P-R 曲線的橫軸為召回率，縱軸為精確率。由圖7 可知，各類P-R 曲線下的面積都很大，AP 值較高，即模型的檢測性能較好。其中，pit 缺陷的平均精度值達(dá)到0.986，scratch 缺陷的平均精度值達(dá)到0.966。

3.4 對(duì)比分析與消融實(shí)驗(yàn)

3.4.1 聚類算法對(duì)比

本節(jié)通過聚類算法的對(duì)比實(shí)驗(yàn)，驗(yàn)證使用K-means++聚類算法生成的先驗(yàn)框?qū)σ簤洪y塊表面微小缺陷檢測的有效性。

在相同訓(xùn)練參數(shù)的前提下，將K-means、K-means++算法在實(shí)驗(yàn)數(shù)據(jù)集上聚類生成的先驗(yàn)框分別應(yīng)用在原YOLOv7 算法上，對(duì)比結(jié)果如表1 所示。

表1 2 種先驗(yàn)框的平均精度值Table 1 Average precision values of two kinds of prior boxes %

從表1 可知，使用K-means++聚類算法聚類生成的先驗(yàn)框應(yīng)用在原YOLOv7 上時(shí)平均精度值比K-means 聚類算法高3.5 個(gè)百分點(diǎn)，K-means++聚類可提高邊框回歸位置預(yù)測的精確度。

3.4.2 注意力機(jī)制對(duì)比

在多尺度特征融合模塊后引入CBAM、SE 以及CA 這3 種不同的注意力機(jī)制，在K-means++算法的基礎(chǔ)上對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，記錄得到的平均精度值，對(duì)比結(jié)果如表2 所示。

表2 引入不同注意力機(jī)制的平均精度值Table 2 Average precision values of introducing different attention mechanisms %

從表2 可以看出，引入SE 以及CA 注意力機(jī)制都可以提高平均精度值，但引入CBAM 注意力機(jī)制后平均精度值反而降低。引入CA 注意力機(jī)制后平均精度值相較于CBAM 與SE 分別提高2.6 與0.8 個(gè)百分點(diǎn)。綜上所述，引入CA 注意力機(jī)制對(duì)提高小目標(biāo)檢測精度具有有效性。

3.4.3 YOLOv7 算法與本文算法的對(duì)比

從數(shù)據(jù)集中分別抽出4 張圖片進(jìn)行對(duì)比，標(biāo)注出真實(shí)框的4 張?jiān)瓐D如圖8 所示。使用YOLOv7 與本文算法對(duì)這4 張圖片進(jìn)行檢測，將檢測到的缺陷部分截取出來進(jìn)行對(duì)比，結(jié)果如圖9 所示。由圖9 可知，YOLOv7 算法相對(duì)于本文算法更容易出現(xiàn)漏檢的情況，且部分缺陷無法被識(shí)別或者識(shí)別出的置信度值較低，而本文算法能夠盡可能準(zhǔn)確地檢測出圖上存在的微小缺陷。

圖8 標(biāo)注出真實(shí)框的原圖Fig.8 Original drawing marked with real frame

圖9 2 種算法的檢測結(jié)果對(duì)比Fig.9 Comparison of detection results of two algorithms

3.4.4 不同算法的對(duì)比

選擇本文改進(jìn)的YOLOv7 算法與Faster R-CNN、YOLOv4、MobileNetv3-YOLOv4、YOLOv5-X、YOLOv7、YOLOv7-W6、YOLOv7-E6E 這7 種檢測算法進(jìn)行對(duì)比實(shí)驗(yàn)，將測試時(shí)的參數(shù)量、精確率、召回率、pit 精度值、scratch 精度值、平均精度值以及檢測速度作為評(píng)估指標(biāo)，對(duì)比結(jié)果如表3 所示。由表3 可知，改進(jìn)后的YOLOv7 算法在所有算法中檢測精度最高，比 Faster R-CNN、YOLOv4、YOLOv5-X 以及MobileNetv3-YOLOv4 這4 種算法的平均精度值至少高出45 個(gè)百分點(diǎn)，可見這4 種算法對(duì)本文數(shù)據(jù)集中的微小缺陷檢測能力非常差，漏檢率高。雖然YOLOv7-W6 與YOLOv7-E6E的檢測精度相較于原YOLOv7 算法高，但是參數(shù)量非常大，導(dǎo)致檢測速度很低，不符合實(shí)際工業(yè)應(yīng)用場景的要求。本文算法檢測速度高于YOLOv7-W6 與YOLOv7-E6E，平均精度值比兩者分別高出4.9 和1.8 個(gè)百分點(diǎn)。綜上所述，本文算法能夠在保證高實(shí)時(shí)性的前提下準(zhǔn)確檢測液壓閥塊表面的微小缺陷。

表3 不同算法的結(jié)果對(duì)比Table 3 Comparison of results of different algorithms

3.4.5 消融實(shí)驗(yàn)

在使用相同訓(xùn)練參數(shù)的前提下，對(duì)改進(jìn)模塊進(jìn)行消融實(shí)驗(yàn)。逐步加入K-means++錨框聚類算法、CA 注意力機(jī)制、改進(jìn)的UpC 多支路上采樣結(jié)構(gòu)與改進(jìn)的ELAN-RepConv 結(jié)構(gòu)，通過多個(gè)評(píng)價(jià)指標(biāo)驗(yàn)證每一步改進(jìn)方法對(duì)檢測精度提升的有效性。消融實(shí)驗(yàn)結(jié)果如表4 所示。由表4 可知，通過添加K-means++聚類算法，平均精度值提高3.5 個(gè)百分點(diǎn)，引入CA 注意力機(jī)制后又提高1.4 個(gè)百分點(diǎn)，添加UpC 多分支上采樣結(jié)構(gòu)，平均精度值進(jìn)一步提高，最后使用ELAN-RepConv 結(jié)構(gòu)將平均精度值提高到97.6%?？芍?，與原始YOLOv7 算法相比，改進(jìn)算法使液壓閥塊表面缺陷檢測的平均精度值提高了8.4 個(gè)百分點(diǎn)。

表4 消融實(shí)驗(yàn)結(jié)果Table 4 Results of ablation experiment

4 結(jié)束語

本文針對(duì)液壓閥塊表面缺陷尺寸微小、背景復(fù)雜、對(duì)比度低的特點(diǎn)，提出一種基于改進(jìn)YOLOv7 的液壓閥塊表面微小缺陷檢測算法。通過引入CA 注意力機(jī)制，同時(shí)使用改進(jìn)的UpC 多支路上采樣結(jié)構(gòu)與改進(jìn)的ELAN-RepConv 結(jié)構(gòu)，提高對(duì)微小缺陷的特征提取能力并減少特征信息丟失。同時(shí)，為了增強(qiáng)本文算法的魯棒性，采用離線數(shù)據(jù)增強(qiáng)融合Mosaic 數(shù)據(jù)增強(qiáng)以及K-means++錨框聚類算法來提高算法的性能。多個(gè)對(duì)比實(shí)驗(yàn)和消融實(shí)驗(yàn)結(jié)果表明，改進(jìn)的YOLOv7 目標(biāo)檢測算法平均精度值達(dá)到97.6%，比原YOLOv7 算法提高8.4 個(gè)百分點(diǎn)，檢測速度達(dá)到55.2 frame/s，符合實(shí)際生產(chǎn)需求。下一步將在模型的主干特征提取部分采用Transformer 網(wǎng)絡(luò)對(duì)算法結(jié)構(gòu)進(jìn)行改進(jìn)，在提高檢測速度的前提下進(jìn)一步提升液壓閥塊表面微小缺陷檢測精度。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡