国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)YOLOv5s的磁瓦表面缺陷檢測(cè)算法

2024-01-15 05:44:50鄒易航朱順痣黃智財(cái)
關(guān)鍵詞:注意力卷積精度

鄒易航,朱順痣*,黃智財(cái)

(1. 廈門(mén)理工學(xué)院計(jì)算機(jī)與信息工程學(xué)院,福建 廈門(mén) 361024;2. 廈門(mén)華廈學(xué)院信息與智能機(jī)電學(xué)院,福建 廈門(mén) 361024)

磁瓦作為汽車(chē)發(fā)動(dòng)機(jī)中電機(jī)的重要零件,其表面缺陷的檢測(cè)在生產(chǎn)過(guò)程中非常關(guān)鍵。在當(dāng)前的工業(yè)生產(chǎn)環(huán)境中,磁瓦表面缺陷的檢測(cè)大多數(shù)仍然依靠人工檢測(cè),效率低下且漏檢率高。

有關(guān)磁瓦表面缺陷檢測(cè),相關(guān)研究人員已進(jìn)行了一系列研究,并取得了一定進(jìn)展。張露濱等[1]提出一種微型磁瓦表面線缺陷檢測(cè)方法,結(jié)合背景紋理抑制和掩膜技術(shù)技術(shù),有效提高了檢測(cè)精度,但不能完全排除噪聲點(diǎn)對(duì)劃痕圖像提取的干擾。楊成立等[2]提出一種基于非下采樣Shearlet變換的磁瓦表面缺陷檢測(cè)方法,該方法能夠有效去除不均勻背景、磨削紋理和噪聲干擾,提升了檢測(cè)的精確度和魯棒性,但該方法僅僅適用于單個(gè)缺陷及缺陷背景簡(jiǎn)單的場(chǎng)景下。丁龍飛等[3]提出了一種融合多重注意力機(jī)制磁瓦缺陷檢測(cè)算法,通過(guò)建立網(wǎng)絡(luò)特征之間的空間相關(guān)性,增強(qiáng)了算法的精確度,但該算法僅適用于對(duì)缺陷進(jìn)行分類(lèi),無(wú)法精準(zhǔn)地標(biāo)注出不同缺陷的位置。胡浩等[4]提出基于機(jī)器視覺(jué)的小磁瓦表面微缺陷檢測(cè)方法研究,將磁瓦缺陷分為3 類(lèi),且針對(duì)相應(yīng)類(lèi)別設(shè)計(jì)了對(duì)應(yīng)的缺陷提取方法,但該方法對(duì)裂紋、氣孔的識(shí)別精度較低。

近年來(lái),隨著深度學(xué)習(xí)的不斷發(fā)展,深度學(xué)習(xí)技術(shù)被逐漸運(yùn)用到目標(biāo)檢測(cè)領(lǐng)域。目前,目標(biāo)檢測(cè)算法大致分為兩類(lèi):以高精度著稱(chēng)的雙階段算法和兼顧檢測(cè)速度與精度的單階段檢測(cè)算法。雙階段檢測(cè)算法如Mask R-CNN[5]、Fast R-CNN[6]和Faster R-CNN[7],它們通過(guò)預(yù)先生成候選框來(lái)提升檢測(cè)精度,但檢測(cè)速度慢,計(jì)算復(fù)雜,難以滿足實(shí)時(shí)檢測(cè)要求。單階段檢測(cè)算法如SSD[8]、YOLO9000[9]、YOLOv3[10]、YOLOv4[11]、YOLOv5 等,在提升檢測(cè)速率的同時(shí)兼顧了檢測(cè)精度。為此,針對(duì)磁瓦圖像高對(duì)比度和不同缺陷類(lèi)別的差異較大、工業(yè)生產(chǎn)環(huán)境中磁瓦檢測(cè)方式漏檢率高、檢測(cè)效率低下的問(wèn)題,考慮到磁瓦檢測(cè)環(huán)境及速率要求,本文以YOLOv5s 為基礎(chǔ),先在neck 端引入GSconv[12]代替標(biāo)準(zhǔn)卷積(standard convolution, SCONV)操作,使卷積計(jì)算的輸出盡可能接近標(biāo)準(zhǔn)卷積,同時(shí)降低計(jì)算成本;然后,添加注意力機(jī)制,對(duì)網(wǎng)絡(luò)進(jìn)行改進(jìn),增加網(wǎng)絡(luò)的特征提取能力;最后,替換原有損失函數(shù),使模型收斂更快。

1 YOLOv5算法簡(jiǎn)述

YOLO 系列算法從v1發(fā)展至今,已經(jīng)實(shí)現(xiàn)速度與精度的平衡。YOLOv5一共包括4個(gè)版本的模型,分別是YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,這些模型通過(guò)控制網(wǎng)絡(luò)的深度和寬度以適應(yīng)不同場(chǎng)景下的檢測(cè)要求。考慮到磁瓦檢測(cè)環(huán)境及速率要求,本文選擇YOLOv5s 作為基準(zhǔn)模型,構(gòu)建磁瓦表面缺陷檢測(cè)算法。

YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)包括輸入端、特征提取網(wǎng)絡(luò)(backbone網(wǎng)絡(luò))、neck網(wǎng)絡(luò)、head網(wǎng)絡(luò)4個(gè)部分。

輸入端會(huì)對(duì)輸入的圖片進(jìn)行預(yù)處理。它以每4個(gè)為一組,通過(guò)隨機(jī)縮放,再隨機(jī)分布進(jìn)行拼接的方式進(jìn)行mosaic數(shù)據(jù)增強(qiáng),可有效增加數(shù)據(jù)的多樣性。而且,由于隨機(jī)縮放增加了許多小目標(biāo),故網(wǎng)絡(luò)的魯棒性更好。

backbone 部分則用于圖像特征提取,主要由CBS 結(jié)構(gòu)、C3 結(jié)構(gòu)、SPPF 結(jié)構(gòu)組成。CBS 由卷積層(conv)、批量歸一化層(batch normalization, BN)、激活函數(shù)(silu)組成。C3 結(jié)構(gòu)由3 個(gè)標(biāo)準(zhǔn)卷積層及多個(gè)bottleneck 結(jié)構(gòu)組合而成,相較于以往的CSP 模塊僅僅在修正單元選擇上的不同,C3 結(jié)構(gòu)能夠減少網(wǎng)絡(luò)計(jì)算復(fù)雜度,并增強(qiáng)網(wǎng)絡(luò)學(xué)習(xí)性能。SPPF 結(jié)構(gòu)是將輸入串行通過(guò)多個(gè)5×5 大小的maxpool層,相對(duì)于以往的SPP 通過(guò)并行輸入多個(gè)不同大小的maxpool,SPPF 在保證相同精度的情況下,速率也得到了極大的提升。

neck 部分由FPN(feature pyramid networks)[13]和New CSP-PAN 組成。FPN 結(jié)構(gòu)通過(guò)構(gòu)造一系列不同尺度的圖像或特征圖進(jìn)行模型訓(xùn)練和測(cè)試,能夠有效提升檢測(cè)算法對(duì)于不同尺寸檢測(cè)目標(biāo)的魯棒性。New CSP-PAN結(jié)構(gòu)則是在PAN(path aggregation networks)結(jié)構(gòu)中引入CSP結(jié)構(gòu)。

head 部分為最后檢測(cè)結(jié)果的輸出,由3 個(gè)大小為80×80、40×40、20×20 的檢測(cè)頭組成,分別對(duì)應(yīng)小、中、大目標(biāo)的檢測(cè)。

2 改進(jìn)的YOLOv5s算法

2.1 使用GSconv結(jié)構(gòu)

GSconv 是一種混合卷積,由標(biāo)準(zhǔn)卷積(standard convolution,Sconv)和深度可分離卷積(depth-wise separable convolution,DWconv)[14]組成。標(biāo)準(zhǔn)卷積是不同的卷積核同時(shí)對(duì)3 個(gè)通道進(jìn)行卷積,它在運(yùn)行卷積過(guò)程時(shí),1 個(gè)卷積核只能得到1 個(gè)特征。DWconv操作是首先用3個(gè)卷積對(duì)3個(gè)通道分別做卷積,在1 次卷積后,輸出3 個(gè)數(shù),然后輸出的這3 個(gè)數(shù),再通過(guò)1 個(gè)1×1×3 的卷積核,得到最后結(jié)果。DWconv 可以很好地減少參數(shù)和浮點(diǎn)運(yùn)算(floating-point,F(xiàn)LOP)的數(shù)量。但是,DWconv 輸入圖像的通道信息在計(jì)算過(guò)程中會(huì)被分離,使磁瓦表面缺陷檢測(cè)精度有所下降。而GSconv 則可以在保證檢測(cè)速度達(dá)到DWconv水準(zhǔn)的同時(shí),使檢測(cè)精度不會(huì)下降得太多。GSconv的結(jié)構(gòu)具體如圖1所示。

圖 1 GSconv結(jié)構(gòu)Fig.1 GSconv structure

本文在neck端引入GSconv結(jié)構(gòu)。因?yàn)樵趎eck端引入GSconv結(jié)構(gòu),可以最大程度地保留每個(gè)通道之間的隱藏鏈接,從而在保證模型準(zhǔn)確率的情況下,降低計(jì)算成本。由于特征圖在neck 端的通道維度最大,因此,GSconv 結(jié)構(gòu)可以更好地處理這種情況,提高模型的效率和準(zhǔn)確性。但是,如果在網(wǎng)絡(luò)的所有部分都運(yùn)用GSconv結(jié)構(gòu),則會(huì)使模型的網(wǎng)絡(luò)更深,增加模型的推理時(shí)間。

2.2 添加CA注意力機(jī)制模塊

注意力機(jī)制是一種源于人類(lèi)視覺(jué)研究的資源分配方案,它可以在計(jì)算能力有限的情況下,將計(jì)算資源分配給更重要的任務(wù),同時(shí)解決信息超載問(wèn)題。通過(guò)添加注意力機(jī)制,模型可以更加高效地處理輸入數(shù)據(jù),從而提升計(jì)算能力和性能。CA 注意力機(jī)制[15]是一種新穎的輕量級(jí)通道注意力機(jī)制,能夠同時(shí)考慮通道間的關(guān)系及長(zhǎng)距離的位置信息,從而更好地捕捉特征之間的關(guān)系,提高模型的性能。CA 注意力機(jī)制結(jié)構(gòu)如圖2 所示。圖2 中,C 代表卷積操作中提取出的特征圖的通道數(shù),H 和W 分別代表特征圖的高度和寬度。

CA 為了獲取圖像寬度和高度上的注意力并對(duì)位置信息進(jìn)行編碼,會(huì)先將原始特征圖xc在寬度和高度兩個(gè)方面,使用尺寸為(H,1)和(1,W)池化核分別進(jìn)行平均池化,從而得到在寬度w處第c個(gè)通道的輸出和在高度h處第c個(gè)通道的輸出。其計(jì)算公式為

圖 2 CA注意力機(jī)制結(jié)構(gòu)Fig.2 CA structure

式(1)~(2)中:h、w、j、i都是代表索引變量。其中,h 和 w 分別表示高度的位置和寬度的位置,而j和i是進(jìn)行求和操作的循環(huán)變量。

公式(1)中,j 作為循環(huán)變量,從0 到H-1,對(duì)每個(gè)位置進(jìn)行平均池化操作。公式(2)中,i 作為循環(huán)變量,從0到W-1,對(duì)每個(gè)位置進(jìn)行平均池化操作。

然后,將獲得全局感受野寬度和高度兩個(gè)方向的特征圖拼接在一起,并將它們送入共享的卷積核為 1×1 的卷積模塊,通過(guò)1個(gè)縮減因子r將其維度降低為原來(lái)的 C/r;再將經(jīng)過(guò)批量歸一化處理的特征圖 F1送入Sigmoid激活函數(shù)δ,得到形如 1 ×(W + H) × C/r的特征圖 ?。其計(jì)算公式為

接著,特征圖?再依照原來(lái)的寬高,對(duì)它用1×1的卷積核卷積,分別得到通道數(shù)與原來(lái)相同的特征圖Fh和Fw,再經(jīng)過(guò)Sigmoid 激活函數(shù)σ 之后,獲得在高度和寬度方向上,與輸入特征圖xc具有相同通道數(shù)的張量g。其計(jì)算公式為

最終,在原始特征圖xc上進(jìn)行乘法加權(quán)計(jì)算,得到在寬度和高度方向上帶有注意力權(quán)重的特征圖yc。其計(jì)算公式為

本文通過(guò)選用CA 注意力機(jī)制,檢測(cè)時(shí)不僅獲取了通道間信息,還考慮了方向相關(guān)的位置信息,從而在磁瓦數(shù)據(jù)集上,使模型能更好地定位和識(shí)別缺陷目標(biāo)。

2.3 改進(jìn)損失函數(shù)

YOLOv5s中采用的邊界框回歸損失函數(shù)為CIoU,其計(jì)算公式為

式(7)中:b 和bgt表示預(yù)測(cè)框和真實(shí)框中心點(diǎn)坐標(biāo);ρ 表示求歐式距離;α 是權(quán)重函數(shù),而v 用來(lái)度量長(zhǎng)寬比的相似性。采用w、h和wgt、hgt分別表示預(yù)測(cè)框高寬和真實(shí)框高寬,則有

當(dāng)真實(shí)框和預(yù)測(cè)框的長(zhǎng)寬比越接近時(shí),v 越小。v 不變時(shí),IoU 越大,α 越大,損失越大,說(shuō)明高IoU時(shí),更加關(guān)注長(zhǎng)寬比,低IoU時(shí),更關(guān)注IoU。但是這種方式?jīng)]有考慮到所需真實(shí)框與預(yù)測(cè)框之間不匹配的方向。這種不足會(huì)導(dǎo)致收斂速度較慢且效率較低,因?yàn)轭A(yù)測(cè)框可能在訓(xùn)練過(guò)程中到處移動(dòng),并最終產(chǎn)生更差的模型。因此,本文采用SIoU[16]。它考慮到所需回歸之間的向量角度,并重新定義了懲罰指標(biāo)。SIoU的定義為

SIoU 由4 個(gè)Cost 函數(shù)組成:Angle cost、Distance cost、Shape cost 和IoU cost。Angle cost 描述了真實(shí)框和預(yù)測(cè)框中心點(diǎn)連接與x-y 軸之間的最小角度;Distance cost 描述了中心點(diǎn)之間的距離;Shape cost則考慮了兩框之間的長(zhǎng)寬比,它是通過(guò)計(jì)算兩框之間寬度差和二者之間最大寬度比(長(zhǎng)同理)來(lái)定義的;IoU cost是預(yù)測(cè)框和真實(shí)框之間的交并比。

改進(jìn)后的YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。由圖3可見(jiàn),與原來(lái)的網(wǎng)絡(luò)相比,改進(jìn)后的算法在neck端引入了GSconv結(jié)構(gòu),以降低計(jì)算的成本;在backbone端引入了CA注意力機(jī)制,以改進(jìn)邊界框回歸的損失函數(shù),加快模型的收斂速度。

圖 3 改進(jìn)的YOLOv5s算法結(jié)構(gòu)Fig.3 Improved YOLOv5s algorithm

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)集與數(shù)據(jù)增強(qiáng)

本文數(shù)據(jù)集來(lái)自文獻(xiàn)[17],由人工拍攝,為了模擬實(shí)際裝配線上的制造過(guò)程,文獻(xiàn)中對(duì)1個(gè)給定的磁瓦在多種照明條件下采集圖像。其包括5 種缺陷類(lèi)別:氣孔、破損、裂紋、磨損和起層。其中,氣孔和裂紋對(duì)磁瓦質(zhì)量的影響最大,這兩種缺陷有很多共同之處,它們的顏色比周?chē)沫h(huán)境暗。起層最難檢測(cè),因?yàn)樗念伾图y理與背景高度相似。磨損的顏色和質(zhì)地與深色表面污垢非常相似。數(shù)據(jù)集共計(jì)383張圖片。由于原始缺陷樣本數(shù)據(jù)不足,因此采用平移、翻轉(zhuǎn),裁剪,縮放等方法對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),擴(kuò)充后的數(shù)據(jù)集達(dá)到2 340張。最終,將數(shù)據(jù)集劃分為訓(xùn)練和測(cè)試集,比例為8∶2。其中,訓(xùn)練集包含1 872張圖片,測(cè)試集包含468張圖片。部分圖片如圖4所示。

圖 4 磁瓦缺陷圖片F(xiàn)ig.4 Magnetic tile defects

3.2 實(shí)驗(yàn)環(huán)境

本文的實(shí)驗(yàn)環(huán)境配置為:Ubuntu18.04 操作系統(tǒng),Intel(R) Xeon(R) Silver 4110 CPU @ 2.10 GHzCPU,GPU 為NVIDIA GeForce RTX 2080Ti 顯卡,基于深度學(xué)習(xí)框架pytorch 下運(yùn)行。實(shí)驗(yàn)中,輸入圖片分辨率為640 px×640 px,batchsize為48,epoch為400。

3.3 實(shí)驗(yàn)評(píng)估指標(biāo)

為了更好地評(píng)價(jià)模型的性能,本文采用目標(biāo)檢測(cè)領(lǐng)域常用的評(píng)估指標(biāo):精確度P、平均精確度AP,平均精確率均值mAP。精確度指的是在預(yù)測(cè)過(guò)程中,預(yù)測(cè)正確的部分占預(yù)測(cè)結(jié)果的比例。平均精確率是每個(gè)類(lèi)別精確率的平均值。相關(guān)計(jì)算公式為

式(11)~(13)中:TP(true positive)表示將正類(lèi)預(yù)測(cè)為正類(lèi)的數(shù)量;FP(false positive)表示將負(fù)類(lèi)預(yù)測(cè)為正類(lèi)的數(shù)量;N表示所有可能的預(yù)測(cè)結(jié)果的數(shù)量。

3.4 實(shí)驗(yàn)結(jié)果與分析

3.4.1 對(duì)比實(shí)驗(yàn)

為了進(jìn)一步驗(yàn)證本文算法模型的性能,選取幾種常用的目標(biāo)檢測(cè)算法,在同一配置環(huán)境和相同數(shù)據(jù)集下進(jìn)行對(duì)比試驗(yàn),以mAP和權(quán)重文件大小作為指標(biāo)。對(duì)比結(jié)果如表1所示。

由表1 可以看出,本文算法YOLOv5s_GCS在mAP上表現(xiàn)優(yōu)異,高于其他算法。相較于YOLOv3,提高了5.1%;相較于Faster R-CNN,提高了6.1%;相較于SSD 算法,提高了12.0%。此外,本文算法的權(quán)重文件大小也低于這3 種算法。與目前較新的YOLOv8 算法比較,YOLOv5s_GCS 在mAP 上也高出了0.6%,且權(quán)重文件大小也要小于YOLOv8 算法??梢?jiàn),YOLOv5s_GCS 具有較高的平均精度,能夠滿足磁瓦表面缺陷的精確識(shí)別,同時(shí)保持較低的權(quán)重文件大小,能夠更好地滿足工業(yè)化環(huán)境下磁瓦缺陷檢測(cè)的部署需求。

YOLOv5s 和YOLOv5s_GCS 的各類(lèi)別平均精度對(duì)比情況如圖5 所示。由圖5 可以看出,除了在Blowhole 類(lèi)的缺陷上,改進(jìn)后的YOLOv5s_GCS 略微地下降了0.2%,其他缺陷類(lèi)別均有不同程度的提升。其中在Fray 類(lèi)別缺陷上,改進(jìn)后的算法相對(duì)于YOLOv5s提高了8.5%。

為了進(jìn)一步驗(yàn)證本文算法引入CA 注意力機(jī)制的可行性,本文選取幾種常用的注意力機(jī)制,與改進(jìn)后的算法進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表2所示。

表 1 主流算法對(duì)比實(shí)驗(yàn)Table 1 Mainstream algorithms compared

表2 注意力機(jī)制對(duì)比實(shí)驗(yàn)Table 2 Attention mechanisms compared

表2 中,YOLOv5s_GSS 表示添加了SE注意力機(jī)制,YOLOv5s_GMS 則是添加CBAM 注意機(jī)制,YOLOv5s_GES表示添加了ECA 注意力機(jī)制。通過(guò)表2 可以看出,YOLOv5s_GCS 的mAP 值要優(yōu)于其他3 種算法。其中,相比YOLOv5s_GSS,mAP 要高出1.3%。這是因?yàn)镾E 注意力機(jī)制僅僅考慮了通道間的信息,而忽略了位置信息,而CA 中加入位置信息能更好的捕捉到缺陷信息,從而提高了檢測(cè)精度。與YOLOv5s_GMS 相比,YOLOv5s_GCS 的mAP 值要高出1.2%,比YOLOv5s_GES 要高出1.6%。雖然在權(quán)重文件大小上YOLOv5s_GCS要稍高于這3種算法,但在實(shí)際生產(chǎn)過(guò)程中,對(duì)缺陷檢測(cè)速率影響不大。

圖 5 不同缺陷類(lèi)別對(duì)比Fig.5 Defect categories compared

最后,設(shè)計(jì)對(duì)比實(shí)驗(yàn),通過(guò)將主流的基礎(chǔ)損失函數(shù)與本文改進(jìn)算法進(jìn)行對(duì)比分析,以更深入地驗(yàn)證本文算法中添加SIoU損失函數(shù)的有效性。結(jié)果如表3所示。

表3 損失函數(shù)對(duì)比實(shí)驗(yàn)結(jié)果Table 3 Results of loss function compared

表 4 網(wǎng)絡(luò)結(jié)構(gòu)消融實(shí)驗(yàn)結(jié)果Table 4 Experimental results of network structure ablation

表3 中,YOLOv5s_GCE 表示加入了EIoU 損失函數(shù),YOLOv5s_GCA 為添加AlphaIoU 損失函數(shù),YOLOv5s_GC 表示使用原有YOLOv5s 損失函數(shù)CIoU,YOLOv5s_GCS 則是本文改進(jìn)算法。通過(guò)表3 實(shí)驗(yàn)數(shù)據(jù)可以看出,加入SIoU 損失函數(shù)后,mAP 值要明顯優(yōu)于加入其他3 種損失函數(shù)后的效果。這是由于SIoU 能夠更好地反映兩個(gè)邊界框的交疊程度。SIoU不僅關(guān)注重疊區(qū)域,還關(guān)注其他的非重合區(qū)域,能更好地反映兩者的重合度,使模型能夠更全面地掌握缺陷信息,從而提高了檢測(cè)精度。

3.4.2 消融實(shí)驗(yàn)

為了驗(yàn)證各個(gè)改進(jìn)模塊對(duì)磁瓦缺陷檢測(cè)的有效性及改進(jìn)算法的性能,對(duì)改進(jìn)算法進(jìn)行消融實(shí)驗(yàn),結(jié)果如表4所示。

表5 中,YOLOv5s_G 表示YOLOv5s 添加GSconv 結(jié)構(gòu),YOLOv5s_GC 表示添加GSconv 結(jié)構(gòu)和CA注意力機(jī)制,最后的YOLOv5s_GCS 是本文的改進(jìn)后的算法。本實(shí)驗(yàn)以YOLOv5s 為基準(zhǔn)模型, 通過(guò)YOLOv5s_G模型實(shí)驗(yàn)結(jié)果可以看出,在neck添加GSconv結(jié)構(gòu)后,模型的權(quán)重大小減少了5.8%,mAP值提升了0.6%。這是因?yàn)镚Sconv結(jié)構(gòu)通過(guò)SC卷積和DW 卷積的混合,使得減輕網(wǎng)絡(luò)的同時(shí)提升檢測(cè)精度。而從YOLOv5s_GC模型的實(shí)驗(yàn)結(jié)果可以看出,模型權(quán)重增加了4%,這是因?yàn)樘砑恿薈A注意力機(jī)制,所以模型參數(shù)量有一定程度的增加。但與此同時(shí),mAP 值提升了1.2%,這證明了CA 注意力機(jī)制的有效性,能夠更好地捕捉缺陷特征,從而提高檢測(cè)精度。再看本文改進(jìn)后的YOLOv5s_GCS,由于引入了SIoU 損失函數(shù)的計(jì)算,相對(duì)于原始模型,其mAP 提升了1.8%。這是由于SIoU 定義了新的懲罰指標(biāo),使得網(wǎng)絡(luò)能夠更快、更準(zhǔn)確的定位缺陷目標(biāo),有效提升了模型的精度。

3.4.3 檢測(cè)效果對(duì)比

分別使用本文算法和Yolov5s算法對(duì)磁瓦圖片進(jìn)行檢測(cè),結(jié)果如圖6所示。

從圖6可以看出,相對(duì)于YOLOv5s算法,改進(jìn)后的算法能夠正確檢測(cè)更多的缺陷,并且,在幾種缺陷類(lèi)別檢測(cè)置信度上都有相應(yīng)的提高。特別是最后一組對(duì)比圖6(e),在無(wú)缺陷樣本的情況下,YOLOv5s 錯(cuò)誤地識(shí)別出了缺陷。表明改進(jìn)算法比YOLOv5s 算法表現(xiàn)得更優(yōu)異,對(duì)缺陷的誤檢率要低于原YOLOv5s算法。

4 結(jié)論

為提高磁瓦表面缺陷檢測(cè)的速度和精度,本文先通過(guò)輕量化neck 端,減輕網(wǎng)絡(luò)負(fù)擔(dān);再引入注意力機(jī)制,加強(qiáng)網(wǎng)絡(luò)計(jì)算能力,提升模型精度;同時(shí),引入新的損失函數(shù),加快網(wǎng)絡(luò)收斂速度,并通過(guò)消融實(shí)驗(yàn)驗(yàn)證了改進(jìn)的可行性。與主流目標(biāo)檢測(cè)算法的對(duì)比實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法在mAP上達(dá)到97.1%,均優(yōu)于相關(guān)算法。本文算法能夠很好地滿足工業(yè)磁瓦缺陷檢測(cè)任務(wù)的需求,并且相對(duì)于原有的Yolov5s模型,平均精度提高了1.8%。此外,較小的權(quán)重文件也易于部署到生產(chǎn)環(huán)境中。

猜你喜歡
注意力卷積精度
讓注意力“飛”回來(lái)
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于DSPIC33F微處理器的采集精度的提高
電子制作(2018年11期)2018-08-04 03:25:38
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
“揚(yáng)眼”APP:讓注意力“變現(xiàn)”
A Beautiful Way Of Looking At Things
GPS/GLONASS/BDS組合PPP精度分析
改進(jìn)的Goldschmidt雙精度浮點(diǎn)除法器
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
东海县| 靖州| 科技| 巴青县| 濮阳县| 常宁市| 大宁县| 呈贡县| 吴堡县| 汤原县| 临颍县| 营山县| 威宁| 沁阳市| 轮台县| 塘沽区| 宁河县| 绥化市| 木兰县| 桦甸市| 苗栗县| 河池市| 云南省| 淅川县| 太和县| 温宿县| 雷山县| 婺源县| 平凉市| 庆元县| 大英县| 观塘区| 四川省| 朝阳区| 淄博市| 普安县| 楚雄市| 东乡族自治县| 休宁县| 吴忠市| 桃园市|