国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

風(fēng)機(jī)葉片小目標(biāo)缺陷精準(zhǔn)檢測(cè)算法研究

2024-12-17 00:00:00張?zhí)孛?/span>張對(duì)軍崔帥黃科雷洋牛霈
關(guān)鍵詞:砂眼小目標(biāo)

摘 要:小目標(biāo)檢測(cè)作為目標(biāo)檢測(cè)任務(wù)中的一種,存在檢測(cè)率低、特征信息不足和漏檢率較高等問題。針對(duì)這些問題,本文提出一種改進(jìn)YOLOv5的小目標(biāo)檢測(cè)算法,將聚集-分發(fā)(Gather-and-Distribute,GD)機(jī)制加入YOLOv5網(wǎng)絡(luò),該機(jī)制通過改進(jìn)卷積和自注意力2種操作提高了多尺度融合能力,用于捕獲不同尺度間像素級(jí)的關(guān)系,取得了延遲和準(zhǔn)確性之間的理想平衡。改進(jìn)后的算法在自制的砂眼數(shù)據(jù)集上進(jìn)行試驗(yàn),平均檢測(cè)精度mAP指標(biāo)達(dá)到98.8%,與基線模型相比,mAP值提高了2.5%,驗(yàn)證了改進(jìn)算法的可行性。

關(guān)鍵詞:砂眼;小目標(biāo);YOLOv5;GD機(jī)制

中圖分類號(hào):TP 391" " " " " " " " " " " " " 文獻(xiàn)標(biāo)志碼:A

目標(biāo)檢測(cè)在計(jì)算機(jī)視覺領(lǐng)域作用十分重要,其核心任務(wù)是對(duì)圖像進(jìn)行目標(biāo)類別識(shí)別和目標(biāo)位置定位。雖然小目標(biāo)檢測(cè)中的砂眼有檢測(cè)率低、特征信息不足和漏檢率較高等缺點(diǎn),但是其在日常生活和工業(yè)領(lǐng)域中應(yīng)用廣泛,價(jià)值很高。

本文研究精確檢測(cè)風(fēng)機(jī)葉片砂眼,采用單階段算法,通過改進(jìn) YOLOv5 提升檢測(cè)速度和準(zhǔn)確率。

針對(duì)上文提到的檢測(cè)率低、特征信息不足以及漏檢率較高等缺點(diǎn),本文將GD機(jī)制引入YOLOv5,改進(jìn)了YOLOv5的信息交換和融合能力。GD機(jī)制通過全局融合多級(jí)特征,并將全局信息注入更高級(jí)別,信息傳遞高效,同時(shí)增加延遲。該模塊可以在局部尺度上結(jié)合來自相鄰層的特征[1],增強(qiáng)模型對(duì)目標(biāo)的表示能力和感知能力。通過這種融合,模型可以更好地捕捉目標(biāo)的細(xì)節(jié)和上下文信息,提高小目標(biāo)和稀疏目標(biāo)的檢測(cè)準(zhǔn)確度。本研究在自制的砂眼數(shù)據(jù)集上進(jìn)行了驗(yàn)證,與YOLOv5網(wǎng)絡(luò)相比,改進(jìn)算法在識(shí)別精度P、召回率R、平均檢測(cè)精度mAP上均有提升。

1 YOLOv5的改進(jìn)

1.1 YOLOv5

YOLOv5分為Backbone、Neck以及 Head 3個(gè)部分。Backbone作為主干網(wǎng)絡(luò),作用是接收輸入圖像并通過一系列卷積、池化和激活操作來提取圖像中的特征信息[3]。YOLOv5 模型結(jié)構(gòu)如圖1所示。Backbone可以將原始圖像轉(zhuǎn)換為一系列特征層,包括圖像中的語義和局部特征。將這些特征層傳遞給后續(xù)的網(wǎng)絡(luò)模塊(例如FPN和Yolo Head)進(jìn)一步處理。

Neck對(duì)特征層進(jìn)行多尺度特征融合,并將這些特征傳遞給預(yù)測(cè)層。YOLOv5采用FPN特征金字塔結(jié)構(gòu),F(xiàn)PN可以使用自上向下和自下向上2種路徑來構(gòu)建多尺度特征金字塔[3],以便在目標(biāo)檢測(cè)和語義分割等任務(wù)中提高性能。自上向下路徑利用上采樣和特征融合來融合不同層次特征,自下向上路徑利用一個(gè)卷積層來融合不同層次特征。這種方式有助于模型在不同尺度上更好地理解和處理輸入數(shù)據(jù),從而提高模型的魯棒性和準(zhǔn)確性。

Head是目標(biāo)檢測(cè)頭,作用是對(duì)特征金字塔進(jìn)行目標(biāo)檢測(cè),它包括卷積層、池化層和全連接層等。在YOLOv5中,Head模塊主要負(fù)責(zé)對(duì)骨干網(wǎng)絡(luò)提取的特征圖進(jìn)行多尺度目標(biāo)檢測(cè)。

1.2 GD機(jī)制

雖然YOLO算法可以通過FPN和PANet進(jìn)行多尺度特征融合[2],但是仍然在一定程度上存在特征信息的提取問題。FPN網(wǎng)絡(luò)的間隔層之間的信息融合需要經(jīng)過中間層,不能直接融合,這樣就會(huì)導(dǎo)致融合速度低、信息丟失等一系列問題,與風(fēng)機(jī)葉片的砂眼檢測(cè)相比,YOLO算法存在檢測(cè)率低、特征信息不足和漏檢率較高等缺點(diǎn)。由于傳統(tǒng)的YOLO算法不能準(zhǔn)確檢測(cè)類似小目標(biāo),因此本文引入GD機(jī)制,結(jié)構(gòu)如圖2所示。

GD機(jī)制收集和分發(fā)數(shù)據(jù),包括特征對(duì)齊模塊(FAM)、特征信息融合模塊(IFM)以及特征信息分發(fā)模塊(Inject)3個(gè)模塊[1]。特征對(duì)齊模塊收集backbone不同尺度的特征圖,利用上采樣或下采樣的方式對(duì)齊。特征信息融合模塊將對(duì)齊后的特征生成全局特征,利用Split模塊拆分為2個(gè)部分,針對(duì)其他尺度進(jìn)行分發(fā)。特征信息分發(fā)模塊利用自注意力機(jī)制將全局特征分割后分發(fā)至各層級(jí)。在Neck階段,Low-GD代替了原始網(wǎng)絡(luò)中PANet模塊的上采樣融合階段,High-GD代替了原始網(wǎng)絡(luò)中PANet模塊的下采樣融合階段。

1.2.1 Low-GD機(jī)制

Low-GD機(jī)制用來提取并融合大尺寸的特征信息。Low-GD分為3個(gè)模塊,分別是Low-FAM 低階特征對(duì)齊模塊、Low-IFM 低階信息融合模塊以及Low-Inject信息分發(fā)模塊。Low-FAM 低階特征對(duì)齊模塊對(duì)小特征圖進(jìn)行雙線性插值,隨后進(jìn)行上采樣,平尺化處理大特征圖,完成下采樣。Low-IFM 低階信息融合模塊包括卷積層模塊、RepBlock模塊以及Split拆分模塊,在Low-FAM 低階特征對(duì)齊模塊通過連接操作得到特征α后,輸入RepBlock模塊得到融合特征β,在卷積層模塊完成調(diào)節(jié)通道后,融合特征β可以適應(yīng)不同模型大小,在Split拆分模塊中拆分特征,得到β1和β2,提取特征。Low-Inject信息分發(fā)模塊的作用是融合相鄰2層的特征,得到轉(zhuǎn)入高階段采集-分發(fā)分支(High-GD)模塊的特征ε,進(jìn)行下采樣。Low-GD 模塊流程如圖3所示。

1.2.2 High-GD機(jī)制

High-GD機(jī)制的流程與Low-GD機(jī)制的流程相似,同樣有3個(gè)模塊,分別為High-FAM高階特征對(duì)齊模塊、High-IFM高階特征融合模塊以及High-Inject信息分發(fā)模塊。與Low-GD模塊不同,從Low-GD機(jī)制得到特征ε后,通過High-FAM高階特征對(duì)齊模塊完成平均池化,將輸入特征的size降維至統(tǒng)一尺寸,再通過鏈接操作合并特征,得到特征θ。High-IFM由Split拆分模塊和Transformer模塊中的多頭注意力機(jī)制(MULTI-Head Attention)以及前饋網(wǎng)絡(luò)(Feed-Forward Network)組成。完成連接操作后,特征θ經(jīng)過Transformer模塊處理得到特征?,為了保證完成拆分操作,在High-GD模塊加入一個(gè)卷積模塊調(diào)整通道,經(jīng)過Split模塊,特征?拆分得到?1以及?2,High-Inject信息分發(fā)模塊融合特征信息。High-GD模塊流程

如圖4所示。

1.3 技術(shù)細(xì)節(jié)

小目標(biāo)具有檢測(cè)率低、特征信息不足和漏檢率較高等缺點(diǎn),傳統(tǒng)的YOLOv5網(wǎng)絡(luò)頸部結(jié)構(gòu)中的FPN結(jié)構(gòu)由多個(gè)分支組成,用于多尺度特征融合,其只能完全融合相鄰層的特征,其他層的信息須通過“遞歸”方式間接獲得。因此本文將上述GD機(jī)制替代傳統(tǒng)的YOLOv5網(wǎng)絡(luò)的Neck中間層,利用特征的對(duì)齊和融合,將各層次信息分配至不同層次,避免了傳統(tǒng)FPN結(jié)構(gòu)中固有的信息丟失,并在不顯著增加延遲的情況下增強(qiáng)了中間層的信息融合能力,在自制的數(shù)據(jù)集上,與傳統(tǒng)的YOLOv5網(wǎng)絡(luò)相比,檢測(cè)精度提升2.5%。

2 試驗(yàn)結(jié)果與分析

2.1 數(shù)據(jù)集介紹

為保證試驗(yàn)結(jié)果可靠、準(zhǔn)確,本次試驗(yàn)采用自制的砂眼數(shù)據(jù)集,砂眼如圖5所示,經(jīng)過挑選,得到320張?jiān)紙D片,為了防止試驗(yàn)中出現(xiàn)過擬合現(xiàn)象,影響試驗(yàn)結(jié)果,本研究將原始圖片經(jīng)過翻轉(zhuǎn)、加噪和剪裁等數(shù)據(jù)增強(qiáng)方式擴(kuò)充至1 800張,圖片的初始分辨率為640 ppi×640 ppi。數(shù)據(jù)增強(qiáng)方式見表1。增強(qiáng)后的砂眼數(shù)據(jù)集按照8∶2的比例分配,有1" 440張圖片作為訓(xùn)練集,360張圖片作為驗(yàn)證集。

表1 數(shù)據(jù)增強(qiáng)方式

增強(qiáng)方式 描述

顏色變化 調(diào)整圖像的對(duì)比度、飽和度

翻轉(zhuǎn) 左右或上下翻轉(zhuǎn)圖像

剪裁 隨機(jī)在圖像中剪裁一塊區(qū)域作為新的圖像

加噪 在圖像上隨機(jī)添加噪聲

旋轉(zhuǎn) 按照一定角度隨機(jī)旋轉(zhuǎn)圖片

2.2 試驗(yàn)評(píng)價(jià)指標(biāo)

本試驗(yàn)在GPU 版本為NVIDIA GeForce GTX 1080 Ti的環(huán)境下完成,訓(xùn)練過程一共300次,優(yōu)化器為SGD,batch_size為16。本文使用識(shí)別精度P、召回率R和平均檢測(cè)精度mAP 這3個(gè)指標(biāo)來評(píng)估目標(biāo)檢測(cè)模型[4]的性能。其中,AP和mAP是通過計(jì)算模型的精準(zhǔn)度和召回率來確定的。精準(zhǔn)度和召回率的計(jì)算過程如公式(1)、公式(2)所示。

(1)

(2)

式中:TP為檢測(cè)的缺陷類別與真實(shí)缺陷類別相同的樣本數(shù)量;FP為檢測(cè)到的缺陷類別與真實(shí)缺陷類別不相同的樣本數(shù)量;FN為真實(shí)存在的缺陷目標(biāo)未被算法正確檢測(cè)出的樣本數(shù)量[5];計(jì)算所有風(fēng)機(jī)葉片缺陷類別精準(zhǔn)度的平均值,計(jì)算過程如公式(3)所示。

(3)

式中:AP(n)為計(jì)算風(fēng)機(jī)葉片表面缺陷單類別精準(zhǔn)度的平均準(zhǔn)確率。;mAP為對(duì)準(zhǔn)確率(Precision)和召回率(Recall)的綜合考量,可以更全面地評(píng)估模型的有效性;n為平均精度的數(shù)量;N為平均精度數(shù)量的和。

2.3 試驗(yàn)結(jié)果分析

為了驗(yàn)證模型對(duì)風(fēng)機(jī)葉片砂眼缺陷的檢測(cè)效果,使用同一數(shù)據(jù)集,試驗(yàn)設(shè)置信息不變,以保證試驗(yàn)的公平性,將YOLOv5與本文的模型進(jìn)行對(duì)比試驗(yàn),對(duì)比指標(biāo)為mAP,對(duì)比結(jié)果見表2。

表2 試驗(yàn)結(jié)果對(duì)比

識(shí)別精度/% 召回率/% 平均檢測(cè)精度/%

YOLOv5 96.5" " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " 96.5 96.3

本文算法 98.6 98.5 98.8

從表2可以看出,與YOLOv5相比,本試驗(yàn)在識(shí)別精度P、召回率R以及平均檢測(cè)精度mAP上達(dá)到了98.6%、98.5%和98.8%。能夠?qū)︼L(fēng)機(jī)葉片砂眼進(jìn)行精準(zhǔn)檢測(cè)。

3 結(jié)論

本文針對(duì)小目標(biāo)存在的檢測(cè)率低、特征信息不足和漏檢率較高等缺點(diǎn),在原來的YOLOv5基礎(chǔ)上,將Gather-and-Distribute機(jī)制引入YOLOv5網(wǎng)絡(luò)中,通過改進(jìn)卷積和自注意力機(jī)制增強(qiáng)了多尺度融合能力,在模型尺度上取得了延遲和準(zhǔn)確性之間的理想平衡,通過自制的砂眼數(shù)據(jù)集證明了試驗(yàn)的可靠性和準(zhǔn)確性。本試驗(yàn)數(shù)據(jù)集有限,還未解決數(shù)據(jù)集的過擬合問題,后續(xù)將增加數(shù)據(jù)集的數(shù)量,提升質(zhì)量,優(yōu)化試驗(yàn)算法,更精準(zhǔn)地檢測(cè)小目標(biāo)。

參考文獻(xiàn)

[1]WANG C, HE W, NIE Y, et al. Gold-YOLO: Efficient object

detector via gather-and-distribute mechanism[J]. Advances in neural

information processing systems,2023,2309(11331):36.

[2]謝椿輝,吳金明,徐懷宇. 改進(jìn)YOLOv5的無人機(jī)影像小目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2023,59(9):198-206.

[3]劉芬,孫杰,張帥,等.基于YOLOv5的紅外船舶目標(biāo)檢測(cè)算法[J].紅外與激光工程,2023,52(10):222-233.

[4]張淳,葛毅,任越,等. 基于優(yōu)化的DeeplabV3+網(wǎng)絡(luò)和高分影像分割浮萍型農(nóng)村黑臭水體[J].遙感技術(shù)與應(yīng)用, 2023,38(6):1433-1444.

[5]張燊,胡林,孫祥娥,等.基于注意力機(jī)制及多尺度融合的紅外船舶檢測(cè)[J].激光與光電子學(xué)進(jìn)展,2023,60(22):256-262.

通信作者:牛霈(1977—),男, 碩士,副高級(jí)工程師,主要研究方向?yàn)樾履茉磾?shù)字化轉(zhuǎn)型、新能源智慧運(yùn)維技術(shù)。

電子郵箱:870631794@qq.com。

猜你喜歡
砂眼小目標(biāo)
大型鑄鋼件散砂控制研究
刷爆朋友圈的“小目標(biāo)”真的有用嗎
月入兩萬元的家庭,如何制定理財(cái)“小目標(biāo)”
田溯寧的安全“小目標(biāo)”
管道 法治管道仍有“砂眼”
AUDI B8/Q5汽車頂蓋激光焊砂眼分析研究
新型電池殼鋼表面十微米級(jí)別“砂眼”的缺陷分析方法
汉中市| 和龙市| 安阳县| 泰宁县| 乐东| 盐亭县| 高淳县| 岑溪市| 迭部县| 台北市| 迁西县| 黄浦区| 定安县| 德保县| 贵港市| 竹北市| 安西县| 北票市| 麻阳| 民勤县| 高青县| 蒙城县| 柏乡县| 永吉县| 达日县| 雷波县| 汨罗市| 阿瓦提县| 杂多县| 上高县| 阿拉尔市| 洪江市| 双柏县| 大名县| 长宁区| 松滋市| 西吉县| 疏勒县| 拉萨市| 西林县| 辽源市|