馬世森 劉國(guó)巍
摘要:針對(duì)傳統(tǒng)火災(zāi)系統(tǒng)預(yù)警不及時(shí)、容易誤報(bào)等問(wèn)題,文章提出了一種基于改進(jìn)YOLOv5的火災(zāi)檢測(cè)算法。為了增強(qiáng)網(wǎng)絡(luò)對(duì)火焰的方向和位置信息的敏感度,在模型中引入CA( Coordinate Attention)注意力機(jī)制:為了提高回歸精度和收斂速度,使用損失函數(shù)SIOU替換CIOU。改進(jìn)的YOLOv5算法的精確率和平均精度達(dá)到了74. 2%和69.4%.相較于標(biāo)準(zhǔn)算法的精確率和平均精度提高了8.8%和2.8%.優(yōu)化定位框和誤檢情況。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的YOLOv5算法模型提高了火災(zāi)檢測(cè)的準(zhǔn)確性和實(shí)時(shí)性。
關(guān)鍵詞:預(yù)警:火災(zāi)檢測(cè):YOLOv5:注意力機(jī)制:損失函數(shù)SIOU
中圖分類(lèi)號(hào): TP391.4 文獻(xiàn)標(biāo)志碼:A
0 引言
火如水一樣,能為生活提供便利,也能讓人們蒙受巨大的損失甚至付出生命。傳統(tǒng)的火災(zāi)預(yù)警檢測(cè)系統(tǒng)是利用溫濕度和煙霧感應(yīng)器檢測(cè)周?chē)h(huán)境中的溫度、濕度、煙霧氣體密度等變化,從而做出判斷[1],存在著預(yù)警不及時(shí)、準(zhǔn)確度低、容易誤報(bào)的問(wèn)題。
近年來(lái),深度學(xué)習(xí)在檢測(cè)、識(shí)別等領(lǐng)域迎來(lái)了空前繁榮[2]。深度學(xué)習(xí)的火災(zāi)檢測(cè)技術(shù)檢測(cè)速度快、精度高、不受環(huán)境影響限制、成本低。針對(duì)傳統(tǒng)的火災(zāi)檢測(cè)模型所存在的不足,本文基于靈活度高的YOLOv5算法模型進(jìn)行改進(jìn)。為了增強(qiáng)網(wǎng)絡(luò)對(duì)火焰特征的方向和位置等參數(shù)信息的敏感度,在模型中引入了CA( Coordinace Attention)注意力機(jī)制:為了提升回歸定位精度和收斂速度使用損失函數(shù)SIOU替換CIOU。做好消融實(shí)驗(yàn)繪制數(shù)據(jù)表,并通過(guò)對(duì)比其它算法證明改進(jìn)算法對(duì)火災(zāi)預(yù)警具有的意義。
1
YOLOv5目標(biāo)檢測(cè)算法原理
YOLO系列發(fā)展到Y(jié)OLOv5以來(lái)一直在更新[3].本文改進(jìn)的是YOLOv5 6.0版本。主要由圖像輸入端、主干網(wǎng)絡(luò)( Backbone)、頸部(Neck)和輸出端4部分組成。根據(jù)寬、深度的不同,主要提供s,m,l,x4個(gè)模型。本文選用速度快精度較好的YOLOv5s為基準(zhǔn)模型,其輸入端使用聚類(lèi)算法采用白適應(yīng)錨框功能得到最佳錨框值,對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理得到豐富數(shù)據(jù)集:主干網(wǎng)絡(luò)將之前版本Focus替換成卷積層Conv.使用C3 - Darknec模塊解決出現(xiàn)的梯度信息重復(fù)問(wèn)題,使模型輕量化,并且在骨干網(wǎng)絡(luò)末端加入SPPF模塊:頸部網(wǎng)絡(luò)采用特征金字塔和白上而下的路徑聚集網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合的方式:輸出端對(duì)頸部輸出的特征圖通過(guò)損失函數(shù)CIOU和經(jīng)典非極大值抑制來(lái)實(shí)現(xiàn)對(duì)不同大小目標(biāo)的預(yù)測(cè)。
2 YOLOv5s算法改進(jìn)
2.1 CA注意力機(jī)制
為了使算法模型增強(qiáng)網(wǎng)絡(luò)對(duì)特征的方向和位置等信息的敏感度,在主干網(wǎng)絡(luò)結(jié)構(gòu)中引用了一種將位置信息嵌入到通道的CA注意力機(jī)制[4]。通過(guò)精確的位置信息編碼,對(duì)特征圖的寬度和高度兩個(gè)位置全局平均池化,給定輸入值后使用尺寸為(H,1)或(1,W)的pooling kernel分別沿著水平和垂直坐標(biāo)對(duì)每個(gè)通道進(jìn)行編碼。表示寬度為w的第c通道的輸出函數(shù)和高度為h的第c通道的輸出函數(shù)如式(1)和式(2)所示。
將上述池化后的特征圖進(jìn)行w維度上的拼接操作,經(jīng)過(guò)一個(gè)卷積和非線(xiàn)性激活函數(shù)的操作在通道維度拆分,通過(guò)卷積和Sigmoid激活函數(shù)獲得對(duì)應(yīng)權(quán)重最終帶有注意力權(quán)重機(jī)制的特征圖。為了加強(qiáng)特征提取對(duì)位置信息的效果,將CA加在網(wǎng)絡(luò)模塊SPPF的前面。
2.2 SIOU損失函數(shù)
已知YOLOv5的損失函數(shù)是由Bhox回歸損失、目標(biāo)置信度損失和類(lèi)別損失3部分組成,在YOLOv5的網(wǎng)絡(luò)結(jié)構(gòu)使用CIOU loss作為Bhox回歸損失。CIOU函數(shù)將目標(biāo)和邊框的距離、尺度等考慮在內(nèi),使目標(biāo)框在回歸時(shí)候變得準(zhǔn)確和穩(wěn)定,函數(shù)表達(dá)如式(3)所示。預(yù)測(cè)框的交并比,A和B表示真實(shí)和預(yù)測(cè)框;p表示預(yù)測(cè)和真實(shí)框的中心點(diǎn)的歐式距離:c表示包含預(yù)測(cè)和真實(shí)框最小區(qū)域的對(duì)角線(xiàn)長(zhǎng)度:d表示權(quán)重函數(shù):v表示用來(lái)度量真實(shí)和預(yù)測(cè)框的長(zhǎng)寬比的相似性。為了提高YOLOv5模型的回歸精度和收斂速度,引入了一種新的SIOU損失函數(shù)替換原來(lái)的CIOU,由Angle,DistanCe.Shape和IOU4個(gè)Cost函數(shù)組成,具體如下列公式所示。
上述公式對(duì)距離重新定義表達(dá)y=2 -A,y表示被賦予時(shí)間的距離值,p表示預(yù)測(cè)和真實(shí)框中心歐式距離;θ值定義每個(gè)數(shù)據(jù)集Shape其值的唯一性;結(jié)合IOU和上述公式得出最終損失函數(shù)表達(dá)式。保證數(shù)據(jù)集和參數(shù)以及訓(xùn)練次數(shù)的設(shè)置相同,最后在理論基礎(chǔ)下的實(shí)驗(yàn)結(jié)果表明.SIOU較CIOU能更好地提高回歸定位精度和速度。
3 實(shí)驗(yàn)結(jié)果和分析
3.1 實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)操作平臺(tái)操作電腦系統(tǒng)為Windowsll. 64位,顯卡為NVIDIA GeForce RTX 3050.處理器是Inrel@
Core'rMi5 - 12500 H 2.50 GHz.運(yùn)行內(nèi)存為16 G。整個(gè)實(shí)驗(yàn)的學(xué)習(xí)框架是PyTorch l.12.實(shí)驗(yàn)環(huán)境是PVthon 3.8,使用PvCharm編譯工具仿真實(shí)驗(yàn),使用GPU加速軟件為CUDA 11.3。實(shí)驗(yàn)訓(xùn)練中設(shè)置EpoChs為300, Batch-size為8,Image -size為640x640n
3.2 準(zhǔn)備數(shù)據(jù)集
實(shí)驗(yàn)使用的數(shù)據(jù)集是通過(guò)飛槳AI Studio網(wǎng)站和視覺(jué)中國(guó)網(wǎng)站等獲取圖片,包括森林和草原火災(zāi)、戶(hù)外建筑火災(zāi)、實(shí)驗(yàn)室火災(zāi)等,整理后得到總共2 059張圖像作為數(shù)據(jù)集,采用標(biāo)注工具Labelimg進(jìn)行數(shù)據(jù)集標(biāo)注,標(biāo)注類(lèi)別為fire.保存為YOLO系列的txt格式。再將其按8:2比例隨機(jī)分配為訓(xùn)練集和驗(yàn)證集,得到1 647張訓(xùn)練圖和412張驗(yàn)證圖。
3.3 評(píng)價(jià)指標(biāo)
本實(shí)驗(yàn)中YOLOv5主要采用準(zhǔn)確率P、召回率R、平均精度AP、平均精度均值mAP和檢測(cè)速度FPS等作為模型性能的評(píng)價(jià)指標(biāo)。具體計(jì)算公式如下所示。
其中.P表示所有預(yù)測(cè)目標(biāo)中正確的比例,TP和FP指的是正負(fù)樣本預(yù)測(cè)的正負(fù)樣本個(gè)數(shù):R表示所有已標(biāo)注目標(biāo)中正確的比例,F(xiàn)N指的是正樣本預(yù)測(cè)出負(fù)樣本的個(gè)數(shù):AP表示以R為橫軸,P為縱軸形成曲線(xiàn)的面積;mAP用來(lái)表示衡量精度的識(shí)別。
3.4 消融實(shí)驗(yàn)
針對(duì)改進(jìn)的YOLOv5算法做了對(duì)應(yīng)的消融實(shí)驗(yàn)對(duì)比驗(yàn)證,改進(jìn)點(diǎn)l為在主干網(wǎng)絡(luò)中加入CA注意力機(jī)制而增加獲取位置信息的敏感度,改進(jìn)點(diǎn)2為修改損失函數(shù)用SIOU函數(shù)替換原模型中CIOU去加強(qiáng)輸出端的回歸精度和收斂速度,具體實(shí)驗(yàn)數(shù)據(jù)如表1所示。
從表l中序號(hào)2和3的實(shí)驗(yàn)得知,在YOLOv5模型中分別加入2種不同改進(jìn)措施都可以有效地提高算法的精度;序號(hào)4得知,最終改進(jìn)YOLOv5算法相比于標(biāo)準(zhǔn)算法,主要在精確率和mAP@0.5上分別提高了8. 8%和2.8%.有效地提高了火災(zāi)檢測(cè)的精度。
3.5 算法對(duì)比實(shí)驗(yàn)
為了和其他算法做比較,要保證所有的實(shí)驗(yàn)都在相同的實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集上進(jìn)行,選擇了YOLOv3和算法SSD對(duì)比[5-6].并對(duì)主要評(píng)價(jià)數(shù)據(jù)進(jìn)行比較,如表2所示。
從表2可以得知,對(duì)比SSD和YOLOv3算法,改進(jìn)YOLOv5在平均精度上最高;在精確率上雖然低于SSD算法,相較于YOLOv3.YOLOv5還是有明顯提高的。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的YOLOv5算法模型提高了火災(zāi)檢測(cè)的準(zhǔn)確性。
4 結(jié)語(yǔ)
本文提出了一種基于改進(jìn)YOLOv5的火災(zāi)檢測(cè)算法,在算法模型主干網(wǎng)絡(luò)加入CA坐標(biāo)注意力機(jī)制去提高網(wǎng)絡(luò)獲取位置信息的敏感度;修改輸出端的損失函數(shù)用SIOU替換CIOU來(lái)提高回歸精度和收斂速度,從而提高檢測(cè)性能。實(shí)驗(yàn)表明,改進(jìn)后的算法可以很好地針對(duì)火災(zāi)情況提高圖像檢測(cè)的性能。后期的研究中,保證模型精度的同時(shí),對(duì)網(wǎng)絡(luò)進(jìn)行輕量化處理,并結(jié)合到移動(dòng)端設(shè)備或低端設(shè)備中,提高火災(zāi)檢測(cè)的實(shí)時(shí)性。
參考文獻(xiàn)
[1]王繼武,王勝.林木智能化火災(zāi)預(yù)警系統(tǒng)設(shè)計(jì)——基于物聯(lián)網(wǎng)和圖像處理[J].農(nóng)機(jī)化研究,2022( 7):224-227.
[2]祝玉華,司藝藝,李智慧.基于深度學(xué)習(xí)的煙霧與火災(zāi)檢測(cè)算法綜述[J].計(jì)算機(jī)工程與應(yīng)用,2022(23):1-11.
[3]蘇凱第,趙巧娥.基于YOLOv5算法的無(wú)人機(jī)電力巡檢快速圖像識(shí)別[J].電力科學(xué)與工程,2022(4):43-48.
[4]肖粲俊,潘睿志,李超,等.基于改進(jìn)YOLOv5s絕緣子缺陷檢測(cè)技術(shù)研究[J].電子測(cè)量技術(shù),2022(24):137-144.
[5]楊萍,房可佳,謝元莎.基于改進(jìn)YOLOv3的火災(zāi)識(shí)別關(guān)鍵技術(shù)研究[J].物聯(lián)網(wǎng)技術(shù).2022(3):21-23.
[6]田靚靚.基于SSD網(wǎng)絡(luò)的蘋(píng)果葉片病害檢測(cè)方法研究[D].咸陽(yáng):西北農(nóng)林科技大學(xué).2022.
(編輯沈強(qiáng))