崔昊楊 楊可欣 葛海華 許永鵬 王浩然 楊 程 戴瑩瑩
①(上海電力大學(xué)電子與信息工程學(xué)院 上海 200090)
②(國網(wǎng)上海市電力公司閘北發(fā)電廠 上海 200438)
③(上海交通大學(xué)電子信息與電氣工程學(xué)院 上海 200241)
電力開關(guān)柜狀態(tài)燈及儀表指示著電力線路的重要狀態(tài)量。目前,在邊端應(yīng)用遙視技術(shù)對(duì)形貌相近、體積微小且分布稠密的開關(guān)柜狀態(tài)燈及儀表進(jìn)行設(shè)備巡檢實(shí)現(xiàn)去人工化是電力行業(yè)日趨明顯的發(fā)展趨勢(shì)。同時(shí),盡管柜上狀態(tài)量可以自動(dòng)上傳至后臺(tái)系統(tǒng),但通過邊端設(shè)備進(jìn)行周期性設(shè)備巡檢及核驗(yàn)仍是保障電力安全不可缺少的一環(huán)。電力開關(guān)柜狀態(tài)實(shí)時(shí)核驗(yàn)的主要難點(diǎn)在于對(duì)復(fù)雜環(huán)境下柜體燈、表目標(biāo)的快速準(zhǔn)確定位,以及對(duì)差異小、尺度小的目標(biāo)特征進(jìn)行精準(zhǔn)分類。目標(biāo)檢測(cè)算法是邊端智能檢測(cè)的有效手段,具有高效的自動(dòng)學(xué)習(xí)和分類能力[1],為電力開關(guān)柜的狀態(tài)實(shí)時(shí)核驗(yàn)提供了可供借鑒的經(jīng)驗(yàn)。
目前,目標(biāo)檢測(cè)算法主要分為兩類:以Regionbased Convolutional Neural Network(R-CNN)為代表的雙階段目標(biāo)檢測(cè)和以YOLO (You Only Look Once)[2,3]為代表的基于端到端的單階段目標(biāo)檢測(cè)。雙階段目標(biāo)檢測(cè)算法包括Fast R-CNN (Fast Region-based Convolutional Neural Network)[4],Faster R-CNN (Faster Region-based Convolutional Neural Network)[5]等,以檢測(cè)精度較高為主要優(yōu)點(diǎn);單階段目標(biāo)檢測(cè)算法有YOLOv3[6,7], YOLOv4[8],YOLOv5[9]和SSD (Singel Shot Detector)[10,11]等,具有優(yōu)秀的檢測(cè)速度。文獻(xiàn)[12]利用單階段多框檢測(cè)器、結(jié)合軟性懲罰非極大值抑制對(duì)變電站小樣本電力設(shè)備進(jìn)行準(zhǔn)確檢測(cè)。文獻(xiàn)[13]通過添加卷積模塊及調(diào)整部分超參數(shù)對(duì)YOLOv3網(wǎng)絡(luò)架構(gòu)進(jìn)行優(yōu)化,可對(duì)高壓開關(guān)設(shè)備的異常發(fā)熱點(diǎn)進(jìn)行準(zhǔn)確、快速的檢測(cè)。文獻(xiàn)[14]以YOLOv4網(wǎng)絡(luò)為基礎(chǔ),結(jié)合注意力機(jī)制對(duì)變電站數(shù)字儀表進(jìn)行實(shí)時(shí)檢測(cè)。上述研究雖然已在小目標(biāo)檢測(cè)方向取得了一定進(jìn)展,但在應(yīng)用方面仍面臨以下困境:(1)應(yīng)用遙視技術(shù)檢測(cè)電力開關(guān)柜上密集、高似然狀態(tài)燈及儀表的研究較少,且現(xiàn)有算法難以滿足準(zhǔn)確檢測(cè)的需求;(2)算法多為深層網(wǎng)絡(luò),參數(shù)量較大,對(duì)GPU性能提出了較高要求,不利于在移動(dòng)邊端的部署;(3)開關(guān)柜數(shù)據(jù)集匱乏,如何合理增強(qiáng)數(shù)據(jù)集、規(guī)避模型欠擬合并加速模型收斂也是需要思考的問題。
針對(duì)上述問題,本文提出一種輕量型GB-YOLOv5m網(wǎng)絡(luò)模型。利用加權(quán)雙向特征金字塔網(wǎng)絡(luò),改進(jìn)模型對(duì)于小尺度密集狀態(tài)燈的特征提取與傳遞融合能力;對(duì)檢測(cè)層及錨定框的數(shù)量、尺寸進(jìn)行優(yōu)化,提高模型對(duì)于柜上小尺度燈表目標(biāo)的定位檢測(cè)能力;通過改進(jìn)主干特征提取網(wǎng)絡(luò),采用Ghost-Net模塊對(duì)卷積過程進(jìn)行簡化,實(shí)現(xiàn)網(wǎng)絡(luò)的輕量化;最后構(gòu)建電力開關(guān)柜狀態(tài)燈及儀表的目標(biāo)檢測(cè)數(shù)據(jù)集,引入預(yù)訓(xùn)練權(quán)重,使模型快速適應(yīng)所構(gòu)建的數(shù)據(jù)集。經(jīng)實(shí)驗(yàn)驗(yàn)證,本文所提算法在電力開關(guān)柜狀態(tài)量遙視檢測(cè)的應(yīng)用中具有較高的實(shí)用性。
YOLOv5目標(biāo)檢測(cè)算法在速度與精度上都具有一定優(yōu)勢(shì)。圖1(a)為輸入模型的開關(guān)柜圖像,圖1(b)為YOLOv5m模型在經(jīng)過第1個(gè)Conv結(jié)構(gòu)后所得的前20張?zhí)卣鲌D,通過對(duì)特征圖進(jìn)行觀察與比較,可知圖1(b)中編號(hào)(2)、編號(hào)(10)、編號(hào)(20)的特征圖包含的有效特征信息極少且相似程度高,浪費(fèi)了計(jì)算空間與時(shí)間,也使得后續(xù)以此特征圖為基礎(chǔ)的卷積等操作難以獲取有效的目標(biāo)特征,導(dǎo)致整體檢測(cè)性能下降。
圖1 YOLOv5m算法首次卷積所得部分特征圖
針對(duì)上述情況,本文提出一種優(yōu)化YOLOv5m網(wǎng)絡(luò),即GB-YOLOv5m模型,該模型的整體網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。模型采用Ghost-Bottleneck-CSPDarknet53結(jié)構(gòu)作為主干網(wǎng)絡(luò),用簡化的卷積對(duì)開關(guān)柜圖像進(jìn)行特征提?。徊捎肂iFPN結(jié)構(gòu)作為Neck部分,提高對(duì)包含豐富表體特征的深層特征圖及大量燈體特征的淺層特征圖的融合能力;在預(yù)測(cè)層通過新增錨框,采用4尺度檢測(cè)頭實(shí)現(xiàn)多尺度檢測(cè),增強(qiáng)模型對(duì)于小型指示燈的特征提取能力,最后對(duì)融合特征進(jìn)行目標(biāo)的定位及分類,輸出全部燈表的具體位置和類別。在模型訓(xùn)練過程中,通過遷移學(xué)習(xí)思想引入預(yù)訓(xùn)練權(quán)重,用于圖像增強(qiáng)后的開關(guān)柜數(shù)據(jù)集,構(gòu)建適用于開關(guān)柜狀態(tài)燈表檢測(cè)的優(yōu)化模型。
圖2 GB-YOLOv5m模型的網(wǎng)絡(luò)結(jié)構(gòu)示意圖
為緩解卷積過后所得特征圖重復(fù)率高的問題,通過GhostNet結(jié)構(gòu)對(duì)卷積過程進(jìn)行簡化,同時(shí)刪除部分冗余特征圖,實(shí)現(xiàn)參數(shù)量縮減與模型壓縮,與常規(guī)卷積對(duì)比如圖3所示。GhostNet中的Ghost模塊采用常規(guī)3×3卷積及線性操作,以少量參數(shù)和計(jì)算量得到大量有效特征圖,通過Ghost卷積代替模型中Conv常規(guī)卷積,將兩個(gè)Ghost模塊疊加并與殘差邊傳入特征信息融合,構(gòu)成如圖4(a)所示的Ghost-Bottleneck結(jié)構(gòu),替換YOLOv5中的Bottleneck模塊,再和C3模塊組合構(gòu)成如圖4(b)所示的Ghost-Bottleneck-CSPDarknet53結(jié)構(gòu),實(shí)現(xiàn)計(jì)算量的減少與模型大小的壓縮。
圖3 Ghost模塊與常規(guī)卷積模塊對(duì)比
圖4 兩個(gè)Ghost模塊
經(jīng)上述操作后,取出首個(gè)Ghost卷積后所得的前20張?zhí)卣鲌D,結(jié)果如圖5所示。通過對(duì)比圖1與圖5可知,Ghost卷積模塊的使用,有效刪減了高相似度的冗余特征圖,并通過線性變換產(chǎn)生包含豐富語義信息的新特征圖,簡化計(jì)算的同時(shí)提取了較為完整的特征信息。
圖5 使用Ghost卷積后的特征圖
由可視化特征圖可知,模型在特征提取的過程中,更多的關(guān)注放在中、大尺度物體上,密集小尺度燈表的特征在卷積的過程中得到的關(guān)注并不夠多,且隨模型網(wǎng)絡(luò)深度增加,在卷積以及上采樣的過程中,每一層網(wǎng)絡(luò)都無法避免丟失部分特征的情況,像素點(diǎn)越小的目標(biāo)在這一過程越有可能被丟失,因此即使最終對(duì)深淺層特征進(jìn)行融合,錨定框在特征信息不良好的特征圖內(nèi)也難以對(duì)小目標(biāo)實(shí)現(xiàn)定位和分類,針對(duì)該問題,本文在檢測(cè)尺度、錨定框大小和數(shù)量以及特征融合方法上做出調(diào)整,使模型更適用于開關(guān)柜數(shù)據(jù)集。
2.2.1 4尺度檢測(cè)策略
YOLOv5采用3尺度特征層進(jìn)行目標(biāo)檢測(cè),當(dāng)前現(xiàn)有的檢測(cè)層尺度分為20×20, 40×40, 80×80 3個(gè)尺度,對(duì)于目標(biāo)較大的對(duì)象有較好的檢測(cè)能力。但通過對(duì)開關(guān)柜待檢測(cè)的狀態(tài)燈及儀表尺寸分析發(fā)現(xiàn),柜體16類目標(biāo)內(nèi),共有9類狀態(tài)燈的像素值在32×32內(nèi),屬于小尺度目標(biāo),因而當(dāng)前3類尺度的錨點(diǎn)框在進(jìn)行檢測(cè)的過程中極易因?yàn)樘卣餍畔⒌膩G失出現(xiàn)對(duì)密集燈表目標(biāo)漏檢或誤檢的情況。
為改善對(duì)這部分目標(biāo)的檢測(cè)效果,在尺寸大小為80×80的特征層后進(jìn)行2次卷積以及上采樣,將所得160×160尺寸的圖片與相同尺寸的第2層特征圖進(jìn)行特征融合,作為輸入預(yù)測(cè)層的目標(biāo)檢測(cè)圖,總共向模型的head部分輸入21, 24, 27, 30層特征融合圖。其中,21層尺寸最大,大小為160×160;30層尺寸最小,大小為20×20,尺寸越大的特征圖包含越多的淺層語義信息,保留了較多的小尺度目標(biāo)特征信息。同時(shí),在保留原始9種錨點(diǎn)框的基礎(chǔ)上,增添大小為(5, 6), (8, 14), (15, 11)的小感受野錨定框,用在低維語義豐富的大尺度特征圖中進(jìn)行目標(biāo)定位。4尺度的特征層最大限度地對(duì)各類燈體及儀表特征進(jìn)行保留,新增錨框?qū)π∧繕?biāo)有很好的敏感度,提升模型對(duì)于分布緊密的小尺度燈的檢測(cè)能力。
2.2.2 跨尺度特征融合網(wǎng)絡(luò)
為提高特征融合效果,目前已構(gòu)建了特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network, FPN)[15,16], 路徑聚合網(wǎng)絡(luò)(Path Aggregation Network,PANet)[17],神經(jīng)架構(gòu)搜索特征金字塔網(wǎng)絡(luò)(Neural Architecture Search-Feature Pyramid Networks,NAS-FPN)[18], BiFPN[19,20]等特征融合網(wǎng)絡(luò)。YOLOv5采用FPN與PAN結(jié)合的方式實(shí)現(xiàn)上下層語義傳遞及融合。但在不同的特征層中,輸入特征具有不同的分辨率,對(duì)輸出特征的貢獻(xiàn)通常并不相等,為進(jìn)一步增強(qiáng)網(wǎng)絡(luò)對(duì)多尺度特征信息的融合能力,更好地平衡不同尺度的特征信息,高效完成特征融合,采用如圖6所示的特征融合單元重復(fù)堆疊替換原始結(jié)構(gòu)。
圖6 BiFPN特征融合單元
BiFPN結(jié)構(gòu)對(duì)輸入的多尺度特征圖,刪除對(duì)跨尺度特征融合貢獻(xiàn)較小的節(jié)點(diǎn);對(duì)同尺度的特征層,為減輕過多層級(jí)導(dǎo)致的特征信息丟失的情況,新增原始輸入節(jié)點(diǎn)到輸出節(jié)點(diǎn)的融合方式;對(duì)輸入特征引入了可學(xué)習(xí)的權(quán)重,對(duì)不同尺度的特征分配差異化權(quán)重,實(shí)現(xiàn)特征的加權(quán)融合。在GB-YOLOv5m中,利用該結(jié)構(gòu)自頂向下的部分,融合3個(gè)相同尺度的特征,在自底向上的結(jié)構(gòu)中完成對(duì)兩個(gè)相同尺度特征的融合,將融合后的特征圖輸入預(yù)測(cè)層,其中,第24層在原基礎(chǔ)上新融入了第4層的淺層特征,第27層新融入了第6層的淺層特征,提高了網(wǎng)絡(luò)對(duì)于深淺層特征的融合度,提升模型對(duì)于各類燈,表的靈敏度,降低漏檢以及誤檢情況的發(fā)生概率,綜合優(yōu)化了模型的目標(biāo)檢測(cè)能力。
在網(wǎng)絡(luò)中,所賦權(quán)重W采用快速正則化方式計(jì)算,各節(jié)點(diǎn)的加權(quán)計(jì)算公式為
其中,ωi表示網(wǎng)絡(luò)可學(xué)習(xí)的權(quán)重,該值始終為正且遠(yuǎn)小于1;Ii表示輸入特征;ε為設(shè)置的極小值,用以保持計(jì)算的穩(wěn)定,經(jīng)實(shí)驗(yàn)測(cè)試,文章選取該值為1×10–4。
為了更為直觀地展現(xiàn)這兩類優(yōu)化策略對(duì)模型性能的影響,對(duì)優(yōu)化方案1, 2以及GB-YOLOv5m模型隨機(jī)抽取相同尺度特征圖,與原始模型的同尺度圖進(jìn)行對(duì)比,驗(yàn)證本文改進(jìn)措施對(duì)于開關(guān)柜狀態(tài)檢測(cè)的優(yōu)化效果,結(jié)果如圖7所示。其中,優(yōu)化方案1采用BiFPN結(jié)構(gòu)融合深淺層特征,優(yōu)化方案2使用4檢測(cè)層用于定位分類。由圖7可知,隨卷積的深入,BiFPN的使用使得深層特征圖中小目標(biāo)的位置信息更為精確;4尺度的檢測(cè)層加強(qiáng)了模型對(duì)于小尺度燈體特征的定位;兩類優(yōu)化策略的共同使用使得GB-YOLOv5m模型在各尺度特征圖中可以獲得較明確的位置信息及清晰的輪廓,實(shí)現(xiàn)對(duì)燈表主體的定位。
圖7 優(yōu)化方案與原YOLOv5m算法特征圖對(duì)比
電力開關(guān)柜內(nèi)部的場景圖像具有較高的保密性,難以獲得大量的數(shù)據(jù)集用于實(shí)驗(yàn)。為防止由于樣本數(shù)量不足導(dǎo)致欠擬合等現(xiàn)象的出現(xiàn),采用遷移學(xué)習(xí)的方法,利用數(shù)據(jù),任務(wù)或模型之間的相似性,將在舊領(lǐng)域?qū)W習(xí)過的模型應(yīng)用于新領(lǐng)域的學(xué)習(xí)過程[21]。VOC數(shù)據(jù)集包含的目標(biāo)尺寸與本文數(shù)據(jù)集具有一定相似性,因此本文首先利用公開的VOC數(shù)據(jù)集對(duì)YOLOv5m模型進(jìn)行預(yù)訓(xùn)練,將訓(xùn)練所得的預(yù)訓(xùn)練模型遷移到本文構(gòu)建的GB-YOLOv5m網(wǎng)絡(luò)后,對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),完成對(duì)網(wǎng)絡(luò)的學(xué)習(xí)。將預(yù)訓(xùn)練權(quán)重載入網(wǎng)絡(luò)作為初始參數(shù),增強(qiáng)模型的泛化能力,加速模型收斂從而提升網(wǎng)絡(luò)的檢測(cè)性能。
實(shí)驗(yàn)依托如圖8所示的上海某電廠實(shí)際工作場景,通過對(duì)圖中所示的5大類目標(biāo)進(jìn)行目標(biāo)檢測(cè),實(shí)現(xiàn)對(duì)10 kV開關(guān)柜的狀態(tài)識(shí)別與檢測(cè)。其中,第1類目標(biāo)為綜合狀態(tài)指示器;第2類為密集小目標(biāo)區(qū),包括“運(yùn)行” “跳位”等9小類高相似小目標(biāo)指示燈;第3~5類分別代表溫濕度狀態(tài)顯示器、帶電情況指示燈以及分合閘狀態(tài)顯示器。以上5大類目標(biāo)全面概括了被檢線路當(dāng)前的運(yùn)行狀態(tài)。實(shí)驗(yàn)采用的處理器為Intel(R) Core(TM) i7-11700H CPU@2.50 GHz,運(yùn)行內(nèi)存16 GB,采用的顯卡為NVIDIA GEFORCE RTX 3060,操作系統(tǒng)為64位Windows10。實(shí)驗(yàn)基于Pytorch1.8.0深度學(xué)習(xí)框架,python 3.8實(shí)驗(yàn)環(huán)境下進(jìn)行,利用CUDA 11.1和CUDNN 8.0.4作為GPU的加速軟件。
圖8 實(shí)驗(yàn)場景及設(shè)備部署情況
對(duì)于數(shù)據(jù)集的處理,本文通過圖像增強(qiáng)的方式對(duì)所拍攝1780張電力開關(guān)柜圖像進(jìn)行處理,獲得包含7550張圖像的新數(shù)據(jù)集。其中,包括1780張?jiān)紙D像,4010張分別進(jìn)行了亮度、清晰度、旋轉(zhuǎn)以及噪聲添加等調(diào)整的增強(qiáng)圖像以及1760張組合使用上述圖像增強(qiáng)方法所得的圖像。按照8:2的比例劃分6040張作為訓(xùn)練集,1510張作為驗(yàn)證集,用以模擬場景可能出現(xiàn)的各類情況下的圖像,提高模型的穩(wěn)定性。實(shí)驗(yàn)采用Labelimg完成標(biāo)簽標(biāo)注工作,共檢測(cè)16類目標(biāo)。在訓(xùn)練參數(shù)的處理上,設(shè)置訓(xùn)練batchsize為8,訓(xùn)練動(dòng)量為0.93;采用余弦退火策略對(duì)模型訓(xùn)練的學(xué)習(xí)率進(jìn)行動(dòng)態(tài)調(diào)整,初始學(xué)習(xí)率設(shè)為0.01,權(quán)重衰減系數(shù)為0.0005;采用Adam作為模型訓(xùn)練的優(yōu)化函數(shù)。訓(xùn)練時(shí),圖片輸入尺寸為640×640,最大迭代次數(shù)為200次。
3.3.1 遷移學(xué)習(xí)結(jié)果分析
按照本文所述參數(shù),采用遷移學(xué)習(xí)的方法對(duì)本文構(gòu)建的開關(guān)柜數(shù)據(jù)集進(jìn)行訓(xùn)練,圖9為訓(xùn)練所得的損失函數(shù)曲線對(duì)比,縱坐標(biāo)代表Loss值,橫坐標(biāo)代表訓(xùn)練輪數(shù)。
由圖9紅綠兩線對(duì)比可知,預(yù)訓(xùn)練模型的使用降低了網(wǎng)絡(luò)的損失函數(shù)值,同時(shí)對(duì)網(wǎng)絡(luò)的收斂起到了加速作用。在預(yù)訓(xùn)練模型及給定訓(xùn)練參數(shù)下,前5輪Loss由0.022下降至0.01左右,訓(xùn)練在5~20輪過程中,損失值平穩(wěn)且緩慢的下降,當(dāng)?shù)?0次時(shí),損失值下降幅度趨近于0,損失值下降并保持在0.008左右。根據(jù)訓(xùn)練中參數(shù)的收斂情況可認(rèn)為,模型獲得了較為理想的訓(xùn)練結(jié)果。同時(shí), GB-YOLOv5m算法的損失函數(shù)曲線在訓(xùn)練過程中始終低于YOLOv5m算法,說明本文設(shè)計(jì)的GB-YOLOv5m算法較原始算法獲得了更小的損失值,具有更好的檢測(cè)性能。
圖9 損失函數(shù)曲線對(duì)比圖
3.3.2 定性結(jié)果分析
為直觀體現(xiàn)GB-YOLOv5m算法的性能,使用該模型與其他模型在同一數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。待檢測(cè)圖中被識(shí)別的目標(biāo)按尺度大小可分為中尺度目標(biāo),其中包含各類狀態(tài)指示燈、 溫濕度控制器、帶電顯示器,以及大尺度目標(biāo)即綜合狀態(tài)指示器。3種不同拍攝角度下采用GB-YOLOv5m算法對(duì)開關(guān)柜進(jìn)行檢測(cè)所得結(jié)果如圖10所示。對(duì)每幅子圖進(jìn)行觀察及總結(jié)可得,本文所提出的GB-YOLOv5m模型在3類拍攝角度檢測(cè)中,不論是對(duì)密集小目標(biāo)指示燈或者是中大目標(biāo)儀表,均實(shí)現(xiàn)了較高質(zhì)量的檢測(cè),對(duì)高密且形貌相似的燈體進(jìn)行了正確定位及分類,未出現(xiàn)漏檢及誤檢情況。
3種拍攝角度下分別使用SSD300, Faster-RCNN, YOLOv4-Tiny, YOLOX, DETR-DC5以及YOLOv5m模型對(duì)開關(guān)柜進(jìn)行檢測(cè),所得結(jié)果如圖11所示。觀察可知,F(xiàn)aster-RCNN, SSD300以及YOLOv4-Tiny模型對(duì)中,大尺度目標(biāo)的幾乎無漏檢,但對(duì)小尺度狀態(tài)燈存在較多的漏檢情況;YOLOX及YOLOv5m模型對(duì)小型密集指示燈同樣存在部分漏檢情況,但漏檢情況逐漸改善;DETR-DC5模型可完成對(duì)各尺度目標(biāo)進(jìn)行分類的任務(wù),但部分背景被錯(cuò)誤地劃分為目標(biāo)燈表,其定位能力尚待提升。圖10、圖11所示結(jié)果的對(duì)比表明,GB-YOLOv5m模型相較于上述6類模型,漏檢率最低,小尺度目標(biāo)檢測(cè)的精確度最高。經(jīng)多場景不同拍攝角度實(shí)驗(yàn)驗(yàn)證,所提模型提升了模型整體的檢測(cè)率,具有較強(qiáng)的泛化性。
圖10 GB-YOLOv5m算法檢測(cè)結(jié)果圖
圖11 不同角度下各對(duì)比算法所得檢測(cè)結(jié)果圖
3.3.3 定量結(jié)果分析
通過3.3.2節(jié)的定性分析可知,GB-YOLOv5m模型可很好地改善密集小目標(biāo)的漏檢情況,同時(shí)提高小尺度目標(biāo)檢測(cè)的精確度;然而,只進(jìn)行定性分析不足以說明GB-YOLOv5m良好的檢測(cè)效果,還需要對(duì)算法進(jìn)行更進(jìn)一步的定量分析。引入精確度P(Precision),R召回率(Recall),均值平均精度mAP,每秒檢測(cè)幀數(shù)fps(frames per second)及模型參數(shù)尺寸Param(Parameters)等評(píng)價(jià)指標(biāo)綜合評(píng)估各類算法的性能。上述評(píng)價(jià)指標(biāo)的計(jì)算公式如式(2)—式(5),對(duì)比結(jié)果如表1所示。
其中,式(2)和式(3)中TP是所有預(yù)測(cè)框中分類正確且邊界坐標(biāo)正確的邊界框數(shù)量,F(xiàn)P是誤檢框數(shù)量,F(xiàn)N是漏檢框數(shù)量,式(4)中AP指各類算法的儀器儀表識(shí)別結(jié)果準(zhǔn)確率平均精度,p(r)指pr曲線上各點(diǎn)的數(shù)值,式(5)中的m是開關(guān)柜面板待檢測(cè)目標(biāo)的種類數(shù)量。
通過對(duì)表1分析可知,對(duì)于可以體現(xiàn)模型整體檢測(cè)性能的均值平均精度mAP而言,由于GBYOLOv5m模型使用了BiFPN結(jié)構(gòu)實(shí)現(xiàn)跨尺度特征融合,在用于預(yù)測(cè)的特征圖中提高淺層特征融合度,同時(shí)又新增上采樣后低維特征明顯的160×160特征圖用于檢測(cè),使得目標(biāo)檢測(cè)精度,尤其是小目標(biāo)的檢測(cè)精度有較大幅度提升,模型mAP值達(dá)到了97.3%,相較于YOLOv5m模型提升了10.2%;相較于雙階段目標(biāo)檢測(cè)算法Faster-RCNN,mAP值提升了54.39%,相較于單階段算法SSD300及YOLOX模型,mAP分別提升了59.31%和12.11%,相較于DETR-DC5網(wǎng)絡(luò),檢測(cè)精度,查全率及mAP均有大幅提升。
表1 GB-YOLOv5m與其他算法對(duì)比結(jié)果
在模型大小方面,GB-YOLOv5m通過GhostNet結(jié)構(gòu)刪減大量冗雜卷積運(yùn)算,轉(zhuǎn)而用線性變換來產(chǎn)生部分所需的特征圖,極大地降低運(yùn)算量與參數(shù)量,使得本模型大小僅為SSD300算法模型大小的13.32%,比YOLOX縮減了18.92 MB,是Faster-RCNN算法模型的51.995%;對(duì)比輕量YOLOv4-Tiny模型,雖然GB-YOLOv5m算法參數(shù)增加了7.38 MB,但實(shí)現(xiàn)了mAP大幅提升,提升了53.7%。
此外,在模型檢測(cè)速度方面,YOLOv5m的CSPDarkNet53主干結(jié)構(gòu)及批處理推理方式,使其速度為對(duì)照組之最,達(dá)43.243 fps,本文提出的GB-YOLOv5m算法,雖然檢測(cè)層尺度的擴(kuò)增增加了一定的計(jì)算量,使得推理時(shí)間增長,但Ghost結(jié)構(gòu)的使用簡化了主干網(wǎng)絡(luò),因此推理檢測(cè)速度較YOLOv5m算法僅產(chǎn)生6 fps左右的下降,fps為37.553,仍優(yōu)于其余各檢測(cè)算法,滿足實(shí)時(shí)監(jiān)測(cè)的需求。
3.3.4 多尺度目標(biāo)檢測(cè)性能分析
通過對(duì)數(shù)據(jù)集包含目標(biāo)進(jìn)行統(tǒng)計(jì)與分析,可劃分出小尺度目標(biāo)9類11個(gè),中尺度目標(biāo)3類3個(gè),大尺度目標(biāo)4類,每張圖像包含其中1個(gè)。其中,APS,APM, APL分別表示小、中、大尺寸目標(biāo)的均值平均檢測(cè)精度,計(jì)算并對(duì)比各算法對(duì)不同尺度目標(biāo)的檢測(cè)能力,實(shí)驗(yàn)結(jié)果包含在表2中。
分析表2中各算法對(duì)于不同尺度目標(biāo)的檢測(cè)結(jié)果可知,GB-YOLOv5m模型在小尺度目標(biāo)的檢測(cè)中APS達(dá)到了95.822%,相較于YOLOv5m的77.6%,提高了18.222%,在小目標(biāo)檢測(cè)的性能上實(shí)現(xiàn)了大幅提升。相較于其他主流的單、雙階段目標(biāo)檢測(cè)算法以及基于Transformer的目標(biāo)檢測(cè)算法在本文所構(gòu)建的數(shù)據(jù)集上的表現(xiàn),GB-YOLOv5m算法在模型大小僅為13.29 MB的情況下,3類尺度目標(biāo)的AP值均高于其他算法。值得注意的是,一般對(duì)算法改進(jìn)時(shí),通常出現(xiàn)的情況是大尺度目標(biāo)的檢測(cè)精度提升效果要優(yōu)于中小型目標(biāo)檢測(cè)的精度提升效果。而在GB-YOLOv5m算法的改進(jìn)中,小尺度目標(biāo)APS值提升幅度最大。上述實(shí)驗(yàn)結(jié)果表明,本文對(duì)于包含豐富稠密小型狀態(tài)燈的開關(guān)柜目標(biāo)檢測(cè)難度大這一問題,有針對(duì)性地做了算法改進(jìn),驗(yàn)證了改進(jìn)算法在實(shí)際應(yīng)用中的可行性以及優(yōu)越性。
表2 GB-YOLOv5m與其他算法對(duì)不同尺度目標(biāo)檢測(cè)精度結(jié)果對(duì)比
在YOLOv5m模型的基礎(chǔ)上,開展添加各類優(yōu)化策略的消融實(shí)驗(yàn),以測(cè)試不同優(yōu)化策略對(duì)于本文所構(gòu)建的數(shù)據(jù)集在模型檢測(cè)性能上的提升效果。通過采用相同的圖像集,參數(shù)設(shè)置以及硬件配置,對(duì)原始YOLOv5m算法,不同優(yōu)化策略相組合的6類算法以及GB-YOLOv5m算法進(jìn)行對(duì)比實(shí)驗(yàn),得到表3中各類算法對(duì)于大、中、小3類尺度目標(biāo)的平均檢測(cè)精度、準(zhǔn)確度、參數(shù)量以及幀數(shù)等結(jié)果。
由表3中數(shù)據(jù)可知,在檢測(cè)性能提升方面,雙向特征金字塔結(jié)構(gòu)以及4檢測(cè)頭結(jié)構(gòu)的使用均對(duì)于小尺度目標(biāo)的檢測(cè)效果具有不錯(cuò)的提升作用。其中,BiFPN結(jié)構(gòu)使得與傳統(tǒng)YOLOv5m算法相比APs值提升了1.41%,4檢測(cè)頭結(jié)構(gòu)的優(yōu)化使得APS值漲幅達(dá)到17.6%。同時(shí),兩者策略的引入幾乎未影響模型對(duì)于中、大型尺度目標(biāo)的檢測(cè)效果,APM和APL的值仍保持在99%附近。
在模型輕量優(yōu)化方面,通過對(duì)比YOLOv5m主干網(wǎng)絡(luò)是否采用GhostNet卷積模塊在目標(biāo)檢測(cè)時(shí)得到的結(jié)果可以發(fā)現(xiàn):該卷積網(wǎng)絡(luò)的使用,可以大幅縮減模型的參數(shù)量,縮減后的模型體積僅為原模型的50%左右,有利于模型在算力有限的移動(dòng)設(shè)備端部署。但GhostNet卷積模塊的引入會(huì)造成算法各性能參數(shù)的下降,通過表3中對(duì)比可知,該模塊會(huì)使得mAP小幅下降1%左右,因此對(duì)模型性能的影響微乎其微,仍可保證對(duì)開關(guān)柜高精確度的檢測(cè)。
表3 基于YOLOv5m模型的消融實(shí)驗(yàn)
除此以外,在檢測(cè)時(shí)效方面,本文所構(gòu)建算法中的改進(jìn)措施可根據(jù)對(duì)幀率的影響分為兩類:第1類為GhostNet結(jié)構(gòu),該結(jié)構(gòu)的使用可以簡化卷積計(jì)算過程,從而達(dá)到提高幀率的效果;第2類為4檢測(cè)層結(jié)構(gòu)及BiFPN結(jié)構(gòu),該類結(jié)構(gòu)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)有一定的復(fù)雜化效果,在原始模型的基礎(chǔ)上增加了上采樣和特征融合等計(jì)算過程,使得計(jì)算量上升,從而導(dǎo)致幀率的下降。通過對(duì)表3中fps數(shù)值的對(duì)比與分析可知,實(shí)驗(yàn)7疊加使用第2類結(jié)構(gòu),使得其幀率為8組中最低;實(shí)驗(yàn)8在實(shí)驗(yàn)7基礎(chǔ)上加入第1類結(jié)構(gòu),使得幀率在此基礎(chǔ)上有所上升。上述數(shù)據(jù)分析結(jié)果與理論分析結(jié)果相符合,驗(yàn)證了本文算法針對(duì)檢測(cè)速率所做改進(jìn)的合理性與有效性,且具有較高的幀率。
針對(duì)變電站開關(guān)柜遙視檢測(cè)中含較多高相似性小尺度目標(biāo)如狀態(tài)燈及儀表,使得現(xiàn)有目標(biāo)檢測(cè)算法出現(xiàn)漏檢、誤檢等檢測(cè)不準(zhǔn)確的問題。本文構(gòu)建了專門的電力開關(guān)柜數(shù)據(jù)集,并提出了一種GBYOLOv5m的輕量型開關(guān)柜目標(biāo)檢測(cè)方法,采用加權(quán)雙向特征金字塔提高網(wǎng)絡(luò)對(duì)于淺層特征的融合能力;通過增設(shè)3個(gè)小感受野的錨點(diǎn)框提高網(wǎng)絡(luò)對(duì)于小目標(biāo)特征的提取能力;采用Ghost-Bottleneck代替主干網(wǎng)絡(luò)中的Bottleneck結(jié)構(gòu),以簡化卷積過程從而實(shí)現(xiàn)模型的輕量化,滿足在移動(dòng)端的部署需要;利用遷移學(xué)習(xí)的思想,在算法中引入預(yù)訓(xùn)練模型,提高模型性能的同時(shí)加速其訓(xùn)練收斂進(jìn)程。實(shí)驗(yàn)結(jié)果表明,提出的模型相較于傳統(tǒng)的YOLOv5m算法在模型大小縮減了1/2的基礎(chǔ)上,mAP值提高了10.2%,達(dá)到97.3%,以更小的參數(shù)量實(shí)現(xiàn)了對(duì)于目標(biāo)數(shù)據(jù)集更高精度的檢測(cè)。此外,提出的算法相較于各類算法都有更好的整體性能,不僅降低了整體的漏檢及誤檢概率,還大大提高了對(duì)小尺度目標(biāo)的檢測(cè)精度,受角度、光照強(qiáng)度等環(huán)境因素的影響較小,具有良好的魯棒性和實(shí)用性,能夠?qū)崿F(xiàn)對(duì)于電力開關(guān)柜狀態(tài)的實(shí)時(shí)核驗(yàn)。
本文所述方法能夠?qū)崿F(xiàn)對(duì)類似開關(guān)柜場景中的目標(biāo)較為準(zhǔn)確的識(shí)別,但在識(shí)別速度上仍有提高的空間。在后續(xù)的工作中,將繼續(xù)研究在實(shí)時(shí)性方面的改進(jìn)措施,進(jìn)一步提高網(wǎng)絡(luò)的實(shí)用性,實(shí)現(xiàn)對(duì)電力開關(guān)柜狀態(tài)的邊端實(shí)時(shí),準(zhǔn)確識(shí)別。