楊 雨,陳 服,陳柏青,張美勇,鄭依然,楊 超
(1.國網(wǎng)浙江省電力有限公司瑞安市供電公司,浙江 瑞安 325200;2.三峽大學(xué) 電氣與新能源學(xué)院,湖北 宜昌 443000)
隨著我國工業(yè)的快速發(fā)展,人們的生活水平迅速提高,對(duì)用電需求也日益增長,使得電力系統(tǒng)的安全運(yùn)行面臨更大的挑戰(zhàn)。因此,在該需求背景下,可以高效、穩(wěn)定運(yùn)行的智能變電站成為未來變電站建設(shè)的新標(biāo)準(zhǔn)。其中,保護(hù)壓板作為一種提高電力系統(tǒng)穩(wěn)定運(yùn)行的重要設(shè)備,一直是變電站巡檢過程中必不可少的一部分,結(jié)合當(dāng)下最新的計(jì)算機(jī)自動(dòng)化技術(shù),實(shí)現(xiàn)對(duì)變電站保護(hù)壓板的智能化改造。
目前,變電站硬壓板遠(yuǎn)方投退重合閘裝置技術(shù)已經(jīng)日漸成熟,具有足夠的應(yīng)用價(jià)值,但針對(duì)變電站保護(hù)壓板的狀態(tài)識(shí)別仍由人工進(jìn)行讀取,極易造成視覺疲勞,誤檢和漏檢的情況時(shí)有發(fā)生,給電網(wǎng)運(yùn)行安全可靠運(yùn)行帶來隱患。因此,基于圖像識(shí)別技術(shù)的壓板檢測與狀態(tài)識(shí)別算法被應(yīng)用于壓板讀取識(shí)別之中,以代替?zhèn)鹘y(tǒng)人工低效率、高錯(cuò)誤率的讀取工作。
目前,基于圖像識(shí)別技術(shù)的壓板檢測與狀態(tài)識(shí)別算法主要分為三類,一類是基于傳統(tǒng)數(shù)字圖像處理的形態(tài)學(xué)與特征分析[1-6],第二類則是基于機(jī)器學(xué)習(xí)的模式識(shí)別[7-8],最后一類則是基于深度學(xué)習(xí)的圖像處理算法[9-11]。由于基于深度學(xué)習(xí)的方法具有實(shí)時(shí)性高、錯(cuò)誤率低等特點(diǎn),因此,本文通過建立壓板數(shù)據(jù)集,利用YOLO v5算法實(shí)現(xiàn)對(duì)壓板的快速檢測與識(shí)別。
本文的壓板數(shù)據(jù)集采集于轄區(qū)范圍內(nèi)37座變電站各個(gè)保護(hù)屏、測控屏內(nèi)硬壓板,數(shù)據(jù)集共包含500張圖片。分辨率大小為640*640。圖1為數(shù)據(jù)集典型樣本(測試集樣本)。
由圖1可知,壓板開關(guān)圖像具有如下特點(diǎn):由于攝像頭拍攝位置不固定,導(dǎo)致壓板開關(guān)的形狀和大小不規(guī)范;壓板開關(guān)的顏色存在多樣性;壓板背景復(fù)雜,存在大量的設(shè)備標(biāo)簽。部分壓板開關(guān)的顏色與背景存在相似性,前景與背景難以區(qū)分。以上因素均導(dǎo)致傳統(tǒng)算法和機(jī)器學(xué)習(xí)算法對(duì)壓板位置和狀態(tài)檢測識(shí)別困難。針對(duì)上述難點(diǎn),我們收集了大量壓板圖像建立數(shù)據(jù)集,以提高網(wǎng)絡(luò)模型的性能,實(shí)現(xiàn)對(duì)壓板的快速檢測與識(shí)別。
本文所使用的標(biāo)注工具為LabelImg,通過回歸框進(jìn)行標(biāo)記,標(biāo)簽值和回歸框位置以TXT文件存儲(chǔ),標(biāo)記后的圖像如圖1(右)所示。
數(shù)據(jù)集由以下兩部分組成,如表1所示,共分為訓(xùn)練集和測試集,以4:1的比例進(jìn)行劃分,進(jìn)行交叉驗(yàn)證。
表1 數(shù)據(jù)集設(shè)置
與RCNN[12]、Fast-RCNN[13]、Faster-RCNN[14]等基于深度學(xué)習(xí)分類方法所不同的是,YOLO系列[15-18]是基于深度學(xué)習(xí)的回歸方法,YOLO共分為五個(gè)版本,本文所使用的是YOLO v5模型,相比于前幾個(gè)版本而言,其優(yōu)點(diǎn)在于具有更強(qiáng)的實(shí)時(shí)特性和更高的預(yù)測精度。其創(chuàng)新之處在于:(1)將自適應(yīng)的計(jì)算錨框添加到模型之中,以適應(yīng)針對(duì)不同數(shù)據(jù)集樣本分布的錨框計(jì)算功能。(2)通過自適應(yīng)的縮放圖片,減少信息冗余,加快推理速度。(3)推出了四種網(wǎng)絡(luò)結(jié)構(gòu),以應(yīng)對(duì)不同場景的需求。
YOLO v5模型架構(gòu)如圖2所示,整體模型主要分為三個(gè)部分,BackBone特征提取網(wǎng)絡(luò)、Neck特征聚合網(wǎng)絡(luò)以及預(yù)測網(wǎng)絡(luò)Prediction。
圖2 YOLO v5整體結(jié)構(gòu)圖
BackBone特征提取網(wǎng)絡(luò)主要由Focus、CRL和CSP模塊組成,F(xiàn)ocus模塊用于對(duì)輸入的RGB圖像進(jìn)行特征融合與提取,獲取圖像中的基本特征。CRL模塊的組成如圖1所示,其包含一個(gè)卷積層、一個(gè)批歸一化層和一個(gè)Leaky relu激活層。CSP模塊通過特征映射增強(qiáng)網(wǎng)絡(luò)的學(xué)習(xí)能力,包含兩個(gè)分支結(jié)構(gòu),第一分支包含兩個(gè)CBM模塊和x個(gè)殘差模塊,第二分支僅包含一個(gè)CBM模塊,兩個(gè)分支的輸出特征通過Concat操作拼接在一起,與其他的殘差模塊相同,第一分支中的x個(gè)殘差模塊是為了加快收斂和訓(xùn)練速度。其中CBM模塊包含一個(gè)卷積層,一個(gè)批歸一化層和一個(gè)Mish激活層。
圖1 數(shù)據(jù)集典型樣本
Neck中通過SPP模塊提取多尺度特征,并通過特征跳躍連接的方式,將來自于網(wǎng)絡(luò)不同深度的特征拼接在一起。如圖3所示,來自BackBone的輸出特征經(jīng)過兩個(gè)CRL模塊后通過SPP模塊提取到了多尺度特征,再通過兩個(gè)CRL模塊和一個(gè)CSP模塊融合局部和全局上下文信息,經(jīng)過線性上采樣使得空間分辨率與BackBone的輸出分辨率相同,兩者進(jìn)行Concat操作,經(jīng)過融合層后作為下一級(jí)的輸入特征。其中,融合層為級(jí)聯(lián)的CSP模塊和CRL模塊。
為了獲得多個(gè)等級(jí)的輸出特征,Neck網(wǎng)絡(luò)中將來自BackBone的中層特征和上級(jí)的輸入特征線性上采樣后Concat操作,經(jīng)過融合層后生成Prediction的上層輸入特征。并將得到的上層輸入特征經(jīng)過一個(gè)CRL模塊后作為下一層Concat操作的輸入之一,此外,上級(jí)的輸入特征被再次利用,與Prediction的上層輸入特征一起生成Prediction的中間層輸入特征。然后,中間層的特征再次作為Concat操作的輸入,結(jié)合BackBone網(wǎng)絡(luò)的輸出,生成Prediction的最下層輸入特征。這種結(jié)構(gòu)的設(shè)計(jì),充分利用了來自網(wǎng)絡(luò)不同深度的特征信息,將上下文信息(開關(guān)位置)和語義信息(說明這是開關(guān))充分融合。
針對(duì)Neck網(wǎng)絡(luò)的三個(gè)輸出,將用于上層預(yù)測的特征和來自網(wǎng)絡(luò)中間層的特征拼接,再通過CSP和CRL模塊進(jìn)行特征融合。在Prediction部分,來自Neck的三個(gè)輸入將分別通過一個(gè)卷積層,生成用于預(yù)測的三個(gè)特征圖。
YOLO v5根據(jù)網(wǎng)絡(luò)深度和寬度的不同可分為四種網(wǎng)絡(luò)結(jié)構(gòu),分別是YOLO v5s、YOLO v5m、YOLO v5l和YOLO v5x。其中通過修改CSP模塊的殘差模塊的個(gè)數(shù)改變網(wǎng)絡(luò)的深度,修改圖1中編號(hào)①-⑤模塊中的卷積核個(gè)數(shù)改變網(wǎng)絡(luò)的寬度。具體參數(shù)設(shè)置如表2、表3所示。
表2 不同模型CSP模塊具體參數(shù)設(shè)置
表3 不同模型卷積核數(shù)具體參數(shù)設(shè)置
本文所采用的深度學(xué)習(xí)框架為Pytorch1.5,所有訓(xùn)練與測試均在單張RTX 3090上進(jìn)行,所使用的優(yōu)化算法為Adam,其參數(shù)設(shè)置為β1=0.9,β2=0.999,學(xué)習(xí)率設(shè)置為0.01,針對(duì)四種不同的網(wǎng)絡(luò)結(jié)構(gòu),其訓(xùn)練大小分別設(shè)置為12,6,6,2,訓(xùn)練周期設(shè)置為1000。
為了能夠直觀地展示本文中所用算法的性能,本文將會(huì)從以精確度P和召回率R對(duì)網(wǎng)絡(luò)進(jìn)行模型評(píng)估,反映模型對(duì)壓板的誤檢和漏檢。具體定義如下所示:
式(1)中,P為模型的預(yù)測精確度,TP為壓板真實(shí)狀態(tài)為on時(shí),預(yù)測結(jié)果也為on的樣本數(shù),即為預(yù)測正確。FP為壓板真實(shí)狀態(tài)為off時(shí),預(yù)測結(jié)果為on的樣本數(shù),即為預(yù)測錯(cuò)誤。FP越大,則預(yù)測精度越低。
式(2)中,R為模型的預(yù)測召回率,F(xiàn)N為壓板真實(shí)狀態(tài)為on時(shí),預(yù)測結(jié)果為off的樣本數(shù),即為預(yù)測錯(cuò)誤。
同時(shí),為了能夠?qū)⑸疃葘W(xué)習(xí)算法與傳統(tǒng)算法進(jìn)行更加全面的比較,本文還引入了漏檢率和推理速度t對(duì)算法的性能進(jìn)行評(píng)估。
式(3)中,M為對(duì)壓板檢測的漏檢率,MD為壓板開關(guān)漏檢數(shù),TD為壓板開關(guān)可以被檢測到的個(gè)數(shù)。
傳統(tǒng)算法對(duì)保護(hù)壓板的識(shí)別過程主要分為以下幾個(gè)步驟:閾值分割、圖像二值化、位置檢測(邊緣提取)、狀態(tài)識(shí)別。如圖3、圖4所示,分別展示了傳統(tǒng)算法對(duì)壓板開關(guān)的閾值分割和狀態(tài)識(shí)別結(jié)果。由圖3可以看到,閾值分割不能很好地提取灰色開關(guān)的有效區(qū)域,從而使得該類顏色壓板開關(guān)的位置不被獲取,出現(xiàn)大量漏檢,如圖4所示。這種漏檢需要人工復(fù)檢才可以對(duì)結(jié)果進(jìn)行補(bǔ)充,雖然該種計(jì)算機(jī)與人工結(jié)合的方式高于純?nèi)斯ぷR(shí)別的效率和準(zhǔn)確率,但并不符合變電站智能化的要求和發(fā)展趨勢。
圖3 傳統(tǒng)算法閾值分割結(jié)果
圖4 傳統(tǒng)算法狀態(tài)識(shí)別結(jié)果
如表4所示,展示了YOLO v5不同網(wǎng)絡(luò)結(jié)構(gòu)和傳統(tǒng)算法下的精確度P、召回率R、漏檢率M和推理時(shí)間t。隨著網(wǎng)絡(luò)深度與寬度的不斷增加,網(wǎng)絡(luò)的精確度和召回率也隨之提升,但網(wǎng)絡(luò)的計(jì)算量大大增加也導(dǎo)致了推理速度的降低,從表中可以看出,YOLO v5x的精確度高達(dá)93.63%,遠(yuǎn)遠(yuǎn)高于傳統(tǒng)算法的87.45%(注意,計(jì)算精確度時(shí)不考慮漏檢),且其推理時(shí)間僅有29ms,低于傳統(tǒng)算法的計(jì)算時(shí)間,滿足實(shí)時(shí)性需求。并且,基于深度學(xué)習(xí)的算法其漏檢率為0,而傳統(tǒng)算法受限于各種條件,漏檢率為12.69%,兩者相比,本文所使用的基于深度學(xué)習(xí)的算法優(yōu)勢明顯,更加適合應(yīng)用到保護(hù)壓板位置檢測與狀態(tài)識(shí)別之中。
表4 不同算法的精確度、召回率、漏檢率和推理時(shí)間
圖5從左到右依次為v5s,v5m,v5l,v5x的推理結(jié)果,從推理結(jié)果可以看出,YOLO v5的所有模型均都可以很好的對(duì)壓板的位置做出檢測并預(yù)測狀態(tài),相比較于傳統(tǒng)算法不能有效的對(duì)前景和背景進(jìn)行準(zhǔn)確分割,基于深度學(xué)習(xí)的方法可以更多的基于空間特征而非顏色特征對(duì)壓板開關(guān)的位置進(jìn)行判斷。從預(yù)測的置信率可以看出,在杜絕漏檢的前提下,該類難以識(shí)別區(qū)域的置信率平均高達(dá)85%,與其他易于分割識(shí)別區(qū)域的置信率不相上下。
圖5 不同網(wǎng)絡(luò)結(jié)構(gòu)的推理結(jié)果圖
由于不同結(jié)構(gòu)的網(wǎng)絡(luò)均可對(duì)壓板狀態(tài)做出較好識(shí)別,在實(shí)際應(yīng)用中,我們可以根據(jù)不同場景使用不同級(jí)別的檢測網(wǎng)絡(luò)。其中v5s模型雖然在準(zhǔn)確率上略低于v5x模型,但前者的推理速度僅有后者的37.9%,適用于緊急的巡檢任務(wù)中。并且更小的模型更加易于與微型計(jì)算機(jī)設(shè)備的計(jì)算能力相匹配,相對(duì)于大型網(wǎng)絡(luò)而言更有優(yōu)勢,降低了計(jì)算成本,更加易于實(shí)現(xiàn)變電站檢測設(shè)備的智能化改造和應(yīng)用。
YOLO v5x模型在推理速度上遠(yuǎn)不及YOLO v5s模型,但前者的預(yù)測精度卻遠(yuǎn)高于后者。雖然部署該類模型在微型計(jì)算機(jī)上成本偏高,但可以將其部署在數(shù)據(jù)中心,通過互聯(lián)網(wǎng)將數(shù)據(jù)傳回預(yù)測并將結(jié)果返回,以滿足對(duì)高精度任務(wù)的需求。
本文利用YOLO v5算法,可快速準(zhǔn)確地實(shí)現(xiàn)對(duì)變電站壓板的檢測和狀態(tài)識(shí)別,其識(shí)別速度可達(dá)90fps/s,精度最高可達(dá)93.63%,效率和準(zhǔn)確率遠(yuǎn)遠(yuǎn)高于當(dāng)下通過人工進(jìn)行校驗(yàn)讀取。接下來的目標(biāo)是將算法應(yīng)用于嵌入式設(shè)備中,實(shí)現(xiàn)與遠(yuǎn)程投退重合閘裝置的聯(lián)合運(yùn)用,以加快實(shí)現(xiàn)變電站智能化進(jìn)程。