張?bào)K,張金鋒,朱能富,余娟,陳子亮
(1. 南京南瑞集團(tuán)公司,南京 211000; 2.國網(wǎng)安徽省電力公司,合肥 230061; 3.安徽大學(xué)電子信息工程學(xué)院,合肥 230601)
變電站實(shí)時(shí)監(jiān)控技術(shù)近年來得到迅猛的發(fā)展,其中基于圖像處理的電力設(shè)備檢測和識(shí)別技術(shù)成為研究的熱點(diǎn)[1-2]。由于現(xiàn)實(shí)中所拍攝的圖像往往包含許多其它目標(biāo)而不僅僅是感興趣的電力設(shè)備目標(biāo)本身,同時(shí)所拍攝的圖像背景也較為復(fù)雜,如不同的光照條件、拍攝角度等,這使得同一目標(biāo)在不同圖像中呈現(xiàn)不同的模式。
傳統(tǒng)的電力設(shè)備(如絕緣子和刀閘)識(shí)別方法主要依靠目標(biāo)顏色特征和幾何特征,這些方法往往受亮度變化和復(fù)雜背景等因素的影響,導(dǎo)致這些方法往往擁有較差的泛化能力[3]。如文獻(xiàn)[4]提出一種簡單快速的刀閘狀態(tài)識(shí)別方法,該方法直接在刀閘邊界圖像上進(jìn)行Hough變換[5]來確定刀閘的狀態(tài)。文獻(xiàn)[6]提出了一種基于刀閘幾何信息的實(shí)時(shí)刀閘狀態(tài)監(jiān)控算法,該算法主要利用Hough變換獲得刀臂直線,并利用余弦定理計(jì)算兩刀臂直線之間的夾角來判斷刀閘的狀態(tài)。文獻(xiàn)[7]提出絕緣子圖像的多種特征提取技術(shù),包括利用灰度共生矩陣提取圖像的紋理特征、利用二值圖像提取不變矩特征、利用圖像的幾何特征提取邊界輪廓,為絕緣子檢測和識(shí)別提供信息。文獻(xiàn)[8]開發(fā)一種能自動(dòng)識(shí)別刀閘位置及狀態(tài)的機(jī)器人,該方法利用SIFT算法進(jìn)行模板匹配來尋找刀閘位置,然后進(jìn)行Hough變換提取直線以判斷刀閘狀態(tài)。文獻(xiàn)[9]則利用ASIFT算法實(shí)現(xiàn)輸電線路視頻與標(biāo)準(zhǔn)圖庫中絕緣子圖片的匹配,進(jìn)而識(shí)別和定位視頻中的絕緣子。
文獻(xiàn)[10]指出上述方法還存在著穩(wěn)定性較差、抗干擾能力不強(qiáng)等問題。為了提高定位和識(shí)別精度,近年來許多研究者利用機(jī)器學(xué)習(xí)的方法來進(jìn)行絕緣子或刀閘的定位和狀態(tài)識(shí)別。如文獻(xiàn)[10]提出了一種基于霍夫森林的刀閘狀態(tài)識(shí)別方法,利用霍夫森林進(jìn)行刀閘斷開和閉合狀態(tài)模型的學(xué)習(xí),訓(xùn)練出刀閘斷開和閉合兩種狀態(tài)的模型,利用該模型對(duì)輸入圖像進(jìn)行刀閘定位和狀態(tài)識(shí)別。文獻(xiàn)[11]利用SVM(Support Vector Machine)來訓(xùn)練絕緣子圖像,并結(jié)合Hough變換來定位圖像中的絕緣子。文獻(xiàn)[12]將圖像的灰度特征矩陣轉(zhuǎn)換為差異表示矩陣并對(duì)其均值化、歸一化和稀疏化,然后利用DBN網(wǎng)絡(luò)對(duì)得到的差異特征進(jìn)行訓(xùn)練,達(dá)到識(shí)別絕緣子故障的目的。文獻(xiàn)[3]提出一個(gè)六層的卷積神經(jīng)網(wǎng)絡(luò)(CNNs)在絕緣子圖像上訓(xùn)練檢測模型,成功地利用該訓(xùn)練模型精確的定位絕緣子。文獻(xiàn)[13]提出了一種新的差異特征描述方法,可以表示圖像的灰度差異、形狀變化等多個(gè)特征,用于目標(biāo)識(shí)別以及實(shí)際航拍圖像的絕緣子識(shí)別。文獻(xiàn)[14]提出了一種基于全卷積神經(jīng)網(wǎng)絡(luò)(FCNs)的刀閘狀態(tài)識(shí)別方法,該方法利用FCNs對(duì)絕緣子和刀閘目標(biāo)進(jìn)行分割定位,并利用絕緣子和刀閘之間的幾何關(guān)系來識(shí)別刀閘目標(biāo)的狀態(tài)。但這類方法存在多刀閘目標(biāo)相互干擾的問題。
為了解決多刀閘目標(biāo)干擾問題和進(jìn)一步提高刀閘狀態(tài)識(shí)別精度,設(shè)計(jì)了一種基于改進(jìn)深度學(xué)習(xí)的多刀閘狀態(tài)識(shí)別方法。該方法通過改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)來深度學(xué)習(xí)包含絕緣子、刀閘等目標(biāo)的圖像,獲得可靠的訓(xùn)練模型。利用訓(xùn)練模型來定位絕緣子和刀閘的位置,最后根據(jù)絕緣子和刀閘目標(biāo)的幾何形狀特征來識(shí)別刀閘狀態(tài)。實(shí)驗(yàn)結(jié)果表明該方法能夠精確地定位絕緣子和刀閘的位置,顯著提高刀閘狀態(tài)識(shí)別的精度。
卷積神經(jīng)網(wǎng)絡(luò)通過增加網(wǎng)絡(luò)的層數(shù)來模擬人類視覺系統(tǒng)的信息處理過程[15]。從最底層到最頂層逐漸提取圖像信息的有效抽象化特征表示,即越高層數(shù)上的圖像特征具有越強(qiáng)的表征能力。卷積神經(jīng)網(wǎng)絡(luò)可以歸結(jié)為輸入層、多個(gè)隱含層和輸出層,其通過共享網(wǎng)絡(luò)參數(shù)來減少網(wǎng)絡(luò)間的權(quán)重,以此來降低訓(xùn)練樣本數(shù)量和提高訓(xùn)練速度。
設(shè){(x(1),y(1)),(x(2),y(2)),…,(x(n),y(n))}表示訓(xùn)練集,x(i)表示輸入圖像,y(i)表示圖像標(biāo)簽。對(duì)于單一圖像,hw,b(x)表示其預(yù)測得分,則其損失項(xiàng)可表示為:
(1)
整個(gè)訓(xùn)練集的損失函數(shù)可以表示為:
(2)
可使用隨機(jī)梯度下降法來更新權(quán)重和偏置參數(shù):
(3)
式中α表示學(xué)習(xí)率,其作用是調(diào)節(jié)梯度下降的速度。有關(guān)CNNs的具體細(xì)節(jié)見文獻(xiàn)[15]。圖1是CNNs提取圖像深度信息的示意圖。
為了降低特征維數(shù)和避免出現(xiàn)過度擬合(over-fitting),CNNs需要進(jìn)行池化操作[16]。池化操作可以提高特征描述的鑒別力,常用的池化操作是平均池化(mean-pooling)、最大池化(max-pooling)和隨機(jī)池化(Stochastic pooling)操作[17]。然而這些池化操作不足以保證特征表示的魯棒性和有效性,因此文中對(duì)CNNs中池化操作進(jìn)行空間加權(quán)的改進(jìn)以進(jìn)一步提高深度特征表示的魯棒性和有效性。
對(duì)于圖1中的卷積特征映射可以表示為H×W×D維的張量,其中H和W表示卷積特征映射的大小(長度和寬度),D表示特征映射的數(shù)量??臻g加權(quán)掩碼可以表示為K個(gè)H×W大小的池化通道,令Pk表示第k個(gè)空間掩碼的池化特征,則其可以表示為:
(4)
(5)
P是圖1中池化層的輸出,是輸入圖像的K×D特征表示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)
圖2給出了基于改進(jìn)CNNs刀閘狀態(tài)識(shí)別方法的流程圖,文中方法分為訓(xùn)練階段和刀閘狀態(tài)識(shí)別階段。在訓(xùn)練階段,利用攝像機(jī)人工拍攝獲取包含絕緣子、刀閘和不同背景的3 000幅圖像作為訓(xùn)練集。在訓(xùn)練圖像集上構(gòu)建6層的CNNs來迭代訓(xùn)練網(wǎng)絡(luò)模型,訓(xùn)練前利用高斯分布(均值為0,標(biāo)準(zhǔn)差為0.01)來隨機(jī)初始化CNNs的權(quán)值,文中使用ReLU(Rectified Linear Unit)激活函數(shù)代替?zhèn)鹘y(tǒng)的sigmoid激活函數(shù),其數(shù)學(xué)表達(dá)式為f(x)=max(0,x),其目的是避免梯度擴(kuò)散以提高隨機(jī)梯度下降法的收斂速度[17],訓(xùn)練過程見圖2(a)所示。
圖2 文中方法的刀閘狀態(tài)識(shí)別過程
定位絕緣子和刀閘后,需要對(duì)多刀閘狀態(tài)進(jìn)行識(shí)別。文中狀態(tài)識(shí)別條件為:(1)刀閘與絕緣子的連通性,如果一個(gè)刀閘區(qū)域與兩個(gè)絕緣子區(qū)域連通,則認(rèn)為該刀閘處于閉合狀態(tài),否則是處于斷開狀態(tài);(2)刀閘區(qū)域的長寬比,如刀閘區(qū)域的長寬比小于0.2,則認(rèn)為該刀閘處于閉合狀態(tài),否則是處于斷開狀態(tài)。刀閘狀態(tài)識(shí)別過程見圖2(b)所示。
本節(jié)主要驗(yàn)證所提出刀閘狀態(tài)識(shí)別方法的有效性。文中隨機(jī)選擇300幅圖像作為測試,每幅圖像包含多個(gè)絕緣子和刀閘目標(biāo)。所有樣本來源于合肥某小區(qū)變電站,通過固定攝像機(jī)拍攝所得。實(shí)驗(yàn)是在Windows 7環(huán)境下,編譯軟件為Visual Studio 2010和OpenCV 2.4.9,實(shí)驗(yàn)硬件為Pentium Dual-Core CPU 2.50 GHz。所使用深度學(xué)習(xí)的訓(xùn)練時(shí)間為18小時(shí)。
文中利用漏檢率(Miss Rate: MR)和誤檢率(False Positive Rate: FPR)對(duì)絕緣子和刀閘檢測效果進(jìn)行評(píng)價(jià),利用識(shí)別精度(Recognition Precision: RP)對(duì)刀閘狀態(tài)識(shí)別結(jié)果進(jìn)行評(píng)價(jià)[20]。漏檢率MR、誤檢率FPR和識(shí)別精度RP分別定義為:
(6)
(7)
(8)
式中 TP(True Positive)、FP(False Positive)、TN(True Negative)和FN(False Negative)分別為將分類正確的正樣本數(shù)、分類錯(cuò)誤的負(fù)樣本數(shù)、分類正確的負(fù)樣本數(shù)、分類錯(cuò)誤的正樣本數(shù)[20]。
表1給出了文獻(xiàn)[8]、文獻(xiàn)[10]、文獻(xiàn)[14]和本文方法的實(shí)驗(yàn)結(jié)果。從表1可以看出,相對(duì)于文獻(xiàn)[8]、文獻(xiàn)[10]、文獻(xiàn)[14]方法,該方法具有較低的漏檢率和誤檢率,具有較高的刀閘狀態(tài)識(shí)別精度。同時(shí)也可以看出,基于深度學(xué)習(xí)的方法(文中算法和文獻(xiàn)[14]算法)在檢測和識(shí)別上都有很大的優(yōu)勢,特別是文中方法的識(shí)別精度達(dá)到93.2%。圖3~圖6給出了兩組不同刀閘類型、不同場景、不同拍攝角度、不同開關(guān)狀態(tài)、不同背景和不同光照強(qiáng)度下刀閘狀態(tài)識(shí)別結(jié)果。其中圖3(a)是輸入待識(shí)別的刀閘圖像,圖3(b)是基于改進(jìn)CNNs輸出的絕緣子和刀閘目標(biāo)定位結(jié)果,圖3(c)顯示目標(biāo)(絕緣子和刀閘)定位結(jié)果和刀閘狀態(tài)識(shí)別結(jié)果。圖3和圖4是一種刀閘類型的兩幅圖像,圖5和圖6是另一類型的刀閘圖像。從圖3~圖6可知,基于深度學(xué)習(xí)的刀閘狀態(tài)識(shí)別方法可以精確定位絕緣子和刀閘目標(biāo)、識(shí)別不同角度和不同開關(guān)狀態(tài)的刀閘狀態(tài)。對(duì)于一幅待識(shí)別圖像,文中刀閘狀態(tài)識(shí)別時(shí)間小于5 s。
表1 刀閘檢測和狀態(tài)識(shí)別結(jié)果
圖3 圖像1刀閘狀態(tài)(閉合)識(shí)別結(jié)果
圖4 圖像2刀閘狀態(tài)(斷開)識(shí)別結(jié)果
圖5 圖像3刀閘狀態(tài)(閉合)識(shí)別結(jié)果
絕緣子定位和刀閘狀態(tài)識(shí)別是電力傳輸系統(tǒng)中至關(guān)重要的問題,為解決復(fù)雜背景和多刀閘目標(biāo)干擾等因素,提出了一種基于改進(jìn)深度學(xué)習(xí)的刀閘狀態(tài)識(shí)別方法。該方法利用改進(jìn)的CNNs算法精確定位絕緣子和刀閘位置,并利用檢測的刀閘區(qū)域長寬比和與絕緣子區(qū)域的連通性來判斷刀閘的開關(guān)/閉合狀態(tài)。實(shí)驗(yàn)結(jié)果證明了該方法具有較低的漏檢率和誤檢率,及較高的刀閘狀態(tài)識(shí)別精度,可以精確識(shí)別不同角度、不同開關(guān)狀態(tài)、不同背景和不同光照強(qiáng)度下的刀閘狀態(tài),可為現(xiàn)代電網(wǎng)的智能化、無人化改造提供一定的理論基礎(chǔ)。