馬文婧,鄭欣,鮑克磊,張偉欣
(廣東電網(wǎng)有限責(zé)任公司廣州供電局,廣東 廣州 511400)
特高頻檢測與氣體檢測法廣泛應(yīng)用于帶電監(jiān)測中。該方法具有檢測頻率高和靈敏度高等優(yōu)點,然而對于放電缺陷類型識別方面還有一些不足,后者檢測結(jié)果比較準(zhǔn)確,但對于突發(fā)情況反應(yīng)較慢[1-2]。而聲音識別由于其易于分類識別、低成本以及快速性廣泛應(yīng)用于生產(chǎn)生活領(lǐng)域,隨著電網(wǎng)智能化的發(fā)展,越來越多的目光集中到這一領(lǐng)域[3]。
傳統(tǒng)的聲音識別主要是以高斯混合模型(gaussian mixture model,GMM)為分類器,進(jìn)行模型訓(xùn)練,完成識別任務(wù),但存在著識別率低以及尋找階數(shù)困難等問題[4-5]。此外基于時頻特征的識別受聲音幅值以及頻率影響較大,針對這種情況,本文使用聲音信號語譜圖和卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方式來提取聲音信號的特征參數(shù)[6-7]。生成的網(wǎng)絡(luò)模型具備處理數(shù)據(jù)能力強(qiáng)、識別率高以及便于優(yōu)化等優(yōu)點。對比文獻(xiàn)[8]20、文獻(xiàn)[9]56,本文方法能夠識別的聲音信號更加多樣化,同時在準(zhǔn)確率上也有所提升[10-11]。
信號特征能反映聲音的重要本質(zhì)參數(shù),而信號又處于非穩(wěn)態(tài)且時變的狀態(tài),因而聲音信號需要進(jìn)行預(yù)處理,便于提取特征。預(yù)處理主要是對聲音信號進(jìn)行預(yù)加重、分幀以及加窗處理。
預(yù)加重一般通過數(shù)字濾波器實現(xiàn),其傳遞函數(shù)如式(1)所示。
H(z)=1-ωz-1
(1)
式中:ω為常量,取值范圍在0.9~1之間;z為原離散信號的Z變換。設(shè)原始聲音信號為s(n),經(jīng)預(yù)加重后如式(2)所示。
s(n)=s(n)-ωs(n-1)
(2)
式中:ω取0.97;n為離散信號點數(shù)。分幀計算公式如式(3)所示。
(3)
式中:LN、LW、LI分別為聲音的信號長度、幀長和幀移。本文設(shè)置幀長為1 024,幀移為512。通過分幀將長為LN聲音信號劃分為f個幾十毫秒的小段信號,這時可以將其視作穩(wěn)態(tài)信號,采用漢明窗,其窗函數(shù)如式(4)所示。
(4)
式中:Whm(n)為漢明窗的窗函數(shù);N為加窗的離散信號點數(shù);LN、LW分別為聲音的信號長度和幀長。
相較于矩形窗以及漢寧窗,漢明窗的第一旁瓣衰減較大,頻譜泄露較少。加窗實際是用窗函數(shù)與分幀后的信號進(jìn)行相乘。
y(n)=S(n)Whm(n)
(5)
式中:y(n)為加窗處理后的離散信號;S(n)為加窗前的離散信號。
由式(2)、式(3)可知:當(dāng)n處于0到LW-1范圍時,y(n)是分幀信號與窗函數(shù)的乘積;當(dāng)n不處于0到LW-1范圍時,y(n)為0,具有低通性質(zhì)。分幀加窗后的聲音信號頻率混雜,需要再進(jìn)一步處理,將每幀聲音信號進(jìn)行快速傅里葉變換,然后轉(zhuǎn)換為各種頻率的波形,并用能量表示信號的強(qiáng)弱程度,如式(6)所示。
(6)
式中:P為能量大?。籒為FFT取點個數(shù),為512;yi為第i個處理后的信號。
通過對分幀加窗處理的每一幀聲音信號進(jìn)行快速傅里葉變換來得到語譜圖。語譜圖著重反映了聲音信號的動態(tài)頻譜,能直觀體現(xiàn)聲音信號在時間軸上的頻率以及聲音信號能量強(qiáng)度。耐壓試驗過程中的放電聲音信號以及對應(yīng)的語譜圖如圖1所示。
圖1(a)、圖1(c)、圖1(e)展示了信號幅值從出現(xiàn)到消失的動態(tài)變化情況。圖1(b)、圖1(d)、圖1(f)展示了信號頻譜從出現(xiàn)到消失的動態(tài)變化情況。坐標(biāo)點顏色的深淺表示信號能量的大小,顏色越深,表示能量越大,反之,表示能量越低。相較于短時能量特征參數(shù),語譜圖能更清晰直觀反映聲音信號的整體特性[12-13]。
圖1 放電聲音信號波形以及語譜圖動態(tài)變化過程
卷積神經(jīng)網(wǎng)絡(luò)主要分為卷積層、池化層和全連接層。一個基本的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示[14]。
圖2 卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
卷積網(wǎng)絡(luò)搭建完成后將語譜圖構(gòu)成的訓(xùn)練集導(dǎo)入輸入層,然后對其進(jìn)行訓(xùn)練,訓(xùn)練后再用測試集檢驗網(wǎng)絡(luò)的性能,得出識別準(zhǔn)確率。卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程圖如圖3所示。卷積網(wǎng)絡(luò)訓(xùn)練完成后,可以用于識別,將測試集的數(shù)據(jù)導(dǎo)入網(wǎng)絡(luò)模型,得到相應(yīng)的識別準(zhǔn)確率[15]。
圖3 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程圖
試驗聲音數(shù)據(jù)中包含五類不同的聲音信號,分別是沖擊放電聲、球隙放電聲、工頻放電聲、電暈放電聲以及空氣噪聲。其中訓(xùn)練集占70%,測試集占30%。搭建了三個不同結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò),采用Adam優(yōu)化函數(shù),結(jié)構(gòu)如圖4所示[16]。
圖4 不同結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)在線監(jiān)測流程圖
圖4中模型a、模型b和模型c在結(jié)構(gòu)上有所不同。三個模型的卷積核大小為3×3,采用2×2最大池化層[17]。三種網(wǎng)絡(luò)分別進(jìn)行10次獨立訓(xùn)練,每次訓(xùn)練周期為30,得到的測試集準(zhǔn)確率曲線如圖5和表1所示。
圖5 三個不同結(jié)構(gòu)模型測試集準(zhǔn)確率曲線
表1 三種網(wǎng)絡(luò)平均準(zhǔn)確率 %
可以看到表1中的訓(xùn)練集平均準(zhǔn)確率>94%,然而測試集平均準(zhǔn)確率相差較大,表明發(fā)生了過擬合現(xiàn)象。為此采用Dropout策略[18-19],在每個模型的全連接層之前加入一個Dropout層,分別構(gòu)成模型a、模型b、模型c。采用該策略后,再次進(jìn)行訓(xùn)練和測試,同樣采用10次獨立訓(xùn)練,每次訓(xùn)練周期30,得到的測試集準(zhǔn)確率曲線如圖6和表2所示。
圖6 Dropout后三個模型測試集準(zhǔn)確率曲線
表2 Dropout后三種網(wǎng)絡(luò)平均準(zhǔn)確率 %
可以看到,加入Dropout優(yōu)化后,三種網(wǎng)絡(luò)的平均準(zhǔn)確率>94%,其中模型c的準(zhǔn)確率最高。對模型c的每個聲音信號類別進(jìn)行平均識別率統(tǒng)計,結(jié)果如表3所示。從表3可以看到,每個類型的放電聲音準(zhǔn)確率>0.97%。
表3 模型c各個類別聲音信號平均準(zhǔn)確率 %
對比文獻(xiàn)[8]20與文獻(xiàn)[9]56的識別率,如表4所示??梢钥闯觯矸e神經(jīng)網(wǎng)絡(luò)相較于文獻(xiàn)[8]20自定義判據(jù)與文獻(xiàn)[9]56中分類器識別率均有所提高,對于準(zhǔn)確分析開關(guān)設(shè)備絕緣狀況,進(jìn)而排除絕緣故障,保障電力系統(tǒng)的安全穩(wěn)定運(yùn)行創(chuàng)造了基礎(chǔ)條件。
表4 與文獻(xiàn)[8]、文獻(xiàn)[9]識別率對比
在對放電聲音的識別中,本文提出的基于卷積神經(jīng)網(wǎng)絡(luò)的識別算法相較于傳統(tǒng)的分類器有更高的準(zhǔn)確率,并且卷積神經(jīng)網(wǎng)絡(luò)更擅長進(jìn)行多類別的識別,類別劃分更為細(xì)致。此外卷積神經(jīng)網(wǎng)絡(luò)能進(jìn)行更大量級的數(shù)據(jù)訓(xùn)練,提取到聲音信號更多的特征信息,從而使模型的識別準(zhǔn)確率更高。在使用中,可能會發(fā)生過度擬合導(dǎo)致的問題。采用Dropout方法可以很好地解決此類問題,使得后續(xù)的模型優(yōu)化更容易,以免模型提取過多的干擾特征,防止模型過擬合現(xiàn)象。