崔佳嘉, 馬宏忠
(河海大學(xué) 能源與電氣學(xué)院,江蘇 南京 211100)
變壓器是電力系統(tǒng)中最重要的電力設(shè)備之一,其運(yùn)行安全影響著整個(gè)電力系統(tǒng)[1]?;诼暭y信號(hào)的變壓器故障診斷技術(shù)是目前的研究熱點(diǎn)之一。
目前針對(duì)電力變壓器的鐵心松動(dòng)故障的診斷方法主要集中在對(duì)振動(dòng)信號(hào)的分析上,振動(dòng)信號(hào)的獲取是通過將振動(dòng)傳感器附著在器壁上而采集得到的。與變電站普遍采用巡檢的方式進(jìn)行故障診斷相比,基于聲紋信號(hào)的診斷方法具有非接觸性、測(cè)量方便及聲傳感器價(jià)格便宜等優(yōu)勢(shì)。因此,依據(jù)變壓器發(fā)生鐵心松動(dòng)故障時(shí)發(fā)出可聽聲信號(hào)(20 Hz~20 kHz),提出采用聲紋信號(hào)對(duì)變壓器鐵心松動(dòng)故障進(jìn)行診斷[2-5]。
目前對(duì)基于聲紋信號(hào)的變壓器鐵心松動(dòng)故障診斷的研究較少。文獻(xiàn)[6]建立了Mel時(shí)頻譜-二維卷積神經(jīng)網(wǎng)絡(luò)(2D-CNN)的鐵心松動(dòng)故障識(shí)別模型,采用的是2D-CNN,其識(shí)別率較低。文獻(xiàn)[7]通過改進(jìn)Mel頻率倒譜系數(shù)(MFCC),優(yōu)化聲音信號(hào)特征提取算法,并通過支持向量機(jī)分類算法對(duì)特征量進(jìn)行識(shí)別。該文獻(xiàn)明確提出只適用于試驗(yàn)室條件下,對(duì)處于室外環(huán)境含有各種噪聲源的大容量變壓器并不適用。除此之外,MFCC是基于人耳對(duì)聲音的感知確定的,而變壓器運(yùn)行發(fā)出的噪聲與人聲差異是巨大的,因此采用該特征量對(duì)故障識(shí)別恐有不妥[8-13]。國(guó)內(nèi)外的學(xué)者對(duì)變壓器的聲紋信號(hào)做了很多的研究,但大多未考慮到實(shí)際變壓器噪聲信號(hào)的測(cè)試結(jié)果會(huì)受多種環(huán)境因素及干擾的影響[14-15],現(xiàn)場(chǎng)采集到變壓器運(yùn)行時(shí)的噪聲信號(hào)不能直接用于故障診斷模型中進(jìn)行識(shí)別,而應(yīng)將復(fù)雜環(huán)境中的其他噪聲源從信號(hào)中濾除,再進(jìn)行特征提取與識(shí)別。目前對(duì)于降噪的研究中,普遍采用的是小波分析和經(jīng)驗(yàn)?zāi)B(tài)分解(EMD),但這二者具有不適應(yīng)性和模態(tài)混疊等缺陷。而完全自適應(yīng)噪聲集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)能夠在分解的每個(gè)階段自適應(yīng)地添加白噪聲,分解過程具有完整性且?guī)缀鯖]有重構(gòu)誤差,解決了EMD重構(gòu)不完整的問題。在利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行聲信號(hào)識(shí)別時(shí),三維卷積神經(jīng)網(wǎng)絡(luò)(3D-CNN)比2D-CNN更適合提取時(shí)空特征,在網(wǎng)絡(luò)訓(xùn)練過程中能使用更少的樣本、更簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu),卻能得到更好的訓(xùn)練效果。
因此,結(jié)合CEEMDAN和小波閾值的濾波方法,及3D-CNN的特點(diǎn),本文提出了基于CEEMDAN-小波閾值及3D-CNN的變壓器鐵心松動(dòng)故障診斷模型。
CEEMDAN是在EMD的基礎(chǔ)上,在原信號(hào)中加入高斯噪聲并通過多次疊加求取平均值的方式抵消噪聲的方法。通過自適應(yīng)地添加高斯白噪聲來削弱模態(tài)混疊問題,且分解過程具有完整性、幾乎無重構(gòu)性誤差的特點(diǎn)。
CEEMDAN的算法具體描述為[16]
(1) 在原始信號(hào)的基礎(chǔ)上加入高斯白噪聲分量ε0ωk(t),其中εi-1表示求解IMFi(t)時(shí)的自適應(yīng)系數(shù),K為在原始信號(hào)上添加白噪聲的數(shù)量。對(duì)分別增加了白噪聲的K個(gè)信號(hào)進(jìn)行EMD分解,得到各個(gè)信號(hào)的一階模態(tài)分量IMF1(t),定義第k次加入噪聲得到的一階模態(tài)分量為imfk1(t)。則CEEMDAN分解得到的一階模態(tài)分量為
(1)
(2) 計(jì)算分解出IMF1(t)后的第一個(gè)余量信號(hào)r1(t),即為
r1(t)=x(t)-IMF1(t)
(2)
(3) 在余量信號(hào)r1(t)的基礎(chǔ)上加入噪聲分量ε1E1[ωj(t)],E1(·)表示經(jīng)過EMD分解產(chǎn)生的第1階模態(tài)分量算子。則CEEMDAN分解得到的二階模態(tài)分量為
(3)
(4) 重復(fù)步驟(2)和步驟(3),就可以計(jì)算出第i個(gè)余量信號(hào)和第i+1階模態(tài)分量:
ri(t)=ri-1(t)-IMFi(t)
(4)
(5)
(5) CEEMDAN分解的終止條件是求解出的余量信號(hào)無法再進(jìn)行EMD分解。若最終分解出I階模態(tài)分量,則最終的余量信號(hào)R(t)為
R(t)=x(t)-IMFI(t)
(6)
在CEEMDAN分解后得到的IMF分量中,選擇適當(dāng)?shù)姆至窟M(jìn)行小波閾值去噪,再對(duì)去噪后的信號(hào)重構(gòu)能進(jìn)一步降低信號(hào)中的噪聲成分。其降噪的步驟為[17]
(1) 對(duì)選擇的信號(hào)進(jìn)行小波分解并求取小波系數(shù);
(2) 設(shè)置閾值,高于閾值的系數(shù)保留,低于閾值的系數(shù)當(dāng)作噪聲去除;
(3) 使用步驟(2)中處理過的小波系數(shù)和近似系數(shù)對(duì)信號(hào)進(jìn)行重構(gòu)。
語譜圖是聲音信號(hào)分析處理的重要特征頻率譜圖,能夠反映信號(hào)在不同時(shí)間下的頻率能量分布。完整地建立聲音信號(hào)在時(shí)域與頻域之間的聯(lián)系,實(shí)現(xiàn)聲音特征信息的最大化,有助于后期聲紋特征的提取與學(xué)習(xí)。
將采集到的變壓器各種工況下的聲紋信號(hào),用上述CEEMDAN-小波閾值濾波法得到純凈的變壓器運(yùn)行的聲音信號(hào)。利用濾波后的信號(hào)繪制聲紋語譜圖,語譜圖的繪制包括分幀、加窗和離散傅里葉變換過程。由于變壓器噪聲較人聲更加平穩(wěn),可以適當(dāng)增加幀長(zhǎng)以保證語音信號(hào)特征的完整性,本文中取每幀N=1 250為25 ms(采集頻率fs=50 kHz),為了使幀與幀之間能平滑過渡,取重疊率為50%。其次,若是直接對(duì)分幀后的數(shù)據(jù)進(jìn)行離散傅里葉變換,會(huì)出現(xiàn)頻譜泄漏的情況,因此需要對(duì)每一幀先作加窗處理,本文選擇加漢明窗,使信號(hào)兩端變得平滑以減少信號(hào)的失真。
繪制的語譜圖的橫坐標(biāo)表示分幀后的幀數(shù)(時(shí)間),縱坐標(biāo)表示頻率,其中的顏色深淺表示該時(shí)刻和頻率下的大小,該大小為功率譜密度。通過短時(shí)傅里葉變換生成的語譜圖如圖1所示。
通過上述預(yù)處理得到的語譜圖可以描述變壓器運(yùn)行過程中時(shí)域與頻域之間的關(guān)系,雖然在時(shí)間上將維度壓縮到159列,但是在頻率維度上卻有2 049行,對(duì)后續(xù)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練識(shí)別速度有很大的影響。因此必須對(duì)頻率維度進(jìn)行壓縮,考慮使用Mel濾波器對(duì)時(shí)頻矩陣降維。
Mel濾波器是根據(jù)人耳結(jié)構(gòu)特征,對(duì)線性的頻段做非線性處理,將低頻部分的權(quán)重加大,對(duì)高頻部分的權(quán)重降低,突出有效頻段的作用。Mel頻率與實(shí)際頻率的轉(zhuǎn)化關(guān)系為[11]
(7)
式中:fMel(f)為Mel刻度下的頻率;f為實(shí)際頻率。
Mel濾波器為一個(gè)由M個(gè)三角形濾波器組成的濾波器組(取M=40),中心頻率為f(m)。在Mel頻率刻度上,濾波器之間的距離是等寬的。該濾波器組的傳遞函數(shù)為
(8)
其中,f(m)定義為[7]
(9)
式中:fh與fl為濾波器濾波頻率的上限與下限;fs為變壓器聲紋采樣的采樣頻率(fs=50 kHz);N為進(jìn)行短時(shí)傅里葉變化時(shí)的幀長(zhǎng)。
通過使用Mel濾波器對(duì)數(shù)據(jù)進(jìn)行降維后,時(shí)頻矩陣從159×2 048被壓縮至159×40,大大縮減了數(shù)據(jù)的尺寸,方便后續(xù)的模型訓(xùn)練與識(shí)別。由此生成的Mel-語譜圖如圖2所示。
傳統(tǒng)的2D-CNN只能提取二維圖像的特征信息,而3D-CNN適用于更高維度的圖像數(shù)據(jù),在處理過程中增加了時(shí)間維度的信息(連續(xù)幀),神經(jīng)網(wǎng)絡(luò)可以同時(shí)提取出時(shí)間與空間的信息。因此,與二維卷積相比,三維卷積更能捕捉到時(shí)序上的特征。3D-CNN的卷積公式為
(10)
Mel-語譜圖生成的圖像的尺寸為41×40×3,其中41表示時(shí)間分量,40表示Mel標(biāo)度下的頻率分量,3表示生成圖片的RGB 3個(gè)通道,而單張圖片只可以作為二維卷積神經(jīng)網(wǎng)絡(luò)的輸入。由于三維卷積神經(jīng)網(wǎng)絡(luò)在二維卷積的基礎(chǔ)上增加了時(shí)間的維度,因此在數(shù)據(jù)集的制作上不同于二維卷積。將采集的2 s原始數(shù)據(jù)分為4幀數(shù)據(jù),用上述方法生成4張Mel語譜圖,并將這4張圖片堆疊成立體數(shù)據(jù)如圖3所示,其數(shù)據(jù)尺寸為4×41×40×3,4表示數(shù)據(jù)深度,41表示時(shí)間分量,40表示Mel標(biāo)度下的頻率分量,3表示生成圖片的RGB 3個(gè)通道。將2 s的數(shù)據(jù)樣本分成4段信號(hào),每段信號(hào)0.5 s;按照前文所提方法,將每段0.5 s信號(hào)按每幀N=1 250為25 ms的長(zhǎng)度分幀,每段信號(hào)生成的Mel語譜圖的尺寸為41×40×3;將4段信號(hào)分別生成的Mel語譜圖堆疊后,數(shù)據(jù)尺寸為41×40×3。
本文使用的3D-CNN是由2層卷積層、2層池化層及2層全連接層組成,均采用SAME補(bǔ)零方式。其中,卷積層后接有激活層,激活層選擇的是線性整流函數(shù)(ReLu)。dropout是一種非常有效的提高泛化能力、降低過擬合的方法,因此選擇在每一個(gè)全連接層后設(shè)置dropout層,速率均設(shè)置為0.5。由于本文作4分類問題,將最后一層設(shè)置為4節(jié)點(diǎn),用softmax函數(shù)激活作分類。網(wǎng)絡(luò)的詳細(xì)結(jié)構(gòu)如表1所示。
表1 3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)
對(duì)于大容量變壓器而言,由于其位置處于室外,在聲紋信號(hào)采集過程中,不可避免地會(huì)受到環(huán)境中各種噪聲的干擾,比如鳥鳴、汽笛聲、特殊天氣的雷電聲,這些噪聲會(huì)直接影響后續(xù)變壓器聲紋故障診斷的準(zhǔn)確性。峭度是信號(hào)時(shí)域特征中反應(yīng)隨機(jī)變量的分布特征,可以用來描述信號(hào)概率密度函數(shù)的陡峭程度。變壓器本體噪聲是較為平穩(wěn)的信號(hào),其峭度值較小,概率密度分布一般呈現(xiàn)高斯分布或亞高斯分布,而其他的噪聲是沖擊性信號(hào),其峭度值很大,概率分布呈現(xiàn)超高斯分布。利用這一特性能有效地將采集的變壓器聲紋信號(hào)中其他噪聲源的含量去除,提高信噪比。
采集一段變壓器運(yùn)行時(shí)純凈的信號(hào)(不含有噪聲),其時(shí)域和頻域信號(hào)如圖4所示。將其進(jìn)行CEEMDAN分解后,得到20個(gè)本征模態(tài)函數(shù)(IMF),再計(jì)算出各個(gè)IMF分量的峭度值,發(fā)現(xiàn)各個(gè)分量的峭度值在2.6左右。
再將一段雷聲的噪音用加性噪聲的處理方法線性疊加在原始信號(hào)中。變壓器運(yùn)行時(shí)帶噪信號(hào)的時(shí)域和頻域波形如圖5所示。
再將帶噪信號(hào)進(jìn)行CEEMDAN分解,共分解出19階IMF和1個(gè)余量,計(jì)算各分量的峭度值如表2所示。
表2 各階分量的峭度值
選擇帶噪信號(hào)分解的分量中峭度值偏離3較大的分量IMF13 、IMF15和 IMF18進(jìn)行小波閾值去噪。最后將經(jīng)過小波閾值去噪后的分量及未處理的分量一同進(jìn)行信號(hào)的重構(gòu),得到去噪后的信號(hào)的時(shí)域和頻域分布,如圖6所示。去噪的信號(hào)與原始信號(hào)在幅值上相差的數(shù)量級(jí)為10-6,信噪比從-15.01升至136.13,去噪效果非常好。
為了驗(yàn)證3D-CNN對(duì)變壓器鐵心松動(dòng)故障識(shí)別效果,搭建了變壓器鐵心松動(dòng)故障試驗(yàn)平臺(tái),采集鐵心在不同松動(dòng)程度下的噪聲信號(hào)。
試驗(yàn)對(duì)象為一臺(tái)S13-M-200/10變壓器,根據(jù)GB/T 1094.10—2003對(duì)該變壓器噪聲測(cè)量的標(biāo)準(zhǔn)和要求,采用電容式麥克風(fēng)作為聲傳感器對(duì)變壓器鐵心不同松動(dòng)情況下的噪聲進(jìn)行測(cè)量,采樣頻率為50 kHz,頻率響應(yīng)為20 Hz~20 kHz。試驗(yàn)在變壓器廠廠房中進(jìn)行,廠房空間較為空曠,幾乎不存在聲波反射的情況,試驗(yàn)環(huán)境如圖7所示。
在設(shè)置鐵心不同松緊程度時(shí),將變壓器油抽出后吊芯,鐵心的壓緊程度是通過改變螺栓的預(yù)緊力來確定的, 先使用扭力扳手確定被測(cè)試的變壓器的額定預(yù)緊力FN,再分別改變螺栓預(yù)緊力使扭力扳手的值分別達(dá)到FN(未松動(dòng))、0.6FN(松動(dòng)40%)、0.2FN(松動(dòng)80%)、0(松動(dòng)100%)。模擬過程如圖8所示。在低壓側(cè)加400 V電壓,變壓器空載運(yùn)行,分別采集變壓器鐵心未松動(dòng)、松動(dòng)40%、松動(dòng)80%、松動(dòng)100%時(shí)的若干個(gè)聲紋信號(hào)。
分別采集鐵心在未松動(dòng)情況下的樣本82個(gè),松動(dòng)40%時(shí)的樣本129個(gè),松動(dòng)80%時(shí)的樣本129個(gè),松動(dòng)100%時(shí)的樣本140個(gè)。其中,將80%的數(shù)據(jù)作為訓(xùn)練樣本,剩余20%作為測(cè)試樣本,驗(yàn)證模型的有效性。
設(shè)置3D-CNN訓(xùn)練的epoch=100,批處理量batch_size=60,優(yōu)化器選擇的是Adam算法,學(xué)習(xí)率設(shè)置為0.001,損失函數(shù)選擇的是傳統(tǒng)的交叉熵函數(shù)。
將采集到的數(shù)據(jù)經(jīng)過CEEMDAN和小波閾值濾波后,將每一段音頻生成Mel-語譜圖,且按照上述方法將每一段語音最終制作成三維的數(shù)據(jù)塊送入模型中訓(xùn)練。用準(zhǔn)確率acc和損失值loss來評(píng)判模型的優(yōu)劣。損失值loss表示預(yù)測(cè)值與實(shí)際值的差距,準(zhǔn)確率acc表示正確分類的數(shù)量與總樣本之間的比值。損失值越小,準(zhǔn)確率越高,說明該模型越適用于變壓器鐵心松動(dòng)的故障識(shí)別。
圖9所示為3D-CNN模型訓(xùn)練過程中準(zhǔn)確率acc隨epoch變化的曲線圖。從圖9中可以看出,當(dāng)epoch未達(dá)到60時(shí),準(zhǔn)確率的浮動(dòng)較大,但是當(dāng)epoch達(dá)到60次后,準(zhǔn)確率穩(wěn)定在0.983 333~1,因此模型在訓(xùn)練達(dá)到60次以后,模型趨于穩(wěn)定。
圖10所示為3D-CNN模型訓(xùn)練過程中損失值loss隨epoch變化的曲線圖。從圖10中可以看出loss值隨著epoch的增加整體上呈現(xiàn)出下降的趨勢(shì)。當(dāng)epoch達(dá)到63以后,loss值穩(wěn)定在1以下;當(dāng)epoch達(dá)到85以后,loss值穩(wěn)定在0.4以下并趨于穩(wěn)定。因此,判斷該模型已經(jīng)收斂并完成訓(xùn)練。
在訓(xùn)練好的模型上對(duì)測(cè)試集測(cè)試,測(cè)試結(jié)果顯示準(zhǔn)確率為0.933 333,綜合訓(xùn)練集上的準(zhǔn)確率acc和損失值loss的結(jié)果及測(cè)試集上的準(zhǔn)確率,確定該3D-CNN適用于變壓器鐵心松動(dòng)故障的診斷。
本文構(gòu)建了基于CEEMDAN-小波閾值的環(huán)境噪聲去除方法和基于聲紋的3D-CNN的變壓器鐵心松動(dòng)故障診斷方法。所提方法考慮到大容量變壓器所處的復(fù)雜環(huán)境噪聲的影響,并搭建3D-CNN網(wǎng)絡(luò)對(duì)鐵心松動(dòng)故障進(jìn)行診斷,具體優(yōu)勢(shì)體現(xiàn)在:
(1) 能去除信號(hào)中含有的復(fù)雜環(huán)境中其他噪聲成分,使得所提出的方法不局限于試驗(yàn)室環(huán)境,更適用于實(shí)際變電站環(huán)境;
(2) 提取聲信號(hào)中連續(xù)幀之間的信息,利用3D-CNN網(wǎng)絡(luò)對(duì)變壓器鐵心松動(dòng)故障識(shí)別,使用最簡(jiǎn)單的3D-CNN結(jié)構(gòu),就可以達(dá)到90%以上的識(shí)別率。