李 楠,馬宏忠,朱 昊,王 健,崔佳嘉,何 萍
(1.河海大學(xué) 能源與電氣學(xué)院,江蘇 南京 211100;2.國網(wǎng)南京供電公司,江蘇 南京 210019)
變壓器是電力系統(tǒng)的核心設(shè)備之一,其安全穩(wěn)定運行對電力系統(tǒng)的安全性和可靠性起著重要作用[1]。國家電網(wǎng)統(tǒng)計表明,繞組損壞引起的變壓器事故占總事故的55.6%。繞組松動導(dǎo)致變壓器抗短路能力大大降低[2],給變壓器安全穩(wěn)定運行造成重大隱患,因此迫切需要切實有效的繞組松動故障診斷方法。
針對繞組松動的故障診斷,現(xiàn)有方法主要包括頻率響應(yīng)法、低壓脈沖法、短路電抗法以及振動檢測法[3]。頻率響應(yīng)法和低壓脈沖法要求設(shè)備必須離線檢測。短路電抗法允許設(shè)備在線檢測,但無法準(zhǔn)確反映故障程度。振動檢測法因其與電力設(shè)備之間無電氣聯(lián)系以及可以實現(xiàn)在線監(jiān)測等優(yōu)點而受到廣泛關(guān)注,但是其對測點選擇要求較為苛刻。
變壓器運行過程中發(fā)出的聲紋信號中包含大量能夠反映設(shè)備狀態(tài)的有效信息?;诼曇粜盘柕淖儔浩鳡顟B(tài)監(jiān)測與故障診斷,具有與被測對象沒有任何接觸、易于實現(xiàn)帶電監(jiān)測與診斷等優(yōu)勢,且能很好地解決振動測點空間敏感度過高的問題,展現(xiàn)出廣闊的應(yīng)用前景[4]。目前,針對變壓器噪聲產(chǎn)生機理進行了廣泛研究[5-9]。多數(shù)學(xué)者認(rèn)為變壓器聲紋信號由繞組以及鐵心振動產(chǎn)生,可以從振動角度去闡述聲紋機理[10],繞組以及鐵心振動基頻為100 Hz,因此變壓器聲紋信號的基頻也是100 Hz[11]。然而從現(xiàn)場數(shù)據(jù)測量分析的結(jié)果看,變壓器聲紋信號除100 Hz以外,還含有其他50 Hz的倍頻分量,并且不同類型的變壓器以及在變壓器不同的運行狀態(tài)下,其聲紋信號也都存在差異[12]。變壓器本身結(jié)構(gòu)的非線性以及聲紋信號為多振動源疊加是產(chǎn)生上述現(xiàn)象的主要原因,并且在變壓器運行工況波動時,提取的特征量在正常和故障之間存在交疊。因此,傳統(tǒng)的特征提取方法難以針對性地提取各類變壓器關(guān)鍵故障特征量,無法形成有效的特征提取和識別方法。
近年來人工智能技術(shù)在預(yù)測、分類等方面的高效率和高準(zhǔn)確度發(fā)展,給變壓器故障診斷和狀態(tài)監(jiān)測提供了一種新的思路。包海龍等[13]針對常規(guī)波束形成算法定位精確度差的問題,開展了基于反卷積波束形成算法的干式變壓器異響故障研究。張重遠(yuǎn)等[14]提出一種基于Mel時頻譜-卷積神經(jīng)網(wǎng)絡(luò)的變壓器鐵心松動聲紋識別方法。馬文嘉等[15]針對變壓器遭受短路沖擊時的聲信號,提出基于稀疏自適應(yīng)S變換的變壓器繞組狀態(tài)檢測方法。大型電力變壓器可靠性高,且工況穩(wěn)定,故障或異常數(shù)據(jù)往往較難獲取,傳統(tǒng)的研究方法對變壓器聲紋信號能夠進行有效的特征提取和模式識別,但存在對不平衡數(shù)據(jù)適用性差和對數(shù)據(jù)樣本數(shù)量要求較高等問題。
為解決上述問題,本文提出一種基于50 Hz倍頻小波時頻熵和RUSBoost的變壓器聲紋繞組松動診斷方法。首先,針對變壓器聲紋特點,提出50 Hz倍頻小波時頻熵,有效提取聲紋特征。然后,利用RUSBoost模型對不同松動故障進行識別。最后,在現(xiàn)場實測數(shù)據(jù)的基礎(chǔ)上驗證了方法的有效性。研究結(jié)果表明,本文所提方法對變壓器繞組不同松動程度故障能夠進行準(zhǔn)確識別。
變壓器聲紋一般可以分為鐵心聲紋和繞組聲紋。變壓器聲紋由鐵心振動和繞組振動產(chǎn)生,聲波通過液體或者固體路徑傳播,最終傳播至變壓器外的聲波為多聲源共同耦合疊加而成。聲波信號在變壓器油以及空氣傳播中衰減極少,并且聲波信號在穿過油箱壁時也不會發(fā)生頻率偏移現(xiàn)象。因此,聲紋特性與振動特性基本保持一致。本文通過分析振動原理對變壓器聲紋進行分析。
繞組是變壓器的基本結(jié)構(gòu),而線圈是繞組的基本組成單元,存在多種繞制方式。以往的質(zhì)量-彈簧-阻尼模型大多針對餅式結(jié)構(gòu),不具備普適性,將墊塊間的導(dǎo)線作為基本物理單元,稱為簡化線圈基本單元。將這種具備機械特性和電磁場特性的物理模型稱為繞組兩體模型[16]。繞組兩體模型的運動方程為
(1)
對兩體模型進行逐步簡化分析,將原非線性系統(tǒng)轉(zhuǎn)換為線性系統(tǒng)。假設(shè)流經(jīng)繞組的電流為
i(t)=Icosωt
(2)
式中:I為電流幅值;ω為電源的角頻率。
兩體模型可以轉(zhuǎn)換為
(3)
求解非齊次常系數(shù)線性微分方程的通解,分為齊次方程的通解和非齊次方程的特解,其中通解為自由分量,特解為強制分量。由于實際系統(tǒng)中的阻尼存在,無源的自由分量最終衰減為零,因此只需要考慮方程的強制分量解:
(4)
式(4)右邊第一項為恒定力產(chǎn)生的恒定分量,第二項中繞組振動的頻率為2ω。對于50 Hz的電力系統(tǒng)而言,其振動頻率為100 Hz,即50 Hz的偶數(shù)倍頻分量。在繞組線圈振動情況下,線圈之間發(fā)生周期性變化,使得導(dǎo)線周圍磁場與自身振動存在機電耦合。當(dāng)變壓器繞組固有頻率與激勵頻率滿足一定條件時,會產(chǎn)生參數(shù)共振;當(dāng)固有頻率與電源頻率相近時,產(chǎn)生激勵電流的奇數(shù)倍頻率;當(dāng)固有頻率為電源頻率2倍時,產(chǎn)生偶數(shù)倍頻率[17]。
本文針對變壓器聲紋信號特點,提出一種針對變壓器聲紋信號的特征提取方法,實現(xiàn)對大量音頻信號的降維壓縮與特征提取,稱之為50 Hz倍頻占比時頻熵(50 FMWTE),主要針對變壓器聲紋信號中50 Hz倍頻分量,其計算過程如圖1所示。
圖1 50 FMWTE計算過程圖
(1) 信號預(yù)處理。對采集到的聲紋信號進行分幀加窗處理,通過分幀將長聲音信號切成短時幀,選取幀長為400 ms,幀重疊率為0.2,并利用漢明窗平滑處理,減輕吉布斯效應(yīng)影響。
(2) 小波時頻分析。對聲音信號進行分幀以及加窗處理后,對聲音信號進行連續(xù)小波變換,先確定小波基與尺度,后求出小波系數(shù),其計算公式如下:
(5)
式中:x(t)為輸入聲音信號序列;ψ為母小波,采用復(fù)數(shù)小波Complex Morlet,其在時頻兩域具有很好的分辨率,適合處理非平穩(wěn)的聲音信號。
(3) 熵值計算。從小波系數(shù)序列中提取50 Hz倍頻分量小波系數(shù)c50×i(i=1,2,3,…,20),并對其進行相空間重構(gòu):
Y=
(6)
式中:m為嵌入維數(shù);t為延遲時間;K=N-(m-1)t。
將Y中每行重構(gòu)分量按照升序重新排列,將重新排列后的矩陣記為S(l)={j(1),j(2),…,j(m)},其中每列數(shù)據(jù)記為一種符號序列,并計算每一種符號序列出現(xiàn)的概率,記為{P1,P2,…,PK}。利用以下公式計算其熵值,再對計算結(jié)果進行歸一化處理,得各50 Hz倍頻分量的時頻熵:
(7)
(4) 占比權(quán)重計算。為削弱無用分量的波動信息,增強幅值大的分量,權(quán)值采用每種頻率分量在時間序列中的最大值之最大值占所有分量在時間序列中的最大值之和的比重,計算公式如下:
(8)
(5) 50 Hz倍頻小波時頻熵計算。將50 Hz倍頻分量小波時頻熵按照頻率大小排列構(gòu)成特征向量Hpe,i×50={Hpe,50,Hpe,100,…,Hpe,1 000}。將權(quán)重按照頻率大小排列構(gòu)成權(quán)重向量δ={δ1,δ2,…,δ20}。50 Hz倍頻小波時頻熵計算公式如下所示:
Hi=Hpe,i×50·δ
(9)
人工智能算法往往要求訓(xùn)練集中各樣本數(shù)據(jù)相對均衡,以保證算法具有良好的泛化性。然而作為運行可靠性相對較高的變壓器而言,各類樣本分布往往不均衡,正常運行狀態(tài)數(shù)據(jù)較多,而非正常運行狀態(tài)數(shù)據(jù)較少,這使得模型預(yù)測結(jié)果往往偏向正常狀態(tài),對更具意義的非正常樣本識別效果不佳。
針對樣本數(shù)據(jù)存在的嚴(yán)重不平衡問題,本文提出基于RUSBoost模型建立變壓器聲紋識別模型,通過欠采樣提高數(shù)據(jù)樣本的均衡性,并結(jié)合提升法,將多個簡單的基學(xué)習(xí)器提升為強學(xué)習(xí)器。對比當(dāng)前基學(xué)習(xí)器的訓(xùn)練誤差調(diào)整訓(xùn)練樣本的分布權(quán)重,并增加懲罰因子,提高后續(xù)訓(xùn)練過程中的關(guān)注度,再利用調(diào)整后的樣本訓(xùn)練下一個基學(xué)習(xí)器,并由此反復(fù)迭代[18]。
RUSBoost模型通過最小化指數(shù)損失函數(shù)以達到貝葉斯最優(yōu)錯誤率,其中最優(yōu)權(quán)重計算公式為
(10)
式中:εt為t組樣本預(yù)測錯誤率。
模型最終輸出的學(xué)習(xí)器為T個基學(xué)習(xí)器的線性權(quán)重疊加組合。
(11)
式中:ht(x)為基學(xué)習(xí)器ht在對應(yīng)樣本x下的預(yù)測值。
設(shè)訓(xùn)練數(shù)據(jù)集為S={S1,S2,…,Sm}。模型流程圖如圖2所示。
圖2 RUSBoost模型流程圖
基于50 Hz倍頻小波時頻熵和RUSBoost的變壓器繞組松動聲紋識別方法如圖3所示。具體步驟如下。
圖3 故障識別流程
(1) 50 Hz倍頻小波時頻熵計算及特征提取。首先將預(yù)處理后的聲紋信號進行小波變換,并提取小波系數(shù),然后提取50 Hz各倍頻小波系數(shù)計算熵值,并利用幅值最大值計算各分量占比權(quán)重,最后計算50 Hz倍頻小波時頻熵并疊加,構(gòu)成21維的特征向量。
(2) 構(gòu)建RUSBoost識別模型。采集構(gòu)建訓(xùn)練集數(shù)據(jù)樣本,通過欠采樣處理不平衡數(shù)據(jù),結(jié)合提升法建立模式識別模型,并通過網(wǎng)格搜索調(diào)參,完成對模型的訓(xùn)練。
(3) 基于聲紋的變壓器運行狀態(tài)監(jiān)測。提取測試集數(shù)據(jù),通過上述方法計算其50 Hz倍頻小波時頻熵,并將計算結(jié)果代入訓(xùn)練好的RUSBoost識別模型,獲得繞組不同松動程度的識別結(jié)果。
本文搭建的變壓器聲紋數(shù)據(jù)采集平臺如圖4所示,數(shù)據(jù)采集平臺主要包括變壓器、電腦、DHDAS動態(tài)信號采集儀、信號傳輸線、前置放大器HS14618以及電容式聲傳感器HS14401等。
圖4 數(shù)據(jù)采集平臺
在信號測量方面,電容式聲傳感器有頻率范圍寬、穩(wěn)定性好、能最大程度減少自身誤差等優(yōu)勢。根據(jù)國際測量標(biāo)準(zhǔn)IEC60651,聲信號測量應(yīng)該覆蓋20 Hz~20 kHz的可聽聲范圍,因此設(shè)備采用50 kHz的采樣頻率。采用抗強磁場干擾的信號傳輸線,有效減少外界電磁場干擾。電容式聲傳感器測點布置如圖5所示,距離變壓器油箱外壁30 cm,距離地面35 cm。變壓器短路試驗下,繞組振動產(chǎn)生的聲音遠(yuǎn)大于鐵心振動引起的聲音。因此,本文開展短路試驗,并利用龍門吊和扭力扳手模擬繞組不同松動程度故障。試驗設(shè)置低壓側(cè)短路,高壓側(cè)從零開始施加電壓,當(dāng)?shù)蛪簜?cè)電流達到額定值時停止,并測量聲紋信號。測量完畢后,重復(fù)通過變壓器吊芯,并利用扭力扳手調(diào)整變壓器繞組垂直方向上的緊固螺絲松緊程度,分別調(diào)整預(yù)緊力為0、0.25FN、0.5FN、0.75FN和FN,此處FN為額定預(yù)緊力,靜置后重新測量變壓器聲紋數(shù)據(jù)。
圖5 聲傳感器測點布置
頻譜與時頻譜是聲信號處理的重要特征頻率譜,頻譜能夠反映信號在不同頻率的幅值大小,時頻譜能夠反映聲音信號在不同時間下頻率能量的分布狀況。頻譜與時頻譜可以有效建立時域與頻域之間的聯(lián)系,展現(xiàn)聲音信號的特征信息,反映變壓器的運行狀態(tài)。如圖6所示,變壓器正常運行時的聲紋信號頻率分量表現(xiàn)為50、100、150 Hz等50 Hz倍頻分量,其中100、200、300 Hz頻率分量相對較多。
圖6 聲紋信號頻域與時頻分布
對比不同測點數(shù)據(jù),如圖7所示,測點位置不同,聲音信號各頻率分量幅值大小有所差異,但都表現(xiàn)出相近的趨勢。聲音信號一般都位于900 Hz范圍內(nèi),并且聲音信號頻率以50 Hz偶數(shù)倍分量為主,50 Hz及其奇數(shù)倍分量所占比重較少。變壓器聲紋為多聲源耦合疊加,造成聲紋復(fù)雜程度增加,測點選取應(yīng)遵循簡單的原則,但變壓器狀態(tài)改變時,測點相對其他測點變化應(yīng)更為劇烈。2號測點多次測量結(jié)果穩(wěn)定,聲紋特征突出,基頻占比高,因此選擇此測點作為代表測點進行后續(xù)研究分析。
圖7 不同測點數(shù)據(jù)對比
針對變壓器聲紋信號特點,提出基于50 Hz倍頻小波時頻熵的聲紋特征提取方法,既保證了關(guān)鍵信息的提取,又防止數(shù)據(jù)量過大。對隨機森林算法進行改進,優(yōu)化調(diào)整其參數(shù),提高識別率。
數(shù)據(jù)是模型訓(xùn)練識別的基礎(chǔ),本文對設(shè)定的5種工況進行數(shù)據(jù)收集,對麥克風(fēng)接收到的聲紋信號進行數(shù)據(jù)預(yù)處理,并計算其50 Hz倍頻小波時頻熵得到[H1H2H3…H20],再對各50 Hz倍頻熵進行疊加求和得到Hsum,將其組合構(gòu)成21維特征向量[H1H2H3…H20Hsum]。
為保證模型識別的有效性,在進行模型訓(xùn)練時,需要樣本集分成訓(xùn)練集和測試集,樣本劃分如表1所示。在共計797組樣本中,正常樣本257組,25%松動程度樣本240組,50%松動程度樣本218組,75%松動樣本43組,100%松動樣本39組,各類別樣本間最大不平衡率為6.94。表中對不同的工況設(shè)置標(biāo)簽,最后將所有帶有標(biāo)簽的樣本隨機輸入到模型中進行訓(xùn)練。
表1 樣本個數(shù)
模型訓(xùn)練采用10折交叉驗證的方式,即將數(shù)據(jù)集劃分為10個子集,隨機挑選其中1個子集作為驗證組,其他9個子集作為訓(xùn)練集,對模型進行10次訓(xùn)練和測試,并通過網(wǎng)格搜索的方法對超參數(shù)進行尋優(yōu)。平均準(zhǔn)確率對不平衡樣本的性能評價不夠全面,因此網(wǎng)格搜索的優(yōu)化目標(biāo)為尋找最優(yōu)AUC值。最終設(shè)置調(diào)整最大分裂數(shù)為37、基學(xué)習(xí)器個數(shù)45以及學(xué)習(xí)率為0.12。評價結(jié)果如圖8所示。
圖8 混淆矩陣
在如圖8所示的混淆矩陣中,橫坐標(biāo)為模型的預(yù)測結(jié)果,縱坐標(biāo)為模型的真實結(jié)果,最右邊1列為模型識別準(zhǔn)確率。由圖8可知,針對鐵心不同松動程度的識別準(zhǔn)確率均高于94%,表明模型對繞組不同松動程度故障均能實現(xiàn)有效識別,總體準(zhǔn)確度達到98.9%。AUC值為0.98,表明模型對存在不平衡問題的變壓器聲紋樣本同樣具有良好的識別精度和適用性。
為驗證本文所提特征提取方法的有效性,繪制各類別特征降維圖,對故障特征提取前后進行可視化。由圖9可知,原始信號特征在不同故障類別間高度重合,難以被區(qū)分,而本文所提50 Hz倍頻小波時頻熵具有良好的區(qū)分度。
圖9 特征可視化
為驗證本文所提優(yōu)化的RUSBoost模型的優(yōu)越性,將常見的決策樹(DT)、隨機森林(RF)、K近鄰(KNN)以及支持向量機(SVM)等模型與本文所提模型進行對比,模型均采用網(wǎng)格搜索尋找最佳超參數(shù),使得其AUC值最佳。各模型分類結(jié)果如表2所示。
表2 常見模型分類結(jié)果對比
由表2可知,5種模型總體識別準(zhǔn)確率都較高,但對于樣本量較少的75%松動和100%松動分類性能較差。針對75%松動故障和100%松動故障,本文所提模型相較于RF、DT、KNN、SVM等傳統(tǒng)模型,至少提高了2.8%和2.5%。由此可知RUSBoost模型對于不平衡的變壓器樣本數(shù)據(jù)具有較好的分類準(zhǔn)確率,這對在實際運用中解決變壓器故障或異常樣本數(shù)據(jù)缺失具有重要作用。
本文以變壓器聲紋信號為研究對象,通過變壓器聲紋數(shù)據(jù)采集平臺采集數(shù)據(jù),對變壓器運行過程中的不同工況進行研究,并搭建50 FMWTE-RUSBoost聲紋信號運行狀態(tài)監(jiān)測,為基于聲紋的變壓器狀態(tài)監(jiān)測和故障診斷提供依據(jù)。主要結(jié)論如下。
通過理論研究和試驗數(shù)據(jù)分析可知,變壓器聲紋信號主要為50 Hz倍頻分量。針對此特點,提出50 Hz倍頻小波時頻熵,提高了信息的利用率和豐富程度,對變壓器繞組不同程度的聲紋信號具有較好的區(qū)分度,并對測點選擇進行研究,選擇信息程度最為豐富、穩(wěn)定的2號測點用作后期算例驗證。
針對變壓器聲紋樣本多存在不平衡以及異常樣本較少的問題,提出基于RUSBoost的變壓器聲紋運行工況模式識別,總體準(zhǔn)確度達到98.9%,樣本量較少的75%松動樣本和100%松動樣本的識別準(zhǔn)確率高達97.2%和94.6%,較其他模型至少提高2.8%和2.5%。結(jié)果表明RUSBoost模型較傳統(tǒng)模型對不平衡樣本數(shù)據(jù)具有更好的準(zhǔn)確度。