許伯強,何俊馳,孫麗玲
(華北電力大學(xué) 電氣與電子工程學(xué)院,河北 保定 071003)
籠型異步電動機廣泛應(yīng)用于電氣傳動領(lǐng)域。異步電機故障頻發(fā),據(jù)統(tǒng)計全國每年異步電機維修費用達20億元[1],電機故障診斷對提高生產(chǎn)率、降低成本具有重要意義。電機故障在線監(jiān)測可以避免停機檢修帶來的經(jīng)濟損失[2]。
由于在制造和安裝過程中定子繞組的絕緣破損,加之工作環(huán)境與機械、電磁等原因?qū)е抡駝?、摩擦而損傷絕緣,籠型異步電動機在運行過程中可能發(fā)生定子繞組匝間短路故障;由于轉(zhuǎn)子導(dǎo)條受到徑向電磁力、旋轉(zhuǎn)電磁力、離心力、熱彎曲撓度力等交變應(yīng)力的作用,加之轉(zhuǎn)子制造缺陷,因而籠型異步電動機在運行過程中可能發(fā)生轉(zhuǎn)子斷條故障。
文獻[3]指出電機故障種類比例如表1所示。
表1 籠型異步電機故障占比Table 1 Fault proportion of asynchronous motor
定子繞組匝間短路和轉(zhuǎn)子斷條均是典型的漸進性故障,因此,進行定子繞組匝間短路以及轉(zhuǎn)子斷條故障診斷具有重要意義。
籠型異步電動機定子某相繞組發(fā)生匝間短路故障后,三相平衡關(guān)系遭到破壞,負序分量變化明顯,同時三相阻抗角以及定子電流的某些頻率分量也會產(chǎn)生一定的變化。因此,定子繞組匝間短路故障的典型特征為負序阻抗,當前的定子繞組匝間短路故障診斷方法也大多依賴于此單一故障特征[3-5]。實際上,除負序阻抗以外,負序電壓和故障相電流的幅值也是受定子繞組匝間短路故障影響較大的量,如果將這些量按照一定的權(quán)重占比加以綜合而診斷故障,將比傳統(tǒng)的依賴于單一故障特征的診斷方法更加可靠。
籠型異步電動機發(fā)生轉(zhuǎn)子斷條故障之后,定子電流中將出現(xiàn)(1±2s)f1頻率的邊頻分量(s為轉(zhuǎn)差率,f1為供電頻率),這是典型的轉(zhuǎn)子斷條故障特征。而定子電流信號易于采集,因此基于傅里葉變換的定子電流信號頻譜分析方法被廣泛應(yīng)用于轉(zhuǎn)子斷條故障診斷。為了改進故障診斷的性能,自適應(yīng)濾波、派克變換、希爾伯特變換以及高頻率分辨力譜估計技術(shù)[7-8]被引入該領(lǐng)域而形成了一系列的籠型異步電動機轉(zhuǎn)子斷條故障診斷方法。但是這些方法在本質(zhì)上均是傳統(tǒng)的依賴于單一故障特征的診斷方法,其性能仍有待提高。且對定子轉(zhuǎn)子故障聯(lián)合診斷時,故障特征的提取難度增大,難以準確辨別定子故障。
更重要的是,由于定、轉(zhuǎn)子之間的雙邊電磁感應(yīng)關(guān)系,籠型異步電動機的定子繞組匝間短路和轉(zhuǎn)子斷條故障相互影響,其故障特征也存在一定程度的相互交織。因此,孤立的定子繞組匝間短路故障診斷或孤立的轉(zhuǎn)子斷條故障診斷往往混淆這兩種故障而做出錯誤診斷。
本文提出一種基于深度學(xué)習(xí)與梯度提升決策樹模型相結(jié)合的故障診斷方法,能夠自動提取異步電機定子繞組匝間短路和轉(zhuǎn)子斷條故障的特征,并準確對故障多分類,從而實現(xiàn)定子繞組匝間短路和轉(zhuǎn)子斷條故障及其嚴重程度的聯(lián)合、同時診斷。
普通自編碼器是一種結(jié)構(gòu)為三層,且輸入輸出層神經(jīng)元數(shù)目相同的神經(jīng)網(wǎng)絡(luò);降噪自編碼器是對實驗數(shù)據(jù)進行加噪處理,利用降噪編碼實現(xiàn)數(shù)據(jù)降噪[10];棧式自編碼器類似一種堆疊的深層自編碼器,它使用逐層貪婪訓(xùn)練法依次訓(xùn)練每層網(wǎng)絡(luò),確保每個層損失最小化[11]。
在訓(xùn)練之前對輸入數(shù)據(jù)進行構(gòu)建。數(shù)據(jù)集制作過程如下:首先對采樣數(shù)據(jù)進行快速傅里葉變換,直接從每個樣本中提取到20個故障特征(A相電壓幅值、B相電壓幅值、C相電壓幅值、A相電流幅值、B相電流幅值、C相電流幅值、A相電壓相位、B相電壓相位、C相電壓相位、A相電流相位、B相電流相位、C相電流相位、正序電壓有效值、負序電壓有效值、正序電流有效值、負序電流有效值、正序阻抗模值、負序阻抗模值、定子電流(1+2s)f1邊頻分量、定子電流(1-2s)f1邊頻分量),得到每種負載27 002個樣本數(shù)據(jù),共81 006個樣本,構(gòu)成輸入數(shù)據(jù){X}。
標簽對應(yīng)故障種類和嚴重程度,標號0~6分別對應(yīng)正常、定子繞組匝間短路故障(輕微)、定子繞組匝間短路故障(中等)、定子繞組匝間短路故障(嚴重)、轉(zhuǎn)子斷條故障(輕微)、轉(zhuǎn)子斷條故障(中等)、轉(zhuǎn)子斷條故障(嚴重)7種狀態(tài),形成標簽數(shù)據(jù)集{Y}。
圖1 降噪自編碼器原理Figu.1 Main theory of denoising auto encoder
構(gòu)建編碼器和解碼器。編碼器結(jié)構(gòu)為3層(輸入層、中間層、輸出層),每層神經(jīng)元數(shù)量依次遞減(20、16、8),如圖2。
圖2 編碼器結(jié)構(gòu)Fig.2 Structure of encoder
圖中輸入層至中間層的關(guān)系、中間層至輸出層神經(jīng)元的關(guān)系分別如下:
(1)
X′=sigmoid(W(2)H+b(2))。
(2)
其中:W(1)為輸入層至中間層神經(jīng)元的dmid×din維的權(quán)重矩陣;W(2)為中間層至輸出層神經(jīng)元的dout×dmid維的權(quán)重矩陣;b(1)為輸入層至中間層神經(jīng)元的維度為dmid的偏置矩陣;b(2)為中間層至輸出層神經(jīng)元的維度為dout的偏置矩陣;din=20為輸入樣本數(shù)據(jù)的維度,即編碼器輸入層數(shù)據(jù)的維度;dmid=16為編碼器中間層數(shù)據(jù)的維度;dout=8為編碼器輸出層數(shù)據(jù)的維度;sigmoid為激活函數(shù),用于激活神經(jīng)元的輸出,使神經(jīng)元非線性化。
式(1)、式(2)組成編碼映射為
(3)
解碼器結(jié)構(gòu)與編碼器對稱,即包含3層(輸入層、中間層、輸出層),每層神經(jīng)元數(shù)量逐層遞增(8、16、20),整個流程與編碼器相反[13],此處不做詳細介紹。
在進行訓(xùn)練前對權(quán)重和偏置進行隨機賦值,然后對每個原始輸入數(shù)據(jù)與解碼后的重構(gòu)數(shù)據(jù)計算重構(gòu)誤差,即
(4)
損失函數(shù)選用MSE均方誤差函數(shù);全部樣本的重構(gòu)誤差均值和正則項相加得到成本函數(shù),即
(5)
前述為正向傳播過程,反向傳播(backward propagation,BP)過程利用隨機梯度下降算法計算梯度值,并更新權(quán)重和偏置,即
(6)
其中α為學(xué)習(xí)率,經(jīng)實驗最優(yōu)值為0.005。
正向傳播計算成本函數(shù),反向傳播更新權(quán)重和偏置矩陣來優(yōu)化成本函數(shù),兩者組成迭代循環(huán),本文經(jīng)過300次迭代,成本函數(shù)達到最小值,對編碼器輸出層(即編碼數(shù)據(jù))進行保存,形成81006×8的二維編碼數(shù)據(jù)集{X′}。
輕型梯度提升機是梯度提升決策樹的一種優(yōu)化算法,其優(yōu)化方向為損失函數(shù)負梯度方向[21];GBDT不僅引入集成學(xué)習(xí),還在訓(xùn)練過程中,下一輪訓(xùn)練在本輪訓(xùn)練結(jié)果疊加殘差的基礎(chǔ)上繼續(xù)擬合,因此每一輪擬合曲線都是上一輪擬合曲線和殘差曲線的疊加,過程如圖3所示;LightGBM算法對GBDT算法進行優(yōu)化,利用直方圖索引和Leaf-wise生長策略[21]提高計算精確度,節(jié)約計算資源。
圖3 GBDT擬合過程Fig.3 GBDT fitting process
在應(yīng)用于電機故障在線監(jiān)測過程中,傳統(tǒng)LightGBM算法的局限性有三點。第一,將故障樣本誤分類為正常樣本相比于將正常樣本誤分類為故障樣本,分類精確度相同但后果嚴重得多,應(yīng)避免。同理,對故障種類的誤分類的后果要比故障嚴重程度誤分類的后果更嚴重;第二,由于各種標簽下的樣本不能做到完全相同,樣本對總體樣本的估計有偏;第三,電機故障特征量較多(達20維),而相應(yīng)的樣本量卻較少(信號處理過程復(fù)雜且相關(guān)開源數(shù)據(jù)集缺乏),因此模型容易過擬合。
針對上述問題,創(chuàng)新點如下:
1)針對問題一,除了定義總體準確率Acc,還定義了召回率Rec,分別如下:
(7)
其中:TP表示正確分類的故障樣本數(shù)量;TN表示正確分類的正常樣本數(shù)量;FN表示錯誤分類的故障樣本數(shù)量;FP表示錯誤分類的正常樣本數(shù)量。
2)針對問題二、三,對損失函數(shù)進行改進,引入L2正則項減少過擬合;再對故障分類賦予更高的權(quán)重,即賦予更高的類別權(quán)重;然后,為了做到總體樣本的無偏估計,對正常非故障樣本賦予更高的樣本權(quán)重。改進方法如下:
第k棵樹的損失函數(shù)為
(8)
其中:Fk-1(xi;Ak-1)表示由前k-1棵樹組成的模型在參數(shù)為Ak-1的條件下對輸入xi的預(yù)測值,L(yi,Fk-1(xi;Ak-1))表示損失函數(shù)。
(9)
其中:α>1且為常數(shù),yi=0即標簽號為0的樣本,即正常樣本賦予的權(quán)重為1,yi≠0為故障樣本,賦予權(quán)重值較大。
改進后的LightGBM算法綜合考慮準確率和召回率,保證電機在線監(jiān)測時,正常樣本的誤分類為零,使誤分類代價最小化;同時,可以通過不斷采集新數(shù)據(jù)訓(xùn)練模型,使模型表現(xiàn)不斷完善。
首先對數(shù)據(jù)集{X′}其對應(yīng)標簽集{Y}按照80%、20%的比例劃分為訓(xùn)練集和測試集。
首先根據(jù)經(jīng)驗對分類器設(shè)定一組超參數(shù),調(diào)用sklearn庫中的GridSearchCV模塊遍歷搜索,得到最優(yōu)超參數(shù)如表2。
表2 超參數(shù)調(diào)節(jié)Table 2 Adjustment of hyperparameters
然后利用訓(xùn)練集數(shù)據(jù)訓(xùn)練LightGBM分類器,測試集數(shù)據(jù)對模型分類效果進行驗證,并調(diào)整分類器參數(shù),以達到最優(yōu)意義下的各項參數(shù)。
故障診斷方法包含3個主要流程:
1)實驗數(shù)據(jù)獲取與數(shù)據(jù)集生成。
進行系統(tǒng)、大量的實驗,測取定子三相電流瞬時信號isA、isB、isC,定子三相電壓瞬時信號usA、usB、usC,獲得81006組樣本數(shù)據(jù);然后針對每一組數(shù)據(jù)所測得的定子三相電流、電壓瞬時信號應(yīng)用快速傅里葉變換提取20個故障特征量,將樣本故障特征量與故障標簽進行整理形成81006×20的二維輸入數(shù)據(jù)集{X}和81006×1的標簽{Y}。
2)故障特征量降維與重構(gòu)。
3)分類器訓(xùn)練與保存。
將重構(gòu)數(shù)據(jù)集按80%、20%劃分訓(xùn)練集和測試集,訓(xùn)練集引入輕型梯度提升機分類器進行訓(xùn)練,利用測試集進行驗證和微調(diào),確定最優(yōu)參數(shù);最后利用pyinstaller庫對模型進行封裝保存。
智慧交通是隨著現(xiàn)代計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展而產(chǎn)生和建立的,使用了多種具有創(chuàng)新性的技術(shù),智慧交通可以使物聯(lián)網(wǎng)技術(shù)在交通行業(yè)中得到大范圍的運用。智慧交通系統(tǒng)在進行建立和發(fā)展的過程中,需要有高新技術(shù)的支持,未來的發(fā)展方向也比較偏向于智能化交通系統(tǒng)的建立,并且在此基礎(chǔ)上與先進的計算機和網(wǎng)絡(luò)技術(shù)結(jié)合,從而更好地解決在交通系統(tǒng)中出現(xiàn)的各種現(xiàn)實問題。
實驗對象是Y100L2-4型籠型異步電動機,額定電壓380 V,額定功率3 kW,額定頻率50 Hz,星形連接。對實驗電機分別采集滿載、半載和空載情況下各種故障工況的定子電壓電流信號轉(zhuǎn)化為標幺值(圖4,橫坐標為采樣點,縱坐標為電壓電流標幺值),采樣頻率為10 600 Hz。工程實際中,電機三相參數(shù)不可能完全對稱(圖4),使用實驗數(shù)據(jù)進行訓(xùn)練可以保證獲得對工程數(shù)據(jù)的泛化能力。
圖4 采樣電流(左)、電壓(右)Fig.4 Sampling current(left)and voltage(right)
由于高維空間無法實現(xiàn)圖像可視化,先將輸出層降至3個神經(jīng)元,以用于對比各種自編碼器的效果以及選擇最合適維度特征。自編碼器降維并進行分類的效果如圖5。從中明顯看出,將原始特征壓縮至3維后,通過觀察樣本的分布情況,可以對標簽為3、4、5、6的樣本進行人工區(qū)分,但其他樣本的劃分需要借助分類器實現(xiàn);若將原始特征壓縮至二維,分類結(jié)果如圖6。除標簽為5、6的樣本,其他樣本已無法完成分類。
圖5 重構(gòu)三維張量圖Fig.5 Reconstructed 3-dimensions figure
圖6 重構(gòu)二維張量圖Fig.6 Reconstructed 2-dimensions figure
對棧式編碼器的損失進行對比發(fā)現(xiàn):當維度低于8維時,損失函數(shù)值急劇增大,因此,選擇重構(gòu)數(shù)據(jù)維度為8維。
對模型是否添加稀疏項的對比如圖7,可以看出稀疏自編碼器損失更小且更不容易發(fā)生過擬合。經(jīng)過前期工作表明λ值等于10e-6時效果較好。
圖7 SAE(左)和AE(右)梯度下降曲線Fig.7 Gradient descent of SAE(left)and AE(right)
表3為特征權(quán)重占比排名,權(quán)重由分類器依據(jù)特征對分類結(jié)果影響程度自動計算得出。編碼后數(shù)據(jù)集分類精確度如表4,可以看出,應(yīng)用棧式自編碼器自動提取特征后訓(xùn)練精確度有所提升;應(yīng)用的降噪自編碼器降噪比為5%,經(jīng)過結(jié)果分析,由于試驗條件下負載變化較小,降噪比對精確度影響較小。但無論哪種負載下,權(quán)重排名前三的特征始終是編碼后的3號、1號和0號特征,可見自編碼器在數(shù)據(jù)降維方面效果顯著。
表3 LightGBM特征權(quán)重Table 3 Features weight of LightGBM
表4 編碼后的LightGBM精確度Table 4 Encoded data accuracy of LightGBM
圖8以負序阻抗、A相電流幅值為例分析故障特征權(quán)重情況(灰度從10%到70%依次對應(yīng)故障標簽)。可以看出,負序阻抗對故障標簽的分類大體較明顯,權(quán)重較大;A相電流幅值僅可判別故障與正常樣本,無法區(qū)分故障類型,權(quán)重較低。但由于負序阻抗特征擬合邊界不明顯,易出現(xiàn)誤判,因此本文綜合20維特征進行故障判別提高精確度。
圖8 特征權(quán)重分析Fig.8 Feature weight analysis
圖9 測試集混淆矩陣Fig.9 Confusion matrix of test data
最后針對實驗數(shù)據(jù)集,本文使用幾種主流分類器進行結(jié)果對比,各種分類器的分類精確度和每100次循環(huán)訓(xùn)練時間如表5。
表5 訓(xùn)練精確度和時間對比Table 5 Training accuracy and time comparison
可見,LightGBM不僅在訓(xùn)練集上可以達到100%的精確度,而且測試集精確度也是以上幾種方法中最高的(高達99.83%)。同時計算所需的時間資源消耗也是最少的,綜合性能最優(yōu)秀,是電機故障在線監(jiān)測的理想模型。
本文提出了一種基于SAE與改進LightGBM相結(jié)合的機器學(xué)習(xí)模型用于籠型異步電動機定子繞組匝間短路和轉(zhuǎn)子斷條故障的聯(lián)合診斷,主要結(jié)論如下:
1)該方法可以對定子匝間短路故障和轉(zhuǎn)子斷條故障進行同時、聯(lián)合診斷,提高了故障診斷效率。結(jié)果表明,本文在故障種類和嚴重程度7分類(正常、定子繞組匝間短路故障輕微、定子繞組匝間短路故障中等、定子繞組匝間短路故障嚴重、轉(zhuǎn)子斷條故障輕微、轉(zhuǎn)子斷條故障中等、轉(zhuǎn)子斷條故障嚴重)數(shù)據(jù)集上訓(xùn)練的平均精確度高達99.83%。
2)該方法僅采集定子電壓、電流信號且只需進行FFT即可實現(xiàn)訓(xùn)練和診斷,符合工程實時性要求。
3)改進了傳統(tǒng)自編碼器和LightGBM算法,不僅將召回率提高到100%、降低誤分類代價,同時可以有效降低過擬合,且能優(yōu)化由于樣本不平衡帶來的有偏估計偏差。