王曉蘭,胡思宇,管毓瑤,劉洋成,魏棕凱
(大唐水電科學(xué)技術(shù)研究院有限公司,廣西 南寧 530007)
水輪發(fā)電機(jī)組的安全穩(wěn)定運(yùn)行,對(duì)于水電站至關(guān)重要。在機(jī)械、水力、電磁因素耦合及機(jī)械部件老化等多種原因的復(fù)合影響下,水電機(jī)組產(chǎn)生的故障大多以振擺形式表現(xiàn)出來(lái),因此振擺信號(hào)可以直觀地對(duì)機(jī)組運(yùn)行狀態(tài)進(jìn)行表征[1-5]。
目前,水輪發(fā)電機(jī)組的在線監(jiān)測(cè)系統(tǒng)對(duì)關(guān)鍵指標(biāo)進(jìn)行越限告警的設(shè)定。但是閾值的設(shè)定往往比較高,也僅僅考慮單一指標(biāo)的越限,機(jī)組預(yù)警的精確度不高,誤報(bào)和漏報(bào)的情況時(shí)有發(fā)生。在穩(wěn)定運(yùn)行區(qū)域,水輪發(fā)電機(jī)組的各個(gè)監(jiān)測(cè)指標(biāo)仍會(huì)受到水頭和勵(lì)磁電流等工況的影響,直接采集計(jì)算的監(jiān)測(cè)指標(biāo)變化率無(wú)法準(zhǔn)確反映設(shè)備狀態(tài)的真實(shí)情況[6,7]。
目前,對(duì)于水輪機(jī)振擺分析存在以下問(wèn)題:(1)海量的在線監(jiān)測(cè)系統(tǒng)沒(méi)有統(tǒng)一的管理和維護(hù)辦法,前端采集到的數(shù)據(jù)沒(méi)有進(jìn)行深入分析和缺乏專業(yè)技術(shù)人員的技術(shù)支持。(2)目前所采用的水輪機(jī)狀態(tài)監(jiān)測(cè)和預(yù)警是通過(guò)設(shè)定固定閾值、計(jì)算變化率的方式,這樣的方式存在誤報(bào)、預(yù)警不及時(shí)的問(wèn)題。(3)水電機(jī)組振擺監(jiān)測(cè)信號(hào)受到運(yùn)行環(huán)境、工況變化等多種因素綜合影響。其信號(hào)是復(fù)雜非線性的,僅僅考慮單一因素?zé)o法準(zhǔn)備預(yù)測(cè)振擺信號(hào)。
本文研究一種基于多模型融合的水輪機(jī)振擺分析預(yù)測(cè)的方法,通過(guò)這種方法,能自動(dòng)進(jìn)行水輪機(jī)振擺幅度實(shí)時(shí)預(yù)測(cè),并對(duì)振擺的振幅進(jìn)行合理性判斷,有效的識(shí)別出超出正常范圍的情況,進(jìn)一步的進(jìn)行告警。
本文提供的振擺分析預(yù)測(cè)方法,通過(guò)最小二乘將SVR、LightGBM和XGBoost進(jìn)行融合,采用融合后的模型,對(duì)水輪機(jī)振擺數(shù)據(jù)進(jìn)行分析預(yù)測(cè),對(duì)異常的振擺值進(jìn)行實(shí)時(shí)報(bào)警,從而達(dá)到故障診斷輔助決策的目的。具體如圖1所示。
具體步驟主要分為以下6部分:
(1)獲取歷史的機(jī)組振擺相關(guān)數(shù)據(jù),并將數(shù)據(jù)表整合。
(2)將預(yù)處理完成的數(shù)據(jù)進(jìn)一步處理為訓(xùn)練集合。
(3)提取出訓(xùn)練集合中的與振擺相關(guān)的數(shù)據(jù),分別輸入SVR機(jī)器學(xué)習(xí)模型、LightGBM模型和XGBoost模型進(jìn)行訓(xùn)練。
(4)對(duì)三個(gè)模型的結(jié)果進(jìn)行最小二乘擬合,得到三個(gè)模型的權(quán)值分配,形成融合模型,使預(yù)測(cè)數(shù)據(jù)貼近真實(shí)狀況,得到能夠精準(zhǔn)預(yù)測(cè)振擺結(jié)果的模型。
(5)將在線監(jiān)測(cè)的振擺相關(guān)數(shù)據(jù)輸入訓(xùn)練好的融合模型,得到預(yù)測(cè)出的振擺并作為該工況下振擺的標(biāo)準(zhǔn)值。
(6)將采集的振擺數(shù)據(jù)與標(biāo)準(zhǔn)數(shù)據(jù)做對(duì)比,標(biāo)記異常數(shù)據(jù)及異常等級(jí)。其中異常等級(jí)的劃分遵循以下原則:當(dāng)振動(dòng)值與擺度值小于40 μm時(shí),若幅度大于預(yù)測(cè)值10 μm以上,判斷為二級(jí)幅度異常,若幅度大于預(yù)測(cè)值20 μm以上,判斷為一級(jí)幅度異常。當(dāng)振動(dòng)值與擺度值大于40 μm時(shí),當(dāng)幅度大于預(yù)測(cè)值的10%~25%,判斷為二級(jí)幅度異常;當(dāng)幅度大于預(yù)測(cè)值的25%時(shí),判斷為一級(jí)幅度異常。
支持向量回歸(SVR)是一種基于支持向量機(jī)(SVM)的用于回歸的機(jī)器學(xué)習(xí)方法[8]。本文基于SVR,結(jié)合振擺及相關(guān)測(cè)點(diǎn)數(shù)據(jù),通過(guò)在樣本空間中找到一條曲線并使所有數(shù)據(jù)點(diǎn)都盡量離該曲線足夠近,以實(shí)現(xiàn)對(duì)振擺數(shù)據(jù)擬合回歸功能[9]。其模型如圖2所示。
圖2 支持向量回歸模型
當(dāng)存在n個(gè)輸入變量時(shí),假設(shè)一個(gè)非線性估計(jì)模型:
其中,b代表偏差,w為權(quán)重向量,φ(?)為高維特征空間[10],xi為輸入向量。
SVR的最終目的即通過(guò)最大化間隔帶的寬度與最小化總損失來(lái)優(yōu)化模型,求解得到f(x)中的w和b,則在求解過(guò)程中,需滿足一定的約束條件,即:
實(shí)際應(yīng)用中,ε設(shè)置太小無(wú)法保證所有樣本點(diǎn)都在間隔帶中,ε太大回歸超平面會(huì)被一些異常點(diǎn)帶偏,為此SVR允許每個(gè)樣本(xi,yi)添加松弛變量ξi以避免優(yōu)化問(wèn)題求解不可行。此時(shí)SVR目標(biāo)函數(shù)表示為[11]:
式中,C為懲罰系數(shù),C過(guò)大或過(guò)小都不恰當(dāng),本文取值C=1以獲得較好的擬合效果。
LightGBM以決策樹(shù)為弱分類器,在傳統(tǒng)梯度提升樹(shù)(Gradient Boosting Decision Tree,GBDT)的基礎(chǔ)上,在生長(zhǎng)策略上做了優(yōu)化。優(yōu)化方式包括特征直方圖、單邊梯度采樣、互斥特征捆綁和Leaf-wise。
假設(shè)訓(xùn)練數(shù)據(jù)集為{(x1,y1),(x2,y2),…(xN,yN)},初始化分類器其中h0(x)為選定的首個(gè)基學(xué)習(xí)器,并設(shè)定T個(gè)基學(xué)習(xí)器的訓(xùn)練目標(biāo),每個(gè)基學(xué)習(xí)器的計(jì)算方法如下。
(1)當(dāng)前損失函數(shù)的負(fù)梯度myi的計(jì)算公式如下:
(2)擬合myi得到當(dāng)前基學(xué)習(xí)器ht的參數(shù):
(3)最小化損失函數(shù)得到當(dāng)前基學(xué)習(xí)器的權(quán)重:
最終的分類器Ft(x)即為每個(gè)基學(xué)習(xí)器的加權(quán)和:
XGBoost同樣以決策樹(shù)為弱學(xué)習(xí)器,其集成模型如式(8)所示。
K是基學(xué)習(xí)器的數(shù)量;R代表基學(xué)習(xí)器的集合空間;fk表示集合R中的一個(gè)函數(shù)。
XGBoost的目標(biāo)函數(shù)如下:
其中T為葉子結(jié)點(diǎn)數(shù)量;γ代表懲罰函數(shù)系數(shù);ωj代表葉子結(jié)點(diǎn)的權(quán)重;λ代表正則化懲罰項(xiàng)系數(shù)。
為增加模型的魯棒性,將三種模型進(jìn)行最小二乘權(quán)值融合,假設(shè)SVR預(yù)測(cè)結(jié)果為y1,LightGBM預(yù)測(cè)結(jié)果為y2,XGBoost預(yù)測(cè)結(jié)果為y3,那么融合后模型的預(yù)測(cè)值y'符合以下約定:
其中β為SVR權(quán)值占組合權(quán)值的比例,γ為L(zhǎng)ightGBM占組合權(quán)值的比例,λ為XGBoost占組合權(quán)值的比例,滿足:
對(duì)綜合權(quán)值進(jìn)行最優(yōu)求解:
實(shí)驗(yàn)時(shí)選取水輪機(jī)水導(dǎo)擺度和頂蓋振動(dòng)作為預(yù)測(cè)目標(biāo),經(jīng)過(guò)專家經(jīng)驗(yàn)篩選49個(gè)相關(guān)特征后,采用皮爾森系數(shù)相關(guān)性分析后,選取25個(gè)高相關(guān)特征作為特征集合。將歷史數(shù)據(jù)拆分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),分別采用SVR、LightGBM和XGBoost進(jìn)行訓(xùn)練和測(cè)試,進(jìn)一步的,為增加模型的魯棒性,采用最小二乘法將三種模型進(jìn)行權(quán)值融合,融合后的權(quán)值分配如表1所示。
表1 融合模型權(quán)值分配結(jié)果
將所有模型的預(yù)測(cè)結(jié)果選取其中100個(gè)點(diǎn)進(jìn)行繪圖,實(shí)驗(yàn)結(jié)果如下:
從圖3可以看出,四種方法在測(cè)試集上的預(yù)測(cè)結(jié)果與真實(shí)值的趨勢(shì)保持一致,說(shuō)明四種方法對(duì)于振擺的預(yù)測(cè)均有良好的效果。為進(jìn)一步對(duì)模型效果進(jìn)行評(píng)價(jià),決定系數(shù)R2指標(biāo)對(duì)四種模型進(jìn)行評(píng)價(jià),R2得分反映因變量的全部變異能通過(guò)回歸關(guān)系被自變量解釋的比例,表示為:
圖3 不同模型預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比圖
其中,yi表示真實(shí)的觀測(cè)值,用表示真實(shí)觀測(cè)值的平均值,用表示預(yù)測(cè)值,MSE為均方誤差,Var為方差。
R2評(píng)分的取值范圍為[0,1],值越趨近于1表示模型擬合效果越好[12]。其結(jié)果如表2所示。
表2 不同模型評(píng)價(jià)結(jié)果
從表2可以看出,三種方法在水導(dǎo)擺度和頂蓋振動(dòng)上的R2系數(shù)均大于0.95,說(shuō)明三種模型均能有效預(yù)測(cè)振擺值,但通過(guò)對(duì)比,經(jīng)過(guò)最小二乘融合后的模型,R2評(píng)分可以達(dá)到0.98以上,有顯著的效果提升。
將融合模型進(jìn)行封裝后實(shí)時(shí)預(yù)測(cè)振擺值,并按照相關(guān)規(guī)則對(duì)異常數(shù)據(jù)和對(duì)應(yīng)的告警等級(jí)進(jìn)行記錄。
(1)在振擺預(yù)測(cè)分析的問(wèn)題上,采用專家經(jīng)驗(yàn)和特征工程技術(shù)共同選定特征集合可以綜合考慮影響振擺變化的因素,全面準(zhǔn)確地提供有效的數(shù)據(jù)基礎(chǔ)。
(2)本文所采用的基學(xué)習(xí)器SVR、LightGBM和XGBoost均能夠有效地對(duì)振擺值進(jìn)行預(yù)測(cè),模型R2評(píng)分可以達(dá)到0.95以上。
(3)本文所研究的基于多模型融合的振擺分析模型在基學(xué)習(xí)器的基礎(chǔ)上,通過(guò)基學(xué)習(xí)器的不同表現(xiàn)進(jìn)行權(quán)值分配,融合后的模型能夠更加有效和穩(wěn)定的預(yù)測(cè)振擺,R2評(píng)分達(dá)到0.98以上,對(duì)比單一模型的效果,有了顯著的優(yōu)化與提升。
(4)本文所研究的方法可以拓展適用于其他部位的預(yù)測(cè),例如水輪機(jī)瓦溫預(yù)測(cè)等。