李雄威,郭曉雅,李庚達,崔青汝,伍 權(quán)
(國家能源集團新能源技術(shù)研究院有限公司,北京 102209)
對風電機組進行狀態(tài)監(jiān)測,在性能劣化早期階段及時預警,能夠有效降低機組故障和電量損失,提升風電場運行效益[1]。作為風電機組的重要部件,齒輪箱長期運行于變工況變載荷條件下,易發(fā)生齒輪表面磨損等問題,若不及時處理將導致嚴重故障[2]。由于齒輪箱故障停機時間長、維護成本高,一旦發(fā)生嚴重故障往往會造成較大的經(jīng)濟損失。因此,開展風電機組齒輪箱狀態(tài)監(jiān)測研究,對于降低機組運維成本、提高可靠性具有重要意義。
風電機組數(shù)據(jù)采集與監(jiān)控(SCADA)系統(tǒng)積累了大量包含機組狀態(tài)信息的數(shù)據(jù),基于SCADA數(shù)據(jù)的齒輪箱狀態(tài)監(jiān)測受到越來越多的關注,多種建模方法被應用于基于SCADA數(shù)據(jù)的齒輪箱狀態(tài)監(jiān)測[3]。文獻[4]基于具有外生輸入的非線性自回歸神經(jīng)網(wǎng)絡分別建立了齒輪箱軸承溫度和潤滑油溫度模型,并應用馬氏距離方法對齒輪箱異常狀態(tài)進行監(jiān)測。文獻[5]提出了一種基于長短期記憶(LSTM)網(wǎng)絡的齒輪箱故障預測方法,該方法表現(xiàn)出了更好的預測性能,能夠較早預測故障的發(fā)生。文獻[6]提出了一種基于自適應神經(jīng)模糊推理系統(tǒng)的建模方法,結(jié)合人工神經(jīng)網(wǎng)絡和模糊邏輯對異常狀態(tài)進行診斷,同時基于if-then規(guī)則提取異常情況的根原因。文獻[7]提出了一種齒輪箱狀態(tài)監(jiān)測廣義模型,分別采用BP神經(jīng)網(wǎng)絡、徑向基神經(jīng)網(wǎng)絡和最小二乘支持向量機建立了齒輪箱狀態(tài)預測模型,并利用信息熵從預測模型殘差中提取有用信息用于故障預警。
人工神經(jīng)網(wǎng)絡能夠模擬變量間復雜的非線性關系,被廣泛應用于齒輪箱狀態(tài)監(jiān)測,但其存在模型擬合參數(shù)多、訓練時間長、易陷入局部最優(yōu)解等問題[8]?;貧w分析能夠在一定程度上避免這些問題,從此,其也被用于齒輪箱狀態(tài)監(jiān)測。但是,常用的多元線性回歸方法在應用中存在著兩個問題。一是由于SCADA數(shù)據(jù)間存在多重線性相關性,使用最小二乘方法可能出現(xiàn)數(shù)據(jù)量冗余和過擬合等問題;二是多元線性回歸方法不能模擬變量間的非線性關系。為解決上述問題,本文建立了一種基于非線性偏最小二乘法(PLS)的齒輪箱狀態(tài)監(jiān)測方法,對SCADA數(shù)據(jù)進行簡化和降維,并在模型中構(gòu)建能夠表征非線性關系的輸入變量,從而更好地對齒輪箱狀態(tài)進行監(jiān)測。
由于齒輪箱狀態(tài)監(jiān)測模型的建立依賴于從訓練集數(shù)據(jù)中學習輸入輸出的映射關系,因此減少訓練集數(shù)據(jù)錯誤、提高數(shù)據(jù)質(zhì)量很重要。若風電機組在信號采集、傳輸或處理過程中出現(xiàn)故障,將會導致SCADA采集數(shù)據(jù)出現(xiàn)異常。因此,本文根據(jù)SCADA數(shù)據(jù)的閾值范圍,對超出閾值范圍的數(shù)據(jù)進行剔除,并去除停機點數(shù)據(jù)。
在限功率條件下,機組發(fā)出的功率低于正常狀態(tài)下的功率值,限功率數(shù)據(jù)也被認為是非正常狀態(tài)數(shù)據(jù)。采用兩步無監(jiān)督聚類對SCADA數(shù)據(jù)進行清洗。首先,采用對噪聲具有較強適應能力的K-medoids聚類算法對SCADA數(shù)據(jù)進行初步劃分,得到若干分段數(shù)據(jù)類。然后,針對不同簇的聚類結(jié)果,選用具有非凸聚類能力的流形譜聚類算法執(zhí)行第二步聚類。以理論風功率曲線為參考,將不同類中遠離理論風功率曲線的類視為異常數(shù)據(jù)類,從而濾除限功率數(shù)據(jù)及數(shù)據(jù)異常值。
在齒輪箱運行異常時,齒輪箱油溫預測值與實際值殘差的統(tǒng)計特性會發(fā)生變化,因而將齒輪箱油溫預測值與實際值的殘差作為監(jiān)測變量。選擇齒輪箱油溫作為模型輸出,用于對齒輪箱故障進行預警。若將全部SCADA數(shù)據(jù)用于建模,會增加模型的復雜度和運算時間,需要選擇能夠代表齒輪箱運行狀態(tài)的SCADA數(shù)據(jù)。首先,從SCADA數(shù)據(jù)中初步選取風速、功率、發(fā)電機轉(zhuǎn)速、環(huán)境溫度、機艙溫度、轉(zhuǎn)子轉(zhuǎn)速、U1繞組溫度、U1電壓、U2電壓、U3電壓、齒輪箱軸1溫度、U1電流、U2電流、U3電流、齒輪箱軸2溫度、功率因數(shù)、風向、電網(wǎng)頻率、電機軸承A溫度、對風角度、發(fā)電量、葉片角度和電機軸承B溫度共23個相關參數(shù)。然后,利用相關性分析,分別計算23個SCADA參數(shù)與齒輪箱油溫的相關性。最后,根據(jù)相關性大小,選取用于齒輪箱狀態(tài)監(jiān)測的SCADA參數(shù)作為模型輸入。
假設23個SCADA參數(shù)中的第i個參數(shù)為xi,齒輪箱油溫為y。采用皮爾遜相關系數(shù)法進行相關性計算。
式中:r為變量xi和變量y的皮爾遜相關系數(shù);n為樣本數(shù)量;xij和yj分別為變量xi和變量y的第j個樣本;和分別為變量xi和變量y的n個樣本的平均值。
PLS方法是一種分析多重共線性自變量和因變量影響關系的統(tǒng)計學方法。它綜合了主成分分析、多元線性回歸和典型相關性分析的優(yōu)點,能夠?qū)?shù)據(jù)進行簡化和降維。相比于最小二乘法,PLS方法通過數(shù)據(jù)篩選和簡化能更好地解決數(shù)據(jù)多重相關性的問題,從而建立更為準確的自變量和因變量間的關系表達式[9]。
式中:m為用于建模的SCADA參數(shù)的數(shù)量;li,ki,pi和d均為用PLS方法回歸得到的系數(shù)。
當齒輪箱工作狀態(tài)正常時,齒輪箱油溫模型的輸入?yún)?shù)為正常工作區(qū)間的SCADA運行參數(shù),模型有較好的預測效果。而當齒輪箱工作狀態(tài)異常時,齒輪箱運行特性發(fā)生變化,導致SCADA參數(shù)間的關系發(fā)生變化,從而使得模型預測值與實際值的偏差變大。因此,為了監(jiān)測齒輪箱運行狀態(tài),需要計算齒輪箱油溫模型的預測值與實測值的殘差。設齒輪箱油溫的預測值與實測值的殘差為R。
式中:yj為j時刻齒輪箱油溫的預測值;fj為j時刻齒輪箱油溫的實際測量值。
為了在早期階段對齒輪箱故障進行及時預警,同時避免誤報警,需要對殘差的分布范圍設定合理的上、下閾值。由于殘差是一個隨機變量,一般服從正態(tài)分布,由此設定殘差分布的上、下閾值。
式中:UCL,LCL分別為齒輪箱油溫的預測值和實際值殘差的上界閾值和下界閾值;μ,σ分別為殘差的均值和標準差;c為根據(jù)實驗測試數(shù)據(jù)確定的系數(shù)。
為驗證本文提出的方法的有效性,采用內(nèi)蒙古某風電場9號風電機組的SCADA數(shù)據(jù)進行驗證。該風電機組的額定功率為1.5MW,采用10min平均的SCADA數(shù)據(jù)用于建模分析。采集數(shù)據(jù)的時間為20190101-20190626。該風電機組在6月26日夜間出現(xiàn)齒輪箱故障。為了說明本文提出模型的效果,建立具有一層隱含層的BP神經(jīng)網(wǎng)絡模型并進行對比。本文采用3種指標對兩種模型的定標和預測效果進行評價,分別是模型的擬合優(yōu)度、平均絕對誤差(MAE)和預測均方根誤差(RMSEP)。
首先,對SCADA數(shù)據(jù)進行預處理。圖1為采用無監(jiān)督聚類對SCADA數(shù)據(jù)進行清洗的效果。由圖1可知,經(jīng)過無監(jiān)督聚類過濾后,能有效濾除限功率數(shù)據(jù)及數(shù)據(jù)異常值,從而為建模分析提供了數(shù)據(jù)質(zhì)量保證。
圖1 SCADA數(shù)據(jù)經(jīng)聚類濾除前后的風功率曲線Fig.1 The power curves of the SCADA data before and after the clustering filter
計算23個SCADA參數(shù)與齒輪箱油溫的相關性,部分結(jié)果如表1所示。選擇與齒輪箱油溫相關的14個SCADA參數(shù)作為模型輸入量,齒輪箱油溫作為模型輸出量。
表1 部分SCADA參數(shù)與齒輪箱油溫的相關系數(shù)Table1 Correlation coefficient between several SCADA parameters and gearbox lubricant oil temperature
選取2019年1月份的SCADA數(shù)據(jù)作為訓練集,選取2019年2月份的SCADA數(shù)據(jù)作為測試集,用于評價非線性PLS模型和BP神經(jīng)網(wǎng)絡模型的定標和預測效果。根據(jù)式(2)建立非線性PLS的齒輪箱油溫模型。該模型計算的齒輪箱油溫的預測值和殘差值如圖2所示。由圖2可知,當齒輪箱正常工作時,該模型的預測值與實際值基本吻合。根據(jù)殘差分布,選取殘差的最大值和最小值分別作為上界閾值和下界閾值,分別根據(jù)式(4),(5)計 算c,選 取 計 算 結(jié) 果 的 最 大 值 作 為c的取值。根據(jù)計算結(jié)果,c的取值為4.7。由此得到,殘差分布范圍的上界閾值為9.3℃,下界閾值為-8.2℃。
圖2 基于非線性PLS的齒輪箱油溫模型的預測值和殘差值Fig.2 Prediction and residuals of the gearbox oil temperature model based on non-linear PLS
非線性PLS模型和BP神經(jīng)網(wǎng)絡模型的定標和預測效果如表2所示。由表2可知,相比于BP神經(jīng)網(wǎng)絡模型,非線性PLS模型的R2由0.85提升到0.9,MAE由1.56℃減小 到1.29℃,RMSEP由2.32℃減小到1.77℃。因此,相比于BP神經(jīng)網(wǎng)絡模型,非線性PLS模型對于訓練數(shù)據(jù)的擬合效果更好,同時具有更高的預測準確性。
表2 兩種齒輪箱油溫預測模型的定標和預測性能比較Table2 Calibration and prediction performance of two prediction models for gearbox oil temperature
將基于非線性PLS的齒輪箱狀態(tài)監(jiān)測模型應用于20190201-20190626的9號風電機組齒輪箱狀態(tài)監(jiān)測,結(jié)果如圖3所示。
圖3 基于PLS的齒輪箱油溫模型的狀態(tài)監(jiān)測結(jié)果Fig.3 Results of condition monitoring using the gearbox oil temperature model based on non-linear PLS
由圖3可知,第一個預警信號于2019年4月8日4點10分發(fā)出,此刻殘差值為22.6℃,明顯超出上界閾值。而在此之前,殘差持續(xù)在正常閾值范圍內(nèi)。此時可以判斷齒輪箱狀態(tài)異常,發(fā)出故障預警。此后直至齒輪箱發(fā)生故障,殘差多次明顯超出正常閾值范圍。2019年6月26日9號風電機組齒輪箱出現(xiàn)故障并停機。由此可見,本文建立的基于非線性PLS的齒輪箱狀態(tài)監(jiān)測模型能夠提前約兩個半月對齒輪箱故障進行有效預警。
將基于BP神經(jīng)網(wǎng)絡模型的齒輪箱狀態(tài)監(jiān)測模型應用于20190201-20190626的9號風電機組齒輪箱狀態(tài)監(jiān)測,結(jié)果如圖4所示。
圖4 基于BP神經(jīng)網(wǎng)絡的齒輪箱油溫模型的狀態(tài)監(jiān)測結(jié)果Fig.4 Results of condition monitoring using the gearbox oil temperature model based on BP artificial neural network
由圖4可知,第一個預警信號于2019年4月28日2點10分發(fā)出,此刻殘差值為12.2℃,超出上界閾值。此時判斷齒輪箱狀態(tài)異常,發(fā)出故障預警。由此可見,利用基于BP神經(jīng)網(wǎng)絡模型的齒輪箱狀態(tài)監(jiān)測模型進行判斷,能夠提前約2個月對齒輪箱故障進行預警。相比而言,本文建立的基于非線性PLS的齒輪箱狀態(tài)監(jiān)測模型,能夠比基于BP神經(jīng)網(wǎng)絡模型的齒輪箱狀態(tài)監(jiān)測模型提前約20d對齒輪箱故障進行預警。
風電機組齒輪箱油溫閾值一般設為75℃,當齒輪箱油溫超過75℃時,將進行油溫高報警。20190101-20190626的9號風電機組齒輪箱油溫的變化趨勢如圖5所示。
2019年6月2日4點30分,齒輪箱油溫達到77.4℃,超出油溫閾值,發(fā)出油溫高報警。利用齒輪箱油溫閾值進行判斷,能夠提前約24d對齒輪箱故障進行預警。相比而言,本文建立的基于非線性PLS的齒輪箱狀態(tài)監(jiān)測模型,能夠比油溫高報警提前約8周對齒輪箱故障進行預警,表明本文模型在齒輪箱故障預警上具有較大的優(yōu)勢。
本文建立了基于非線性PLS的風電機組齒輪箱狀態(tài)監(jiān)測方法,對SCADA數(shù)據(jù)進行簡化和降維,并在模型中構(gòu)建了能夠表征非線性關系的輸入變量。根據(jù)模型輸出結(jié)果與齒輪箱油溫的殘差分布,設置合理閾值,對齒輪箱狀態(tài)進行監(jiān)測。采用內(nèi)蒙古某風場風電機組的SCADA數(shù)據(jù)對本文建立的齒輪箱狀態(tài)監(jiān)測模型進行驗證。結(jié)果表明,相比于BP神經(jīng)網(wǎng)絡模型,本文提出的非線性PLS模型具有更高的擬合優(yōu)度和預測精度,且相比于齒輪箱油溫高預警能夠提前約8周對齒輪箱故障進行有效預警,在齒輪箱狀態(tài)監(jiān)測上具有很大的應用潛力。