付恩強(qiáng),黎天雙,楊佳林,楊金聲,宋 美,馬亞杰
(魯東大學(xué)數(shù)學(xué)與統(tǒng)計(jì)科學(xué)學(xué)院,山東 煙臺(tái) 264000)
近年來,清潔能源得到不斷推廣,中國風(fēng)電行業(yè)得到了大力發(fā)展,但由于風(fēng)電場大多數(shù)建造于偏遠(yuǎn)地區(qū),運(yùn)行環(huán)境惡劣,維護(hù)困難,導(dǎo)致風(fēng)電的單位產(chǎn)出成本較高,所以降低運(yùn)維成本是風(fēng)電行業(yè)需要解決的關(guān)鍵問題[1]。發(fā)電機(jī)作為風(fēng)電機(jī)組的重要部件,其運(yùn)行狀況極大地影響著風(fēng)機(jī)的工作效率,目前在風(fēng)電領(lǐng)域,研究者在溫度預(yù)測方面更傾向于對(duì)齒輪箱油,齒輪箱內(nèi)部軸承,發(fā)電機(jī)軸承等重要部件展開研究,如韋古強(qiáng)等[2]基于隨機(jī)森林算法對(duì)齒輪箱故障進(jìn)行分類,實(shí)現(xiàn)智能診斷,許駿龍等[3]運(yùn)用最小二乘法支持向量機(jī)對(duì)風(fēng)電機(jī)組齒輪箱故障進(jìn)行預(yù)測診斷。周致富等[4]建立基于BP 神經(jīng)網(wǎng)絡(luò)和Pearson 相關(guān)系數(shù)的發(fā)電機(jī)軸承溫升故障診斷模型,用來預(yù)測預(yù)測風(fēng)機(jī)發(fā)電機(jī)軸承溫升變化,通過將溫度預(yù)測值與正常工況下的溫度值進(jìn)行誤差對(duì)比,判斷發(fā)電機(jī)是否處于正常工作狀態(tài)。前述方法并沒有涉及發(fā)電機(jī)繞組溫度預(yù)測,而繞組溫度作為反映發(fā)電機(jī)健康狀態(tài)的關(guān)鍵指標(biāo),需要實(shí)時(shí)判斷并預(yù)知其走向,以便及時(shí)排查故障并制定維修方案,避免發(fā)電機(jī)的嚴(yán)重?fù)p毀[5]。
鑒于此,本文采用SCADA 數(shù)據(jù)庫中并網(wǎng)狀態(tài)下正常運(yùn)行的數(shù)據(jù),利用Pearson相關(guān)系數(shù)等篩選特征變量,再經(jīng)與多種機(jī)器學(xué)習(xí)模型對(duì)比,建立最優(yōu)模型對(duì)發(fā)電機(jī)繞組溫度進(jìn)行故障監(jiān)測,利用多重指標(biāo)來對(duì)所選模型的準(zhǔn)確率做出評(píng)價(jià),最后對(duì)比真實(shí)溫度與預(yù)測溫度,在兩者偏離程度較大時(shí)發(fā)出預(yù)警,并指導(dǎo)工作人員進(jìn)行維修處理。
本文基于某風(fēng)場的A15 風(fēng)機(jī)進(jìn)行建模研究,從SCADA 數(shù)據(jù)庫中 提 取了2018 年1 月-2019 年12 月以1 分鐘為時(shí)間間隔的數(shù)據(jù),共約91 萬條,經(jīng)專家經(jīng)驗(yàn)指導(dǎo),篩選并網(wǎng)狀態(tài)下的數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行如下處理:①刪去含有缺失值的數(shù)據(jù)行與數(shù)據(jù)列;②刪除日期時(shí)間列和控制狀態(tài)列;③故障前一段時(shí)間溫度呈不正常趨勢,故刪除故障前后24 小時(shí)的數(shù)據(jù),以減少數(shù)據(jù)異常波動(dòng)帶來的影響。經(jīng)上述預(yù)處理后有效數(shù)據(jù)為665667條。
上述預(yù)處理所得數(shù)據(jù)中的變量并不都有利于模型的訓(xùn)練。為減少特征變量,提高訓(xùn)練后模型的敏感度與準(zhǔn)確度,對(duì)輸入變量進(jìn)行特征選擇。結(jié)合相關(guān)資料與專家經(jīng)驗(yàn),本文選擇發(fā)電機(jī)繞組溫度作為特征變量。
利用Pearson 相關(guān)系數(shù)和隨機(jī)森林算法對(duì)變量進(jìn)行重要性排序,對(duì)可能影響發(fā)電機(jī)繞組軸承溫度的8 個(gè)輸入變量的重要性進(jìn)行加權(quán)打分,得出排序結(jié)果如表1所示。
表1 變量重要性排序表
為了評(píng)價(jià)所選模型的準(zhǔn)確率及穩(wěn)健性,本文用均方誤差(MSE)、平均絕對(duì)誤差(MAE)、平均相對(duì)誤差絕對(duì)值(MAPE)、擬合優(yōu)度(R Squared)四項(xiàng)評(píng)價(jià)指標(biāo)對(duì)整個(gè)模型訓(xùn)練的優(yōu)劣進(jìn)行總體的評(píng)判。
為了證明所選擇模型對(duì)故障預(yù)警和溫度預(yù)測的能力優(yōu)于其他模型,本文將XGBoost 算法與其他兩種算法進(jìn)行了對(duì)比,根據(jù)相應(yīng)的判別指標(biāo)來比較三者的優(yōu)劣,本文保證了三者訓(xùn)練數(shù)據(jù)和檢驗(yàn)數(shù)據(jù)的一致,利用第一步數(shù)據(jù)預(yù)處理得到的數(shù)據(jù),將訓(xùn)練集和測試集都按照7:3劃分(表2),確保唯一變量。
表2 數(shù)據(jù)集劃分表
對(duì)比發(fā)現(xiàn),XGBoost 時(shí)效性更佳,穩(wěn)定性更好,預(yù)測準(zhǔn)確性更高,表2是各模型計(jì)算得出的指標(biāo)結(jié)果。
表3 模型對(duì)比結(jié)果表
結(jié)合上表2,我們得出三者各項(xiàng)指標(biāo)對(duì)比圖(圖1),更加清晰直觀的看出三者的優(yōu)劣,經(jīng)過上述對(duì)比,本文決定選取模型預(yù)測效果最好的XGBoost 算法建立模型。
圖1 各項(xiàng)指標(biāo)對(duì)比圖
本文設(shè)置樹的深度、樹的棵數(shù)等參數(shù),先用機(jī)器學(xué)習(xí)中的隨機(jī)搜索來確定參數(shù)的粗略范圍,再進(jìn)一步利用網(wǎng)格搜索對(duì)參數(shù)調(diào)優(yōu),得出局部最優(yōu)參數(shù)組合,采用三折交叉驗(yàn)證方法降低隨機(jī)事件發(fā)生的概率,以此來確保所選模型的準(zhǔn)確性和穩(wěn)定性,本文XGBoost模型中主要設(shè)定以下表中參數(shù)。
本文提出一種基于XGBoost 算法的故障監(jiān)測及預(yù)警模型,用于風(fēng)機(jī)發(fā)電機(jī)繞組軸承溫度故障監(jiān)測與故障原因診斷,流程如圖2所示。
圖2 監(jiān)測模型及預(yù)警系統(tǒng)流程圖
圖2 中對(duì)數(shù)據(jù)預(yù)處理后,以此為訓(xùn)練集輸入多種算法模型中,得出相應(yīng)算法模型的評(píng)價(jià)指標(biāo),對(duì)比得出的評(píng)價(jià)指標(biāo),選擇預(yù)測效果最優(yōu)的XGBoost 算法作為基礎(chǔ)建立故障監(jiān)測模型并應(yīng)用于風(fēng)機(jī)發(fā)電機(jī)監(jiān)測系統(tǒng)中,持續(xù)輸入監(jiān)測數(shù)據(jù)后得出模型圖趨勢,若顯示正常,則繼續(xù)監(jiān)測,若顯示異常(實(shí)際溫度與預(yù)測溫度的差超出閾值),則發(fā)出警報(bào),表明風(fēng)機(jī)可能存在故障。當(dāng)模型試驗(yàn)結(jié)果達(dá)到要求后,可用于實(shí)際風(fēng)場中。
本文提取故障發(fā)生前一天的數(shù)據(jù)進(jìn)行研究,提取歷史數(shù)據(jù)中多段故障數(shù)據(jù),從故障點(diǎn)向前推進(jìn)24小時(shí)對(duì)殘差的絕對(duì)值做均值處理,由此得出多個(gè)預(yù)警閾值,為保證故障發(fā)生時(shí)模型能夠準(zhǔn)確做到不漏報(bào),取故障均值最小值作為預(yù)警閾值。公式如下:
threshold=Min{Mean(R)}[6]
經(jīng)計(jì)算得出閾值為6.5℃。
當(dāng)模型預(yù)測值與所得真實(shí)值偏差較大時(shí),就輸出預(yù)警信號(hào),提示維修工人檢修。但逐一排查耗時(shí)、耗力,針對(duì)此問題,可依據(jù)表4 給出的變量重要性排序優(yōu)先檢修相關(guān)性高的指標(biāo)所對(duì)應(yīng)風(fēng)機(jī)部件,定位故障源頭,及時(shí)檢修,避免造成不必要的經(jīng)濟(jì)損失。
表4 參數(shù)調(diào)優(yōu)表
本文將正常和異常狀態(tài)下的預(yù)測結(jié)果做了可視化處理,為了驗(yàn)證模型的有效性,評(píng)估正常狀態(tài)下的模型預(yù)測效果,本文選取某風(fēng)場A15號(hào)風(fēng)機(jī)2018年12月5 日16:24 這一故障點(diǎn)作為檢驗(yàn)樣本點(diǎn)(日期時(shí)間記錄源于風(fēng)電系統(tǒng)故障記錄表)來檢驗(yàn)異常狀態(tài)下模型的效果,此故障為發(fā)電機(jī)轉(zhuǎn)子繞組故障,本文選擇故障發(fā)生前后各一時(shí)間段內(nèi)約2000 個(gè)樣本點(diǎn)進(jìn)行分析。如圖3所示,在故障發(fā)生前一段時(shí)間,實(shí)際溫度會(huì)發(fā)生一定范圍內(nèi)的波動(dòng),與預(yù)測溫度存在一定偏差屬正?,F(xiàn)象。但如果兩條溫度曲線偏差達(dá)到本文所設(shè)置的閾值時(shí),便考慮風(fēng)機(jī)將要發(fā)生故障。
圖3 發(fā)電機(jī)繞組溫度預(yù)測趨勢圖
圖4 中灰色實(shí)線表示實(shí)際溫度,黑色虛線表示預(yù)測溫度,黑色實(shí)線表示實(shí)測溫度和預(yù)測溫度的殘差值,可以看出兩者擬合效果較好,預(yù)測曲線可較好地反應(yīng)發(fā)電機(jī)繞組的運(yùn)行狀況。
圖4 發(fā)電機(jī)繞組的溫度趨勢圖
圖3中虛線表示實(shí)際溫度,實(shí)線表示預(yù)測溫度,實(shí)線與虛線在矩形方框的位置偏差較大且超出所設(shè)置的閾值,故判斷矩形方框位置風(fēng)機(jī)可能發(fā)生了故障。與故障記錄表對(duì)比,此時(shí)段確有故障發(fā)生。
從圖5可以更加清晰地看到預(yù)測溫度與實(shí)際溫度的殘差。方框位置殘差較大且超出閾值,模型預(yù)警,工作人員可根據(jù)表4 依次對(duì)故障進(jìn)行定位,在故障發(fā)生前將問題解決,極大地降低因風(fēng)機(jī)故障導(dǎo)致風(fēng)機(jī)停機(jī)所帶來的經(jīng)濟(jì)損失。實(shí)驗(yàn)結(jié)果表明,本文提出的模型實(shí)用性良好。
圖5 發(fā)電機(jī)繞組溫度殘差圖
本文首先選取相關(guān)性大的變量作為特征變量,在此基礎(chǔ)上建立三種機(jī)器學(xué)習(xí)模型對(duì)所得數(shù)據(jù)進(jìn)行訓(xùn)練,根據(jù)所得的評(píng)價(jià)指標(biāo),最終選定最優(yōu)的XGBoost模型作為故障預(yù)警的最終模型,結(jié)合多段故障點(diǎn)前24小時(shí)的殘差數(shù)據(jù),將多個(gè)殘差的最小均值作為預(yù)警閾值,實(shí)現(xiàn)了故障狀態(tài)監(jiān)測和故障原因診斷,本項(xiàng)目對(duì)降低風(fēng)機(jī)故障損失、提高風(fēng)場經(jīng)濟(jì)效益具有重大意義。