梁川
摘 ?要:風電場風機葉片積冰會造成風電機組的效率降低,嚴重時會導致葉片斷裂,嚴重威脅風電場的正常生產(chǎn)運行。文章提出了一種基于一維卷積神經(jīng)網(wǎng)絡的風機葉片結(jié)冰預測方法,能夠根據(jù)風機運行的SCADA數(shù)據(jù)對葉片結(jié)冰的早期過程進行精確預測,并采用某風電場的2臺風機數(shù)據(jù)進行模型驗證和對比試驗,并提出了針對不平衡數(shù)據(jù)集處理的加權(quán)精確率的評價指標。實驗結(jié)果表明文章所提方法能有效預測風機的早期故障,對設備作出預測性維護,減少經(jīng)濟損失。
關鍵詞:卷積神經(jīng)網(wǎng)絡;葉片結(jié)冰;故障預測
中圖分類號:TH165 ? ? ? ? 文獻標志碼:A ? ? ? ? 文章編號:2095-2945(2020)32-0132-04
Abstract: Ice accumulation on wind turbine blades of wind farms will reduce the efficiency of wind turbines. In severe cases, the blades will break, which seriously threatens the normal production and operation of wind farms. This paper proposes a wind turbine blade icing prediction method based on a one-dimensional convolutional neural network, which can accurately predict the early process of blade icing based on the SCADA data of the wind turbine operation. Using2 wind turbine data of a wind farm, this paper conducts model verification and comparative experiments, and then puts forward evaluation indexes of weighted accuracy rate for imbalanced data set processing. The experimental results show that the method proposed in this paper can effectively predict the early failure of the fan, make predictive maintenance on the equipment, and reduce economic losses.
Keywords: convolutional neural network; blade icing; fault prediction
1 概述
隨著經(jīng)濟的發(fā)展,人們對于能源的依賴逐步加強,化石燃料能源對生態(tài)環(huán)境負面影響很大,因此,可再生能源的發(fā)展備受關注。其中,風能便是常用可再生能源之一[1]。但將風能轉(zhuǎn)化為電能的風機時常會受到低溫潮濕環(huán)境影響,葉片容易發(fā)生結(jié)冰現(xiàn)象,從而影響風機的發(fā)電性能和安全性[2]。因此,對風機葉片結(jié)冰預測研究具有較高的應用價值。
故障預測與健康管理[3](PHM)是指利用傳感器采集系統(tǒng)的數(shù)據(jù)信息,借助于信息技術、人工智能推理算法來監(jiān)控,在系統(tǒng)發(fā)生故障之前對其故障進行預測,并結(jié)合現(xiàn)有的資源信息提供一系列的維護保障建議或決策,它是一種集故障檢測、隔離、健康預測與評估及維護決策于一身的綜合技術。在整個過程中,故障的預測的精確性和準確性對整個系統(tǒng)起的關鍵作用,具有很大的潛在研究價值。Mostafa B等人[4]提出了一種基于時域和頻域(FFT相角和PSD)統(tǒng)計分析、主成分分析(PCA)和自適應神經(jīng)模糊推理系統(tǒng)(ANFIS)的智能故障預測方法。Amruthnath N等人[5]提出了一種基于模型聚類的無監(jiān)督學習故障類別預測,避免了對歷史數(shù)據(jù)的需求。
國內(nèi)外對于風機葉片結(jié)冰的故障預測的研究尚處于起步階段,由于風機葉片本身結(jié)構(gòu)復雜,因此一般的結(jié)冰狀態(tài)監(jiān)測主要是在風機葉片上加裝葉片傳感器。Simani等[6]提出了數(shù)據(jù)驅(qū)動方法對風機的早期故障進行檢測,主要運用了模糊系統(tǒng)和神經(jīng)網(wǎng)絡來描述測量和故障之間的強非線性關系。Hongyuan Xiao等[7]采用人工蜂群(ABC)和EMD分解方法對支持向量機(SVM)的模型進行優(yōu)化,提高了對風機故障診斷和預測的精度。張明德等[8]提出了一種基于多尺度卷積策略CNN的滾動軸承故障診斷方法,其將表征滾動軸承故障的一維振動信號輸入模型,然后利用卷積層中的多尺度卷積結(jié)構(gòu)對原始信號進行卷積運算,最后通過池化層進行特征信息的提煉和簡化,從而實現(xiàn)滾動軸承故障診斷。
本文以國內(nèi)某風機場的2臺風機數(shù)據(jù)分別進行模型訓練和測試,采用了一種基于一維卷積神經(jīng)網(wǎng)絡的模型結(jié)構(gòu)對風機葉片結(jié)冰進行預測,有效提高對風機結(jié)冰故障的預測準確率。提出了針對不平衡數(shù)據(jù)集處理的加權(quán)精確率評價指標,提升了結(jié)果的可靠性。
2 基于一維卷積神經(jīng)網(wǎng)絡的風機故障預測算法
卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)是一種深度學習架構(gòu)[9]。其獨特的多卷積層次結(jié)構(gòu)使得模型具有學習序列數(shù)據(jù)更深層次特征的能力,提高模型的魯棒性。卷積運算是CNN的核心操作,其本質(zhì)就是對數(shù)據(jù)進行特征提取,其通過不同的卷積核對輸入數(shù)據(jù)進行卷積運算,從而獲取數(shù)據(jù)的全局化特征,再經(jīng)過池化操作對提取到的特征進行下采樣,在降低運算量的同時也可以一定程度抑制模型的過擬合。卷積神經(jīng)網(wǎng)絡主要涉及三個基本概念[8]:局部感知、參數(shù)共享和池化。在卷積層中,每一個卷積核都會連接到輸入數(shù)據(jù)的一個小區(qū)域上,然后通過時間步的方式在輸入矩陣上進行不斷掃描,這個過程就是局部感知。卷積核通過對掃描區(qū)域不斷進行內(nèi)積運算,從而實現(xiàn)特征映射。其數(shù)學模型表述如下:
其中,Xt:t+k-1表示經(jīng)過時間步處理的時間序列,k表示卷積核的大小;WT為共享的權(quán)重參數(shù),b為共享偏置,共享權(quán)重和共享偏置的機制使得模型的訓練參數(shù)大大減少,也使得卷積神經(jīng)網(wǎng)絡學到的模式具有了平移不變性,從而使得卷積神經(jīng)網(wǎng)絡在訓練模型時可以高效利用數(shù)據(jù),提高模型的訓練速度和泛化能力。f(·)為激活函數(shù),激活函數(shù)為模型引入了非線性因素,使得模型的表達能力大大增強。max(·)函數(shù)為最大池化函數(shù),其可以在保留卷積層特征的同時降低模型訓練的數(shù)據(jù)量。
卷積神經(jīng)網(wǎng)絡最初是被設計出來處理圖像數(shù)據(jù),由于每次都是直接在圖像矩陣上用同樣的卷積核對像素點進行卷積操作,所以與傳統(tǒng)的全連接神經(jīng)網(wǎng)絡相比,卷積神經(jīng)網(wǎng)絡能夠大幅降低模型訓練所需要的參數(shù),從而提高模型的訓練速度。一維卷積神經(jīng)網(wǎng)絡[10]是卷積神經(jīng)網(wǎng)絡的演變版,可以很好地應用于傳感器數(shù)據(jù)的時間序列分析,與專門用來處理時間序列數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡相比,一維卷積神經(jīng)網(wǎng)絡具有結(jié)構(gòu)更加簡單,處理速度更快的優(yōu)點。圖1為一維卷積神經(jīng)網(wǎng)絡的工作原理,其利用一維卷積核在時間序列上進行滑動,由于其每次處理的數(shù)據(jù)為一個時間周期而不是某一時刻的數(shù)據(jù),所以它能夠提取到序列數(shù)據(jù)在時間維度上體現(xiàn)出來的前后變化關系,從而學習到更多的數(shù)據(jù)信息,進而提高模型的精度以及泛化能力。
3 實驗
本文采用的數(shù)據(jù)集來自2017年國內(nèi)首屆工業(yè)大數(shù)據(jù)創(chuàng)新競賽,該數(shù)據(jù)集包含兩臺風機近兩個月的SCADA系統(tǒng)數(shù)據(jù)及對應的正常和故障狀態(tài)的時間段,數(shù)據(jù)集共有26個特征維度,共包含584382條樣本。
3.1 數(shù)據(jù)預處理
數(shù)據(jù)集中包含了正常數(shù)據(jù)、故障數(shù)據(jù)以及無效數(shù)據(jù),分別將其對應的樣本標簽標記為0,1,2。其中,對于無效數(shù)據(jù),在實際的模型訓練中將其刪除。如圖2所示,在風機的26個特征維度中,由于風機三個葉片的相同屬性值表現(xiàn)出強線性關系,可通過取這些相同屬性的平均值來代替原有的多個特征。經(jīng)處理后,數(shù)據(jù)集剩余553715×20組數(shù)據(jù)。
為了將單純的分類問題轉(zhuǎn)換成故障預測問題,需要對風機數(shù)據(jù)集進行重新分割,但該數(shù)據(jù)集本身存在數(shù)據(jù)采樣周期不一致的問題,需要對數(shù)據(jù)進行重采樣,將數(shù)據(jù)處理成等時間間隔的標準時序數(shù)據(jù)。通過計算,該數(shù)據(jù)集采樣的平均周期維持在7.5s左右,考慮到神經(jīng)網(wǎng)絡對數(shù)據(jù)量的要求比較高,本文采用周期為10s對原數(shù)據(jù)集進行重新采樣,把數(shù)據(jù)分割成等時間間隔的時序數(shù)據(jù)。通過重采樣處理好的數(shù)據(jù)為一個時間步對應一個標簽,但是這種數(shù)據(jù)無法被用作故障預測,故障預測問題需要用設備歷史數(shù)據(jù)來推斷設備未來的狀態(tài),所以需要對數(shù)據(jù)進行重新分割。如圖3所示,經(jīng)過多次嘗試,本文最終選擇每次取20條數(shù)據(jù)作為一個時間窗口,將其作為歷史數(shù)據(jù),再取對應時間窗口后面的第10條數(shù)據(jù)的標簽值作為設備未來狀態(tài)的標簽,最后以10為步長在數(shù)據(jù)集上進行滑動,將數(shù)據(jù)集重新分割成符合故障預測的標準數(shù)據(jù)集。經(jīng)數(shù)據(jù)分割處理后,數(shù)據(jù)集被分為55369組大小為(20,20)的新樣本。
3.2 數(shù)據(jù)集劃分及模型訓練
在處理完成的新數(shù)據(jù)集中取最后的15369條樣本作為模型最終的測試集,其中故障樣本971條,正常樣本14398條。將前面的40000條樣本按7:3的比例劃分為訓練集與驗證集,將數(shù)據(jù)輸入所提模型進行訓練,模型結(jié)構(gòu)如圖4所示。
圖5和圖6分別展示了模型訓練過程中訓練集和驗證集上的損失和準確率的變化曲線,其中橫坐標為模型訓練次數(shù)。從圖中可以看出,無論是訓練集還是驗證集,損失值整體呈下降趨勢,精度呈上升趨勢,模型擬合情況良好,沒有出現(xiàn)過擬合情況。后期的精度雖然出現(xiàn)了一定的下降,但仍具有上升趨勢,通過增加訓練次數(shù)可能讓模型具有更好的表現(xiàn)效果。
4 實驗結(jié)果分析
在測試集上對模型進行測試,結(jié)果如圖5所示,其中上方部分為真實值,下方部分為預測值。
為判定此算法的性能,本文采用了準確率(Accuracy)、精確率(Precision)、召回率(Recall)、特異度(Specificity)和加權(quán)正確率(Weighted-Accuracy)。各個指標的定義如下:
其中,TP指正類判定為正類,F(xiàn)P指負類判定為正類,F(xiàn)N指正類判定為負類,TN指負類判定為負類。準確率是指分類模型所有判斷正確的結(jié)果占總觀測值的比重;精確率是指被分為正類的示例中實際為正類的比例;召回率是指在所有正類樣本中被預測正確的概率;特異度是值在所有負類樣本中被預測正確的概率;加權(quán)正確率是綜合考慮正類和負類的樣本數(shù)量,使用加權(quán)的方法來解決樣本不均衡所帶來的評價不嚴謹?shù)膯栴}。
表1展示了本文所提方法在各個評價指標下的故障預測效果。
5 結(jié)論
現(xiàn)有風電機組結(jié)冰預測方式的準確率和精確率還有一定欠缺,本文提出的基于一維卷積神經(jīng)網(wǎng)絡的風機結(jié)冰故障預測方法,對準確率和精確率有了些許提升,該方法在風機預測時提前預測給出結(jié)冰預警,有效避免因風機結(jié)冰而產(chǎn)生的不必要損失,有效運用了風機的數(shù)據(jù),對風機結(jié)冰故障預測的研究有實際意義。
使用加權(quán)精確率的評價指標可以綜合正類的準確率和負類的準確率,進一步降低原始數(shù)據(jù)不平衡而導致的單個精確率的可參考性。
參考文獻:
[1]薛陽,王琳,王舒,等.一種結(jié)合CNN和GRU網(wǎng)絡的超短期風電預測模型[J].可再生能源,2019(3):456-462.
[2]張延伍.可再生能源政策對發(fā)電行業(yè)的影響分析[D].華北電力大學,2019.
[3]曾聲奎,Michael G. Pecht, 吳際.故障預測與健康管理(PHM)技術的現(xiàn)狀與發(fā)展[J].航空學報,2005,26(5):626-632.
[4]Mostafa B, Hossein J, Ebrahim E. Intelligent Prediction of Fault Severity of Tractor's Gearbox by Time-domain and Frequency-domain(FFT phase angle and PSD) Statistics Analysis and ANFIS[J]. Journal of Mechanical Engineering, 2018,47(1):51.
[5]Amruthnath N, Gupta T. Fault class prediction in unsupervised learning using model-based clustering approach[C]// International Conference on Information & Computer Technologies. IEEE, 2018.
[6]Simani S, Farsoni S, Castaldi P. DATA-DRIVEN TECHNIQUES FOR THE FAULT DIAGNOSIS OF A WIND TURBINE BENCHMARK[J]. International Journal of Applied Mathematics and Computer ence, 2018,28(2):247-268.
[7]Hongyuan Xiao, Yuejia Sun, Yibo Jin. Optimization about Fault Prediction and Diagnosis of Wind Turbine Based on Support Vector Machine[C]// International Conference on Measuring Technology & Mechatronics Automation. IEEE Computer Society, 2018.
[8]張明德,盧建華,馬婧華.基于多尺度卷積策略CNN的滾動軸承故障診斷[J].重慶理工大學學報(自然科學),2020(06):102-110.
[9]周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡研究綜述[J].計算機學報,2017(6):1229-1251.
[10]謝遠東,雷文平,韓捷.基于全矢1D-CNN的軸承故障診斷研究[J].設備管理與維修,2019(15):21-24.