劉帥 劉長良 甄成剛
摘 要:針對風電機組故障預警中,原始動態(tài)時間規(guī)整(DTW)算法無法有效度量風電機組多變量時間序列數(shù)據(jù)之間距離的問題,提出一種基于猶豫模糊集的動態(tài)時間規(guī)整(HFS-DTW)算法。該算法是原始DTW算法的一種擴展算法,可對單變量和多變量時間序列數(shù)據(jù)進行距離度量,且精度與速度較原始DTW算法更優(yōu)。以子時間序列相似度距離為目標函數(shù),使用帝國競爭算法(ICA)優(yōu)化了HFS-DTW算法中的子序列長度和步距參數(shù)。算例研究表明與僅DTW算法和非參數(shù)最優(yōu)的HFS-DTW算法相對比,參數(shù)最優(yōu)的HFS-DTW可挖掘更多的多維特征點信息,輸出的多維特征點相似序列具有更豐富細節(jié);且基于所提算法可提前10天預警風電機組齒輪箱故障。
關鍵詞:風電機組;故障預警;猶豫模糊集;帝國競爭算法;動態(tài)時間規(guī)整
中圖分類號:TP206.3
文獻標志碼:A
文章編號:1001-9081(2019)04-1229-05
Abstract: For wind turbine fault warning, original Dynamic Time Warping (DTW) algorithm cannot measure the distance effectively between two multivariate time series data of wind turbines. Aiming at this problem, a DTW algorithm based on Hesitation Fuzzy Set (HFS-DTW) was proposed. The algorithm is an extended algorithm of the original DTW algorithm, which can measure the distance of both univariate and multivariate time series data, and has higher accuracy and speed compared to the original DTW algorithm. With the sub-sequence similarity distance applied as cost function, the length of sub-sequence and step parameters in HFS-DTW algorithm were optimized by using Imperialist Competitive Algorithm (ICA). The study shows that compared to the only DTW algorithm and the HFS-DTW algorithm with non-optimal parameter, the HFS-DTW with optimal parameter can mine more information on multi-dimensional feature point, and the output multi-dimensional feature point similar sequence has more details. And based on the proposed algorithm, the wind turbine gearbox fault can be warned 10 days in advance.
Key words: wind turbine; fault warning; Hesitant Fuzzy Set (HFS); imperialist competitive algorithm; Dynamic Time Warping (DTW)
0?引言
依據(jù)《中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要》,國家發(fā)改委、能源局積極引導風電產(chǎn)業(yè)。截至2018年6月底,我國風電裝機超過1.7億千瓦,所貢獻電力約占全國總電力近4.8%。由于“搶裝”潮在各地泛濫,部分地區(qū)的風電規(guī)模已經(jīng)超出2020年規(guī)劃目標。
大量新風場的部署、建成標志著漫長運維工作的開端;若按5年質保期算,后續(xù)幾年將有大批已安裝的風電機組相繼出質保期。這兩項因素給風電機組運維工作帶來巨大壓力,但目前精準的預測性風電運維技術、通用的運維平臺尚未成熟,日益增長的運維需求和較為滯后的運維技術發(fā)展之間的矛盾愈加凸顯?;跀?shù)據(jù)采集與監(jiān)控(Supervisory Control And Data Acquisition, SCADA)系統(tǒng)的風電機組故障預警技術不僅具有良好的現(xiàn)場實施條件,而且無需加裝額外傳感器,是降低風場運營成本的首選,也是學者研究的重點、熱點內容。
基于SCADA數(shù)據(jù)的風電機組故障預警的技術路線大致上可以分為兩種:一種是殘差類,利用現(xiàn)場數(shù)據(jù)與所建立模型預測數(shù)據(jù)形成的殘差序列來判斷機組是否存在潛在故障;一種是算法類,采集現(xiàn)場運行數(shù)據(jù)后使用統(tǒng)計方法或其他算法直接得出機組是否存在潛在故障。
在近年研究中,殘差類故障預警技術有:戴巨川等[1]基于SCADA數(shù)據(jù)使用有限元仿真方法獲得塔架模態(tài)頻率及其相應振型,得出了風電機組振動極大值出現(xiàn)在風輪運行頻率與塔架固有頻率接近時的結論;孫鵬等[2]基于SCADA數(shù)據(jù)建立了神經(jīng)網(wǎng)絡狀態(tài)參數(shù)預測模型,采用模糊綜合評判對篩選出的預測模型的異常辨識結果進行融合;尹詩等[3]采用非線性狀態(tài)估計技術作為數(shù)據(jù)挖掘方法,使用SCADA數(shù)據(jù)建立了機組變槳控制系統(tǒng)故障模型;Bangalore等[4]提出了一種基于停機成本預防性維護調度問題的數(shù)學模型,其優(yōu)點在于考慮了基于年齡和基于條件的故障率模型,并通過案例研究驗證了維護管理模型的優(yōu)勢;de la Hermosa[5]提出了一種基于模糊聚類和Mahalanobis距離的預警和故障檢測方法,并已實際應用。此類故障預警技術對模型的訓練數(shù)據(jù)要求較高,不同的訓練數(shù)據(jù)所獲得模型在預警能力上差別較大,往往需要針對具體機型具體分析,甚至同型號機組的模型都不同,需要單獨調試。
算法類的故障預警技術研究有:劉帥等[6]提出一種基于群體多維特征相似性的故障預警策略,以多個風機之間的SCADA數(shù)據(jù)為研究對象,采用分級時間滾動窗口技術預警潛在故障,并以齒輪箱故障驗證了所提算法的有效性;Herp等[7]基于貝葉斯框架預測風力機軸承故障,提出了在線預測風電機組狀態(tài)的統(tǒng)計方法,實驗結果表明可以通過樣本模型和描述狀態(tài)轉換概率的危險率函數(shù)來計算潛在故障;Wang等[8]提出了一種基于主成分分析(Principal Component Analysis,PCA)和多選擇標準的變量選擇算法,其結果可確定故障發(fā)生的相應時間和位置,優(yōu)點在于可估計故障的嚴重程度。
從以上分析可知:國內外的風電機組故障預警技術路線大體相同,而研究方法多樣化,側重點各不相同,但從多變量時間序列角度出發(fā)的故障預警技術尚缺乏研究。
為有效處理風電機組中SCADA數(shù)據(jù)中大量的多變量數(shù)據(jù),本文提出了一種基于猶豫模糊集的動態(tài)時間規(guī)整(Dynamic Time Warping based on Hesitant Fuzzy Sets, HFS-DTW)算法,所提算法能夠發(fā)掘多變量數(shù)據(jù)的內在隱含信息,達到預警風電機組潛在故障的目的。
1?相關算法
1.1?動態(tài)時間規(guī)整
動態(tài)時間規(guī)整(Dynamic Time Warping, DTW)算法是Itakura[9]于1975年研究語言識別問題時所提出,現(xiàn)如今在相似度度量[6]、語音識別[10]等方面研究較為充分。DTW算法是一種突破時間尺度的序列匹配算法,該算法原理是將兩個時間序列之間的元素按照最短累積距離路徑一對一或一對多匹配,其優(yōu)點在于解決了傳統(tǒng)歐幾里得距離只能使用相同時刻元素一對一匹配的限制。
其中:c(k)=(ap,bq)是最短累積距離路徑中的路徑元素; p和q是第k個路徑元素的角標;d(c(k))是路徑元素之間的歐氏距離;w(k)是路徑的權重。
在選擇最短累積距離路徑過程中,至少需要滿足3個約束條件:1)單調性。最短累積距離路徑元素的角標總是不小于前一個元素的角標。
2)連續(xù)性。最短累積距離路徑相鄰元素的角標增量必須在集合{0,1}之內取一元素。
3)有界性。最短累積距離路徑元素的起始與結束分別對應了兩個時間序列的首尾。
1.2?猶豫模糊集
猶豫模糊集(Hesitant Fuzzy Set, HFS)[11]是Torra于2009年提出的一種模糊集理論,Xu等[12]在2011年對其中的距離算法進行了充分研究與拓展,在多屬性評價、系統(tǒng)決策等方面猶豫模糊集應用場景較為豐富;Gou等[13] 研究了描述人們在決策過程中主觀認知的猶豫模糊語言術語集。猶豫模糊集是對模糊集的拓展,將其中隸屬度的個性化問題模糊化,使得一個元素屬于一個集合的隸屬度成為幾個可能的值,其優(yōu)點是可以反映多個決策者的不同偏好。
1.3?帝國競爭算法
2007年Atashpaz-Gargari等[14]提出一種啟發(fā)式算法——帝國競爭算法(Imperialist Competitive Algorithm, ICA),通過建立多個國家,模仿帝國競爭、殖民地分配以及革命等多種歷史行為,完成對定義域內的最優(yōu)值搜索。較先前的粒子群算法、遺傳算法在搜索最優(yōu)值速度與精度方面均有較大程度提高,并在倉儲調度[15-16]、參數(shù)優(yōu)化[17]等方面有相關應用研究。
其算法流程大體如下:1)隨機初始化各個國家,并選出區(qū)域內的帝國主義國家及其附屬殖民地;
2)各帝國主義國家吸引其附屬殖民地向其移動,然后在帝國內重新選出帝國主義國家和殖民地;
3)帝國之間排序,將末尾帝國內的殖民地以一定概率分配給相鄰更強大的帝國,各帝國重新排序且帝國內重新排序;
4)不斷重復步驟2)~3),直至僅剩一個帝國,其中的帝國主義國家所代表的參數(shù)即為當前最優(yōu)值。
2?本文改進算法
本文提出的HFS-DTW算法[18]將猶豫模糊集的概念引入原始DTW算法,克服其處理多變量時間序列方面的不足;同時,改進算法的速度與精度比原始DTW算法都有提高,在特定情況下亦可退化為原始DTW算法。算法詳情如下:
除了原始DTW算法的基礎約束條件外,改進的HFS-DTW仍需滿足額外的3個條件:
1)正整數(shù)。l和ls都必須為正整數(shù)。
2)邊界性。l和ls需要額外滿足如下不等式約束:
3)完整性。X和Y的每個元素在運算中至少使用一次。
3?算例研究
雖然SCADA系統(tǒng)所記錄的數(shù)據(jù)屬性和數(shù)據(jù)格式不盡相同,但都可以將這些SCADA數(shù)據(jù)歸為多變量數(shù)據(jù)?;赟CADA數(shù)據(jù)的風電機組故障預警實質上是對多變量數(shù)據(jù)的分析、處理,以達到從多變量數(shù)據(jù)中發(fā)現(xiàn)異常的目的。
本文采用與文獻[3]相似的群體多維相似性故障預警策略,使用本文算法替換原故障預警策略中的“主成分分析+DTW”部分,并與原算法預警結果對比,研究所提算法的故障預警效果。
3.1?風電機組故障預警策略
由于風電機組SCADA原始數(shù)據(jù)中含有較多異常值、錯位數(shù)據(jù),需要對數(shù)據(jù)進一步處理。文獻[3]中對SCADA數(shù)據(jù)預處理后,進一步使用高斯混合模型(Gaussian Mixture Model, GMM)提取機組的統(tǒng)計學特征作為相似度分析算法的輸入數(shù)據(jù)(多維特征點),最終通過機組之間的相似度評判機組是否存在潛在故障,其預警策略總結為圖1。
由圖1中右側的數(shù)據(jù)類型可知:從多維特征點到多維特征點相似序列共經(jīng)過兩個算法(主成分分析及原始DTW算法),首先經(jīng)過主成分分析獲取多維特征點中的主要特征,然后使用DTW算法匹配不同機組的多維特征點,生成多維特征點相似序列。本文HFS-DTW更適合多變量數(shù)據(jù)的相似性距離度量,可替代圖1中“相似度分析”的兩個算法(PCA+DTW),衡量上述多個機組的多維特征點之間的相似度。
3.2?故障預警策略參數(shù)設置
所使用的算例數(shù)據(jù)來自于福建近海某風場,其風電機組額定發(fā)電功率為2MW,切入風速為4m/s,切出風速為25m/s。相似風電機群編號為12、13、14號,在算例研究中共約使用約25400行數(shù)據(jù)(數(shù)據(jù)時長從2016年1月至7月),14號風機在7月13號因齒輪箱故障停機,7月18號維修結束重新上網(wǎng)發(fā)電。
數(shù)據(jù)預處理階段的參數(shù)設置與文獻[3]相同。由于HFS-DTW中參數(shù)的要求必須是整數(shù),且在參數(shù)的定義域內存在最優(yōu)值,所以采用帝國競爭算法進行參數(shù)尋優(yōu)。尋優(yōu)策略為參數(shù)個性化尋優(yōu),即兩兩機組之間的算法參數(shù)具有獨特性,分別對每兩機組間HFS-DTW算法尋優(yōu)。參數(shù)l和ls的定義域范圍分別為[1,50]和[1,25],目標函數(shù)為兩時間序列的前300個序列值的距離,參數(shù)優(yōu)化結果如表1。
3.3?故障預警策略結果
3.3.1?僅DTW算法
原風電機組故障預警策略中,除去主成分分析方法,僅余DTW算法,可得如圖2所示的結果。
圖2中的4類線型表示不同的多維特征點相似度序列。從圖2依x坐標軸橫向,可以看出兩兩風機之間的多維特征點相似序列的趨勢較為相近,但同一個多維特征點序列縱向對比,相似度并不高。將上述多維特征點相似序列作為輸入,使用熵權法做最終處理可得圖3。
分別分析每個子圖中相似關系趨勢:圖3(a)12號與13號風機相似關系整體起伏較大,第20步至40步之間幅值較大;圖3(b)12號與14號風機中可觀察到兩機組的相似關系在第40步至第50步之間相似度較低,暗示潛在故障;圖3(c)13號與14號風機的相似關系較為平穩(wěn),波動范圍較為穩(wěn)定,波動周期在變小,但無法辨別是否存在潛在故障。綜上,無法在14號風機故障明顯表現(xiàn)之前確定是否存在潛在故障。
3.3.2?本文HFS-DTW算法(無參數(shù)優(yōu)化)
HFS-DTW算法參數(shù)未優(yōu)化時,在符合算法約束下,隨機選擇子序列長度為l=5,步距為ls=2。使用本文HFS-DTW算法替代原故障預警策略中的主成分分析和原始DTW算法,首先使用多維特征點作為輸入,可得機組多維特征點相似序列,如圖4所示;然后使用熵權法綜合多個多維特征點相似序列,得到兩兩風機相似關系,如圖5所示。
圖4中的4類不同顏色不同線型表示不同的多維特征點相似度序列。以圖4每個子圖縱向觀察,多維特征點之間有小部分相似性或趨勢相似性,細節(jié)、信息量較僅DTW算法和文獻[3]中更充分、豐富。
圖5中:圖5(a)整體上看12號與13號風機的相似性關系波動性周期及波動范圍變化較小,趨勢較為平緩,可判斷其相似關系較為穩(wěn)定;圖5(b)12號與14號風機相似關系變化較為平緩,雖然第5步時峰值達到63.97,但直觀上較難判斷是否兩機組間相似性發(fā)生變化;圖5(c)13號與14號風機相似關系在前40步相似關系較為平穩(wěn),并無較大波動,但40步之后趨勢與圖5(b)12號與14號機組相似關系較為同步,可判斷兩機組之間相似性發(fā)生改變,兩機組中有一臺(14號)存在潛在故障。綜上,無參數(shù)優(yōu)化的HFS-DTW算法展現(xiàn)了一定的多變量距離度量能力,但故障機組的判斷依然需要詳細對比才能得到與文獻[3]相同的結論。
3.3.3?本文HFS-DTW算法(已參數(shù)優(yōu)化)
本文HFS-DTW算法使用表1所列優(yōu)化參數(shù),替代原故障預警策略中的主成分分析和原始DTW算法,可得圖6機組多維特征點相似序列,使用熵權法后得到圖7兩兩風機相似關系。
圖6中為經(jīng)HFS-DTW算法所得4類多維特征點相似序列,以每個子圖橫向觀察或以每類多維特征點縱向觀察,多維特征點之間都有部分相似性,細節(jié)豐富且波動較為頻繁,信息量較僅DTW算法、無參數(shù)優(yōu)化的HFS-DTW算法和文獻[3]算法更豐富,驗證了所提算法在多變量數(shù)據(jù)距離度量方面的有效性。
圖7中:圖7(a)12號與13號風機的相似性關系波動性周期及波動范圍變化較小,可判斷其相似關系較為穩(wěn)定;圖7(b)12號與14號風機相似關系在第50步以后出現(xiàn)較大波動,峰值達到8.2,可判斷12號與14號機組中有一機組存在潛在故障;圖7(c)13號與14號風機相似關系在前50步相似關系較為平穩(wěn),并無較大波動,但50步之后趨勢與圖7(b)12號與14號機組相似關系較為同步,達到了極值4.7。綜合以上分析,在第59步時(2016年7月3日)可作出14號風機的預警報告,此時距離發(fā)生故障10d。
橫向對比幾種算法的預警結果,僅DTW算法的相似性波動劇烈,不易確定潛在故障機組;無參數(shù)優(yōu)化的HFS-DTW算法相似關系較平緩,無劇烈變化,需要詳細分析才能得出與文獻[3]中相同的結論;而參數(shù)優(yōu)化過的HFS-DTW算法(圖7)與前三者相比相似關系圖更直觀,更容易判斷潛在故障風機。但本文HFS-DTW算法的提前預警時間不如文獻[3]算法長,本文算法依然存在改進空間。
4?結語
使用本文基于猶豫模糊集的動態(tài)時間規(guī)整(HFS-DTW)算法,經(jīng)帝國競爭算法調優(yōu)參數(shù),處理了風電機組多維特征點,預警了機組潛在故障。本文HFS-DTW算法比原始DTW算法更適于度量多變量時間序列之間的距離,能獲取到多變量時間序列中的更多本質特征。通過福建某風場運行數(shù)據(jù)的案例研究,可得到如下結論:1)HFS-DTW算法可替代“僅DTW算法”“主成分分析+DTW算法”兩種方案,驗證了所提算法的優(yōu)異性,達到了改進算法的目的;
2)使用首段子序列相似距離作為目標函數(shù),以帝國競爭算法優(yōu)化HFS-DTW參數(shù)后,預警結果更清晰,可讀性更高;
3)可提前10d報告潛在故障,給現(xiàn)場運維工作留有較大時間裕度,達到了風電機組故障預警的目的。
參考文獻(References)
[1] 戴巨川, 袁賢松, 劉德順, 等. 基于SCADA系統(tǒng)的大型直驅式風電機組機艙振動分析[J]. 太陽能學報, 2015, 36(12): 2895-2905. (DAI J C, YUAN X S, LIU D S, et al. Vibration analysis of large direct drive wind turbine nacelle based on SCADA system[J]. Acta Energiae Solaris Sinica, 2015, 36(12): 2895-2905.)
[2] 孫鵬, 李劍, 寇曉適, 等. 采用預測模型與模糊理論的風電機組狀態(tài)參數(shù)異常辨識方法[J]. 電力自動化設備, 2017, 37(8): 90-98. (SUN P, LI J, KOU X S, et al. Wind turbine status parameter anomaly detection based on prediction models and fuzzy theory[J]. Electric Power Automation Equipment, 2017, 37(8): 90-98.)
[3] 尹詩, 余忠源, 孟凱峰, 等. 基于非線性狀態(tài)估計的風電機組變槳控制系統(tǒng)故障識別[J]. 中國電機工程學報, 2014 34(增刊1): 160-165. (YIN S, YU Z Y, MENG K F, et al. Fault identification of pitch control system of wind turbine based on nonlinear state estimation[J]. Proceedings of the CSEE, 2014, 34(S1): 160-165.)
[4] BANGALORE P, PATRIKSSON M. Analysis of SCADA data for early fault detection, with application to the maintenance management of wind turbines[J]. Renewable Energy, 2018, 115: 521-532.
[5] de la HERMOSA G-C R R. Wind farm monitoring using Mahalanobis distance and fuzzy clustering[J]. Renewable Energy, 2018, 123: 526-540.
[6] 劉帥, 劉長良, 甄成剛, 等. 基于群體多維相似性的風機齒輪箱預警策略[J]. 儀器儀表學報, 2018, 39(1): 180-189. (LIU S, LIU C L, ZHEN C G, et al. Fault warning strategy of wind turbines gearbox based on group multi-dimensional similarity[J]. Chinese Journal of Scientific Instrument, 2018, 39(1): 180-189.)
[7] HERP J, RAMEZANI M H, BACH-ANDERSEN M, et al. Bayesian state prediction of wind turbine bearing failure[J]. Renewable Energy, 2018, 116: 164-172.
[8] WANG Y, MA X, QIAN P. Wind turbine fault detection and identification through PCA-based optimal variable selection[J]. IEEE Transactions on Sustainable Energy, 2018, 9(4): 1627-1635.
[9] ITAKURA F. Minimum prediction residual principle applied to speech recognition[J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1975, 23(1): 67-72.
[10] 解本銘, 韓明明, 張攀, 等. 飛機牽引車語音識別的動態(tài)時間規(guī)整優(yōu)化算法[J]. 計算機應用, 2018, 38(6): 1771-1776, 1789. (XIE B M, HAN M M, ZHANG P, et al. Optimization algorithm of dynamic time warping for speech recognition of aircraft towing vehicle[J]. Journal of Computer Applications, 2018, 38(6): 1771-1776, 1789.)
[11] TORRA V, NARUKAWA Y. On hesitant fuzzy sets and decision [C]// Proceedings of the 2009 IEEE International Conference on Fuzzy Systems. Piscataway, NJ: IEEE, ?2009: 1378-1382.
[12] XU Z, XIA M. Distance and similarity measures for hesitant fuzzy sets[J]. Information Sciences, 2011, 181(11): 2128-2138.
[13] GOU X, XU Z, LIAO H. Hesitant fuzzy linguistic entropy and cross-entropy measures and alternative queuing method for multiple criteria decision making[J]. Information Sciences, 2017, 388/389: 225-246.
[14] ATASHPAZ-GARGARI E, LUCAS C. Imperialist competitive algorithm: an algorithm for optimization inspired by imperialistic competition[C]// CEC 2007: Proceedings of the 2007 IEEE Congress on Evolutionary computation. Piscataway, NJ: IEEE, 2007: 4661-4667.
[15] 呂聰, 魏康林. 柔性車間調度問題的協(xié)作混合帝國算法[J]. 計算機應用, 2018, 38(7): 1882-1887. (LYU C, WEI K L. Cooperative hybrid imperialist competitive algorithm for flexible job-shop scheduling problem [J]. Journal of Computer Applications, 2018, 38(7): 1882-1887.)
[16] 楊小東, 康雁, 柳青, 等. 求解作業(yè)車間調度問題的混合帝國主義競爭算法[J]. 計算機應用, 2017, 37(2): 517-522, 552. (YANG X D, KANG Y, LIU Q, et al. Hybrid imperialist competitive algorithm for solving job-shop scheduling problem[J]. Journal of Computer Applications, 2017, 37(2): 517-522, 552.)
[17] 劉帥, 劉長良. 基于帝國競爭算法的主汽溫控制系統(tǒng)參數(shù)優(yōu)化研究[J]. 系統(tǒng)仿真學報, 2017, 29(2): 368-373. (LIU S, LIU C L. Cascade PID parameter optimization of main steam temperature control system based on imperialist competitive algorithm[J]. Journal of System Simulation, 2017, 29(2): 368-373.)
[18] LIU S, LIU C. Scale-varying dynamic time warping based on hesitant fuzzy sets for multivariate time series classification[J]. Measurement, 2018, 130: 290-297.