楊天玥,趙麗軍,徐健,厲偉,張國軍
(1.沈陽工業(yè)大學(xué)電氣工程學(xué)院,遼寧 沈陽 110870;2.華能遼寧清潔能源有限責(zé)任公司,遼寧 沈陽 110015)
風(fēng)電機組的功率曲線是風(fēng)電機組控制系統(tǒng)設(shè)計的重要依據(jù),也是評估風(fēng)電機組性能及發(fā)電能力的重要指標(biāo)[1-2]。在風(fēng)電機組控制系統(tǒng)中,功率曲線直接影響控制策略以及控制過程中參數(shù)的調(diào)整。因此,功率曲線異常識別是十分有必要的。
風(fēng)電機組功率曲線異常識別及故障診斷是當(dāng)前的研究熱點,國內(nèi)外學(xué)者已開展相關(guān)工作并取得了一定的研究成果,其中風(fēng)電機組功率曲線數(shù)據(jù)識別的代表性成果有:文獻[3]通過采用分組最優(yōu)方差算法成功識別出功率曲線下方堆積型異常數(shù)據(jù),但該算法無法識別功率曲線上方堆積型異常數(shù)據(jù);文獻[4]基于Copula函數(shù)建立概率功率曲線模型,基于SCADA數(shù)據(jù)對風(fēng)電機組進行故障診斷,模型可以對風(fēng)電機組葉片、偏航系統(tǒng)及變槳系統(tǒng)進行早期故障預(yù)測,但輸入變量只有風(fēng)速,無法準(zhǔn)確描述風(fēng)電機組整體運行情況;文獻[5]通過建立功率曲線的非線性模型來識別異常數(shù)據(jù),但是需要大量的正常數(shù)據(jù)作為樣本,否則會使模型誤差變大,這將導(dǎo)致異常數(shù)據(jù)識別速度變慢;文獻[6]假設(shè)風(fēng)速、功率的概率密度函數(shù)服從正態(tài)分布,提出了基于3δ法則的異常數(shù)據(jù)識別與清洗方法,但該方法與實際風(fēng)電機組運行中風(fēng)速功率的概率密度函數(shù)不符,其適應(yīng)性及異常數(shù)據(jù)識別效果欠佳;文獻[7]通過加權(quán)最小二乘支持向量機回歸模型建立的功率曲線模型檢測風(fēng)電機組的異常運行,利用在線監(jiān)測不斷更新模型并剔除異常點,結(jié)果表明該模型準(zhǔn)確性高于其他模型。
針對傳統(tǒng)的異常數(shù)據(jù)識別算法中存在的問題,本文提出基于Copula函數(shù)的風(fēng)電機組異常識別方法,首先,對風(fēng)電機組正常運行不同工況下功率曲線的影響因素進行相關(guān)性分析,判斷出對功率曲線影響大的特征參量;其次,通過二元概率分布函數(shù)得到了風(fēng)電機組功率曲線上下邊界,對于上下邊界外的可疑點進行時序分析;最后,通過計算可疑點與正常點之間各特征參量的歐氏距離判斷可疑點是否為異常點,從而確定風(fēng)電機組故障位置。基于SVM線性回歸,采用某風(fēng)電機組的實測數(shù)據(jù)進行仿真驗證,結(jié)果表明混合Copula函數(shù)模型能夠準(zhǔn)確的識別異常數(shù)據(jù),具有較強的實用性。
將風(fēng)電機組運行中最大風(fēng)能追蹤階段劃分為工況B,發(fā)電機轉(zhuǎn)矩控制階段劃分為工況C,定速變槳控制階段劃分為工況D,如圖1所示。分別對各工況下的風(fēng)速-功率、風(fēng)速-葉輪轉(zhuǎn)速、風(fēng)速-槳距角、風(fēng)速-偏航角進行Kendall相關(guān)性分析,結(jié)果如表1所示,當(dāng)功率曲線出現(xiàn)異常時大概率是相關(guān)性較大的變量異常導(dǎo)致。由表1可見,工況B下,風(fēng)速-功率、風(fēng)速-葉輪轉(zhuǎn)速、葉輪轉(zhuǎn)速-轉(zhuǎn)矩、葉輪轉(zhuǎn)速-有功功率、轉(zhuǎn)矩-有功功率相關(guān)系數(shù)均很高;工況C下,轉(zhuǎn)矩-有功功率相關(guān)系數(shù)最高;工況D下,風(fēng)速-槳距角相關(guān)系數(shù)最高。三個工況中,風(fēng)速-偏航角相關(guān)系數(shù)最低,說明偏航角與風(fēng)速相關(guān)性較小。相關(guān)性分析所得結(jié)果與風(fēng)電機組的工作特性相吻合。因此,本文著重于風(fēng)速-功率、風(fēng)速-葉輪轉(zhuǎn)速、風(fēng)速-槳距角對風(fēng)電機組運行狀態(tài)的影響進行分析。
圖1 功率曲線工況劃分圖
表1 相關(guān)性分析
風(fēng)電機組的功率特性除取決于風(fēng)電機組的性能外,還取決于氣象環(huán)境條件以及風(fēng)電機組在風(fēng)電場中的排布等[8]。風(fēng)電機組在設(shè)計時假定空氣密度為常數(shù),實際上空氣密度會隨地理位置不同而不同,空氣密度所造成的誤差會在風(fēng)速中放大[9],因此每臺風(fēng)電機組正常運行的輸出特性也不盡相同,所以直接使用風(fēng)電機組廠商提供的功率曲線對異常進行狀態(tài)檢測存在較大的故障誤報風(fēng)險,需要基于每臺風(fēng)電機組的實際運行數(shù)據(jù)來進行功率曲線建模,為下一步的異常運行狀態(tài)檢測提供基礎(chǔ)。
風(fēng)速和功率具有隨機性和波動性,可將其視為具有相關(guān)性的兩個隨機變量,而Copula函數(shù)能夠反映兩個隨機變量之間的相關(guān)性[10]。
多元Sklar定理指出,對于邊緣分布函數(shù)F1(u1),F(xiàn)2(u2),…,F(xiàn)n(un),存在一個 Copula 函數(shù)C滿足:
且當(dāng)F1(u1),F(xiàn)2(u2),…,F(xiàn)n(un)連續(xù)時,Copula函數(shù)C是唯一確定的,其中F(u1,u2,…,un)是邊緣分布函數(shù)的聯(lián)合分布函數(shù)。
根據(jù)風(fēng)電機組正常運行數(shù)據(jù),計算風(fēng)速V和輸出功率P的累積概率分布,利用能反映風(fēng)速和功率之間相關(guān)性的Copula函數(shù),在不同風(fēng)速值和置信度下,得到輸出功率的條件概率分布對應(yīng)的上下分位數(shù)值,最后在各個風(fēng)速值下對應(yīng)的輸出功率上下邊界值形成的兩條曲線就是概率功率曲線[11]。
設(shè)V、P分別為風(fēng)速、功率變量,F(xiàn)p(p)、Fv(v)分別為其核密度估計累積概率分布函數(shù),C用來描述由唯一Copula函數(shù)連接起來的V、P聯(lián)合分布函數(shù),F(xiàn)是風(fēng)速累積概率分布取值條件下的功率累積概率分布,即:
其中,V、P分別為工況 B、C、D下的風(fēng)速、功率變量。
在B、C、D工況下分別選取二元Gumbel Copula函數(shù)、二元Frank Copula函數(shù)和二元Clayton Copula函數(shù),選用混合Copula函數(shù)可得到更加精確的功率曲線上下邊界。依次設(shè)工況B、C、D的理論等效功率曲線的置信水平1-βi(i=1,2,3),采用非對稱概率區(qū)間確定輸出功率置信區(qū)間上下界,置信區(qū)間上下界的分位概率β′ij、β″ij,置信區(qū)間不對稱系數(shù)為κij分別為:
其中,κi-min為第i區(qū)域的不對稱系數(shù)的最小值;κi-max為第i區(qū)域的不對稱系數(shù)的最大值;li為第i區(qū)域的不對稱系數(shù)的變化率;j=1,2,…,m。
分別在工況B、C、D上,利用最大似然估計法分別求出風(fēng)速整體累積概率分布函數(shù)中的參數(shù)Fv(v;θ1)和第j段上功率累積概率分布函數(shù)中的參數(shù);當(dāng)測量風(fēng)速V取值已知時,設(shè)條件概率分布F(Fp(p)|Fv(v))的對應(yīng)分位點分別為p1、p2,即p1、p2分別對應(yīng)第j段輸出功率累積概率分布的取值,分別對p1、p2求逆,得到在該風(fēng)速條件下,置信等效功率上下邊界值,對上下邊界求逆即可得到概率功率曲線[12],如圖2中實線所示。
圖2 風(fēng)電機組概率功率曲線
概率功率曲線上下邊界外的數(shù)據(jù)點為可疑點,要確定其為異常點還需要進一步進行驗證。
SVM線性回歸是一種基于統(tǒng)計學(xué)習(xí)的機器學(xué)習(xí)方法,在解決非線性、小樣本及高維度識別中占有較大優(yōu)勢。 設(shè)給定樣本為(xi,yi),i=1,2,…,l,x∈R。xi為第i個輸入量,yi為第i個輸出量,其基本思想是通過樣本集在樣本空間找到一個分類超平面,將具有不同特征的樣本分開,分類超平面可描述為[13]:
式中,wT為特征空間權(quán)系數(shù)向量,b為偏置。若樣本能夠按照各自類別被正確區(qū)分,且即對于yi=1,有wT·x+b≥1;對于yi=-1,有wT·x+b≤ -1。
在樣本空間中,樣本點到超平面的距離為
當(dāng)點到超平面的距離最大時,說明不同特征的數(shù)據(jù)集之間間隔最遠,模型分類效果最好。
為了驗證上述異常數(shù)據(jù)識別模型的有效性,本文以某風(fēng)電場風(fēng)電機組的實際運行數(shù)據(jù)作為研究對象,機組額定功率為1.5MW,選取10000個連續(xù)測量的風(fēng)速與功率數(shù)據(jù)對,數(shù)據(jù)采樣間隔為10min。
基于Copula函數(shù)構(gòu)建的概率功率曲線如圖3所示,在概率功率曲線上下邊界外有概率可疑點;相對應(yīng)的,從圖4的B、C、D工況下風(fēng)速與葉輪轉(zhuǎn)速、發(fā)電機轉(zhuǎn)矩、槳距角的時序圖中可以看出,在風(fēng)速未出現(xiàn)較大波動的情況下,葉輪轉(zhuǎn)速與槳距角出現(xiàn)明顯波動的數(shù)據(jù)點。
圖3 風(fēng)電機組實測風(fēng)速功率圖
圖4 時序圖
計算可疑點與相鄰正常點之間的歐式距離,并與相鄰兩個非可疑數(shù)據(jù)點相比較,結(jié)果如表2、3、4所示。由表可知,在工況B恒風(fēng)速下,葉輪轉(zhuǎn)速低于正常值時,由于轉(zhuǎn)速與轉(zhuǎn)矩的高相關(guān)性,轉(zhuǎn)矩也會相應(yīng)下降,由風(fēng)速決定的槳距角仍處于正常范圍內(nèi),但有功功率由于轉(zhuǎn)矩的下降而低于正常值;工況C中歐式空間距離波動范圍較小,沒有異常數(shù)據(jù),與混合Copula函數(shù)模型識別結(jié)果一致;在工況D恒風(fēng)速下,槳距角異常時,葉輪轉(zhuǎn)速和轉(zhuǎn)矩均處于正常范圍,但有功功率低于正常值。因此可判定概率功率曲線上下邊界以外的數(shù)據(jù)確為異常點。
表2 葉輪轉(zhuǎn)速異常
表3 轉(zhuǎn)矩值正常
表4 槳距角異常
本文以殘差最小為原則,建立三個工況下相關(guān)性最大的特征參量:葉輪轉(zhuǎn)速,轉(zhuǎn)矩,槳距角的SVM線性回歸模型,對混合Copula函數(shù)模型進行驗證,具體過程如下:
(1)數(shù)據(jù)采集。分別采集風(fēng)電機組正常運行時三個工況下的葉輪轉(zhuǎn)速、發(fā)電機轉(zhuǎn)矩和槳距角數(shù)據(jù)。采樣間隔為10min,每種工況下采樣點數(shù)為5000個;并隨機選取其中前3000個數(shù)據(jù)作為預(yù)測模型的訓(xùn)練樣本,余下2000個數(shù)據(jù)作為測試樣本。
(2)建立預(yù)測模型。使用均方根誤差最小的40組數(shù)據(jù)集對模型進行多次訓(xùn)練和測試,以RMSE最小為原則,建立精度較高的預(yù)測模型。建立模型時,交叉驗證選擇的原則是RMSE最小,根據(jù)訓(xùn)練好的模型,將混合Copula函數(shù)模型所識別出的數(shù)據(jù)及相鄰數(shù)據(jù)點作為測試樣本進行檢驗,圖5為測試樣本的SVM線性回歸模型預(yù)測值與實際值對比情況及相應(yīng)特征變量的殘差圖,其中殘差圖控制上限UCL、控制下限LCL之間的距離為3σ。
圖5 SVM回歸模型結(jié)果
從圖5(a)、(b)中可以看出,工況B中第26個樣本點,風(fēng)電機組的葉輪轉(zhuǎn)速偏離預(yù)測值且超出閾值下限,表明該樣本點確為異常數(shù)據(jù)點,此時風(fēng)輪可能出現(xiàn)輕微故障;從圖5(c)、(d)可知,工況C中發(fā)電機轉(zhuǎn)矩樣本點均在閾值范圍內(nèi),沒有異常數(shù)據(jù)點;從圖5(e)、(f)中可以看出,在工況D第16~21個樣本點之間,槳距角偏離預(yù)測值且超出閾值下限,表明該樣本點為異常點,變槳系統(tǒng)可能出現(xiàn)故障,需要維修人員進行檢查。
綜上,風(fēng)電機組各特征參量SVM回歸模型結(jié)果與混合Copula函數(shù)模型所得結(jié)果一致,驗證了混合Copula函數(shù)模型的準(zhǔn)確性。
本文提出一種基于Copula函數(shù)的風(fēng)電機組異常識別方法,利用風(fēng)電機組實際運行數(shù)據(jù)進行仿真分析,得出以下結(jié)論:
(1)通過對概率功率曲線上下邊界外可疑點的時序分析和歐式距離計算,能夠準(zhǔn)確判斷可疑點是否為異常點。
(2)通過對不同工況下功率曲線影響因素的Kendall秩相關(guān)性分析,得到每個工況下影響較大的因素,有利于故障定位。
(3)通過建立SVM線性回歸模型,對混合Copula函數(shù)模型所確定的異常數(shù)據(jù)進行檢驗,結(jié)果與混合Copula函數(shù)模型所得結(jié)果一致,表明混合Copula函數(shù)模型能夠準(zhǔn)確識別異常數(shù)據(jù),模型精確性較高。
本文提出的方法基于風(fēng)電機組歷史運行數(shù)據(jù),構(gòu)建等效概率功率曲線并結(jié)合數(shù)據(jù)的時序特性進行分析,能夠有效識別異常數(shù)據(jù),判斷機組故障位置,彌補傳統(tǒng)算法的不足,有較強的適應(yīng)性與實用性,為風(fēng)電機組異常數(shù)據(jù)識別提供了一種新方法。