文 | 馬強(qiáng),劉波,安宗文
?
基于核密度估計(jì)的風(fēng)速建模方法﹡
文 | 馬強(qiáng),劉波,安宗文
風(fēng)能作為一種清潔可再生資源,正在被越來越多的國家用以發(fā)電并作為改善能源結(jié)構(gòu)的一種措施。風(fēng)能具有的隨機(jī)性、波動性及間歇性特點(diǎn)將對風(fēng)電機(jī)組的安全穩(wěn)定運(yùn)行帶來影響;同時,風(fēng)速預(yù)測也是風(fēng)功率預(yù)測的關(guān)鍵步驟之一。目前,風(fēng)速模型主要從概率分布角度出發(fā)對其隨機(jī)性進(jìn)行描述,當(dāng)研究短周期或某些特殊時段的風(fēng)速分布特性時,由于氣候變化等隨機(jī)因素影響的明顯增強(qiáng),將會導(dǎo)致兩峰甚至多峰風(fēng)速分布情況的出現(xiàn)。因此,對于多峰風(fēng)速分布情況,如何對其進(jìn)行有效的風(fēng)速分布描述及建立相應(yīng)的風(fēng)速模型,具有一定的研究意義。
基于此,本文針對風(fēng)速分布可能呈現(xiàn)單峰、雙峰或多峰的特性,提出一種基于核密度估計(jì)建立風(fēng)速模型的方法。通過MATLAB對實(shí)測風(fēng)速進(jìn)行核密度估計(jì)并繪制概率密度估計(jì)值曲線;利用權(quán)重系數(shù)組合多個正態(tài)分布對概率密度估計(jì)值曲線進(jìn)行擬合,從而獲得風(fēng)速的概率密度函數(shù);由概率密度函數(shù)生成隨機(jī)風(fēng)速樣本并通過殘差值和確定系數(shù)對擬合精度進(jìn)行檢驗(yàn)。
為了獲得總體概率密度分布,常用的方法有參數(shù)法和非參數(shù)法。
參數(shù)法由樣本的頻率直方圖輪廓假設(shè)總體的概率密度分布,并通過樣本對分布參數(shù)進(jìn)行估計(jì)。如圖1所示,樣本的頻率直方圖輪廓呈單峰狀,近似正態(tài)分布。因此假設(shè)總體服從正態(tài)分布,并通過樣本對正態(tài)分布參數(shù)μ,σ進(jìn)行估計(jì)得到總體的概率密度分布,如圖2所示。
參數(shù)法依賴于對總體分布的假設(shè),并且對分布參數(shù)進(jìn)行估計(jì)時所涉及函數(shù)常為多元函數(shù),需使用最大似然估計(jì)等方法借助編程計(jì)算獲得參數(shù)估計(jì)值,過程相對復(fù)雜。威布爾模型、權(quán)重系數(shù)組合模型都屬于參數(shù)法。
非參數(shù)法則根據(jù)某一點(diǎn)處概率密度值與該點(diǎn)附近包含樣本個數(shù)間的關(guān)系對其進(jìn)行估計(jì),無需假設(shè)總體分布及參數(shù)估計(jì),引用經(jīng)驗(yàn)密度函數(shù)^f( x )作為總體密度函數(shù)的一個非參數(shù)估計(jì),如式(1)所示:
式中,n為樣本總數(shù);hi表示每個區(qū)間的長度,稱為帶寬; ni為該帶寬內(nèi)樣本點(diǎn)個數(shù)。某一點(diǎn)x處的概率密度估計(jì)值大小與該點(diǎn)附近包含的樣本點(diǎn)個數(shù)有關(guān)。若x附近樣本點(diǎn)較多,則概率密度估計(jì)值較大,反之較小。
由式(1)可知,某一點(diǎn)處的密度函數(shù)估計(jì)值依賴于區(qū)間的劃分。為了克服區(qū)間劃分的限制,Paren提出按照鄰域內(nèi)各點(diǎn)距離x的遠(yuǎn)近來確定其貢獻(xiàn)大小,即核密度估計(jì),如式(2)所示:
式中,K為核函數(shù),即某個分布的密度函數(shù),常用分布有正態(tài)分布、均勻分布等;Xi為樣本值,h為帶寬。
實(shí)際上,核函數(shù)K的選取對于概率密度估計(jì)值影響不大,而帶寬h的選取則會直接影響概率密度估計(jì)值。取較大的值則有更多的樣本點(diǎn)對概率密度估計(jì)值產(chǎn)生影響,生成曲線越光滑,但也丟失了部分?jǐn)?shù)據(jù)信息;取較小的值,則生成曲線為不光滑折線,但能反映每個數(shù)據(jù)所包含的信息。
通過核密度估計(jì),可以獲得各樣本點(diǎn)的概率密度估計(jì)值,但不能像參數(shù)法一樣獲得總體的概率密度函數(shù)。
一、 風(fēng)速模型的建立
(一)以風(fēng)電場的實(shí)測風(fēng)速數(shù)據(jù)為基礎(chǔ),利用MATLAB軟件調(diào)用ksdensity函數(shù)對實(shí)測風(fēng)速數(shù)據(jù)進(jìn)行核密度估計(jì),獲取風(fēng)速分布的概率密度估計(jì)值并繪制其曲線。
(二)針對概率密度估計(jì)值曲線,利用權(quán)重系數(shù)組合多個正態(tài)分布進(jìn)行擬合,表達(dá)式為:
式中, n為所用正態(tài)分布個數(shù), ai、 bi、ci為分布參數(shù),i =1,2 n 。擬合過程可通過MATLAB的曲線擬合工具箱實(shí)現(xiàn),所用正態(tài)分布個數(shù)由函數(shù)f(x)曲線與概率密度估計(jì)值曲線的接近程度決定。擬合所獲得的函數(shù)f(x),即為實(shí)測風(fēng)速的概率密度函數(shù)。
二、 風(fēng)速模型的驗(yàn)證
由擬合獲得的概率密度函數(shù)f(x),基于蒙特卡羅方法通過MATLAB編程生成符合該分布函數(shù)的隨機(jī)風(fēng)速模型進(jìn)行擬合精度檢驗(yàn)。
(一) 殘差值ew
殘差值為實(shí)測風(fēng)速vi由小到大排序后,與隨機(jī)風(fēng)速模型樣本v^i之差的平方和,表達(dá)式為:
(二) 確定系數(shù)R2
確定系數(shù)是用于檢驗(yàn)?zāi)撤N分布與原數(shù)據(jù)分布是否一致的統(tǒng)計(jì)方法,表達(dá)式為:
式中,R2越接近1,則擬合越好,模型參考價值越高。
表1 某風(fēng)電場一個月實(shí)測風(fēng)速數(shù)據(jù)
表2 多峰風(fēng)速建模時概率密度函數(shù)參數(shù)值
表3 短期風(fēng)速模型擬合精度比較
表4 某風(fēng)電場2006年全年實(shí)測風(fēng)速數(shù)據(jù)
表5 單峰風(fēng)速建模時概率密度函數(shù)參數(shù)值
表6 長期風(fēng)速模型擬合精度比較
一、風(fēng)速分布呈多峰狀時
基于表1中的實(shí)測數(shù)據(jù),通過本文風(fēng)速模型的建模方法,計(jì)算分析可知,當(dāng)所用正態(tài)分布的個數(shù)n取5時,f(x)曲線與實(shí)測風(fēng)速概率密度估計(jì)值曲線最接近,f(x)各參數(shù)的計(jì)算結(jié)果如表2所示。
根據(jù)表1中的數(shù)據(jù)(考慮到風(fēng)電場方面的利益,所以只是在表1中列舉了部分?jǐn)?shù)據(jù))分別繪制實(shí)測風(fēng)速頻率直方圖、本文風(fēng)速模型概率密度曲線及威布爾模型概率密度曲線,如圖3所示。圖3中該風(fēng)電場一個月的實(shí)測風(fēng)速分布呈多峰狀,本文風(fēng)速模型概率密度曲線與實(shí)測風(fēng)速頻率直方圖輪廓更為接近,對于多峰情況的描述更加準(zhǔn)確。
采用蒙特卡羅方法,生成威布爾模型、本文風(fēng)速模型的隨機(jī)風(fēng)速樣本,并計(jì)算得到殘差值、確定系數(shù),如表3所示。表3中,本文風(fēng)速模型的樣本殘差值為93.9797,遠(yuǎn)小于威布爾模型的樣本殘差值;同時,確定系數(shù)達(dá)到99.36%,相較于威布爾模型提高了4.48%。
二、風(fēng)速分布呈單峰狀時
基于美國國家可再生能源實(shí)驗(yàn)室(NREL)提供的某風(fēng)電場2006年全年風(fēng)速數(shù)據(jù),如表4所示?;诒?中的實(shí)測數(shù)據(jù),通過本文風(fēng)速模型的建模方法,計(jì)算分析可知,當(dāng)所用正態(tài)分布的個數(shù)n取5時,f(x)曲線與實(shí)測風(fēng)速概率密度估計(jì)值曲線最接近,f(x)各參數(shù)如表5所示。
根據(jù)表4中的數(shù)據(jù)分別繪制實(shí)測風(fēng)速頻率直方圖、本文風(fēng)速模型概率密度曲線、威布爾模型概率密度曲線,見圖4。圖4中,對于風(fēng)速分布呈單峰狀時,本文風(fēng)速模型概率密度曲線對于實(shí)測風(fēng)速頻率直方圖輪廓發(fā)生細(xì)微變化處的描述更加準(zhǔn)確,有利于還原真實(shí)的風(fēng)速分布。
采用蒙特卡羅方法,生成威布爾模型、本文風(fēng)速模型的隨機(jī)風(fēng)速樣本,并計(jì)算得到殘差值、確定系數(shù),如表6所示。表6中,威布爾模型對于單峰風(fēng)速分布具有較高的擬合精度,但本文方法風(fēng)速模型在擬合精度上仍高于威布爾模型。
本文基于核密度估計(jì)提出了一種建立風(fēng)速模型的方法,并通過MATLAB軟件分別對實(shí)測風(fēng)速分布呈單峰、多峰的情況進(jìn)行了擬合。由擬合結(jié)果得出以下結(jié)論:本文方法所建模型對于單峰、多峰風(fēng)速分布均具有較高的擬合精度,能夠?yàn)轱L(fēng)能預(yù)測以及可靠性評估等研究提供更加準(zhǔn)確的風(fēng)速模型。
(作者單位:蘭州理工大學(xué)機(jī)電工程學(xué)院)
基金項(xiàng)目:﹡國家科學(xué)自然基金(51265025)——《基于載荷條件及失效相關(guān)的風(fēng)電齒輪箱壽命建?!?/p>