曾杰 朱宜飛 陳衛(wèi)鵬
摘要:由于風(fēng)速具有隨機(jī)波動(dòng)性,使得對(duì)其預(yù)測的準(zhǔn)確度不高。針對(duì)此,采用最小二乘支持向量機(jī)(LS-SVM)方法對(duì)風(fēng)速進(jìn)行預(yù)測分析??紤]到LS-SVM的參數(shù)選取方面尚無有效手段,嘗試結(jié)合遺傳算法對(duì)LS-SVM進(jìn)行參數(shù)選取。選取山西省陽泵市風(fēng)場前15 d的實(shí)測風(fēng)速數(shù)據(jù),采用遺傳算法優(yōu)化LS-SVM參數(shù)后的預(yù)測模型,對(duì)第16天的風(fēng)速進(jìn)行預(yù)測分析。經(jīng)過模型計(jì)算,風(fēng)速的預(yù)測值與實(shí)測值的平均絕對(duì)百分比誤差只有5.95%。結(jié)果表明:模型計(jì)算結(jié)果理想,驗(yàn)證了采用遺傳算法優(yōu)化LS-SVM參數(shù)后用于風(fēng)速短期預(yù)測的有效性。研究成果可為風(fēng)電場實(shí)際運(yùn)行中風(fēng)功率短期、中長期預(yù)報(bào)提供理論支持。
關(guān)鍵詞:風(fēng)速預(yù)測;遺傳算法;最小二乘支持向量機(jī); 風(fēng)電場
中圖法分類號(hào):TK81 文獻(xiàn)標(biāo)志碼:A DOI:10.15974/j.cnki.slsdkb.2021.12.017
文章編號(hào):1006 - 0081(2021)12 - 0097 - 04
0 引 言
2020年全國兩會(huì)提出了2030年前實(shí)現(xiàn)碳達(dá)峰、2060年實(shí)現(xiàn)碳中和的目標(biāo)承諾。清潔能源利用已成為實(shí)現(xiàn)該目標(biāo)的重要手段,而風(fēng)能作為清潔能源的一類,風(fēng)能資源開發(fā)受到日益關(guān)注。風(fēng)能資源具有很大的間歇性和隨機(jī)波動(dòng)性,因此大規(guī)模的風(fēng)電場接入電網(wǎng),勢必對(duì)電網(wǎng)的穩(wěn)定、安全運(yùn)行有著較大影響。同時(shí),風(fēng)電場的前期規(guī)劃、選址和風(fēng)電機(jī)組的安全穩(wěn)定運(yùn)行都與風(fēng)速變化有著直接關(guān)系。因此,如何高效、準(zhǔn)確地對(duì)風(fēng)電場風(fēng)速進(jìn)行短期、中長期預(yù)報(bào)成為重點(diǎn)研究方向[1]。對(duì)于風(fēng)速預(yù)測的方法,主要有時(shí)間序列算法[2]、人工神經(jīng)網(wǎng)絡(luò)算法[3]、小波分析法[4]、卡爾曼濾波法和遺傳算法等。目前用于預(yù)測風(fēng)速的最小二乘支持向量機(jī)(LS-SVM)在參數(shù)選取方面暫時(shí)沒有較好的方法。因此,本文以風(fēng)電場歷史測風(fēng)數(shù)據(jù)為基礎(chǔ),采用遺傳算法(Genetic Algorithm, GA)優(yōu)化LS-SVM模型參數(shù),再對(duì)風(fēng)速進(jìn)行預(yù)測分析,探討遺傳算法用于LS-SVM風(fēng)速預(yù)測模型中參數(shù)優(yōu)化的可行性。
1 LS-SVM基本理論
最小二乘支持向量機(jī)LS-SVM[5-6]是對(duì)標(biāo)準(zhǔn)向量機(jī)(SVM)[7]理論的擴(kuò)展改進(jìn),其約束條件將原來傳統(tǒng)的不等式約束優(yōu)化變?yōu)榈仁郊s束形式,同時(shí)損失函數(shù)采用的是最小二乘線性函數(shù),降低了SVM理論的復(fù)雜性。該方法將標(biāo)準(zhǔn)支持向量機(jī)二次規(guī)劃問題優(yōu)化調(diào)整為線性方程式的求解,同時(shí)優(yōu)化了SVM的求解速度和精度[8]。采用非線性函數(shù)映射來實(shí)現(xiàn)最小二乘支持向量機(jī)輸入值的高維空間轉(zhuǎn)換,在完成高維空間轉(zhuǎn)換后再實(shí)現(xiàn)計(jì)算的優(yōu)化處理。
設(shè)定數(shù)據(jù)樣本集{(x1,y1),(x2,y2),…,(xt,yt)},其中xi∈Rn,yi∈R,映射成高維空間的最小二乘支持向量機(jī)函數(shù)為
[yx=wTφx+b]? ? ? ? ? ? ? ? ? ? ? ? ?(1)
式中:φ(x)為非線性映射函數(shù);b為常數(shù)值;w為權(quán)向量值。通過高維空間轉(zhuǎn)換,最小二乘支持向量機(jī)函數(shù)的優(yōu)化問題可以轉(zhuǎn)化為求解下式:
[minw,b,eJpw,e=w22+γ2k=1te2k]? ? ? ? (2)
其中轉(zhuǎn)換的約束條件為
[yk=wTφxk+b+ek]? k=1,2,…,N? ? ? ? ? (3)
式中:γ為規(guī)劃參數(shù),且γ>0;ek為松弛變量。拉格朗日轉(zhuǎn)換函數(shù)L為
[Lw,b,e,a=Jw,e-k=1Nak[wTφ(xk)+b+ek-yk]]? ? (4)
式中:ak為拉格朗日乘子。通過KKT優(yōu)化條件計(jì)算可知:
[?L?w=0?w=k=1Nakφxk]? ? ? ? ? ? ?(5)
[?L?b=0?k=1Nak=0]? ? ? ? ? ? ? ? ? ?(6)
[?L?ek=0?ak=γek] ,k=1,2,…,N? ? ? ? (7)
[?L?ak=0?wTφxk+b+ek-yk=0],k=1,2,…,N
(8)
通過計(jì)算,可得到如下公式:
[0ITIΩ+γ-1Iba=0y]? ? ? ? ? ? ? (9)
式中:a=[a1,a2,…,aN],y=[y1,y2,…,yN],I=[1,1,…,1],Ωki=φ(xk)Tφ(xi),k,i=1,2,…,N。
通過Mercer條件計(jì)算,高維度映射函數(shù)φ和核函數(shù)k(xk,xi)計(jì)算式為
[kxk, xi=φxkTφxi]? ? ? ? ? ? ? ? (10)
最小二乘支持向量機(jī)函數(shù)式為
[yx=k=1Nakkx, xk+b]? ? ? ? ? ? ? ?(11)
式中:a,b由公式(9)計(jì)算所得。
2 遺傳算法理論
2.1 遺傳算法
20世紀(jì)60年代末,受遺傳理論啟示,Holland提出了一種優(yōu)化計(jì)算方法,即遺傳算法[9-11](Genetic Algorithm, GA)。在生物遺傳進(jìn)化過程中,按照自然選擇與最優(yōu)適應(yīng)性,生物種群進(jìn)行不斷的進(jìn)化,以適應(yīng)自然環(huán)境。遺傳算法理論核心就是生物遺傳進(jìn)化理論。遺傳算法具有良好的全局優(yōu)化性和隨機(jī)搜索特點(diǎn),在各行業(yè)的優(yōu)化計(jì)算中都有廣泛的應(yīng)用[12-14]。
2.2 遺傳算法框架構(gòu)成
遺傳算法計(jì)算框架主要分以下幾個(gè)步驟:編碼、評(píng)價(jià)函數(shù)、遺傳運(yùn)算、初始化種群、選擇控制參數(shù)和終止條件。
2.2.1 編 碼
遺傳算法無法直接處理空間參數(shù),須通過編碼方式將求解的問題轉(zhuǎn)換為遺傳中的染色體或個(gè)體,這個(gè)轉(zhuǎn)換過程就是遺傳編碼。遺傳編碼常見的處理方法有實(shí)數(shù)編碼、二進(jìn)制編碼及Gray編碼。
2.2.2 評(píng)價(jià)函數(shù)
進(jìn)化論中適應(yīng)度是衡量個(gè)體對(duì)周邊環(huán)境適應(yīng)性大小的參數(shù),也表示生物繁殖能力大小。遺傳算法中的適應(yīng)度函數(shù)也叫評(píng)價(jià)函數(shù),用于判斷個(gè)體優(yōu)劣程度,根據(jù)所需求解問題的目標(biāo)函數(shù)進(jìn)行評(píng)估。評(píng)價(jià)函數(shù)的設(shè)計(jì)直接決定著遺傳算法的優(yōu)劣。
2.2.3 遺傳運(yùn)算
遺傳運(yùn)算是遺傳算法的主要優(yōu)化計(jì)算過程,主要是用于形成新的后代種群,實(shí)現(xiàn)計(jì)算的延續(xù)。遺傳運(yùn)算的主要方式有:選擇運(yùn)算、交叉運(yùn)算和變異運(yùn)算。其中選擇運(yùn)算是選擇合適的算子用于群體,選擇運(yùn)算的目是把進(jìn)化后的個(gè)體特性遺傳到下代或通過交叉配對(duì)產(chǎn)生新個(gè)體再遺傳到后代。選擇運(yùn)算方式有:基于排名先后的運(yùn)算、基于局部競爭的運(yùn)算和基于適應(yīng)值的運(yùn)算。交叉運(yùn)算是將交叉算子應(yīng)用于群體中,在遺傳算法理論中起到至關(guān)重要的作用。變異運(yùn)算是對(duì)群體中個(gè)體基因值作變動(dòng)而形成新的個(gè)體。變異運(yùn)算主要有二進(jìn)制變異運(yùn)算和實(shí)值變異運(yùn)算等。
2.2.4 初始化種群
主要是設(shè)置進(jìn)化代數(shù),隨機(jī)生成N個(gè)個(gè)體作為初始群體。
2.2.5 選擇控制參數(shù)
在優(yōu)化迭代計(jì)算前,需對(duì)遺傳算法的運(yùn)算參數(shù)進(jìn)行設(shè)置。通過設(shè)置遺傳迭代次數(shù)、種群規(guī)模大小、變異概率值和交叉概率值等來控制遺傳計(jì)算。
2.2.6 終止條件
當(dāng)遺傳的最優(yōu)個(gè)體適應(yīng)度達(dá)到設(shè)定值,或者群體適應(yīng)度不再提高,或迭代次數(shù)達(dá)到設(shè)定值時(shí),遺傳算法終止計(jì)算。
3 遺傳算法優(yōu)化LS-SVM模型參數(shù)
3.1 遺傳編碼
受溫度、氣壓和濕度等氣象因素影響,同時(shí)在不同風(fēng)電場地形、地貌條件下,風(fēng)速大小和風(fēng)向變化與各影響因素形成復(fù)雜的非線性關(guān)系,風(fēng)速是非穩(wěn)定的數(shù)據(jù)。在采用LS-SVM進(jìn)行模型預(yù)測時(shí),需對(duì)原始數(shù)據(jù)進(jìn)行均一化處理,減少原始數(shù)據(jù)非穩(wěn)定性對(duì)模型預(yù)測結(jié)果的影響。
設(shè)定原始數(shù)據(jù)序列x={x(t),t=1,2,…,n},對(duì)x進(jìn)行均一化處理,均一化處理公式如下所示[13]。
[xi=xi-xminxmax-xmin+b]? ? ? ? ? ? ? ? ? ? (12)
式中:b為偏差值,取值為0.1。xmax和xmin為原始數(shù)據(jù)序列中的最大值和最小值。
LS-SVM模型需要對(duì)均一化處理后的數(shù)據(jù)序列進(jìn)行高維空間轉(zhuǎn)換,如前文提到的,LS-SVM模型通常采用非線性函數(shù)映射實(shí)現(xiàn)高維空間轉(zhuǎn)換。
經(jīng)均一化處理的數(shù)據(jù)序列為Xi,Xi={xi-n,xi-n+1,…,xi-1};輸出序列Yi,Yi=xi。
3.2 模型評(píng)價(jià)參數(shù)
通常需要設(shè)定評(píng)價(jià)模型參數(shù)標(biāo)準(zhǔn),風(fēng)速是隨機(jī)變化量,采用預(yù)測值與實(shí)測值的相對(duì)偏差量作為LS-SVM模型預(yù)測準(zhǔn)確度評(píng)判標(biāo)準(zhǔn)。相對(duì)偏差量計(jì)算式如下:
[EMAPE=1Ni=1NPi-PiPi×100%ERE=Pi-PiPi×100%]? ? ? ? ? (13)
式中:[EMAPE]為平均絕對(duì)百分比誤差;[ERE]為相對(duì)誤差;N為預(yù)測風(fēng)速樣本數(shù)量;[Pi]為實(shí)測風(fēng)速;[Pi]為模型預(yù)測值。
3.3 LS-SVM模型參數(shù)優(yōu)化
核函數(shù)的選取對(duì)LS-SVM模型計(jì)算的準(zhǔn)確度至關(guān)重要。對(duì)于核函數(shù)及其參數(shù)的選取也是研究的重點(diǎn),核函數(shù)可以通過很多算法結(jié)合,但核函數(shù)復(fù)雜,需適當(dāng)簡化。為了簡化模型計(jì)算,適應(yīng)風(fēng)速預(yù)測需要,選用函數(shù)參數(shù)較少的RBF徑向基核函數(shù)。
RBF函數(shù)訓(xùn)練LS-SVM時(shí),需考慮兩個(gè)參數(shù):懲罰系數(shù)C和Gamma。C的較小值能使得決策計(jì)算平滑,較大值能準(zhǔn)確分類所有樣本數(shù)據(jù)。Gamma對(duì)單一樣本訓(xùn)練能有較大影響。對(duì)于C和Gamma暫無高效的處理方法,擬采用遺傳算法優(yōu)化核函數(shù)的選取。
設(shè)定懲罰系數(shù)C的計(jì)算區(qū)間為[1,100],Gamma計(jì)算區(qū)間為(0,100]。遺傳算法初始種群規(guī)模設(shè)為20,評(píng)價(jià)函數(shù)采用均方誤差倒數(shù)形式,最高迭代次數(shù)40次。
[EMSE=1Ni=1NPi-Pi2]? ? ? ? ? ? ? ?(14)
[fit=1EMSE]? ? ? ? ? ? ? ? ? ? ? (15)
式中:N為計(jì)算樣本量;[Pi]為模型預(yù)測值;[Pi]為實(shí)測數(shù)據(jù);fit為評(píng)價(jià)函數(shù)。
3.4 模型計(jì)算結(jié)果
預(yù)測模型的基礎(chǔ)數(shù)據(jù)樣本為前15 d的實(shí)測風(fēng)速,共計(jì)360個(gè)數(shù)據(jù)樣本?;A(chǔ)數(shù)據(jù)如圖1所示。
采用遺傳算法對(duì)LS-SVM風(fēng)速預(yù)測模型進(jìn)行參數(shù)優(yōu)化。其中,由遺傳算法優(yōu)化得到LS-SVM的RBF徑向基核函數(shù)的兩個(gè)參數(shù)為:懲罰系數(shù)C為91.2,Gamma值為0.466。利用優(yōu)化參數(shù)后的LS-SVM風(fēng)速預(yù)測模型對(duì)第16天的風(fēng)速進(jìn)行預(yù)測。
在山西省陽泵市風(fēng)電場前15 d實(shí)測風(fēng)速樣本的基礎(chǔ)上,通過利用優(yōu)化模型參數(shù)后的LS-SVM風(fēng)速預(yù)測模型對(duì)第16天風(fēng)速進(jìn)行預(yù)測,表1和圖2為風(fēng)速預(yù)測結(jié)果。結(jié)果顯示預(yù)測值與實(shí)測值間的相對(duì)誤差較小,整體平均絕對(duì)百分比誤差為5.95%,預(yù)測結(jié)果較好。通過上述計(jì)算,驗(yàn)證了遺傳算法優(yōu)化模型參數(shù)后的LS-SVM預(yù)測短期風(fēng)速是可行的,具有一定的實(shí)用性。
4 結(jié) 論
LS-SVM模型核函數(shù)及其參數(shù)的選取具有多樣性和復(fù)雜性。如何有效得出核函數(shù)及其參數(shù),對(duì)LS-SVM計(jì)算的準(zhǔn)確性及高效性有著至關(guān)重要影響。對(duì)于風(fēng)速這種隨機(jī)變化的數(shù)據(jù)量,選擇合適的預(yù)測模型存在一定的困難。結(jié)合遺傳算法的優(yōu)勢,將其應(yīng)用于LS-SVM模型參數(shù)的選取,通過實(shí)例進(jìn)行計(jì)算,發(fā)現(xiàn)預(yù)測風(fēng)速值與實(shí)測風(fēng)速值相對(duì)偏差較小,從而驗(yàn)證了本文方法的可行性。結(jié)果表明:利用遺傳算法優(yōu)化LS-SVM風(fēng)速預(yù)測模型參數(shù)的方法在短期風(fēng)速預(yù)測中具有較好的效果,為風(fēng)電場中長期風(fēng)速預(yù)測和風(fēng)功率預(yù)報(bào)等提供了理論方法支撐,具有較好的實(shí)用性。
參考文獻(xiàn):
[1] FLORES P,TAPIA A,TAPIA G. Application of a control algorithm for wind speed prediction and active power generation[J].Renewable Energy,2005,30(4):523-536.
[2] 蔡凱,譚倫農(nóng),李春林,等.時(shí)間序列與神經(jīng)網(wǎng)絡(luò)法相結(jié)合的短期風(fēng)速預(yù)測[J].電網(wǎng)技術(shù),2008,32(8):82-85.
[3] 范高鋒,王偉勝,劉純,等.基于人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測[J].中國電機(jī)工程學(xué)報(bào),2008,28(34):118-123.
[4] 楊延西,劉丁.基于小波變換和最小二乘支持向量機(jī)的短期電力負(fù)荷預(yù)測[J].電網(wǎng)技術(shù),2005,29(13):60-63.
[5] SUYKENS J A K,VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Process Lett., 1999,9(3):293-300.
[6] HIKMET E,F(xiàn)ILIZ O,MEHMET E,et al. Modelling of a new solar air heater through least-squares support vector machines[J].Expert System with Applications,2009,36(7):10-673-10682.
[7] PARK S,INMAN D J,LEE J J,et al. Piezoelectric sensor-based health monitoring of railroad tracks using a Two-step support vector machine classifier[J].Journal of Infrastructure Systems,2008,14(1):80-88.
[8] POLAT K,AKDEMIR B,GUNES S. Computer aided diagnosis of ECG data on the least square support vector machine[J].Digital Signal Processing,2008,18(1):25-32.
[9] HOLLAND J H. Adaptation in natural and artificial systems[M].Michigan:University of Michigan Press,1975.
[10] POOJARI C A, BEASLEY J E. Improving benders decomposition using a genetic algorithm[J].European Journal of Operational Research,2009,199(1):89-97.
[11] VALENTE? J? M? S, GONCALVES? J F. A genetic algorithm approach for the single machine scheduling problem with linear earliness and quadratic tardiness penalties[J].Computers & Operations Research,2009,36(10):2707-2715.
[12] GEORGIEVA? A, JORDANOV? I . Global optimization based on novel heuristics, low-discrepancy sequences and genetic algorithms[J]. European Journal of Operational Research,2009,196(2):413-422.
[13] 文常保,馬文博,劉鵬里. 基于改進(jìn)遺傳算法的RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化研究[J].計(jì)算機(jī)工程與科學(xué),2019, 41(5):917-923.
[14] 朱苗苗,潘偉杰,劉翔,等. 基于BP神經(jīng)網(wǎng)絡(luò)代理模型的交互式遺傳算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2020, 56(2): 146-151.
(編輯:江 文)
Wind speed prediction model of least squares support vector? machine based on genetic algorithm
ZENG Jie,ZHU Yifei,CHEN Weipeng
(Changjiang Survey, Planning, Design and Research Co., Ltd., Wuhan 430010, China)
Abstract: In view of poor accuracy of wind speed prediction due to random fluctuation of wind speed, this paper uses least squares support vector machine(LS-SVM) method to predict and analyze the wind speed. Considering that there is no effective method for selecting LS-SVM parameters, this paper adopts genetic algorithm theory to select LS-SVM parameters. The wind speed data measured in the first 15 days in a wind farm in Shanxi Province are selected and LS-SVM model with the parameters optimized by genetic algorithm is set to predict wind speed of the 16th day. The calculated mean absolute percentage error is 5.95%, showing that the calculation results is ideal, and the effectiveness of LS-SVM with the parameters optimized by genetic algorithm is verified . The analysis results can provide theoretical support for short-term, medium and long-term wind power prediction of wind power in the actual operation of wind farms.
Key words:wind speed prediction; genetic algorithm; least squares support vector machine; wind farm