楊君琪 劉海忠
(蘭州交通大學(xué),甘肅 蘭州 730000)
目前主流方法依然是數(shù)值天氣預(yù)報(bào)法和時(shí)間序列預(yù)測(cè),諸如利用經(jīng)驗(yàn)小波和高斯回歸的方法綜合預(yù)測(cè)每小時(shí)的風(fēng)速[2]。在對(duì)風(fēng)速短期預(yù)測(cè)過程中,統(tǒng)計(jì)方法也用來(lái)作為一種預(yù)測(cè)方法,Miranda M S 提出了基本的貝葉斯方法來(lái)建立風(fēng)向預(yù)報(bào)1 h的自回歸模型[3]。從傳統(tǒng)時(shí)間序列分析角度,Lahouar A 和Slama J 提出利用ARMA 模型用于根據(jù)時(shí)間序列中的過去數(shù)據(jù)知識(shí)進(jìn)行預(yù)測(cè),得到了和好的預(yù)測(cè)效果[4]。時(shí)間序列對(duì)于波動(dòng)較大時(shí)預(yù)測(cè)并不明顯,但是,由于線性特性,ARMA 模型的預(yù)測(cè)在給定的工作條件下是有效的[5]。而機(jī)器學(xué)習(xí)方法,例如人工神經(jīng)網(wǎng)絡(luò),利用非線性函數(shù)的無(wú)限逼近來(lái)達(dá)到預(yù)測(cè)目的,很好地抓住了風(fēng)速非線性的特性,從而擁有較為可觀的預(yù)測(cè)精度。相比較ARMA 模型,ANN 模型所具有的非線性激活函數(shù),使得在風(fēng)速波動(dòng)較大時(shí)更能體現(xiàn)出ANN 的優(yōu)勢(shì)[6]。諸如Amjady, N 在對(duì)風(fēng)能進(jìn)行短期預(yù)測(cè)時(shí)引入了嶺函數(shù)Ridgelet 神經(jīng)網(wǎng)絡(luò)(RNN)[7]。Sideratos 提出一種新的預(yù)測(cè)方法,其在預(yù)測(cè)過程中綜合利用了模糊邏輯與神經(jīng)網(wǎng)絡(luò),整個(gè)預(yù)測(cè)的魯棒性有顯著的提升[8]。本文嘗試提出一種集成學(xué)習(xí)模型結(jié)合機(jī)器學(xué)習(xí)模型的方法來(lái)預(yù)測(cè)風(fēng)速,并且與常見的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行精度比較,在預(yù)測(cè)精度評(píng)價(jià)指標(biāo)方面上,本文選擇均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo),并在最后比較了預(yù)測(cè)模型的誤差平方的整體表現(xiàn),得到了較好預(yù)測(cè)結(jié)果。
圖1 原始風(fēng)速序列樣例
圖2 單一模型預(yù)測(cè)比較
本文采用來(lái)自美國(guó)國(guó)家海洋大氣管理局(NOAA)2019 年9月22 日-9 月27 日某地風(fēng)電設(shè)備實(shí)測(cè)數(shù)據(jù)進(jìn)行研究。以2019年9 月22 日數(shù)據(jù)為例,原始風(fēng)速數(shù)據(jù)在采樣過程中以2min 為間隔,當(dāng)日共采集720 個(gè)采樣點(diǎn),以此建立原始風(fēng)速序列如圖1所示。
在本文中,利用BP 單一模型進(jìn)行預(yù)測(cè)的特征輸入為1,隱含層節(jié)點(diǎn)個(gè)數(shù)按照經(jīng)驗(yàn)設(shè)置為2,輸入層節(jié)點(diǎn)個(gè)數(shù)為1。即BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為1-2-1,訓(xùn)練迭代次數(shù)為1000 次,學(xué)習(xí)率為0.01 最大誤差為0.00001。RBF 神經(jīng)網(wǎng)絡(luò)的核函數(shù)選擇高斯徑向基函數(shù)。首先選擇訓(xùn)練數(shù)據(jù),本文選擇某地22-26 號(hào)的風(fēng)速數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),預(yù)測(cè)27 日的風(fēng)速整體大小情況,訓(xùn)練方法是,將前一時(shí)刻的風(fēng)速數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入,將當(dāng)前時(shí)刻的風(fēng)速數(shù)據(jù)作為輸出。得到預(yù)測(cè)軌跡結(jié)果如圖2。
預(yù)測(cè)精度評(píng)價(jià)指標(biāo):
本文采取均方根誤差作為評(píng)判預(yù)測(cè)精度的評(píng)價(jià)指標(biāo),其計(jì)算公式為:
其中N 為風(fēng)速序列預(yù)測(cè)值的個(gè)數(shù);yt為風(fēng)速在t 時(shí)刻的真實(shí)值;y^t為相應(yīng)t 時(shí)刻風(fēng)速的預(yù)測(cè)值。
單一預(yù)測(cè)模型預(yù)測(cè)過程簡(jiǎn)單,但是存在魯棒性較差的情況,一次預(yù)測(cè)結(jié)果在某種程度上并不能說明模型預(yù)測(cè)的穩(wěn)健性良好,其預(yù)測(cè)結(jié)果或多或少是帶有一定的不確定性存在。為了增加模型的穩(wěn)健性,我們嘗試采用Adaboost 方法來(lái)彌補(bǔ)這一不足,由于Adaboost 方法對(duì)樣本每一次訓(xùn)練抽取時(shí)的權(quán)重不一,這使得最后預(yù)測(cè)結(jié)果更加具有泛化能力,樣本能夠得到充分利用。
Adaboost 是集成學(xué)習(xí)中的一個(gè)重要方法,Adaboost 是一種迭代算法,其核心思想是針對(duì)同一個(gè)訓(xùn)練集訓(xùn)練不同的分類器(弱分類器),然后把這些弱分類器集合起來(lái),構(gòu)成一個(gè)更強(qiáng)的最終回歸器(強(qiáng)回歸器)。
圖3 Adaboos 預(yù)測(cè)方法流程
圖4 各預(yù)測(cè)模型比較
圖5 各預(yù)測(cè)模型預(yù)測(cè)整體誤差比較
Adaboost 算法本身是通過改變數(shù)據(jù)分布來(lái)實(shí)現(xiàn)的,它根據(jù)每次訓(xùn)練集中每個(gè)樣本的分類是否正確,以及上次的總體分類的準(zhǔn)確率,來(lái)確定每個(gè)樣本的權(quán)值。將修改過權(quán)值的新數(shù)據(jù)送給下層回歸器進(jìn)行訓(xùn)練,最后將每次得到的回歸器融合起來(lái),作為最后的決策回歸器。本文提出的預(yù)測(cè)方法的整個(gè)預(yù)測(cè)流程為圖3。
其首先對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,繼而開始將歸一化后的是數(shù)據(jù)進(jìn)行劃分訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù),通過構(gòu)造神經(jīng)網(wǎng)絡(luò)進(jìn)行一級(jí)預(yù)測(cè),在預(yù)測(cè)中嵌入Adaboost 框架,本文中所選擇的Adaboost 框架確定迭代次數(shù)為10 次,及K=11。由于基回歸器采用BP 神經(jīng)網(wǎng)絡(luò),而BP 神經(jīng)網(wǎng)絡(luò)有陷入局部最優(yōu)解的缺陷,這里我們采用遺傳算法進(jìn)行優(yōu)化,使得預(yù)測(cè)結(jié)果更加穩(wěn)定。
在這里我們不僅比較本文提出的模型與BP 神經(jīng)網(wǎng)絡(luò)和RBF 神經(jīng)網(wǎng)絡(luò)的精度,進(jìn)一步,我們通過對(duì)每一時(shí)刻每個(gè)預(yù)測(cè)值與真實(shí)值的誤差平方作比較(圖4),并畫出誤差平方圖來(lái)證實(shí)本文提出的模型的優(yōu)勢(shì)(圖5),與此同時(shí),在預(yù)測(cè)精度為RMSE的情況下比較常見的神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)時(shí)的結(jié)果(表1)。
表1 各模型預(yù)測(cè)精度最終比較結(jié)果
風(fēng)速預(yù)測(cè)對(duì)風(fēng)電場(chǎng)風(fēng)能收集具有重要意義,風(fēng)速的提前捕捉能有效增強(qiáng)風(fēng)電采集設(shè)備的穩(wěn)定性,使風(fēng)電場(chǎng)各觀測(cè)設(shè)備提前做好應(yīng)對(duì)策略;本文采用集成學(xué)習(xí)Adaboost 與機(jī)器學(xué)習(xí)ANN相結(jié)合的方式對(duì)風(fēng)速數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果表明其預(yù)測(cè)的精度較單一預(yù)測(cè)模型有較好的優(yōu)勢(shì);采用Adaboost 方法,有效彌補(bǔ)了單一預(yù)測(cè)模型穩(wěn)健較差的缺陷,圖5 對(duì)集成之后的預(yù)測(cè)模型進(jìn)行預(yù)測(cè)后與單一模型進(jìn)行誤差平方的整體比較,顯示出在加入Adaboost 模型后整體的預(yù)測(cè)穩(wěn)健性有了明顯的提升,其各預(yù)測(cè)點(diǎn)預(yù)測(cè)結(jié)果的誤差平方基本小于單一模型。同時(shí)對(duì)基回歸器BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)優(yōu)化,采用傳統(tǒng)遺傳算法,進(jìn)而使BP 神經(jīng)網(wǎng)絡(luò)跳出局部最優(yōu)解情況,提高了預(yù)測(cè)精度,通過個(gè)預(yù)測(cè)模型的比較(表1),Adaboost-GA-BP 模型的預(yù)測(cè)精度由于本文中涉及到的各預(yù)測(cè)模型。由于機(jī)器學(xué)習(xí)模型在不斷產(chǎn)生新的方法,基于Adaboost 模型的風(fēng)速預(yù)測(cè)有待進(jìn)一步的進(jìn)行優(yōu)化。而本文并未將涉及與風(fēng)速相關(guān)的其他因素例如濕度、溫度、風(fēng)向等作為同等輸入特征,因此對(duì)于其他特征對(duì)風(fēng)速變化的研究并沒有涉及,將作為后期重點(diǎn)研究對(duì)象進(jìn)行展開。