盛秀梅,張仲榮,王春媛,劉海忠
(1.蘭州交通大學(xué)數(shù)理學(xué)院,甘肅蘭州 730070;2.蘭州石化職業(yè)技術(shù)學(xué)院信息處理與控制工程學(xué)院,甘肅蘭州 730060)
近年來(lái),全球環(huán)境污染問(wèn)題變得日趨嚴(yán)重。風(fēng)能、太陽(yáng)能、水能、波浪能、生物能、地?zé)崮堋⒊毕艿刃履茉撮_始受到廣泛關(guān)注,這些新能源不會(huì)產(chǎn)生溫室氣體,對(duì)氣候變化沒(méi)有明顯的影響。在常規(guī)能源告急和全球生態(tài)環(huán)境惡化的雙重壓力下,風(fēng)能作為一種無(wú)污染和可再生的新能源有著巨大的發(fā)展?jié)摿?,即使在發(fā)達(dá)國(guó)家,風(fēng)能作為一種高效清潔的新能源也日益受到重視。比如,單是德克薩斯州和南達(dá)科他州的風(fēng)能密度就足以供應(yīng)全美國(guó)的用電量[1]。然而,風(fēng)力發(fā)電的發(fā)電能力受到自然界風(fēng)源間歇性和隨機(jī)性的困擾,因此,它仍然是一個(gè)不可靠的來(lái)源,很難被整合到電網(wǎng)系統(tǒng)中。風(fēng)力發(fā)電廠可以通過(guò)精確地預(yù)測(cè)風(fēng)速的動(dòng)態(tài)變化來(lái)解決這一問(wèn)題。準(zhǔn)確的短期風(fēng)速預(yù)測(cè)可以有效地減少風(fēng)力變化和風(fēng)速突然中斷對(duì)常規(guī)動(dòng)力系統(tǒng)的沖擊而導(dǎo)致的電壓和頻率的波動(dòng)[2-3]。
目前,風(fēng)速預(yù)測(cè)建模方法包括時(shí)間序列法[4-5]、人工神經(jīng)網(wǎng)絡(luò)法[6]以及卡爾曼濾波法[7]等。其中,用時(shí)間序列法用于預(yù)測(cè)時(shí)對(duì)歷史數(shù)據(jù)有較大的依賴性,只適用于超短期預(yù)測(cè);人工神經(jīng)網(wǎng)絡(luò)方法曾一度成為預(yù)測(cè)領(lǐng)域的研究熱點(diǎn),但它至今仍然存在著許多未解決的問(wèn)題;卡爾曼濾波適用于風(fēng)速的在線預(yù)測(cè),這些方法在用于短期風(fēng)速預(yù)測(cè)時(shí)的精度較低。為提高風(fēng)速預(yù)測(cè)的精度,各種組合預(yù)測(cè)方法得到了廣泛的應(yīng)用[8],其中應(yīng)用較為廣泛的是與神經(jīng)網(wǎng)絡(luò)結(jié)合的混合模型。而基于誤差修正的神經(jīng)網(wǎng)絡(luò)混合模型,更能合理地提高模型的精度[9]。通過(guò)對(duì)過(guò)去幾年文獻(xiàn)的分析可知,不同方法的混合預(yù)測(cè)已成為一種趨勢(shì)。例如,Li H Z等人提出了一種混合負(fù)荷預(yù)測(cè),該模型結(jié)合果蠅優(yōu)化算法和GRNN算法,證明了該混合模型的有效性[10]。Ghasemi等采用ABC、SVM和ARIMA對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè),結(jié)果證明該混合模型有更高的準(zhǔn)確性[11]。Wang等應(yīng)用GA和BP神經(jīng)網(wǎng)絡(luò)對(duì)內(nèi)蒙古的風(fēng)速數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果證明該模型不僅提高了預(yù)測(cè)精度,而且減小了時(shí)間復(fù)雜度[12]。
縱向數(shù)據(jù)選擇方法(LDS)的應(yīng)用,使得選擇的數(shù)據(jù)類型具有相同屬性;利用奇異譜分析(SSA)技術(shù)來(lái)處理風(fēng)速數(shù)據(jù)中的異常值和其趨勢(shì)、季節(jié)成分,使得原始風(fēng)速數(shù)據(jù)重構(gòu),大大地降低了噪聲對(duì)序列的影響;最小二乘支持向量機(jī)(LSSVM)是把標(biāo)準(zhǔn)支持向量機(jī)(SVM)的不等式約束條件改為等式約束條件,在一定程度上,降低了計(jì)算復(fù)雜度,提高了計(jì)算速度,并且較適合于處理大規(guī)模的非線性擬合數(shù)據(jù)問(wèn)題[13],并且其泛化能力要優(yōu)于神經(jīng)網(wǎng)絡(luò)模型與單一的時(shí)間序列模型。在LSSVM的參數(shù)選擇方面,粒子群優(yōu)化算法(PSO)的加入減少了LSSVM在參數(shù)選擇方面的人為影響以及避免陷入局部最優(yōu)的問(wèn)題。將PSOLSSVM與時(shí)間序列的方法結(jié)合起來(lái)建立基于誤差修正的混合預(yù)測(cè)模型(PSOLSSVM-ARIMA),可以完整地?cái)M合風(fēng)速數(shù)據(jù)中的非線性部分與線性部分,從而提高風(fēng)速的預(yù)測(cè)精度。
在用風(fēng)速的歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí),風(fēng)速的隨機(jī)性與不穩(wěn)定性等特征,會(huì)使預(yù)測(cè)模型產(chǎn)生較大的誤差。而混合模型則是目前解決這一問(wèn)題較為重要且前沿的方法,其主要思想就是將不同的模型及其分析理論混合,形成一種新的預(yù)測(cè)模型。而誤差修正模型又可以對(duì)當(dāng)前的混合預(yù)測(cè)模型進(jìn)行補(bǔ)充,即克服了單一方法的局限性,又合理地提高了模型的預(yù)測(cè)精度。
本文建立了一種基于誤差修正的混合模型來(lái)對(duì)風(fēng)速數(shù)據(jù)進(jìn)行預(yù)測(cè),具體流程圖如圖1所示,其中奇異譜分析(SSA)由Colebrook于1978年首先在海洋學(xué)研究中提出的,是研究非線性時(shí)間序列的一種方法,它結(jié)合多元統(tǒng)計(jì)與概率論的思想去分析時(shí)間序列[14],并且提取出代表原序列不同程度的信號(hào),如長(zhǎng)期趨勢(shì)信號(hào)、周期信號(hào)、噪聲信號(hào)等;最小二乘支持向量機(jī)(LSSVM)是一種遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structural Risk Minimization,SRM)原則的核函數(shù)學(xué)習(xí)機(jī)器,有很強(qiáng)的非線性擬合能力,并被廣泛地用于科學(xué)工程;粒子群優(yōu)化算法PSO(Particle Swarm Optimization)則是由Eberhart和Kennedy博士發(fā)明的一種基于全局優(yōu)化的智能優(yōu)化算法,它主要源于對(duì)鳥類捕食行為的模擬[15]。作為一種重要的優(yōu)化工具,粒子群優(yōu)化算法已經(jīng)被成功地用于神經(jīng)網(wǎng)絡(luò)的參數(shù)訓(xùn)練[16];而用于誤差修正的ARIMA模型又稱為求和自回歸移動(dòng)平均(autoregressive integrated moving average)模型,是一種基于時(shí)間序列的預(yù)測(cè)模型,適用于短期和超短期預(yù)測(cè),并且預(yù)測(cè)精度較高[17]。
圖1 基于ARIMA修正的混合模型流程圖
文中建立混合模型的具體步驟如下:
步驟1 利用縱向數(shù)據(jù)選擇方法(LDS),選擇合適的數(shù)據(jù)類型;
步驟2 利用SSA-PSOLSSVM模型對(duì)每個(gè)子集序列進(jìn)行預(yù)測(cè),并得到誤差序列;
步驟3 利用ARIMA模型進(jìn)行誤差修正;
步驟4 獲得最終的風(fēng)速預(yù)測(cè)值,并進(jìn)行結(jié)果分析。
為了驗(yàn)證文中方法的可行性,選擇了西班牙Sotavento Galicia風(fēng)場(chǎng)2016年2月和2017年2月的風(fēng)速數(shù)據(jù)進(jìn)行分析,其中數(shù)據(jù)間隔為1小時(shí),數(shù)據(jù)樣本總量為1368(圖2)。其中,選取1032個(gè)數(shù)據(jù)作為訓(xùn)練集,選取336個(gè)數(shù)據(jù)作為測(cè)試集。
圖2 歷史風(fēng)速數(shù)據(jù)圖
為了提高模型的性能,采用LDS方法將原始數(shù)據(jù)集進(jìn)行劃分,即將這兩個(gè)月的數(shù)據(jù)按照星期數(shù)劃分成7個(gè)子集(從周一到周日,如圖3所示),這確保了數(shù)據(jù)結(jié)構(gòu)具有相同的屬性。利用奇異譜分析(SSA)分別對(duì)7個(gè)子集(其中周一有216個(gè)數(shù)據(jù),剩余6個(gè)子集有192個(gè)數(shù)據(jù))的數(shù)據(jù)進(jìn)行重構(gòu),在這里所選擇的窗口長(zhǎng)度L=90,獲得7組消除噪聲影響的風(fēng)速數(shù)據(jù)集;再利用LSSVM模型對(duì)每個(gè)風(fēng)速數(shù)據(jù)的子集進(jìn)行訓(xùn)練預(yù)測(cè),并通過(guò)粒子群優(yōu)化算法(PSO)得到最小二乘支持向量機(jī)(LSSVM)的調(diào)節(jié)因子c和核參數(shù)σ2。PSOLSSVM模型將每個(gè)子集的前144個(gè)(周一為168個(gè))數(shù)據(jù)作為其訓(xùn)練集,后48個(gè)數(shù)據(jù)作為測(cè)試集(圖4即為7個(gè)測(cè)試集的預(yù)測(cè)值與真實(shí)值結(jié)果對(duì)比圖)。將7個(gè)子集所得到誤差項(xiàng)按照時(shí)間順序形成一條新的殘差序列。
由圖4可以看出,當(dāng)風(fēng)速出現(xiàn)波動(dòng)的時(shí)候,其風(fēng)速的預(yù)測(cè)值與真實(shí)值偏差較大,其擬合效果并不是很好,因此,為了使模型的預(yù)測(cè)值具有更高精度,可采用ARIMA模型對(duì)預(yù)測(cè)模型的誤差進(jìn)行修正。
圖3 LDS方法選擇數(shù)據(jù)的形式
圖4 7個(gè)測(cè)試集的預(yù)測(cè)風(fēng)速與真實(shí)風(fēng)速對(duì)比
首先,在EVIEWS軟件中利用單位根檢驗(yàn)(ADF)對(duì)所獲得的誤差數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn),得到表1所示的結(jié)果。由表1可知,ADF檢驗(yàn)的t檢驗(yàn)值小于各顯著性水平的測(cè)試臨界值,并且其大于t檢驗(yàn)值的概率遠(yuǎn)遠(yuǎn)小于各顯著性水平的值,因此,可以得到序列不存在單位根,即誤差序列平穩(wěn)。
表1 誤差序列單位根檢驗(yàn)結(jié)果
其次,對(duì)誤差序列進(jìn)行相關(guān)性檢查,并得到誤差序列的相關(guān)性分析圖(圖5)。而在相關(guān)性分析中,當(dāng)P<0.05時(shí),表示拒絕原假設(shè),即序列相關(guān);相反地,當(dāng)P>0.05時(shí),接受原假設(shè),序列不相關(guān)。圖4中所有的P<0.05,因此,誤差序列相關(guān)。由圖4自相關(guān)部分可以看到,第4個(gè)數(shù)已明顯收斂到2倍的置信區(qū)間內(nèi),由偏自相關(guān)部分可以看到,第3個(gè)數(shù)明顯收斂到2倍的置信區(qū)間內(nèi),因此,p,q在[1,4]之間選值,結(jié)合最小信息準(zhǔn)則(AIC),可確定誤差序列采用ARIMA(1,0,1)模型進(jìn)行修正。
圖5 誤差序列的相關(guān)性分析圖
模型的參數(shù)確定結(jié)果如表2所示。從表2中可以看出參數(shù)的P值,即大于t檢驗(yàn)值的概率值均小于0.05,因此,模型參數(shù)均顯著。最后,進(jìn)行檢驗(yàn)發(fā)現(xiàn)殘差序列為白噪聲序列,因此,所選用的誤差修正模型是合理的。
表2 模型參數(shù)顯著性
將混合模型與誤差修正模型所得到的預(yù)測(cè)值結(jié)合,得到最終的風(fēng)速預(yù)測(cè)結(jié)果(圖6)。由圖6可以清晰地看出,經(jīng)過(guò)誤差修正后的風(fēng)速預(yù)測(cè)值更接近于其真實(shí)值。
圖6 經(jīng)過(guò)ARIMA修正后的預(yù)測(cè)值與真實(shí)值
本文采用了平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)、標(biāo)準(zhǔn)化的均方誤差(NMSE)以及均方根誤差(RMSE)四種評(píng)價(jià)指標(biāo)評(píng)價(jià)混合模型在風(fēng)速預(yù)測(cè)中的準(zhǔn)確性,其具體公式如下:
(1)
(2)
(3)
(4)
(5)
與PSOLSSVM、LSSVM、ARIMA以及GM(1,1)模型預(yù)測(cè)的風(fēng)速結(jié)果進(jìn)行對(duì)比,由于測(cè)試集數(shù)據(jù)量較大,為了更加顯著地顯示各模型的預(yù)測(cè)效果,隨機(jī)對(duì)比了各模型在2017年2月20日的風(fēng)速預(yù)測(cè)值(圖6)。從圖6可以看出,LSSA_PSOLSSVM_ARIMA模型的預(yù)測(cè)結(jié)果更接近當(dāng)天的風(fēng)速真實(shí)值,而單一的LSSVM模型和GM(1,1)模型的預(yù)測(cè)效果較差,其中GM(1,1)模型的預(yù)測(cè)結(jié)果是一條直線,而單一的LSSVM模型的預(yù)測(cè)結(jié)果雖然有趨勢(shì),但其預(yù)測(cè)值與真實(shí)值之間有較大的偏離,ARIMA模型和PSOLSSVM模型的預(yù)測(cè)結(jié)果接近于真實(shí)值,但仍沒(méi)有LSSA_PSOLSSVM_ARIMA模型預(yù)測(cè)效果好。
將各模型評(píng)價(jià)指標(biāo)(MAE、NMSE、MAPE、RMSE)的對(duì)比結(jié)果列于表3,由表3數(shù)據(jù)可知,LSSA_PSOLSSVM_ARIMA模型的4個(gè)評(píng)價(jià)指標(biāo)值在表3中都是最小值,因此,該模型相對(duì)表中其它預(yù)測(cè)模型有更高的精度。其中,單一的LSSVM模型和GM(1,1)模型的預(yù)測(cè)精度較低,PSOLSSVM模型和ARIMA模型的預(yù)測(cè)精度高于單一的LSSVM模型和GM(1,1)模型的預(yù)測(cè)精度,但低于LSSA_PSOLSSVM_ARIMA模型的預(yù)測(cè)精度。
圖7 2017年2月20日的風(fēng)速預(yù)測(cè)結(jié)果對(duì)比圖
模型MAENMSEMAPE/%RMSELSSA_PSOLSSVM_ARIMA0.19950.00463.89840.2577PSOLSSVM0.25290.02167.80090.5590LSSVM7.59345.1859129.74088.6518ARIMA0.93050.099719.27811.1998GM(1,1)4.07171.47784.6185102.3896
由于風(fēng)速數(shù)據(jù)的季節(jié)性和不確定性,使得風(fēng)速時(shí)間序列具有復(fù)雜的非線性性和不穩(wěn)定性。本文首先采用縱向數(shù)據(jù)選擇方法(LDS)選擇合適的數(shù)據(jù)類型;然后利用奇異譜分析(SSA)技術(shù)剔除風(fēng)速時(shí)間序列中的噪聲與季節(jié)性,從而加強(qiáng)最小二乘支持向量機(jī)(LSSVM)的預(yù)測(cè)性能;同時(shí),利用通過(guò)粒子群優(yōu)化算法優(yōu)化最小二乘支持向量機(jī)(LSSVM)的最優(yōu)調(diào)節(jié)因子c和核參數(shù)σ2,將風(fēng)速數(shù)據(jù)輸入該模型進(jìn)行模擬預(yù)測(cè),并得到相應(yīng)的誤差序列;最后,利用ARIMA模型對(duì)所得到的誤差序列進(jìn)行修正,并結(jié)合PSOLSSVM的預(yù)測(cè)結(jié)果,得到最終的風(fēng)速預(yù)測(cè)數(shù)據(jù)。利用西班牙Sotavento Galicia風(fēng)場(chǎng)的風(fēng)速數(shù)據(jù)來(lái)驗(yàn)證混合模型的性能,結(jié)果發(fā)現(xiàn)本文提出的基于誤差修正的混合模型相比較于其它單一的預(yù)測(cè)模型具有更高的精度。除此之外,該方法也可以應(yīng)用于股票指數(shù)、航空運(yùn)輸、意外死亡等方面的預(yù)測(cè)。