趙 興 王星惠 楊夢夢
(安徽大學 經(jīng)濟學院,安徽 合肥 230601)
隨著經(jīng)濟全球化進程不斷加速,國際原油期貨市場的風險逐步加大,一些極端的情況時有發(fā)生。近年來,國際原油價格震蕩頻繁,新冠疫情暴發(fā)導致國際原油價格暴跌為負數(shù)。國家經(jīng)濟發(fā)展需要原油作為支撐,我國經(jīng)濟處于上升期,能夠準確把握國際原油價格波動對經(jīng)濟穩(wěn)定發(fā)展有重要意義。
許多學者對原油價格的預測研究通常使用ARIMA模型與GARCH模型等計量經(jīng)濟學模型。如丁靜之,閔騏等[1]156-159使用ARIMA模型直接對原油價格預測;魏蓉蓉、葉圣偉[2]68-69用ARIMA模型對原油價格的波動進行了分析;姚小劍和吳文潔[3]1-4使用GARCH族模型分析了原油價格波動特征。近年來,LSTM(長短期記憶網(wǎng)絡)、SVR(支持向量回歸)和KNN(最鄰近規(guī)則分類)等機器學習的方法也都被廣泛地運用在原油價格的預測上,如潘少偉、李輝等[4]180-185使用LSTM模型對原油價格進行了預測;慕曉茜、何佳等[5]4585-4589使用SVR模型對原油期貨價格進行了短期預測;楚新元、盧愛珍等[6]15-22等使用KNN模型對原油價格進行了研究。然而,各種模型都有一定的局限性,直接對原始序列應用某種單一的預測模型時,所得到的預測結(jié)果都會存在改良空間。因此,近些年來越來越多的學者將組合模型的預測方法應用到該領域。如許南、廖施煜等[7]234-236使用混合型PSO-BP模型對原油期貨價格進行了預測;曹新悅、賀春林等[8]418-425使用X12-ARIMA和LSTM組合模型對城市蔬菜價格波動規(guī)律進行了研究。然而,組合模型雖然較好地將各模型的優(yōu)缺點進行了中和,但直接將模型應用于原始序列的分析方法仍然不能完全提取原始序列中的特征,而經(jīng)驗模態(tài)分解方法則可以在一定程度上解決這個問題。如楊云飛、鮑玉昆等[9]1884-1889使用EMD-SVMs的組合模型對原油價格進行了預測;姚洪剛和沐年國[10]239-244使用EMD-LSTM模型對金融時間序列進行了分析;Wu Y X,Wu Q B[11]114-124等使用EEMD-LSTM的組合模型對原油價格進行了預測;李政毓[12]1-67使用EEMD-ARIMA-LSTM組合模型對原油價格進行了預測;崔金鑫和鄒輝文[13]28-39使用CEEMDAN-PSO-ELM模型對原油期貨價格進行了預測;邸浩、趙學軍等[14]72-76將EEMD模型和LSTM-Adaboost模型結(jié)合對商品價格進行了預測。經(jīng)驗模態(tài)分解方法是先將原始序列進行分解后再進行預測,并將預測結(jié)果再進行加和重構(gòu),有效提高了模型預測的效率,也是近年來預測研究的熱點之一。
經(jīng)驗模態(tài)分解(EMD)模型由Huang,Shen等[15]903-995創(chuàng)造性地提出,可以將原始信號分解為不同頻率的若干個模態(tài)分量(IMF)和殘差分量(即趨勢項)。EMD模型的特點在于可以完全按照自身的特征對原始序列進行分解,具有自適應性。然而,EMD模型卻有著容易出現(xiàn)模態(tài)混淆的缺點。Wu,Huang[16]1-41提出了集合經(jīng)驗模態(tài)分解(EEMD)模型,有效解決了模態(tài)混淆的問題。通過向原始序列添加噪聲來避免模態(tài)混淆的發(fā)生,但因為存在噪聲殘余導致重構(gòu)誤差的問題。在預測過程中,模態(tài)分解的重構(gòu)誤差會影響最終的預測結(jié)果。María,Marcelo等[17]4144-4147提出的適應白噪聲的完全集合經(jīng)驗模態(tài)分解(CEEMDAN)模型則可以在模態(tài)分量不含殘余噪聲的同時避免模態(tài)混淆的發(fā)生,有效地解決了上述的兩個問題。因此,CEEMDAN模型在重構(gòu)預測的過程中顯現(xiàn)出一定優(yōu)勢。
本文基于原油價格預測,期間引入了CEEMDAN模型,使用CEEMDAN模型將原始序列分解為不同頻率的模態(tài)分量和殘差分量,再用ARIMA模型分別對各個分量和趨勢項進行擬合預測并在最后加和重構(gòu)。由于分解所得的高頻分量波動非常頻繁,ARIMA模型并不能很好地捕捉其特征,因而可以使用GARCH模型對高頻分量的擬合殘差平方序列進行進一步擬合,即用GARCH模型對殘差的預測值來對高頻分量的ARIMA預測值進行修正。因此,建立了CEEMDAN-ARIMA-GARCH模型。在CEEMDAN-ARIMA模型基礎之上,提出了對高頻分量有必要檢驗其殘差序列是否具有ARCH效應的原則,使用ARIMA-GARCH模型將分量中所含的信息盡可能提取出來,實現(xiàn)更好的預測效果。
2.1.1 EMD分解原理
EMD模型又稱經(jīng)驗模態(tài)分解,是由Huang,Shen等[15]903-905提出的一種根據(jù)時間序列的局部時變特征,將序列分解為若干個模態(tài)分量(IMF)和殘差分量(即趨勢項)的模型。所獲得的IMF需要滿足以下2個基本原則:任意IMF的極值點與零點的個數(shù)之差小于等于1;任意IMF的局部極大值和局部極小值的包絡線之和均值為0。
EMD分解步驟如下:
第一步,三次樣條插值法對原始序列x(t)中所有的局部極大值和極小值進行擬合,形成上下包絡線,記做u(t)與i(t);
第二步,計算上下包絡線u(t)與i(t)的均值o(t),見(1)式:
(1)
第三步,將原序列x(t)與o(t)相減得到新序列p(t),見(2)式:
p(t)=x(t)-o(t)
(2)
第四步,若p(t)滿足IMF的2個基本條件,則將p(t)作為EMD分解的第一個模態(tài)分量IMF1;若p(t)不滿足IMF的2個基本條件,則將p(t)定義為原序列,重復第一至第三步直到其滿足IMF的基本條件,得到第一個模態(tài)分量IMF1;
第五步,將原始序列x(t)減去IMF1,得到r1(t),見(3)式:
r1(t)=x(t)-IMF1
(3)
第六步,將r1(t)作為下一個要分解的原始序列,重復第一至第五步,直至得到殘余分量rn(t)小于預先設定值,或為單調(diào)函數(shù)、常數(shù)時,分解完畢。在分解完成之后,原始序列x(t)見(4)式:
(4)
然而EMD模型在實際的應用過程中會有模態(tài)混淆的情況發(fā)生。下文中的EEMD模型則可以解決模態(tài)混淆的問題。
2.1.2 EEMD模型分解原理
EEMD模型又稱集合經(jīng)驗模態(tài)分解,由Wu和Huang[16]1-41提出,利用多重白噪聲均值為0的特點,通過加入白噪聲的原始序列進行EMD分解,再將得到的模態(tài)分量取均值以達到控制噪聲對分解結(jié)果的影響。
EEMD分解步驟如下:
第一步,預先確定添加白噪聲次數(shù)Nε和白噪聲振幅系數(shù)ε;
第二步,在原始序列x(t)中加入白噪聲序列,得到Nε個染噪序列見(5)式:
xj(t)=x(t)+εnj(t)
(5)
其中nj(t)為第j次添加的白噪聲序列,xj(t)表示第j個染噪序列;
第三步,對得到的染噪序列進行EMD分解,得到Nε組模態(tài)分量IMFij,和Nε個殘余分量rj(t);
第四步,對第三步中獲得的Nε組模態(tài)分量中的第i個分量和Nε個殘余分量分別進行平均,見(6)、(7)式:
(6)
(7)
第五步,最終分解結(jié)果x(t)見(8)式:
(8)
在EEMD模型中,雖然解決了EMD模型的模態(tài)混淆的問題,但其分解所得到的各個模態(tài)分量卻會存在殘留的噪聲,進而帶來重構(gòu)誤差的問題,會在一定程度上影響最終的分析結(jié)果。
2.1.3 CEEMDAN模型
CEEMDAN模型又稱具有自適應白噪聲的完全集合經(jīng)驗模態(tài)分解,由María,Marcelo等[17]4144-4147提出,是EEMD模型的改進版算法,該模型在解決模態(tài)混淆問題的同時還解決了噪聲殘余的問題。分解步驟如下。
第一步,預先確定添加白噪聲次數(shù)Nε和第i次添加的白噪聲振幅系數(shù)εi;
第二步,在原始序列x(t)中加入白噪聲序列,得到Nε個染噪序列,見(9)式:
xj(t)=x(t)+ε1nj(t)
(9)
其中nj(t)為向原始序列中添加的第j個白噪聲序列,xj(t)表示第j個染噪序列;
第三步,對得到的Nε個染噪序列進行EMD分解,將得到的Nε個第1個IMF分量加總平均即為CEEMDAN分解的第一個分量cIMF1,見(10)式:
(10)
第四步,進一步得到殘余分量r1(t)=x(t)-cIMF1,將r1(t)當作x(t)重復第二至第三步直至殘余分量rn(t)不能進行EMD分解而得到n個模態(tài)分量cIMFi;
第五步,最終分解結(jié)果x(t)見(11)式
(11)
2.1.4 ARIMA模型
ARIMA模型全稱為回歸移動平均模型[18]94,是一種在時間序列預測中較為常見的模型。ARIMA模型有三種基本類型:自回歸(AR)模型、移動平均模型(MA)、自回歸移動平均模型(ARMA),見(12)式:
xt=φ0+φ1xt-1+φ2xt-2+…+φpxt-p+at+θ1at-1+θ2at-2+…+θqat-q
(12)
其中at為殘差序列,p表示自回歸項數(shù),q表示移動平均項數(shù),φ0,φ1,φ2,…,φp表示需要估計的自回歸系數(shù),θ0,θ1,θ2,…,θp表示需要估計的移動平均系數(shù)。當q=0或p=0時,其可轉(zhuǎn)化為AR模型或MA模型。由于ARMA模型只能處理過程平穩(wěn)的時間序列,因此,如果要分析非平穩(wěn)的時間序列,則需要對原始序列進行d次差分,將其轉(zhuǎn)化為平穩(wěn)序列,然后再用ARMA模型進行分析。
2.1.5 GARCH模型
GARCH模型全稱為廣義自回歸條件異方差模型,由Bollerslev[19]307-327在ARCH模型的基礎上提出。在ARCH的模型的基礎上,將滯后階段引入條件方差,得到廣義ARCH模型,見(13)式。
(13)
2.1.6 CEEMDAN-ARIMA-GARCH模型
ARIMA-GARCH模型即在用ARIMA模型對原始序列進行擬合建模后,將得到的殘差序列進行ARCH效應檢驗,若存在ARCH效應,則再用GARCH模型對其進行擬合,盡可能提取出殘差序列中的殘余信息,將其預測結(jié)果用于對ARIMA的預測結(jié)果進行修正,見(14)式。
(14)
文中涉及的記號與術(shù)語可參見[1,10-11]。若X是拓撲空間,F?X,F在X中的閉包記為clF,在涉及多個空間時,為區(qū)分起見也記作clXF??臻gX的全體開集與全體閉集分別記為Ο(x)與Γ(x)。
進一步,根據(jù)模態(tài)分量的實際情況將ARIMA-GARCH模型或ARIMA模型應用于CEEMDAN模型分解所得的高頻分量與低頻分量進行預測,并將預測結(jié)果加和得到最終的預測值,CEEMDAN-ARIMA-GARCH模型的預測流程見圖1。
圖1 CEEMDAN-ARIMA-GARCH模型的預測流程
為更加準確地分析國際原油價格波動的特征并進行預測,本文選擇使用WTI原油期貨價格作為分析對象。WTI原油期貨在保持其價格高度透明的同時還有著優(yōu)良的流動性,是世界原油市場上的三大基準價格之一。所有與美國有貿(mào)易往來的原油產(chǎn)品在計價時都以WTI的價格作為基準。
本文選取2020年8月26日至2021年8月25日的WTI原油收盤價作為原始數(shù)據(jù)。由上述模型介紹可知,CEEMDAN模型對原始序列的數(shù)據(jù)并沒有特殊的要求,而ARIMA模型則要求數(shù)據(jù)具有平穩(wěn)性。然而,僅僅是原始數(shù)據(jù)本身具有平穩(wěn)性是不夠的,為了使CEEMDAN模型分解所得的IMF分量可以擬合ARIMA模型,還要求原始數(shù)據(jù)通過CEEMDAN分解所得的IMF分量也具有平穩(wěn)性。若存在部分分量不符合平穩(wěn)性要求,則進行相應的平穩(wěn)性轉(zhuǎn)換。因此,本文使用ADF檢驗對WTI原油收盤價及其IMF分量進行平穩(wěn)性檢驗,各序列的平穩(wěn)性檢驗結(jié)果見表1。
表1 各序列的平穩(wěn)性檢驗結(jié)果
由表1檢驗結(jié)果可知,選用的WTI原油收盤價的數(shù)據(jù)從特征上是適合本文模型的。在預測方法上,選取滾動預測的方法,文中使用的原始數(shù)據(jù)共有262個樣本單位,選擇將前232個樣本單位(2020年8月26日至2021年7月13日)作為初始樣本。初始樣本中數(shù)據(jù)在原始數(shù)據(jù)中的占比超過了85%,可以為模型提供足夠的先驗信息,很好地擬合原始序列的特征。在此基礎上,將用初始樣本模擬的模型向前預測一步,得到2021年7月13日的預測值,之后再將2021年7月13日的真實值加入初始樣本重新擬合模型,重復以上步驟直至得到了2021年8月25日的預測值。這樣就保證了在選取的原始數(shù)據(jù)范圍內(nèi),獲得的每一個預測值都充分利用了原始數(shù)據(jù)中的信息,確保了預測結(jié)果的準確性。
將WTI原油收盤價數(shù)據(jù)進行CEEMDAN分解,得到4個IMF分量以及一個趨勢項,原始序列CEEMDAN分解結(jié)果見圖2。對分解的4個IMF分量以及趨勢項在2020年8月26日至2021年7月13日期間的數(shù)據(jù)擬合ARIMA模型,IMF分量與趨勢項的ARIMA擬合參數(shù)見表2。
隨著分量序列的頻率降低,ARIMA模型擬合的效果也越來越好,IMF分量與趨勢項的ARIMA擬合結(jié)果見圖3。因此進一步計算各IMF分量及趨勢項與原始序列的相關(guān)系數(shù),將序列區(qū)分為高頻與低頻。根據(jù)計算,IMF1、IMF2、IMF3、IMF4、趨勢項與原始序列之間的相關(guān)系數(shù)分別為0.0670、-0.0679、-0.0064、0.4426、0.9751。因此IMF1、IMF2、IMF3被判定為高頻分量,有必要檢驗其中的ARCH效應,嘗試進一步從中提取信息。
表2 IMF分量與趨勢項的ARIMA擬合參數(shù)
圖2 原始序列CEEMDAN分解結(jié)果
圖3 IMF分量與趨勢項的ARIMA擬合結(jié)果
圖4 高頻IMF的擬合殘差平方序列分布圖
圖5 IMF1、IMF2的殘差平方序列Ljung-Box檢驗結(jié)果
IMF1、IMF2的殘差平方序列Ljung-Box檢驗結(jié)果見圖5。從圖5可以看出,IMF1、IMF2的殘差平方序列檢驗得到的Q統(tǒng)計量的p值均小于0.05,即以上2個殘差平方序列都顯著地表現(xiàn)出了ARCH效應,可以進一步進行GARCH模型的擬合,從中提取有效信息。在GARCH模型的擬合中,本文對IMF1、IMF2擬合GARCH(1,1)模型,分別得到(15)式、(16)式:
(15)
(16)
首先對2020年8月26日至2021年7月13日期間的數(shù)據(jù)用表2中的ARIMA模型對各分量與趨勢項進行動態(tài)預測,分別得到5個預測樣本,再用(14)式對IMF1、IMF2的預測結(jié)果進行修正,修正結(jié)果見表3。
表3 IMF1、IMF2的預測值、修正值、真實值對比
根據(jù)表3可以看到,擬合的GARCH(1,1)模型有效修正了原預測值,使IMF1、IMF2的預測值更為準確,從而進一步提高了整體預測的準確度。將得到的IMF1、IMF2的修正預測值與IMF3、IMF4、trend的預測值進行加和,得到最終的預測結(jié)果,4種模型預測結(jié)果對比見圖6。
圖6 4種模型預測結(jié)果對比
從圖6可以看出,CEEMDAN-ARIMA-GARCH模型的預測值比其他模型的預測值更為精準。模型的預測數(shù)據(jù)在整體更加貼近原始數(shù)據(jù)的同時,對原始數(shù)據(jù)的趨勢與波動的反應也更為準確,相比CEEMDAN-ARIMA-GARCH模型,其他的模型則表現(xiàn)出了滯后性,也不能準確捕捉原始數(shù)據(jù)趨勢的缺陷。為了有效評估模型預測的效果,本文選用均方根誤差(RMSE)和對稱平均絕對百分比誤差(SMAPE)來對模型的預測效果進行評估。
RMSE與SMAPE計算方法見(17)、(18)式:
(17)
(18)
進一步使用RMSE與SMAPE2個指標來評價以上的4個預測模型的預測效果。指標值越小則表明預測誤差越小,模型的預測效果越好。
表4 4種模型預測效果評價
從表4可以看出,由于GARCH模型可以將殘差序列中的有效信息進一步提取出來,GARCH模型與ARIMA模型和CEEMDAN-ARIMA模型的結(jié)合都在一定程度上優(yōu)于ARIMA模型和CEEMDAN-ARIMA模型,實現(xiàn)了更高的預測精度。另一方面,CEEMDAN-ARIMA模型的預測效果也顯著優(yōu)于ARIMA模型,即后者可以通過分解重構(gòu)的方法使ARIMA模型可以更加精細地捕捉原始序列中的信息,從而提高了預測的精度。然而,ARIMA模型并不能很好地擬合CEEMDAN模型分解所得高頻分量,這時則會導致對高頻分量的預測效率低下,從而在重構(gòu)預測值時影響最終的結(jié)果。因此,在使用CEEMDAN-ARIMA-GARCH模型時,可以補齊ARIMA模型難以擬合高頻序列的缺陷,使有效信息被更為充分地利用。理論和實證的分析也顯示,CEEMDAN-ARIMA-GARCH模型在預測原油價格的研究中具有明顯的優(yōu)勢。
本文提出了一種新的預測模型——CEEMDAN-ARIMA-GARCH模型。該模型通過選用無模態(tài)混淆和重構(gòu)誤差的CEEMDAN模型,提高了對分量進行擬合預測后重構(gòu)預測值的精度。另一方面,對各個分量初步擬合ARIMA模型并對擬合的殘差序列進行分析,發(fā)現(xiàn)高頻分量在擬合ARIMA模型后的殘差平方序列中存在ARCH效應的問題。即以CEEMDAN-ARIMA模型為基礎,提出了通過對高頻序列的殘差平方序列擬合GARCH模型,以修正原有的ARIMA模型預測值,達到更高的預測精度的預測方法。
實證中,將2020年8月26日至2021年7月13日期間的國際原油價格作為原始數(shù)據(jù)并分為訓練集與測試集,預測測試集最后30天的國際原油價格。實證結(jié)果表明,在對比預測模型中,CEEMDAN-ARIMA-GARCH模型的預測精度最高。在面對原油價格波動時的表現(xiàn)也顯著優(yōu)于其他的模型。如在2021年7月中下旬原油價格的銳降與反彈以及2021年8月上旬的波動中,CEEMDAN-ARIMA-GARCH模型的預測值都與真實值非常接近,沒有表現(xiàn)出任何的滯后性。可見,在國際原油價格的預測中,CEEMDAN-ARIMA-GARCH模型可以更及時、更準確地對價格的波動做出反應,這對在國際原油市場中規(guī)避風險以及尋求獲利機會都有著相當重要的現(xiàn)實意義。