朱彥名 張振華
摘要:文章使用互補集合經(jīng)驗模態(tài)分解(CEEMD)和自回歸移動平均(ARIMA)組合預測模型對中美雙邊貿(mào)易進出口總額進行建模預測。傳統(tǒng)ARIMA模型的擬合精度較低,CEEMD-ARMA組合相比傳統(tǒng)時間序列模型預測精度更高,有效解決了原始數(shù)據(jù)的非平穩(wěn)性。仿真結(jié)果表明,該模型優(yōu)于其他模型,能夠以一定的精度預測中美雙邊貿(mào)易額走勢。
關(guān)鍵詞:CEEMD;ARIMA;組合預測;中美雙邊貿(mào)易額
一、引言
改革開放以來,我國的經(jīng)濟迅速發(fā)展,進出口貿(mào)易的快速增長功不可沒。對外貿(mào)易作為拉動經(jīng)濟發(fā)展的三輛馬車之一,合理的預測其發(fā)展走勢是必不可少的,這對制定未來貿(mào)易戰(zhàn)略方針具有重大的指導性作用,對外貿(mào)易市場的進一步擴大,參與全球化經(jīng)濟競爭,保證我國經(jīng)濟平穩(wěn)快速增長,保證國民經(jīng)濟平穩(wěn)增長具有積極的意義。
進出口貿(mào)易是拉動經(jīng)濟增長和實現(xiàn)對外交流的重要工具,近年來我國對外貿(mào)易發(fā)展迅速,尤其是出口經(jīng)濟。但隨著國際形勢的日益復雜化和我國高新技術(shù)產(chǎn)業(yè)核心競爭力升級,近年來中美貿(mào)易摩擦日益嚴重。美國以“貿(mào)易逆差”為由對中國發(fā)動貿(mào)易戰(zhàn),實則是為了遏制中國的崛起。自2018年3月以來,美國針對中國推出三輪提高關(guān)稅政策。另一方面,美國指責中國“竊取知識產(chǎn)權(quán)”和“強迫技術(shù)轉(zhuǎn)讓”,體現(xiàn)出美國試圖妨礙中國發(fā)展高新技術(shù)。中美關(guān)稅增加,貿(mào)易摩擦的產(chǎn)生必然對中美雙邊貿(mào)易產(chǎn)生影響??茖W預測中美貿(mào)易的發(fā)展趨勢,對我國制定中美貿(mào)易戰(zhàn)略方針有著一定指導性作用。
目前針對進出口貿(mào)易額的預測應用分析,我國學者所選擇的預測方法各有不同,但預測方法多為單一模型。吳昕(2016)基于向量自回歸模型,采取定量與定性分析相結(jié)合的方式對我國進出口貿(mào)易趨勢進行了預測研究;陳銳(2015)基于“監(jiān)督分組”主成分回歸對進出口貿(mào)易值與增速進行了預測?;貧w預測的缺陷在于只提取了線性規(guī)律而對非線性規(guī)律則無法進一步進行挖掘。杜江(2010)基于模糊時間序列模型,針對我國對外貿(mào)易的進口水平進行了預測;陳蔚(2015)使用人工BP神經(jīng)網(wǎng)絡(luò)方法和ARIMA模型,對我國對外貿(mào)易的進口與出口貿(mào)易額進行了預測;王雅琴(2018)采用時間序列分析和彈性分析法就中美貿(mào)易戰(zhàn)局勢下對我國煤炭進出口貿(mào)易額進行了預測。目前傳統(tǒng)單一模型預測結(jié)果的平均絕對百分誤差多在10%~40%間,為了提高預測的精度,近年來更多的學者將神經(jīng)網(wǎng)絡(luò)、時間序列、支持向量機(SMV)、灰色預測、模糊算法等相結(jié)合,形成多方法并用的組合預測算法模型。舒服華(2018)運用小波變換和灰色DGM(2,1)模型相結(jié)合的方法預測我國進出口貿(mào)易總額。本文選用時間序列預測模型,結(jié)合適用于非平穩(wěn)時間序列的CEEMD分解法構(gòu)建組合預測模型,該模型相比其他模型能夠有效地解決時間序列數(shù)據(jù)的非平穩(wěn)性問題,且預測精度更高。
二、相關(guān)模型理論
(一)時間序列模型
根據(jù)時間序列模型的建模步驟,首先對原時間序列需進行平穩(wěn)性檢驗和白噪聲檢驗。
1. 時間序列預處理
(1)平穩(wěn)性檢驗。圖檢驗法和單位根檢驗法是常見的平穩(wěn)性檢驗方法。圖檢驗法利用了平穩(wěn)序列具有短期相關(guān)的特性,對序列自相關(guān)系數(shù)進行觀察,若其較快衰減到零而后在零附近波動,則原序列為平穩(wěn)的。而常見單位根檢驗法有DF檢驗、ADF檢驗和PP檢驗,若檢驗出原序列存在單位根,則序列為非平穩(wěn)時間序列,反之則為平穩(wěn)序列。在實際分析過程中,由于經(jīng)濟發(fā)展趨勢,大多數(shù)的經(jīng)濟時間序列都是非平穩(wěn)的。因此要對原序列進行平穩(wěn)化,若原序列為非平穩(wěn)時間序列,可通過對數(shù)處理和差分處理等方式將非平穩(wěn)時間序列平穩(wěn)化。
(2)白噪聲檢驗。白噪聲檢驗也稱作純隨機性檢驗,其目的是檢驗原時間序列是否為白噪聲序列。白噪聲序列的特點是任意兩個時點的隨機變量都無關(guān)系,即原序列中沒有任何動態(tài)規(guī)律可以為人所用。因此白噪聲序列是無法進行預測分析的。只有通過白噪聲檢驗,也就是說原序列為非白噪聲序列,預測建模才有意義。
2. 平穩(wěn)時間序列建模
(1)自回歸模型。p階自回歸過程AR(p)的表達式為:
Yt=c+■?覬iYt-i+εt(1)
自回歸模型討論的是t時刻的序列值Yt與過去時序值Yt-i和常數(shù)項c的相關(guān)關(guān)系,φi(i=1,2,…,p)表示自回歸系數(shù),且φp≠0,εt表示殘差,殘差應符合白噪聲序列。
(2)移動平均模型。q階移動平均模型MA(q)的表達式為:
Yt=c+■θiεt-i+εt(2)
移動平均模型討論的是t時刻的序列值Yt與現(xiàn)在干擾值εt以及過去隨機干擾值εt-i的相關(guān)關(guān)系。εt為t時刻的干擾值,c表示常數(shù),θi(i=1,2,…,q)表示移動平均系數(shù),且θq≠0。
(3)自回歸移動平均模型。自回歸移動平均模型討論的是t時刻的序列值Yt與現(xiàn)在干擾值εt、過去隨機干擾值εt-i,以及過去時序值Yt-i和常數(shù)項c的相關(guān)關(guān)系,即ARMA(p,q)模型、表達式為:
Yt=c+■?覬iYt-i+εt-■θiεt-i(3)
3.非平穩(wěn)時間序列建模
單整自回歸移動平均模型,即ARIMA(p,d,q)模型,表達式為:
(1-■?覬iBi)(1-B)dYt=(1+■θiBi)εi(4)
ARIMA模型可用于非平穩(wěn)時間序列,其中p為自回歸系數(shù),q為移動平均系數(shù),d表示差分階數(shù)。實際上ARIMA(p,d,q)模型可從ARMA(p,q)模型通過d階差分得到,即將非平穩(wěn)時序通過差分的方式使原序列平穩(wěn)化,再采用ARMA模型進行建模的過程。
(二)CEEMD分解
1. EMD分解思想
經(jīng)驗模態(tài)分解法,也可稱為EMD分解法是一種自適應信號時頻處理方法。EMD方法由N. E. Huang(1998,2009)提出,該分解方法適合處理非線性、非平穩(wěn)信號序列。相比較于傳統(tǒng)的小波分解,EMD分解更能保持原有序列的信息,信號損失更小,且局部表現(xiàn)能力更優(yōu),更適合對高頻、非線性的經(jīng)濟宏觀數(shù)據(jù)進行處理。通過EMD方法分解得出來的分量被稱作本征模函數(shù)(Intrinsic Mode Function,簡稱IMF)。分解步驟如下:
(1)找出原始信號s(t)所有的極大值點,并將其用三次樣條函數(shù)擬合出原始信號的上包絡(luò)線;同理,找出信號所有極小值點,擬合出下包絡(luò)線。
(2)計算上下包絡(luò)線的均值,記為m1(t),那么原信號的第一個IMF分量為:
h1(t)=s(t)-m1(t)(5)
經(jīng)驗模態(tài)分解法將信號分解為一系列表征時間尺度的IMF分量,使得各IMF分量是窄帶信號,即IMF分量必須滿足下面兩個條件:在整個信號程度上,極值點和過零點的數(shù)目必須相等或者至多只相差一個;在任意時刻,由極大值點定義的上包絡(luò)線和由極小值點定義的下包絡(luò)線的平均值為零,即信號的上下包絡(luò)線關(guān)于時間軸對稱。具體步驟如下:
找出原始信號x(t)所有的極值點,使用三次樣條函數(shù)擬合出原始信號的上包絡(luò)線emax(t)和下包絡(luò)線emin(t);
計算上下包絡(luò)線均值,記為m1(t),用原始信號x(t)減去m1(t):
m1(t)=(emintm1(t)+emaxm1(t))/2(6)
h1(t)=x(t)-m1(t)(7)
(3)對殘余的h1(t)作為原始信號重復上述步驟,直到得出的余量滿足以下兩個條件為止:函數(shù)在整個時間范圍內(nèi),局部極值點和過零點的數(shù)目必須相等,或最多相差一個;在任意時刻點,局部最大值的包絡(luò)(上包絡(luò)線)和局部最小值的包絡(luò)(下包絡(luò)線) 均值為零。此時得到第一個IMF分量,用IMF1(t)表示,此分量為原序列x(t)中最高頻分量。
h1k(t)=h1(k-1)(t)-m1k(t)(8)
c1(t)=h1k(t)(9)
(4)將分量IMF1(t)從原序列x(t)中剔除,得到殘余序列r1(t):
r1(t)=x(t)-IMF1(t)(10)
將殘余序列r1(t)作為原始信號,重復上述步驟,則可以得到第二個分量IMF2(t),如此循環(huán):
r2(t)=r1(t)-IMF2(t)(11)
rn(t)=rn-1(t)-IMFn(t)(12)
到此原始序列x(t)則被分解成n個IMF分量,其頻率由高頻逐漸到低頻,以及殘余函數(shù)rn(t),殘余函數(shù)rn(t)代表了序列的平均趨勢,
2. CEEMD基本思想
互補集合模態(tài)分解(complementary ensemble empirical mode decomposition,簡稱CEEMD)是由Yeh(2010)等人從EMD方法和EEMD方法不斷優(yōu)化而來。相比EMD方法,他解決了EMD方法所存在的模態(tài)混疊效應與頻譜泄露問題,相比EEMD方法,他能更高效地抹去重組信號中的殘余輔助噪聲,在一定程度上提高了效率。其主要步驟為:
第一步:向原始序列x(t)中添加n組正、負成對的輔助白噪聲序列,得到
M■M■=1 11 -1x(t)N(13)
其中,N表示輔助白噪聲,加入白噪聲后重組數(shù)據(jù)為M1、M2。
第二步:對第一步處理后的數(shù)據(jù)進行EMD處理??梢缘玫絀MFij,即第i個分量的第j個IMF。
第三步:計算均值得到
IMFj=■■IMFij(14)
其中,IMFj表示CEEMD分解后最終得到的第j個IMF分量,n為白噪聲組數(shù)。
三、實驗研究
(一)數(shù)據(jù)獲取
考慮數(shù)據(jù)的連續(xù)性及有效性,本文選取了2008年5月至2019年12月共140個數(shù)據(jù)作為本文核心數(shù)據(jù),下文皆以此月度數(shù)據(jù)為核心,數(shù)據(jù)來源于中國商務(wù)部國別報告(https://countryreport.mofcom.gov.cn/)。此外,為了提高預測結(jié)果的穩(wěn)健性,本文選取了1985年第一季度至2020年第二季度共142個季度數(shù)據(jù),數(shù)據(jù)來源于Wind數(shù)據(jù)庫。月度與季度數(shù)據(jù)原始數(shù)據(jù)時序圖(見圖1、圖2)。
(二)時間序列預測模型
1. 時間序列預處理
經(jīng)濟學上的時間序列通常呈現(xiàn)非平穩(wěn)性,通過觀察中美雙邊貿(mào)易進出口總額的時間序列圖,可以發(fā)現(xiàn)其整體存在著上升趨勢。本文采用ADF檢驗法對序列平穩(wěn)性進行檢驗,ADF檢驗結(jié)果表明,t值為-2.401,均大于1%、5%、10%顯著水平下的臨界值,進一步表明中美雙邊貿(mào)易進出口總額時間序列為非平穩(wěn)序列。
中美雙邊貿(mào)易的非平穩(wěn)性通常是宏觀經(jīng)濟波動和季節(jié)波動所造成的,欲將原始序列平穩(wěn)化,本文先對原序列進行季節(jié)差分,再進行一階差分。差分處理后的數(shù)據(jù)如圖3所示,可見處理后的序列基本在零值附近波動,無明顯的上升趨勢。將處理后的序列再進行ADF檢驗,結(jié)果顯示,t值為-4.375,此時1%水平的臨界值為-3.493、5%水平的臨界值為-2.889、10%水平的臨界值為-2.581,t值小于各個顯著水平下的臨界值,同時p值小于0.01,表明處理后的序列不存在單位根。將處理后的時間進行Ljung-Box檢驗,發(fā)現(xiàn)其p值小于0.01,表明差分后的序列不是白噪聲序列。由此可見,經(jīng)過預處理后的序列符合平穩(wěn)非白噪聲序列,可以進行下一步建模。
2. 模型定階
中美雙邊貿(mào)易進出口總額時間序列進行差分后為平穩(wěn)序列,建立ARIMA(p,d,q)模型,數(shù)據(jù)預處理中進行了季節(jié)差分和一階差分,因此可以將季節(jié)差分后的數(shù)據(jù)作為原始數(shù)據(jù),再取差分階數(shù)d=1。由自相關(guān)函數(shù)圖和偏自相關(guān)系數(shù)圖(見圖4),可以確定模型中p與q的階數(shù),本文的預選模型為ARIMA(2,1,2)和ARIMA(2,1,3)。
3. 建模
利用R.Studio軟件,本文分別對預處理后的數(shù)據(jù)進行ARIMA(2,1,2)和ARIMA(2,1,3)建模,參數(shù)估計的結(jié)果如表1所示。
根據(jù)表1可以看出,ARIMA(2,1,2)模型的AIC值比ARIMA(2,1,3)模型的AIC值更小,說明ARIMA(2,1,2)模型更優(yōu)。因此本文選用ARIMA(2,1,2)模型進行預測。預測擬合結(jié)果如圖5所示,帶有“▲”的曲線表示原始序列,帶有“×”的曲線表示預測序列。均方誤差(MSE)為42.0707可見其預測性能一般,有待提高。
(三)CEEMD-ARIMA組合預測模型
1. 中美雙邊貿(mào)易進出口總額時間序列的經(jīng)驗模態(tài)分解
根據(jù)CEEMD的分解算法,利用Python3.7軟件對中美雙邊貿(mào)易進出口總額時間序列進行分解。得到的各頻斷信號如圖6所示,從上至下第一項為原始信號圖,中間四項分別為IMF1到IMF4,自上而下頻率由高到低,最后一項為剩余分量。
用x(t)表示原始數(shù)據(jù),rn表示殘余分量,則原始數(shù)據(jù)與各分量的數(shù)學關(guān)系為:
x(t)=■IMFi+rn(15)
2. 混合預測模型
中美雙邊貿(mào)易進出口總額時間序列為非平穩(wěn)序列,運用傳統(tǒng)的時間序列模型預測存在一定的誤差。本文對時間序列進行CEEMD分解,可以有效地降低其非平穩(wěn)性。如表2所示,經(jīng)過ADF檢驗,分解出來的IMF1至IMF4分量均在0.01水平上顯著為平穩(wěn)序列。如表3所示,經(jīng)過Ljung-Box檢驗,IMF1為白噪聲序列,IMF2至IMF4分量在0.01水平上顯著通過白噪聲檢驗,因此對于IMF2至IMF4分量無需差分即對每一頻帶分別進行ARIMA模型預測,IMF1分量取0值,無需進行預測。
其擬合效果如圖7所示,從左至右以此為IMF2至IMF4分量的擬合圖,帶有“▲”的曲線表示原始序列,帶有“×”的曲線表示預測序列,由圖7可看出擬合效果非常好。
(四)誤差分析
為了體現(xiàn)誤差分析的穩(wěn)健性,本文選用平均絕對百分誤差(MAPE)和均方誤差(MSE)作為指標來進行預測結(jié)果的分析對比,其數(shù)學表達式如式(16)、(17)所示。
MAPE=■■■×100%(16)
MSE=■■(xi-pi)2(17)
其中,xi表示原始序列的真實數(shù)據(jù),pi表示預測結(jié)果,N為樣本數(shù)。
本文采用CEEMD分解法,從月度數(shù)據(jù)和季度數(shù)據(jù)兩個層面與傳統(tǒng)時間序列模型進行對比驗證,另外在模型定階上對比了ACF/PACF圖形定階法與自動定階法。得出的平均絕對百分誤差(MAPE)以及均方誤差(MSE)如表4所示。
從表4中可以看出,無論是季度數(shù)據(jù)還是月度數(shù)據(jù),CEEMD-ARIMA組合預測模型的表現(xiàn)都明顯優(yōu)于傳統(tǒng)時間序列模型,平均絕對百分誤差(MAPE)和均方誤差(MSE)也更小,因此采用CEEMD-ARIMA組合預測模型的精度更高,預測效果更佳。此外,對比月度數(shù)據(jù)和季度數(shù)據(jù)可以看出,在近乎相同數(shù)據(jù)量的情況下,時間跨度小的月度數(shù)據(jù)比跨度大的季度數(shù)據(jù)預測結(jié)果更加精確,因此用月度數(shù)據(jù)進行預測更加具有可靠性。
四、結(jié)語
本文采用了互補集合經(jīng)驗模態(tài)分解與ARIMA的組合預測方法建模,較之于傳統(tǒng)的單一時間序列模型使用差分等方法處理序列的非平穩(wěn),采用分解的方式對原始序列的信息損失更小,且計算精度更高。通過對非平穩(wěn)的中美雙邊貿(mào)易額的實際數(shù)據(jù)實驗對比,可以看出互補集合經(jīng)驗模態(tài)分解與ARIMA的組合模型在非平穩(wěn)時間序列預測中比傳統(tǒng)模型預測效果更加良好。
本文給予了中美兩國進出口貿(mào)易的預測,一方面發(fā)現(xiàn)月度數(shù)據(jù)比季度數(shù)據(jù)預測效果更好,另一方面驗證了CEEMD-ARIMA預測模型的實用性。能否就此將此方法應用在兩國出口貿(mào)易、進口貿(mào)易,乃至某行業(yè)某領(lǐng)域進出口貿(mào)易,還有待探究。
參考文獻:
[1]吳欣,王雯婧.我國進出口貿(mào)易潛力預測研究——基于VAR分析方法[J].經(jīng)濟研究參考,2016(33):34-39.
[2]陳銳.基于“監(jiān)督分組—殘差”主成分回歸的進出口貿(mào)易預測[J].統(tǒng)計與決策,2015(13):112-114.
[3]杜江,李玉蓉,鐘菲菲.基于模糊時間序列對我國對外貿(mào)易中的進口水平的預測[J].統(tǒng)計與決策,2010(23):112-114.
[4]陳蔚.基于線性ARIMA與非線性BP神經(jīng)網(wǎng)絡(luò)組合模型的進出口貿(mào)易預測[J].統(tǒng)計與決策,2015(22):47-49.
[5]王雅琴.中美貿(mào)易戰(zhàn)下我國煤炭進出口預測[J].中國煤炭,2018,44(10):9-13.
[6]舒服華.基于小波DGM(2,1)模型的我國進出口貿(mào)易額預測[J].保定學院學報,2018,31(03):17-23.
[7]Norden E.Huang,Zheng Shen,Steven R.Long, et al.The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Non-Stationary Time Series Analysis[J].1998,454(1971):903-995.
[8]Wu Z, Huang N E. Ensemble Empirical Mode Decomposition:A Noise-Assisted Data Analysis Method[J].Advances in Adaptive Data Analysis,2009,1(01):1-41.
[9]Yeh J R,Shieh J S,Huang N E. Complementary Ensemble Empirical Mode Decomposition:a Novel Noise Enhanced Data Analysis Method[J].Advances in Adaptive Data Analysis,2010,2(02):135-156.
*本文受全國統(tǒng)計科學研究重點項目資助(項目號2016LZ18)。
(作者單位:廣東外語外貿(mào)大學。張振華為通訊作者)