陳黎明,傅 珊
(湖南大學(xué)金融與統(tǒng)計(jì)學(xué)院,長沙 410079)
不同的預(yù)測方法根據(jù)相同的信息,往往會(huì)提供不同的結(jié)果,如果簡單的將誤差較大的一些方法舍棄掉,將會(huì)丟棄一些有用的信息,使得模型的精度不高。組合預(yù)測法是指通過建立一個(gè)組合預(yù)測模型,把多種預(yù)測方法所得到的預(yù)測結(jié)果進(jìn)行綜合。由于組合模型能夠較大限度地利用各種預(yù)測樣本信息,所以它比單項(xiàng)預(yù)測模型考慮問題更系統(tǒng)、更全面,因而能夠有效地減少單個(gè)預(yù)測模型受隨機(jī)因素的影響,可以提高預(yù)測的精確度和穩(wěn)定性[1]。
1.1.1 灰色預(yù)測模型
(1)殘差檢驗(yàn)
按預(yù)測模型計(jì)算X^(1)(i),并將X^(1)(i)累減生成X^(0)(i),然后計(jì)算原始序列X(0)(i)與X^(0)(i)的絕對誤差序列Δ(0)(i)及相對誤差序列Φ(i),一般而言,當(dāng)絕對誤差序列的數(shù)值波動(dòng)較小且Φ(i)≤5%時(shí),即可認(rèn)為通過了殘差檢驗(yàn)。
(3)后驗(yàn)差檢驗(yàn)
若所建模型不能通過殘差檢驗(yàn),為了提高灰色預(yù)測模型的精度可建立殘差GM(1,1)模型,用殘差GM(1,1)模型的修正值加到原預(yù)測值上,以補(bǔ)償原預(yù)測值。
1.1.2 回歸組合模型
一般而言,反映社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)序列不平穩(wěn),往往呈現(xiàn)出一定的趨勢或者周期性,可以建立非平穩(wěn)的時(shí)間序列模型。觀察GDP數(shù)據(jù)的時(shí)序圖,發(fā)現(xiàn)GDP數(shù)據(jù)確實(shí)存在如上的性質(zhì)。因而可以用以下模型來描述其變化:
其中f(t)表示GDPt隨時(shí)間變化的均值,是序列的確定性趨勢,可以用多項(xiàng)式、指數(shù)函數(shù)等來描述,ut為GDPt序列中剔除確定性趨勢后的隨機(jī)部分,可以看做是一個(gè)零均值的平穩(wěn)過程,用ARMA模型來描述。在實(shí)踐中對其通常有兩種處理方法:一是直接建立ARMA模型;二是采用一種組合模型,根據(jù)序列GDPt的特點(diǎn),選取合適的函數(shù)形式擬合確定性部分f(t),直到剩余序列ut可以用ARMA模型擬合。該方法即考慮了時(shí)間序列變動(dòng)的確定性因素,又考慮了隨機(jī)因素,具有良好的預(yù)測效果,本文采用這種處理方式。
1.1.3 雙指數(shù)平滑
時(shí)間序列平滑預(yù)測法,主要通過事物自身的發(fā)展變化,借以預(yù)測事物的未來發(fā)展趨勢。在沒有發(fā)生重大的經(jīng)濟(jì)體制轉(zhuǎn)變時(shí),GDP的發(fā)展趨勢可以延伸到未來,故采用時(shí)間序列來擬合GDP的發(fā)展趨勢是合適的。指數(shù)平滑法是對時(shí)間序列由近及遠(yuǎn)采取逐步衰減的加權(quán)處理,當(dāng)時(shí)間序列的變動(dòng)具有線性趨勢時(shí),采用雙指數(shù)平滑來消除滯后誤差。預(yù)測步驟如下:
權(quán)軼和張勇傳(2005)系統(tǒng)分析了組合預(yù)測模型的權(quán)重確定方法,并對各種權(quán)重的模型預(yù)測精度進(jìn)行了比較,證明最優(yōu)組合綜合模型的精度優(yōu)于其中任何一個(gè)單一模型和其他的組合模型[2]。本文欲通過預(yù)測值代替“真值”進(jìn)行數(shù)據(jù)質(zhì)量評估,需盡量提高模型的預(yù)測精度,因此選擇使精度達(dá)到最高的權(quán)重,構(gòu)建基于誤差絕對值和最小的組合預(yù)測模型。
該線性規(guī)劃問題有m+2n個(gè)未知量和n+1個(gè)約束條件,可以利用單純行法進(jìn)行線性問題的最優(yōu)解求解[3]。
在估計(jì)出具體的評估模型之后,對數(shù)據(jù)質(zhì)量評估方法的選擇,本文從檢驗(yàn)異常值角度分析預(yù)測誤差,找出離群值的思想,利用Grubbs準(zhǔn)則和Dxion準(zhǔn)則檢驗(yàn)?zāi)P皖A(yù)測相對誤差的異常值,進(jìn)行數(shù)據(jù)質(zhì)量評估。值得注意的是,異常值討論的前提是觀測樣本主體(除個(gè)別離群值外的大部分樣本值)均來自同一正態(tài)總體或近似正態(tài)總體,因此,需要事先對觀測樣本進(jìn)行正態(tài)性檢驗(yàn)。
(1)Grubbs準(zhǔn)則
對于服從正態(tài)分布的n個(gè)相對誤差數(shù)據(jù)P1,P2,P3,…Pn,按從小到大排序,計(jì)算檢驗(yàn)統(tǒng)計(jì)量Gn=P(n)-Pˉ/s,G1=Pˉ-P(1)/s,其中P(n)和P(1)分別為排序后的最大值和最小值,Pˉ和S分別是樣本均值和樣本標(biāo)準(zhǔn)差。在雙側(cè)情形下,給定顯著性水平α,若Gn≥G(α,n),Gn>G1,則認(rèn)為P(n)為異常值;若G1≥G(α,n),G1>Gn,則認(rèn)為P(1)為異常值。其中G(α,n)是檢驗(yàn)統(tǒng)計(jì)量的臨界值,可通過查表得到。
(2)Dxion準(zhǔn)則
對于服從正態(tài)分布的n個(gè)相對誤差數(shù)據(jù)P1,P2,P3,…Pn,按從小到大排序,得到順序統(tǒng)計(jì)量P(1)≤P(2)≤…≤P(n)。檢驗(yàn)統(tǒng)計(jì)量根據(jù)樣本量n以及可疑數(shù)值的位置和個(gè)數(shù)來選取,具體由表1給出:
表1 Dixon檢驗(yàn)統(tǒng)計(jì)量
在雙側(cè)情形下,給定顯著性水平α,查Dixon臨界值表對應(yīng)n的臨界值D(α,n).若D>D',D>D(α,n),則可判斷P(n)為異常值;若D'>D,D'>D(α,n),則可判斷P(1)為異常值;否則,判斷數(shù)據(jù)沒有異常值。數(shù)學(xué)證明,在一組數(shù)據(jù)只有一個(gè)異常值時(shí),Grubbs準(zhǔn)則優(yōu)于Dxion準(zhǔn)則,當(dāng)數(shù)據(jù)存在一個(gè)以上異常值時(shí),Dxion準(zhǔn)則要優(yōu)于Grubbs準(zhǔn)則[4]。
我國統(tǒng)計(jì)部門于1985年才建立GDP核算制度,此后的GDP數(shù)據(jù)相對之前的數(shù)據(jù)更可靠。此外,本文是將樣本集即作為訓(xùn)練集又作為評估集,需要假定樣本集的數(shù)據(jù)基本可信,因此選擇1985~2010年間的GDP數(shù)據(jù)作為樣本進(jìn)行分析,為了剔除價(jià)格因素的影響,將其統(tǒng)一換算成1985年的不變價(jià)GDP。
2.2.1 灰色預(yù)測模型
所建模型不能直接用于預(yù)測,需進(jìn)行灰色預(yù)測檢驗(yàn),檢驗(yàn)結(jié)果如表2所示:
表2 灰色預(yù)測檢驗(yàn)
2.2.2 回歸組合模型
(1)對GDP序列確定性趨勢的模擬
對GDP繪制散點(diǎn)圖,通過圖形可以看出GDP數(shù)據(jù)呈現(xiàn)曲線上升的趨勢,為非平穩(wěn)時(shí)間序列??梢钥紤]選擇二次曲線模型或者指數(shù)模型來擬合GDP的趨勢增長,經(jīng)過實(shí)踐,發(fā)現(xiàn)指數(shù)模型的預(yù)測效果較好,因此,選擇擬合指數(shù)模型。
指數(shù)模型GDPt=aebt+εt可以通過數(shù)據(jù)的對數(shù)變換化為直線回歸模型,使分析更為直觀和簡便,因此對上式兩邊取對數(shù)得到線性回歸模型:lnGDPt=lna+bt+μt,其中t為趨勢項(xiàng)(t=1,2,…,26),采用最小二乘法估計(jì)得到如下模型:
其中,可決系數(shù)為0.998,F(xiàn)統(tǒng)計(jì)量為9768.744,對應(yīng)的P值為0.000,在5%的顯著性水平下,回歸方程和回歸系數(shù)都很顯著。然而模型的DW值較低,只有0.437,模型可能存在自相關(guān)。因此,對殘差序列進(jìn)行LM檢驗(yàn),得到LM檢驗(yàn)統(tǒng)計(jì)量為20.413,相伴概率為0.000088,在5%顯著性水平下,拒絕原假設(shè),即認(rèn)為模型的殘差序列存在二階自相關(guān),考慮對殘差序列μt建立ARMA模型。
(2)對模型殘差序列μt的模擬
在建立ARMA模型之前先對序列μt進(jìn)行平穩(wěn)性檢驗(yàn),在5%的顯著性水平下,根據(jù)AIC準(zhǔn)則選取階數(shù),對殘差序列進(jìn)行包括常數(shù)項(xiàng)和趨勢項(xiàng)的ADF檢驗(yàn),得到ADF統(tǒng)計(jì)量為-3.658,相伴概率為0.047,小于0.05,拒絕原假設(shè),判定殘差序列平穩(wěn),可以建立ARMA模型。通過觀察μt的自相關(guān)與偏自相關(guān)圖,發(fā)現(xiàn)自相關(guān)拖尾,偏自相關(guān)二階截尾,初步判定μt存在二階自相關(guān),可擬合AR(2),結(jié)果如下:
通過該模型殘差序列的自相關(guān)和偏自相關(guān)分析圖,發(fā)現(xiàn)其自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都落入了2倍標(biāo)準(zhǔn)差之內(nèi),Q統(tǒng)計(jì)量的相伴概率都大于0.05,可認(rèn)為殘差序列為白噪聲序列,說明AR(2)模型的擬合效果較好。
(3)最終回歸組合模型
將模型隨機(jī)誤差項(xiàng)μt的滯后項(xiàng)μt-1、μt-2引入原模型,在Eviews軟件中對原回歸方程重新做整體性估計(jì),得到回歸組合模型為:
模型調(diào)整后的可決系數(shù)為0.999,F(xiàn)值為11892.62,對應(yīng)的P值為0.000,模型顯著。為驗(yàn)證模型殘差是否還存在自相關(guān),對模型殘差進(jìn)行LM檢驗(yàn),在5%的顯著性水平下,LM檢驗(yàn)統(tǒng)計(jì)量為1.112,相伴概率為0.292,大于0.05,說明殘差序列已不存在自相關(guān),模型擬合效果較好。
2.2.3 雙指數(shù)平滑
由上文可知,GDP序列呈指數(shù)形式增長,其對數(shù)序列線性增長,為了描述這一特征,將其對數(shù)序列進(jìn)行雙指數(shù)平滑,得到平滑預(yù)測值,然后取其反對數(shù),即可得我國GDP的預(yù)測值。運(yùn)行Eviews軟件,采用使誤差平方和達(dá)到最小的準(zhǔn)則對平滑參數(shù)進(jìn)行估計(jì),得到平滑參數(shù)α=0.999,殘差平方和為0.015,預(yù)測效果較好。
則組合預(yù)測模型為:
為檢驗(yàn)組合預(yù)測模型的有效性,對所建的三個(gè)單項(xiàng)預(yù)測模型和組合預(yù)測模型進(jìn)行精度比較,評價(jià)指標(biāo)選用平均相對絕對誤差MAPE,計(jì)算結(jié)果如表3:
表3 模型預(yù)測精度評價(jià)結(jié)果
由表3可知,組合預(yù)測模型的MAPE最小,預(yù)測精度最高,利用該模型對我國1985~2010年間的GDP數(shù)據(jù)進(jìn)行預(yù)測所得的預(yù)測值更接近“真值”,數(shù)據(jù)質(zhì)量評估的可靠性更高。
從異常值的角度進(jìn)行數(shù)據(jù)質(zhì)量評估,需結(jié)合異常值產(chǎn)生的背景進(jìn)行分析。雖然1989年的GDP數(shù)據(jù)是異常值,但其異常與其所處的特殊時(shí)代背景有關(guān),1988年中國發(fā)生了嚴(yán)重的通貨膨脹,與上年相比,零售商品價(jià)格上升了18.5%,居民消費(fèi)價(jià)格上升了18.8%。全國各地發(fā)生了搶購商品潮。政府從1988年的第四季度起實(shí)行嚴(yán)厲的“治理整頓”,利用各種手段緊縮投資和貨幣投放,使得價(jià)格的上升速度迅速下降。但是嚴(yán)厲的緊縮也引起了經(jīng)濟(jì)增長速度的迅速下滑,1989年和1990年GDP分別只增長了4.1%和3.8%。這是改革開放以來最慢的增長率。1989年間的GDP數(shù)據(jù)低于其他年份的數(shù)據(jù)是可以理解的,但是并不能確定1989年GDP數(shù)據(jù)的異常是否就是由客觀原因造成的,因此不能直接判斷其準(zhǔn)確性,需要進(jìn)一步研究,只能認(rèn)為1985~2010年間的GDP數(shù)據(jù)基本上都是準(zhǔn)確的。
利用統(tǒng)計(jì)模型對數(shù)據(jù)質(zhì)量進(jìn)行評估,基本思想是用模型的預(yù)測值充當(dāng)“真值”,然后檢驗(yàn)預(yù)測值與評估數(shù)據(jù)的差異是否顯著,若差異顯著,則數(shù)據(jù)存在異常值,如果異常值不是客觀原因(如外部沖擊、體制變革等)造成的,即可認(rèn)為是數(shù)據(jù)本身的準(zhǔn)確性問題。然而根據(jù)歷史數(shù)據(jù)得到的預(yù)測值和真實(shí)值之間存在一定的差異,要得到更準(zhǔn)確的結(jié)論,需要采用預(yù)測效果更好的模型進(jìn)行預(yù)測,盡可能地縮小這個(gè)差異。組合預(yù)測模型能將各種不同類型的單項(xiàng)預(yù)測模型兼收并蓄,集中更多的經(jīng)濟(jì)信息與預(yù)測技術(shù),減少預(yù)測系統(tǒng)誤差,顯著改進(jìn)預(yù)測效果??梢?,相比單項(xiàng)預(yù)測模型,運(yùn)用組合預(yù)測模型對數(shù)據(jù)的準(zhǔn)確性進(jìn)行檢驗(yàn)效果會(huì)更好。本文以我國1985~2010年間GDP數(shù)據(jù)的準(zhǔn)確性為例進(jìn)行實(shí)證分析,依據(jù)考察指標(biāo)的特點(diǎn)構(gòu)建了灰色預(yù)測模型、回歸組合模型和雙指數(shù)平滑模型三個(gè)單項(xiàng)預(yù)測模型,然后根據(jù)組合預(yù)測模型的基本思想,將三個(gè)單項(xiàng)預(yù)測模型的預(yù)測值進(jìn)行加權(quán)組合得到組合預(yù)測模型。通過對比各個(gè)單項(xiàng)預(yù)測模型和組合預(yù)測模型的預(yù)測精度發(fā)現(xiàn),組合預(yù)測模型確實(shí)優(yōu)于單項(xiàng)預(yù)測模型,所得的預(yù)測值更接近“真值”,更適合于數(shù)據(jù)的準(zhǔn)確性檢驗(yàn)??梢?,組合預(yù)測模型在統(tǒng)計(jì)數(shù)據(jù)的準(zhǔn)確性檢驗(yàn)中確實(shí)存在較高的實(shí)用價(jià)值,值得進(jìn)一步研究。
[1]徐國祥.統(tǒng)計(jì)預(yù)測和決策[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2009.
[2]權(quán)軼,張勇傳.組合預(yù)測方法中的權(quán)重算法及應(yīng)用[J].科技創(chuàng)業(yè)月刊,2006(5).
[3]農(nóng)吉夫,金農(nóng),譚福錦,主毅.最優(yōu)組合預(yù)測的短期氣候預(yù)報(bào)建模研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,38(8).
[4]王華,金勇進(jìn).統(tǒng)計(jì)數(shù)據(jù)準(zhǔn)確性評估:方法分類及適用性分析[J].統(tǒng)計(jì)研究,2009,26(1).