基于組合預(yù)測模型的GDP統(tǒng)計(jì)數(shù)據(jù)質(zhì)量評估研究

2013-03-15 00:23陳黎明

統(tǒng)計(jì)與決策 2013年8期

陳黎明，傅珊

（湖南大學(xué)金融與統(tǒng)計(jì)學(xué)院，長沙 410079）

1 組合預(yù)測模型及數(shù)據(jù)質(zhì)量評估方法

不同的預(yù)測方法根據(jù)相同的信息，往往會(huì)提供不同的結(jié)果，如果簡單的將誤差較大的一些方法舍棄掉，將會(huì)丟棄一些有用的信息，使得模型的精度不高。組合預(yù)測法是指通過建立一個(gè)組合預(yù)測模型，把多種預(yù)測方法所得到的預(yù)測結(jié)果進(jìn)行綜合。由于組合模型能夠較大限度地利用各種預(yù)測樣本信息，所以它比單項(xiàng)預(yù)測模型考慮問題更系統(tǒng)、更全面，因而能夠有效地減少單個(gè)預(yù)測模型受隨機(jī)因素的影響，可以提高預(yù)測的精確度和穩(wěn)定性[1]。

1.1 單項(xiàng)預(yù)測模型

1.1.1 灰色預(yù)測模型

(1)殘差檢驗(yàn)

按預(yù)測模型計(jì)算X＾(1)(i)，并將X＾(1)(i)累減生成X＾(0)(i)，然后計(jì)算原始序列X(0)(i)與X＾(0)(i)的絕對誤差序列Δ(0)(i)及相對誤差序列Φ(i)，一般而言，當(dāng)絕對誤差序列的數(shù)值波動(dòng)較小且Φ(i)≤5%時(shí)，即可認(rèn)為通過了殘差檢驗(yàn)。

(3)后驗(yàn)差檢驗(yàn)

若所建模型不能通過殘差檢驗(yàn)，為了提高灰色預(yù)測模型的精度可建立殘差GM（1,1）模型，用殘差GM（1,1）模型的修正值加到原預(yù)測值上，以補(bǔ)償原預(yù)測值。

1.1.2 回歸組合模型

一般而言，反映社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)序列不平穩(wěn)，往往呈現(xiàn)出一定的趨勢或者周期性，可以建立非平穩(wěn)的時(shí)間序列模型。觀察GDP數(shù)據(jù)的時(shí)序圖，發(fā)現(xiàn)GDP數(shù)據(jù)確實(shí)存在如上的性質(zhì)。因而可以用以下模型來描述其變化：

其中f(t)表示GDPt隨時(shí)間變化的均值，是序列的確定性趨勢，可以用多項(xiàng)式、指數(shù)函數(shù)等來描述，ut為GDPt序列中剔除確定性趨勢后的隨機(jī)部分，可以看做是一個(gè)零均值的平穩(wěn)過程，用ARMA模型來描述。在實(shí)踐中對其通常有兩種處理方法：一是直接建立ARMA模型；二是采用一種組合模型，根據(jù)序列GDPt的特點(diǎn)，選取合適的函數(shù)形式擬合確定性部分f(t)，直到剩余序列ut可以用ARMA模型擬合。該方法即考慮了時(shí)間序列變動(dòng)的確定性因素，又考慮了隨機(jī)因素，具有良好的預(yù)測效果，本文采用這種處理方式。

1.1.3 雙指數(shù)平滑

時(shí)間序列平滑預(yù)測法，主要通過事物自身的發(fā)展變化，借以預(yù)測事物的未來發(fā)展趨勢。在沒有發(fā)生重大的經(jīng)濟(jì)體制轉(zhuǎn)變時(shí)，GDP的發(fā)展趨勢可以延伸到未來，故采用時(shí)間序列來擬合GDP的發(fā)展趨勢是合適的。指數(shù)平滑法是對時(shí)間序列由近及遠(yuǎn)采取逐步衰減的加權(quán)處理，當(dāng)時(shí)間序列的變動(dòng)具有線性趨勢時(shí)，采用雙指數(shù)平滑來消除滯后誤差。預(yù)測步驟如下：

1.2 組合預(yù)測模型

權(quán)軼和張勇傳（2005）系統(tǒng)分析了組合預(yù)測模型的權(quán)重確定方法，并對各種權(quán)重的模型預(yù)測精度進(jìn)行了比較，證明最優(yōu)組合綜合模型的精度優(yōu)于其中任何一個(gè)單一模型和其他的組合模型[2]。本文欲通過預(yù)測值代替“真值”進(jìn)行數(shù)據(jù)質(zhì)量評估，需盡量提高模型的預(yù)測精度，因此選擇使精度達(dá)到最高的權(quán)重，構(gòu)建基于誤差絕對值和最小的組合預(yù)測模型。

該線性規(guī)劃問題有m+2n個(gè)未知量和n+1個(gè)約束條件，可以利用單純行法進(jìn)行線性問題的最優(yōu)解求解[3]。

1.3 數(shù)據(jù)質(zhì)量的評估

在估計(jì)出具體的評估模型之后，對數(shù)據(jù)質(zhì)量評估方法的選擇，本文從檢驗(yàn)異常值角度分析預(yù)測誤差，找出離群值的思想，利用Grubbs準(zhǔn)則和Dxion準(zhǔn)則檢驗(yàn)?zāi)Ｐ皖A(yù)測相對誤差的異常值，進(jìn)行數(shù)據(jù)質(zhì)量評估。值得注意的是，異常值討論的前提是觀測樣本主體（除個(gè)別離群值外的大部分樣本值）均來自同一正態(tài)總體或近似正態(tài)總體，因此，需要事先對觀測樣本進(jìn)行正態(tài)性檢驗(yàn)。

（1）Grubbs準(zhǔn)則

對于服從正態(tài)分布的n個(gè)相對誤差數(shù)據(jù)P1,P2,P3,…Pn，按從小到大排序，計(jì)算檢驗(yàn)統(tǒng)計(jì)量Gn=P(n)-Pˉ/s,G1=Pˉ-P(1)/s，其中P(n)和P(1)分別為排序后的最大值和最小值，Pˉ和S分別是樣本均值和樣本標(biāo)準(zhǔn)差。在雙側(cè)情形下，給定顯著性水平α，若Gn≥G(α,n),Gn＞G1,則認(rèn)為P(n)為異常值；若G1≥G(α,n),G1＞Gn，則認(rèn)為P(1)為異常值。其中G(α,n)是檢驗(yàn)統(tǒng)計(jì)量的臨界值，可通過查表得到。

（2）Dxion準(zhǔn)則

對于服從正態(tài)分布的n個(gè)相對誤差數(shù)據(jù)P1,P2,P3,…Pn，按從小到大排序，得到順序統(tǒng)計(jì)量P(1)≤P(2)≤…≤P(n)。檢驗(yàn)統(tǒng)計(jì)量根據(jù)樣本量n以及可疑數(shù)值的位置和個(gè)數(shù)來選取，具體由表1給出：

表1 Dixon檢驗(yàn)統(tǒng)計(jì)量

在雙側(cè)情形下，給定顯著性水平α，查Dixon臨界值表對應(yīng)n的臨界值D(α,n).若D＞D',D＞D(α,n),則可判斷P(n)為異常值；若D'＞D,D'＞D(α,n)，則可判斷P(1)為異常值；否則，判斷數(shù)據(jù)沒有異常值。數(shù)學(xué)證明，在一組數(shù)據(jù)只有一個(gè)異常值時(shí)，Grubbs準(zhǔn)則優(yōu)于Dxion準(zhǔn)則，當(dāng)數(shù)據(jù)存在一個(gè)以上異常值時(shí)，Dxion準(zhǔn)則要優(yōu)于Grubbs準(zhǔn)則[4]。

2 組合預(yù)測模型對我國GDP數(shù)據(jù)準(zhǔn)確性檢驗(yàn)的實(shí)證分析

2.1 數(shù)據(jù)的選取

我國統(tǒng)計(jì)部門于1985年才建立GDP核算制度，此后的GDP數(shù)據(jù)相對之前的數(shù)據(jù)更可靠。此外，本文是將樣本集即作為訓(xùn)練集又作為評估集，需要假定樣本集的數(shù)據(jù)基本可信，因此選擇1985～2010年間的GDP數(shù)據(jù)作為樣本進(jìn)行分析，為了剔除價(jià)格因素的影響，將其統(tǒng)一換算成1985年的不變價(jià)GDP。

2.2 單項(xiàng)預(yù)測模型的建立

2.2.1 灰色預(yù)測模型

所建模型不能直接用于預(yù)測，需進(jìn)行灰色預(yù)測檢驗(yàn)，檢驗(yàn)結(jié)果如表2所示：

表2 灰色預(yù)測檢驗(yàn)

2.2.2 回歸組合模型

（1）對GDP序列確定性趨勢的模擬

對GDP繪制散點(diǎn)圖，通過圖形可以看出GDP數(shù)據(jù)呈現(xiàn)曲線上升的趨勢，為非平穩(wěn)時(shí)間序列?？梢钥紤]選擇二次曲線模型或者指數(shù)模型來擬合GDP的趨勢增長，經(jīng)過實(shí)踐，發(fā)現(xiàn)指數(shù)模型的預(yù)測效果較好，因此，選擇擬合指數(shù)模型。

指數(shù)模型GDPt=aebt+εt可以通過數(shù)據(jù)的對數(shù)變換化為直線回歸模型，使分析更為直觀和簡便，因此對上式兩邊取對數(shù)得到線性回歸模型：lnGDPt=lna+bt+μt，其中t為趨勢項(xiàng)(t=1,2,…,26),采用最小二乘法估計(jì)得到如下模型：

其中，可決系數(shù)為0.998，F(xiàn)統(tǒng)計(jì)量為9768.744，對應(yīng)的P值為0.000，在5%的顯著性水平下，回歸方程和回歸系數(shù)都很顯著。然而模型的DW值較低，只有0.437，模型可能存在自相關(guān)。因此，對殘差序列進(jìn)行LM檢驗(yàn)，得到LM檢驗(yàn)統(tǒng)計(jì)量為20.413，相伴概率為0.000088，在5%顯著性水平下，拒絕原假設(shè)，即認(rèn)為模型的殘差序列存在二階自相關(guān)，考慮對殘差序列μt建立ARMA模型。

（2）對模型殘差序列μt的模擬

在建立ARMA模型之前先對序列μt進(jìn)行平穩(wěn)性檢驗(yàn)，在5%的顯著性水平下，根據(jù)AIC準(zhǔn)則選取階數(shù)，對殘差序列進(jìn)行包括常數(shù)項(xiàng)和趨勢項(xiàng)的ADF檢驗(yàn)，得到ADF統(tǒng)計(jì)量為-3.658，相伴概率為0.047，小于0.05，拒絕原假設(shè)，判定殘差序列平穩(wěn)，可以建立ARMA模型。通過觀察μt的自相關(guān)與偏自相關(guān)圖，發(fā)現(xiàn)自相關(guān)拖尾，偏自相關(guān)二階截尾，初步判定μt存在二階自相關(guān)，可擬合AR(2)，結(jié)果如下：

通過該模型殘差序列的自相關(guān)和偏自相關(guān)分析圖，發(fā)現(xiàn)其自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都落入了2倍標(biāo)準(zhǔn)差之內(nèi)，Q統(tǒng)計(jì)量的相伴概率都大于0.05，可認(rèn)為殘差序列為白噪聲序列，說明AR(2)模型的擬合效果較好。

（3）最終回歸組合模型

將模型隨機(jī)誤差項(xiàng)μt的滯后項(xiàng)μt-1、μt-2引入原模型，在Eviews軟件中對原回歸方程重新做整體性估計(jì)，得到回歸組合模型為：

模型調(diào)整后的可決系數(shù)為0.999，F(xiàn)值為11892.62，對應(yīng)的P值為0.000，模型顯著。為驗(yàn)證模型殘差是否還存在自相關(guān)，對模型殘差進(jìn)行LM檢驗(yàn)，在5%的顯著性水平下，LM檢驗(yàn)統(tǒng)計(jì)量為1.112，相伴概率為0.292，大于0.05，說明殘差序列已不存在自相關(guān)，模型擬合效果較好。

2.2.3 雙指數(shù)平滑

由上文可知，GDP序列呈指數(shù)形式增長，其對數(shù)序列線性增長，為了描述這一特征，將其對數(shù)序列進(jìn)行雙指數(shù)平滑，得到平滑預(yù)測值，然后取其反對數(shù)，即可得我國GDP的預(yù)測值。運(yùn)行Eviews軟件，采用使誤差平方和達(dá)到最小的準(zhǔn)則對平滑參數(shù)進(jìn)行估計(jì)，得到平滑參數(shù)α=0.999，殘差平方和為0.015，預(yù)測效果較好。

2.3 組合預(yù)測模型

則組合預(yù)測模型為：

為檢驗(yàn)組合預(yù)測模型的有效性，對所建的三個(gè)單項(xiàng)預(yù)測模型和組合預(yù)測模型進(jìn)行精度比較，評價(jià)指標(biāo)選用平均相對絕對誤差MAPE，計(jì)算結(jié)果如表3：

表3 模型預(yù)測精度評價(jià)結(jié)果

由表3可知，組合預(yù)測模型的MAPE最小，預(yù)測精度最高，利用該模型對我國1985～2010年間的GDP數(shù)據(jù)進(jìn)行預(yù)測所得的預(yù)測值更接近“真值”，數(shù)據(jù)質(zhì)量評估的可靠性更高。

2.4 數(shù)據(jù)質(zhì)量評估

3 結(jié)論與評價(jià)

從異常值的角度進(jìn)行數(shù)據(jù)質(zhì)量評估，需結(jié)合異常值產(chǎn)生的背景進(jìn)行分析。雖然1989年的GDP數(shù)據(jù)是異常值，但其異常與其所處的特殊時(shí)代背景有關(guān)，1988年中國發(fā)生了嚴(yán)重的通貨膨脹，與上年相比，零售商品價(jià)格上升了18.5%，居民消費(fèi)價(jià)格上升了18.8%。全國各地發(fā)生了搶購商品潮。政府從1988年的第四季度起實(shí)行嚴(yán)厲的“治理整頓”，利用各種手段緊縮投資和貨幣投放，使得價(jià)格的上升速度迅速下降。但是嚴(yán)厲的緊縮也引起了經(jīng)濟(jì)增長速度的迅速下滑，1989年和1990年GDP分別只增長了4.1%和3.8%。這是改革開放以來最慢的增長率。1989年間的GDP數(shù)據(jù)低于其他年份的數(shù)據(jù)是可以理解的，但是并不能確定1989年GDP數(shù)據(jù)的異常是否就是由客觀原因造成的，因此不能直接判斷其準(zhǔn)確性，需要進(jìn)一步研究，只能認(rèn)為1985～2010年間的GDP數(shù)據(jù)基本上都是準(zhǔn)確的。

利用統(tǒng)計(jì)模型對數(shù)據(jù)質(zhì)量進(jìn)行評估，基本思想是用模型的預(yù)測值充當(dāng)“真值”，然后檢驗(yàn)預(yù)測值與評估數(shù)據(jù)的差異是否顯著，若差異顯著，則數(shù)據(jù)存在異常值，如果異常值不是客觀原因（如外部沖擊、體制變革等）造成的，即可認(rèn)為是數(shù)據(jù)本身的準(zhǔn)確性問題。然而根據(jù)歷史數(shù)據(jù)得到的預(yù)測值和真實(shí)值之間存在一定的差異，要得到更準(zhǔn)確的結(jié)論，需要采用預(yù)測效果更好的模型進(jìn)行預(yù)測，盡可能地縮小這個(gè)差異。組合預(yù)測模型能將各種不同類型的單項(xiàng)預(yù)測模型兼收并蓄，集中更多的經(jīng)濟(jì)信息與預(yù)測技術(shù)，減少預(yù)測系統(tǒng)誤差，顯著改進(jìn)預(yù)測效果?？梢?，相比單項(xiàng)預(yù)測模型，運(yùn)用組合預(yù)測模型對數(shù)據(jù)的準(zhǔn)確性進(jìn)行檢驗(yàn)效果會(huì)更好。本文以我國1985～2010年間GDP數(shù)據(jù)的準(zhǔn)確性為例進(jìn)行實(shí)證分析，依據(jù)考察指標(biāo)的特點(diǎn)構(gòu)建了灰色預(yù)測模型、回歸組合模型和雙指數(shù)平滑模型三個(gè)單項(xiàng)預(yù)測模型，然后根據(jù)組合預(yù)測模型的基本思想，將三個(gè)單項(xiàng)預(yù)測模型的預(yù)測值進(jìn)行加權(quán)組合得到組合預(yù)測模型。通過對比各個(gè)單項(xiàng)預(yù)測模型和組合預(yù)測模型的預(yù)測精度發(fā)現(xiàn)，組合預(yù)測模型確實(shí)優(yōu)于單項(xiàng)預(yù)測模型，所得的預(yù)測值更接近“真值”，更適合于數(shù)據(jù)的準(zhǔn)確性檢驗(yàn)?？梢?，組合預(yù)測模型在統(tǒng)計(jì)數(shù)據(jù)的準(zhǔn)確性檢驗(yàn)中確實(shí)存在較高的實(shí)用價(jià)值，值得進(jìn)一步研究。

[1]徐國祥.統(tǒng)計(jì)預(yù)測和決策[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2009.

[2]權(quán)軼,張勇傳.組合預(yù)測方法中的權(quán)重算法及應(yīng)用[J].科技創(chuàng)業(yè)月刊,2006(5).

[3]農(nóng)吉夫,金農(nóng),譚福錦,主毅.最優(yōu)組合預(yù)測的短期氣候預(yù)報(bào)建模研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,38(8).

[4]王華,金勇進(jìn).統(tǒng)計(jì)數(shù)據(jù)準(zhǔn)確性評估:方法分類及適用性分析[J].統(tǒng)計(jì)研究,2009,26(1).

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡