王明輝
將一個(gè)國(guó)家核算期內(nèi)(通常是一年)實(shí)現(xiàn)的國(guó)內(nèi)生產(chǎn)總值與這個(gè)國(guó)家的常住人口(或戶籍人口)相比進(jìn)行計(jì)算,得到的人均國(guó)內(nèi)生產(chǎn)總值(人均GDP),不僅是衡量各國(guó)人民生活水平的重要標(biāo)準(zhǔn),而且是人們了解和把握一個(gè)國(guó)家的宏觀經(jīng)濟(jì)運(yùn)行狀況的有效工具,常作為經(jīng)濟(jì)學(xué)中衡量經(jīng)濟(jì)發(fā)展?fàn)顩r的指標(biāo),是最重要的宏觀經(jīng)濟(jì)指標(biāo)之一。特別是從2010年起,我國(guó)GDP總量超越日本位居世界第二后,主流意識(shí)都逐漸強(qiáng)調(diào)起人均GDP的重要性,這是一種必要的戒驕戒躁、理性清醒和自覺(jué),因?yàn)槲覈?guó)的人均GDP和發(fā)達(dá)國(guó)家相比差距還很大,要認(rèn)識(shí)到“第二大”并不等于“第二強(qiáng)”。所以,較為精確地分析并預(yù)測(cè)人均GDP的變化趨勢(shì)是非常有必要的。
在過(guò)去的70多年里,時(shí)間序列分析,尤其是線性時(shí)間序列ARIMA模型[1]發(fā)展迅速、成果豐富。其研究日趨成熟,并得到廣泛且非常成功的應(yīng)用。然而在很多領(lǐng)域,例如在經(jīng)濟(jì)、金融、環(huán)境、氣象和生物等諸多領(lǐng)域,存在著大量涉及非線性時(shí)間序列的問(wèn)題,用線性時(shí)序分析方法去研究和解決這些問(wèn)題,易丟失信息,效果欠佳。經(jīng)驗(yàn)表明,非線性時(shí)間序列分析方法在這些領(lǐng)域已經(jīng)取得成功的應(yīng)用。非線性時(shí)間序列,哪怕是很簡(jiǎn)單的非線性時(shí)間序列,都能顯示出奇異的現(xiàn)象,足以令人新奇不已。況且,非線性時(shí)間序列分析與許多非線性科學(xué)領(lǐng)域有著密切的聯(lián)系,例如與混沌、分形和神經(jīng)網(wǎng)絡(luò)等領(lǐng)域均有密切的關(guān)系。這也說(shuō)明非線性時(shí)間序列能表現(xiàn)出更豐富、更復(fù)雜的客觀現(xiàn)象,比線性時(shí)間序列有著更廣闊的應(yīng)用前景,能解決許多復(fù)雜的實(shí)際問(wèn)題。事實(shí)上,在很多領(lǐng)域,已經(jīng)顯示出非線性時(shí)間序列分析的應(yīng)用前景。因此,近年來(lái)對(duì)非線性時(shí)間序列分析的研究受到廣泛關(guān)注[2]。
研究非線性時(shí)間序列,很難仿效或沿用已有的線性時(shí)間序列的理論與方法,而且所面臨的困難也遠(yuǎn)遠(yuǎn)超過(guò)線性情況。正像在其他非線性科學(xué)領(lǐng)域一樣,人們遇到了許多新的激動(dòng)人心的挑戰(zhàn)。常見(jiàn)的處理非線性關(guān)系的方法有數(shù)據(jù)轉(zhuǎn)換方法和神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、投影尋蹤和基于樹(shù)的方法等高計(jì)算強(qiáng)度方法。然而,這些方法要么在實(shí)際使用過(guò)程中有很大的局限性,要么得到的結(jié)果無(wú)法解釋。使用半?yún)?shù)模型來(lái)模擬非線性關(guān)系則在一定程度可以避免這些問(wèn)題。
半?yún)?shù)模型是二十世紀(jì)八十年代發(fā)展起來(lái)的一類重要的統(tǒng)計(jì)模型。這類模型由于引入了表示模型誤差或其他系統(tǒng)誤差的非參數(shù)分量,因而既含有參數(shù)分量,又含有非參數(shù)分量,兼顧了參數(shù)模型和非參數(shù)模型的優(yōu)點(diǎn),較之參數(shù)模型或非參數(shù)模型有更大的適應(yīng)性,也具有更強(qiáng)的解釋能力,同時(shí)又可避免許多“維數(shù)災(zāi)難”問(wèn)題。
因此,本文采用1978~2016年的人均GDP數(shù)據(jù),嘗試建立半?yún)?shù)時(shí)間序列模型,通過(guò)分析其變化特征,預(yù)測(cè)未來(lái)三年的數(shù)值,并給出其95%的置信區(qū)間,以期對(duì)現(xiàn)有模型進(jìn)行一定程度的擴(kuò)充,同時(shí)給未來(lái)的研究者提供一定的借鑒意義,也可為促進(jìn)經(jīng)濟(jì)更好更快地發(fā)展提供參考依據(jù)。
半?yún)?shù)時(shí)間序列模型是一類非線性時(shí)間序列模型的統(tǒng)稱,包括可加、單指標(biāo)和變系數(shù)等模型,其中一種較為簡(jiǎn)單的模型為具有自回歸誤差項(xiàng)的部分線性模型。Yu等[3]對(duì)于具有獨(dú)立同分布誤差項(xiàng)的自回歸模型,假定回歸函數(shù)來(lái)自某個(gè)參數(shù)分布族,使用條件最小二乘方法得到參數(shù)估計(jì)后,再運(yùn)用非參數(shù)核方法進(jìn)行調(diào)整,最后證明了回歸函數(shù)估計(jì)量具有弱相合性。Farnoosh和Mortazavi[4]則將該方法運(yùn)用到具有一階自相關(guān)誤差項(xiàng)的自回歸模型中。Farnoosh等[5]研究了具有獨(dú)立同分布誤差項(xiàng)的部分線性自回歸模型中回歸函數(shù)的半?yún)?shù)估計(jì)和性質(zhì)。
本文主要采用具有一階自回歸誤差項(xiàng)的部分線性模型:
圖1 人均GDP時(shí)序圖
本文主要研究1978~2016年的人均GDP(1978年=100),原始數(shù)據(jù)Yt來(lái)源于《中國(guó)統(tǒng)計(jì)年鑒—2017》,對(duì)于=Yt/1000繪制時(shí)序圖。
圖2 一階差分序列時(shí)序圖
從圖1可看出該序列在這39年間呈曲線增長(zhǎng)趨勢(shì),顯然非平穩(wěn),一階差分后的時(shí)序圖見(jiàn)圖2,仍顯示不平穩(wěn),但二階差分后在顯著性水平0.05下,變?yōu)榘自肼曅蛄?,因此不適合采用ARIMA模型進(jìn)行擬合。
取 g(x,θ)=θex,采用上節(jié)所述方法建立具有一階自回歸誤差項(xiàng)的部分線性時(shí)間序列模型,所得擬合方程如下:
圖3 的真實(shí)值(實(shí)線)與估計(jì)值(虛線)對(duì)比
對(duì)參數(shù)進(jìn)行顯著性檢驗(yàn),結(jié)果顯示在表1中,因此在0.05的顯著性水平下,三個(gè)參數(shù)均顯著。
表1 參數(shù)顯著性檢驗(yàn)結(jié)果
圖4 殘差序列Q-Q圖
圖4為殘差序列的Q-Q圖,用來(lái)描述殘差序列是否服從正態(tài)分布。圖中的數(shù)據(jù)點(diǎn)基本上按照對(duì)角直線排列,趨于一條直線,并被對(duì)角直接穿過(guò),且有95%的樣本點(diǎn)落在[-2,2]值區(qū)間內(nèi),故應(yīng)認(rèn)為殘差序列近似服從正態(tài)分布。再加上采用Shapiro-Wilk正態(tài)性檢驗(yàn)方法,所得統(tǒng)計(jì)量的值為0.9682,對(duì)應(yīng)的P值為0.3618,更加印證了殘差序列具有正態(tài)性。兩者從側(cè)面反映了本節(jié)方法的擬合效果。
利用上節(jié)模型預(yù)測(cè)2017~2019年的,并還原為人均GDP,所得結(jié)果見(jiàn)表2,同時(shí)給出它們的95%置信區(qū)間,預(yù)測(cè)結(jié)果延續(xù)了該序列的增長(zhǎng)趨勢(shì),2019年的數(shù)據(jù)將突破3000,會(huì)是1978年的30倍。
表2 2017~2019年的預(yù)測(cè)值
前面已經(jīng)做過(guò)分析,該人均GDP序列不適合采用ARIMA模型進(jìn)行擬合,為了說(shuō)明本文方法的可行性,我們采用二次回歸、三次回歸、指數(shù)回歸和冪模型進(jìn)行建模,各方法所對(duì)應(yīng)方程如下:
表3列出了本文所用方法與其他方法的參數(shù)估計(jì)和模型匯總。經(jīng)過(guò)顯著性檢驗(yàn),發(fā)現(xiàn)上述模型的擬合方程均在0.05的顯著性水平下顯著,同時(shí)模型殘差也能通過(guò)正態(tài)性檢驗(yàn)。只有兩個(gè)參數(shù)在該顯著性水平下不顯著,刪除這兩個(gè)參數(shù)后的擬合方程也包含在表中。與其他方法相比,本文采用的方法擬合效果較好,具有一定的優(yōu)越性。
本文以我國(guó)人均GDP為研究對(duì)象,利用1978~2016年的數(shù)據(jù),通過(guò)建立半?yún)?shù)時(shí)間序列模型分析其變化特征,并預(yù)測(cè)了未來(lái)三年的數(shù)值,給出了其95%的置信區(qū)間。該方法不僅是對(duì)現(xiàn)有模型的擴(kuò)展,而且具有一定的參考價(jià)值和實(shí)用價(jià)值。
不可否認(rèn),該建模方法也存在一定的難點(diǎn)和不足。首先,模型的定階存在一定難度,即Yt和ut滯后階數(shù)的確定暫時(shí)沒(méi)有較為完善的方法。其次,參數(shù)分布族{g(x,θ);θ∈Θ}的確定也具有一定的難度,且直接影響模型的擬合效果。這些難點(diǎn)都對(duì)研究者提出較大挑戰(zhàn),需要其較為準(zhǔn)確地把握數(shù)據(jù)本身的趨勢(shì),這將是我們下一步的研究重點(diǎn)。
表3 參數(shù)估計(jì)和模型匯總