(玉溪師范學(xué)院 數(shù)學(xué)與信息技術(shù)學(xué)院,云南 玉溪 653100)
考察能源消費(fèi)量與經(jīng)濟(jì)增長(zhǎng)及發(fā)展趨勢(shì),進(jìn)行經(jīng)濟(jì)統(tǒng)計(jì)研究和預(yù)測(cè)分析,可以反映經(jīng)濟(jì)發(fā)展與能源發(fā)展的趨勢(shì),為相關(guān)部門(mén)提供更好的科學(xué)決策依據(jù).目前,常用的預(yù)測(cè)方法有定性預(yù)測(cè)法、回歸預(yù)測(cè)法和時(shí)間序列法.其中,定性預(yù)測(cè)是以主觀邏輯判斷為主的預(yù)測(cè)方法;回歸預(yù)測(cè)是以變量為基礎(chǔ)研究多個(gè)變量之間是否存在某一特定關(guān)系,是用一個(gè)或多個(gè)變量的值來(lái)預(yù)測(cè)因變量的值;時(shí)間序列預(yù)測(cè)是用過(guò)去時(shí)間序列進(jìn)行統(tǒng)計(jì)分析來(lái)預(yù)測(cè)未來(lái)時(shí)間序列.
預(yù)測(cè)GDP的常用方法有時(shí)間序列預(yù)測(cè)、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)、灰色預(yù)測(cè)及各種組合模型.例如,王冬冬[1]利用1997年到2014年重慶市GDP數(shù)據(jù)基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)重慶市2015年到2017年GDP做出預(yù)測(cè),預(yù)測(cè)精度為97.01%,得到該模型具有較好的擬合效果.孫皖宇[2]分析2000年到2016年中國(guó)GDP季度數(shù)據(jù)并基于季節(jié)SARIMA模型對(duì)中國(guó)2017年各季度數(shù)據(jù)進(jìn)行預(yù)測(cè),得到GDP平均誤差為4.478 7%;未來(lái)我國(guó)GDP將持續(xù)增長(zhǎng),但增長(zhǎng)率逐漸減少;且固定在7%左右,最為適合中國(guó)經(jīng)濟(jì)發(fā)展.王紅超、王紅蕾[3]利用我國(guó)2006年到2015年GDP數(shù)據(jù)采用二次指數(shù)平滑法與回歸分析相結(jié)合的方法,對(duì)我國(guó)2017年GDP進(jìn)行預(yù)測(cè).李佩、彭斯俊[4]為了提高組合預(yù)測(cè)的精度,提出了一種新的組合權(quán)重計(jì)算方法,該方法通過(guò)將平均絕對(duì)百分?jǐn)?shù)誤差(MAPE)和最小二乘法相結(jié)合來(lái)確定組合預(yù)測(cè)模型的權(quán)重值,并對(duì)湖北省GDP進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果表明該組合權(quán)重與單一權(quán)重相比,可將組合模型的預(yù)測(cè)精度提高約0.3%.李小月[5]利用1990~2010年中國(guó)GDP數(shù)據(jù),在建立ARIMA、多項(xiàng)式趨勢(shì)擬合模型和GM(1,1)模型基礎(chǔ)上,以誤差平方和最小為最優(yōu)準(zhǔn)則建立組合預(yù)測(cè)模型,并把它應(yīng)用于我國(guó)GDP的預(yù)測(cè),所得結(jié)果誤差優(yōu)于三個(gè)模型的分別預(yù)測(cè),表明組合預(yù)測(cè)模型在時(shí)間序列數(shù)據(jù)的預(yù)測(cè)中更有優(yōu)勢(shì).然而,對(duì)于GDP預(yù)測(cè),由于選取的地點(diǎn)、時(shí)間、預(yù)測(cè)分析方法不同,預(yù)測(cè)結(jié)果也多種多樣.相對(duì)而言,組合模型把各個(gè)獨(dú)立模型的優(yōu)勢(shì)進(jìn)行整合,把信息利用率最大化,可以避免有效信息的浪費(fèi)也能減少偶然因素對(duì)預(yù)測(cè)結(jié)果的影響,其預(yù)測(cè)精度相對(duì)較高[6,7],因此,組合模型在能源、GDP等預(yù)測(cè)中得到了廣泛應(yīng)用.例如,周揚(yáng)等人建立BP神經(jīng)網(wǎng)絡(luò)與灰色GM的優(yōu)化組合模型對(duì)江蘇省未來(lái)15年煤炭和石油的需求量進(jìn)行預(yù)測(cè)[6].王莎莎等人采用組合模型預(yù)測(cè)了中國(guó)GDP的發(fā)展情況[7].
當(dāng)前,云南省大力培育和發(fā)展煙草、生物資源、旅游、礦產(chǎn)、電力五大支柱產(chǎn)業(yè)群[8~12],五大支柱產(chǎn)業(yè)群已經(jīng)在云南省GDP中占有了較大份額,成為了云南省經(jīng)濟(jì)增長(zhǎng)的重要保障.如何研究云南省經(jīng)濟(jì)增長(zhǎng)情況及發(fā)展趨勢(shì)成為目前亟待解決的熱點(diǎn)問(wèn)題.基于上述考慮,本文選取云南省能源消費(fèi)量占比較大的煤炭、石油、一次電消費(fèi)量的統(tǒng)計(jì)數(shù)據(jù),采用組合模型,即多元線性回歸與時(shí)間序列ARIMA預(yù)測(cè)模型來(lái)研究能源消費(fèi)量與云南省GDP的關(guān)系,并對(duì)未來(lái)幾年云南省GDP進(jìn)行分析及預(yù)測(cè).
在處理實(shí)際問(wèn)題時(shí),影響一個(gè)變量Y的因素通常是有多個(gè).如果有p個(gè)自變量,自變量為xi(i=1,…,p)與隨機(jī)變量Y之間存在相關(guān)關(guān)系,通常就意味著xi變量取定值后,Y便有相應(yīng)的值與之對(duì)應(yīng).線性回歸模型可以表示為:
Y=β0+β1x1+β2x2+…+βpxp+ε
(1)
其中,β0是常數(shù)項(xiàng),ε是隨機(jī)誤差表示由于客觀原因沒(méi)有考慮到的其他因素,β1、β2…βp是回歸系數(shù).為了讓建立的模型能達(dá)到預(yù)期效果,必須保證選擇的自變量對(duì)因變量有顯著的影響,并且具有密切的相關(guān)性,同時(shí)自變量之間要有互斥性,自變量的統(tǒng)計(jì)數(shù)據(jù)也要完整.在得到多元線性回歸方程之后,需要對(duì)模型進(jìn)行檢驗(yàn),即要測(cè)定模型的擬合度,通過(guò)對(duì)回歸方程、回歸系數(shù)的顯著性檢驗(yàn),判別多重共線性,才能得到擬合度較好的線性回歸模型.
時(shí)間序列是指一個(gè)依時(shí)間順序做成的觀察資料的集合.時(shí)間序列分析過(guò)程中最常用的方法是:指數(shù)平滑、自回歸、綜合移動(dòng)平均及季節(jié)分解.本次實(shí)驗(yàn)研究云南省GDP與能源消費(fèi)量的關(guān)系,但能源消費(fèi)量往往受到許多因素的制約,這些因素之間有著錯(cuò)綜復(fù)雜的聯(lián)系,因此,運(yùn)用結(jié)構(gòu)性的因果模型分析和預(yù)測(cè)能源消費(fèi)量往往是比較困難的.
該預(yù)測(cè)模型對(duì)數(shù)據(jù)處理需要特別注意三點(diǎn):一是對(duì)有缺失值的數(shù)據(jù)進(jìn)行修補(bǔ);二是將數(shù)據(jù)資料定義為相應(yīng)的時(shí)間序列;三是對(duì)時(shí)間序列數(shù)據(jù)的平穩(wěn)性進(jìn)行計(jì)算觀察.根據(jù)時(shí)間序列的特征和分析的要求,選擇恰當(dāng)?shù)哪P瓦M(jìn)行數(shù)據(jù)建模和分析,則需要預(yù)測(cè)年限的數(shù)據(jù)即可得到.
為研究云南省GDP值的變化與能源消費(fèi)量的變化關(guān)系,根據(jù)1978年至2017年能源消費(fèi)量數(shù)據(jù)統(tǒng)計(jì),發(fā)現(xiàn)云南省能源消費(fèi)量中煤炭、石油、一次電、天然氣消費(fèi)量占比較大,其中煤炭、石油、一次電消費(fèi)量又相對(duì)較大,所以本文研究云南省GDP與煤炭、石油、一次電消費(fèi)量的關(guān)系.
分析1978年以來(lái)云南省地區(qū)GDP-y,選取煤炭消費(fèi)量—x1、石油消費(fèi)量—x2、一次電消費(fèi)量—x3、能源消費(fèi)總量—x4為自變量,數(shù)據(jù)如表1.
表1 云南省1978年~2017年GDP與能源消費(fèi)量統(tǒng)計(jì)
續(xù)表1
數(shù)據(jù)來(lái)源:2018年《云南省統(tǒng)計(jì)年鑒》.
根據(jù)表1數(shù)據(jù),利用SPSS可畫(huà)出散點(diǎn)圖1:根據(jù)散點(diǎn)圖分布情況可以發(fā)現(xiàn)云南省煤炭消費(fèi)量和GDP無(wú)線性關(guān)系,石油消費(fèi)量和一次電消費(fèi)量與GDP成線性關(guān)系,所以選擇線性模型進(jìn)行建模.
根據(jù)上述散點(diǎn)圖分析可將1978年至2015年數(shù)據(jù)導(dǎo)入SPSS軟件,點(diǎn)擊變量視圖更改標(biāo)簽→分析→回歸→線性,煤炭消費(fèi)量、石油消費(fèi)量、一次電消費(fèi)量為自變量,GDP為因變量,置信區(qū)間為95%水平,選擇逐步回歸分析法進(jìn)行數(shù)據(jù)分析研究.
圖1 煤炭消費(fèi)量、石油消費(fèi)量以及一次電消費(fèi)量與生產(chǎn)總值的關(guān)系圖
表2 模型參數(shù)及檢驗(yàn)說(shuō)明
表2中,a為預(yù)測(cè)變量(常量),一次電消費(fèi)量;b為預(yù)測(cè)變量(常量),一次電消費(fèi)量,石油消費(fèi)量.模型1自變量為一次電消費(fèi)量,模型2自變量為一次電消費(fèi)量、石油消費(fèi)量,因變量都為GDP,剔除了自變量煤炭消費(fèi)量,符合散點(diǎn)圖預(yù)分析.根據(jù)R2可以判斷線性方程的擬合度,越接近1,說(shuō)明方程的擬合度越好.模型2調(diào)整后R2為0.995,比模型1調(diào)整后R2(0.987)更接近1,且都在0.96以上,表明模型2的擬合度是最好的.
表3 模型顯著性檢驗(yàn)
說(shuō)明:a.因變量:GDP;b.預(yù)測(cè)變量(常量),一次電消費(fèi)量;c.預(yù)測(cè)變量(常量),一次電消費(fèi)量,石油消費(fèi)量.
表3是方差分析數(shù)據(jù),F(xiàn)值是對(duì)整個(gè)回歸方程的顯著性檢驗(yàn),當(dāng)F對(duì)應(yīng)的顯著性值小于0.05時(shí),回歸方程才有意義.從表中可以可看出兩個(gè)模型的F值對(duì)應(yīng)的顯著性值都小于0.05,說(shuō)明各模型自變量綜合起來(lái)看對(duì)因變量是有顯著性影響的,模型可以使用.
表4 回歸系數(shù)及顯著性檢驗(yàn)
說(shuō)明:a.因變量:GDP.
表4給出了線性方程的回歸系數(shù)及顯著性檢驗(yàn),這里的t檢驗(yàn)是對(duì)單個(gè)變量的顯著性檢驗(yàn),當(dāng)t對(duì)應(yīng)的顯著性值小于0.05時(shí),回歸方程才有意義.從表中可以看出t對(duì)應(yīng)的顯著性值都為0,所以各個(gè)自變量單獨(dú)來(lái)看對(duì)因變量是有顯著影響的.B表示各個(gè)自變量在方程中的系數(shù).各自變量的B的95.0%置信區(qū)間都在10以下,說(shuō)明各自變量并無(wú)較強(qiáng)的多重共線性.
根據(jù)分析結(jié)果,石油消費(fèi)量、一次電消費(fèi)量對(duì)GDP的影響是顯著的,并且各個(gè)變量之間也不存在較強(qiáng)的多重共線性,說(shuō)明數(shù)據(jù)分析結(jié)果是有效的,建立的模型也是有意義的.相比較而言,模型2的擬合度更好,自變量顯著性更高.所以將表4中模型2的各自變量回歸系數(shù)代入線性回歸模型,得到回歸方程:
y=-651.407+2.248x2+2.454x3
(2)
將2016年、2017年石油和一次電消費(fèi)量代入(2)式,檢測(cè)模型得到GDP值與實(shí)際值的對(duì)比如表5所示,可以看出誤差率在6.00%以下,在可接受范圍內(nèi).
表5 模型計(jì)算值與實(shí)際GDP值對(duì)比
再加入2016年和2017年數(shù)據(jù),并用以上相同的方法、步驟修正模型,可以得到修正模型:
y=-689.896+1.95x2+2.650x3
(3)
如圖2,將修正模型(3)式得到的GDP和實(shí)際GDP建立折線統(tǒng)計(jì)圖,擬合效果比較理想.
圖2 修正模型計(jì)算GDP值與實(shí)際GDP值擬合度
從上述分析中可得到云南省GDP預(yù)測(cè)模型為(3)式:
y=-689.896+1.95x2+2.650x3
為了應(yīng)用模型(3)式預(yù)測(cè)2018~2022年云南省GDP,還需預(yù)測(cè)2018~2022年的石油消費(fèi)量、一次電消費(fèi)量.下面利用時(shí)間序列ARIMA預(yù)測(cè)模型研究石油消費(fèi)量、一次電消費(fèi)量的預(yù)測(cè)模型.
根據(jù)自相關(guān)和偏相關(guān)圖判斷該數(shù)據(jù)是平穩(wěn)的,對(duì)原始序列建立(p,0,q)模型,經(jīng)過(guò)反復(fù)試驗(yàn)確定模型為ARIMA(5,0,5),此時(shí)R2達(dá)到0.990,擬合程度較好.
石油消費(fèi)量預(yù)測(cè)通過(guò)以上分析采用ARIMA(5,0,5)模型建模,得到以下預(yù)測(cè)值.
表6 石油消費(fèi)量預(yù)測(cè)值
表6中,對(duì)于每個(gè)模型,預(yù)測(cè)從所請(qǐng)求估算期范圍內(nèi)的最后一個(gè)非缺失值之后開(kāi)始,并結(jié)束于最后一個(gè)所有預(yù)測(cè)變量都有可用的非缺失值的周期,或者在所請(qǐng)求預(yù)測(cè)期的結(jié)束日期結(jié)束,以較早者為準(zhǔn).
從圖3中的擬合度對(duì)比圖可看出,該預(yù)測(cè)模型擬合度較好,可清晰看出石油消費(fèi)量預(yù)測(cè)趨勢(shì).
圖3 石油消費(fèi)量預(yù)測(cè)擬合度對(duì)比圖
數(shù)據(jù)處理和石油消費(fèi)量預(yù)測(cè)一樣,同樣將原始數(shù)據(jù)1978~2017年數(shù)據(jù)導(dǎo)入SPSS,通過(guò)同樣的方法可得到預(yù)測(cè)值.
根據(jù)自相關(guān)和偏相關(guān)圖判斷該數(shù)據(jù)是非平穩(wěn)的,進(jìn)行了一次差分,得到差分序列自相關(guān)和偏相關(guān)圖都是拖尾的,因此可對(duì)原始序列建立(p,1,q)模型,經(jīng)過(guò)反復(fù)試驗(yàn)確定模型為ARIMA(5,1,6),此時(shí)R2達(dá)到0.992,擬合效果較好.
一次電消費(fèi)量預(yù)測(cè)通過(guò)以上分析采用ARIMA(5,1,6)模型建模,得到以下預(yù)測(cè)值.
表7 一次電消費(fèi)量預(yù)測(cè)值
表7中,對(duì)于每個(gè)模型,預(yù)測(cè)從所請(qǐng)求估算期范圍內(nèi)的最后一個(gè)非缺失值之后開(kāi)始,并結(jié)束于最后一個(gè)所有預(yù)測(cè)變量都有可用的非缺失值的周期,或者在所請(qǐng)求預(yù)測(cè)期的結(jié)束日期結(jié)束,以較早者為準(zhǔn).
圖4中擬合度對(duì)比圖可看出該預(yù)測(cè)模型擬合度較好,可清晰看出一次電消費(fèi)量預(yù)測(cè)趨勢(shì).
圖4 一次電消費(fèi)量預(yù)測(cè)擬合度對(duì)比圖
GDP預(yù)測(cè)結(jié)果及分析分別把表6和表7中的2018~2022年石油消費(fèi)量和一次電消費(fèi)量帶入修正模型
y=-689.896+1.95x2+2.650x3,
(3)
得到2018年~2022年云南省地區(qū)GDP預(yù)測(cè)數(shù)據(jù)如下:
表8 修正模型GDP 預(yù)測(cè)值
(1)云南省未來(lái)石油消費(fèi)量和一次電消費(fèi)量依然處于上升水平,雖然有時(shí)會(huì)有波動(dòng),但總體波動(dòng)不大.
(2)云南省一次電消費(fèi)量還處于急速增長(zhǎng)狀態(tài),未來(lái)一次電消費(fèi)量應(yīng)會(huì)持續(xù)增加.
(3)云南省GDP值處于上升水平,但是增速相對(duì)緩慢.
(4)從本文的預(yù)測(cè)數(shù)據(jù)看,2019年GDP相對(duì)2018年GDP出現(xiàn)稍微下降趨勢(shì),這為云南省制定下一步相應(yīng)政策提供了一定的數(shù)據(jù)依據(jù).需要說(shuō)明的是,由于2019年出版的是2018年的統(tǒng)計(jì)年鑒,而在本文成文時(shí)年鑒中的數(shù)據(jù)只更新到2017年,從時(shí)效看稍顯滯后,但新出來(lái)的數(shù)據(jù)也能對(duì)本文預(yù)測(cè)結(jié)果做一個(gè)及時(shí)的驗(yàn)證.
模型說(shuō)明
(1)本文采用SPSS多元線性回歸模型和時(shí)間序列ARIMA預(yù)測(cè)模型組合來(lái)預(yù)測(cè)未來(lái)5年云南GDP值,具有較高的精確性和可靠性,為云南省制定相應(yīng)政策提供數(shù)據(jù)支持.
(2)ARIMA預(yù)測(cè)模型既能提取序列的確定性信息,又能提取其隨機(jī)性信息,提高了模型的擬合精度,具有確定性分析和隨機(jī)性分析的優(yōu)點(diǎn).
(3)ARIMA預(yù)測(cè)模型,隨著預(yù)測(cè)時(shí)間的延長(zhǎng),預(yù)測(cè)誤差會(huì)逐漸增大,精度也會(huì)隨之下降,進(jìn)而影響組合模型的精度.
(4)ARIMA預(yù)測(cè)模型具有較強(qiáng)的時(shí)間趨勢(shì).