鄒 圓 王立威
(1 重慶工商大學經濟學院,重慶 400067;2 六盤水師范學院物理與電氣工程學院,貴州六盤水 553004)
能源強度是國內生產總值(GDP)所消耗的能量,反映了一國或地區(qū)能源利用效率、經濟結構、經濟發(fā)展方式的變化,對其準確預測有助于科學把握經濟發(fā)展的現(xiàn)實特征。其與現(xiàn)實中廣泛存在的一些預測問題相似,均帶有非線性、時變性和不確定性的特點,加之樣本數(shù)據量少、波動大、影響因素眾多,因而對其精確預測是一個既復雜又極具挑戰(zhàn)的重要課題。目前所采用的方法大致可歸納為四種類型:傳統(tǒng)統(tǒng)計學模型、神經網絡模型、灰色預測模型和組合預測模型。傳統(tǒng)統(tǒng)計學模型包括博克思(Box)和詹金斯(Jenkins)提出的時間序列自回歸積分滑動平均模型(Autoregressive In?tegrated Moving Average Model,ARIMA)[1]、多元線性回歸[2]、二次指數(shù)平滑法[3]等。其缺陷在于難以刻畫預測問題中的非線性情形,易造成預測誤差偏大且整體趨勢擬合度偏低。BP 神經網絡作為一種非線性建模方法,其多層前饋神經網絡能以任意給定精度逼近任意非線性函數(shù),常被用于各種預測如稅收預測[4]、GDP 預測[5]等,但對訓練樣本數(shù)量與質量要求較高,適應范圍和預測精度往往受到制約[6]。
灰色系統(tǒng)理論是由鄧聚龍教授于1982 年首次提出的一種能有效針對小樣本、貧信息系統(tǒng)的不確定性理論[7],隨后被廣泛應用于經濟、管理、電力、機械、生物醫(yī)學等領域[8-12]。GM(1,1)是灰色系統(tǒng)中的經典模型,它的核心思想是以一條較為平滑的指數(shù)型曲線去擬合原始數(shù)據序列。而其固有缺陷在于對隨時間階段發(fā)展特征不一,即帶時間冪函數(shù)項的非齊次指數(shù)數(shù)據序列擬合較差、預測精度較低。錢吳永等[13]將傳統(tǒng)灰色GM(1,1)模型推廣到含時間冪次項的灰色GM(1,1,tα)模型,并通過具體應用檢驗了所構建模型的有效性。崔杰等[14]揭示了該模型的病態(tài)特征,表明其魯棒性較強。吳紫恒等[15]提出一種改進的含時間冪次項灰色模型,進一步提高了模型的擬合與預測精度。馬爾可夫鏈作為一個離散變量的隨機過程,通過狀態(tài)轉移概率矩陣將前后狀態(tài)聯(lián)系起來,該過程要求具備特定類型“無記憶性”,即下一狀態(tài)的概率分布只能由當前狀態(tài)決定,能提升灰色模型的適用性和預測精度?;疑R爾可夫模型在能源消費[16]、事故預測[17]、醫(yī)療需求[18]、設備故障[19]、財務危機預警[20]等領域得到具體應用?;疑R爾可夫模型與傳統(tǒng)GM(1,1)模型共同缺陷在于不能很好處理現(xiàn)實中廣泛存在的帶非齊次指數(shù)規(guī)律的預測問題。
基于此,本文構建了帶時間冪次項的灰色馬爾可夫預測模型。其集成了帶時間冪次項的灰色模型和馬爾可夫鏈的各自優(yōu)點,適用范圍和預測精度都獲得較大提升。主要體現(xiàn)在三個方面:一是不受樣本量限制,能有效克服訓練樣本數(shù)不足的問題;二是根據具體問題確定時間冪次項指數(shù),可以有效擬合帶齊次指數(shù)或非齊次指數(shù)規(guī)律的數(shù)據序列;三是馬爾可夫鏈針對偏差較大的預測結果序列提取狀態(tài)信息轉移規(guī)律,進一步增強預測精度。本文將之應用于中國能源強度預測問題并進行了模型預測精度的比較分析,證實了所提模型的有效性和可行性。
本節(jié)首先簡要回顧了灰色GM(1,1)和帶時間冪次項的灰色GM(1,1,tα)模型,通過引入馬爾可夫鏈,構建了帶時間冪次項的灰色馬爾可夫預測模型并給出了相應的算法流程,為了比較不同模型的預測能力,介紹了一些常用的定量評價指標,為接下來對中國能源強度的預測奠定了方法基礎。
1.1.1 灰色GM(1,1)模型
在對現(xiàn)實問題預測中,影響考察對象的因素眾多,且易受到各種隨機沖擊,從而表現(xiàn)出不同程度的不確定性和非典型波動特征?;疑P途哂胁灰蕾嚇颖痉植?、所需數(shù)據量較少、計算簡便、預測精度較高等優(yōu)點,可根據待考察對象變動的時間序列特性,挖掘其內部變化規(guī)律,預測結果較為準確且穩(wěn)定。傳統(tǒng)灰色GM(1,1)建?;玖鞒倘缦拢?/p>
Step 4:由于上述累加生成序列X(1)與一階線性微分方程的解曲線相似,因此可以導出GM(1,1)模型中的白化微分方程如下:
Step 5:用最小二乘法解得白化微分方程中的參數(shù)a,b為:
其中,a稱為發(fā)展系數(shù),b稱為灰色作用量。
Step 6:將參數(shù)向量代入微分方程并進行求解,得:
Step 7:將上式進行累減還原,獲得預測值:
1.1.2 灰色GM(1,1,tα)模型
傳統(tǒng)GM(1,1)模型對滿足齊次指數(shù)規(guī)律的數(shù)據序列具有較好的預測效果,但現(xiàn)實中存在許多系統(tǒng),其發(fā)展和演化規(guī)律無法簡單采用指數(shù)規(guī)律來精確描述。通過考慮時間冪次項對傳統(tǒng)灰色模型進行修訂,以期準確反映在現(xiàn)實預測問題中大量存在的非指數(shù)規(guī)律變化特征,灰色GM(1,1,tα)建模過程如下[13]:
令α為非負常數(shù),Step 1和Step 2同上,構建新的矩陣B和常數(shù)向量Y如下:
當α=0 時,GM(1,1,tα)模型退化為傳統(tǒng)GM(1,1)模型,預測值如公式(6)所示;當α=1 時,GM(1,1,tα)變?yōu)镚M(1,1,t),預測值為:
當α=2 時,GM(1,1,tα)變?yōu)镚M(1,1,t2),預測值為:
在進行預測中往往受到一些未知或隨機因素的影響,如隨機的外部沖擊,導致數(shù)據出現(xiàn)一定的波動性和無序性,這對灰色模型的預測精度影響較大。可用馬爾可夫模型抽取數(shù)據序列波動信息,修正灰色模型預測結果,來提高預測的精確度。首先利用灰色模型獲得預測值,求出比率序列{s(k)},;其次對比率序列進行狀態(tài)劃分,確定比率序列中各值所處的狀態(tài),獲得狀態(tài)轉移概率矩陣;最后根據初始狀態(tài)的概率向量和狀態(tài)轉移概率矩陣來推測預測對象未來某一時間所處的狀態(tài)和預測值。其建模包括三個基本步驟:第一,劃分狀態(tài)序列;第二,建立狀態(tài)轉移概率矩陣;第三,確立新的經修正后的預測值。
將比率序列{s(i)} 劃分為m個狀態(tài),記作{Q1,Q2,…,Qm},每個比率值s(i)可唯一地劃入狀態(tài)Qj中,即滿足s(i)∈Qj。其中Q j滿足:
這里Lj、Uj分別表示狀態(tài)Qj的下限和上限,滿足:
用Pij(λ)表示預測對象由狀態(tài)Qi經過λ步轉移至狀態(tài)Qj的概率,該λ步轉移概率可近似由轉移頻率來估計,即:
這里Mij(λ)為狀態(tài)Qi經過λ步轉移至狀態(tài)Qj的比率序列樣本數(shù),Mi為處于狀態(tài)Qi的比率序列樣本數(shù)。由Pij(λ)組成的矩陣即是馬爾可夫鏈中的狀態(tài)轉移概率矩陣,即:
假定( π1(k),π2(k),…,πm(k))為狀態(tài)概率分布向量,πj(0)為初始狀態(tài)概率,利用此狀態(tài)概率分布向量和狀態(tài)轉移概率矩陣可估算未來任一時期所處狀態(tài)和預測值。第k+1期預測值可表示為[21]:
帶時間冪次項的灰色馬爾可夫預測模型流程如圖1所示:
圖1 帶時間冪次項的灰色馬爾可夫預測模型流程
為合理評價模型的預測能力,需要量化預測誤差。本文參照常用的相對誤差(Relative Per?centage Error,RPE)、平均絕對誤差百分比(Mean Absolute Percentage Error,MAPE)以及均方根誤差(Root Mean Squared Error,RMSE)作為模型預測能力的測度指標,計算公式如下:
為了分析帶時間冪次項的灰色馬爾可夫模型是否能夠提升對中國能源強度的預測能力,本文選取了在預測中得到廣泛應用的灰色GM(1,1)和帶不同時間冪次項的GM(1,1,tα)(α=1,2)進行了相同的預測,旨在對不同模型的預測能力進行對比分析。
2.1.1 問題描述與指標選取
為了驗證所提出的模型在預測問題中的有效性和可操作性,本文對中國能源強度指標單位產值能耗進行預測,該指標計算公式為能源消費總量(噸標煤)/GDP(萬元),用A表示。利用灰色GM(1,1)模型,帶時間冪次項的GM(1,1,t)和GM(1,1,t2)進行對照分析,從中提取出最優(yōu)α值,以此來構建經馬爾可夫鏈修正后的GM(1,1,tα)模型,并評價其預測精度表現(xiàn)。
本文將樣本區(qū)間設置為1995—2020 年,其中以1995—2018 年數(shù)據作為訓練集訓練模型,2019—2020年數(shù)據作為測試集用于預測不同模型的預測性能,并對2021年指標值進行預測。
首先利用自然對數(shù)變換對原始數(shù)據進行平滑性處理。
2.1.2 參數(shù)α的確定
將α取值分別設定為0,1,2,獲得三個灰色模型GM(1,1)、GM(1,1,t)和GM(1,1,t2),利用MATLAB軟件(R2010a版)分別對各模型進行算法實現(xiàn),獲得lnA的擬合預測值后,再通過逆自然對數(shù)轉換為原值。三個模型關于A在1995—2020 年的擬合結果趨勢如圖2所示:
圖2 不同時間冪次項下灰色模型的擬合預測值與真實值
通過比較可以發(fā)現(xiàn),無論是從預測結果與實際值的擬合程度看,還是從整體變化趨勢狀況看,GM(1,1,t2)整體上擬合值較為接近真實值,擬合效果最佳。其次是GM(1,1),表現(xiàn)最差的是GM(1,1,t),與真實情況存在明顯的差異。利用上述的RPE誤差度量指標分別對三個灰色模型的預測性能進行定量考查,獲得計算結果如表1所示:
表1 不同時間冪次項下灰色模型的擬合預測結果比較
從表1測算結果表明,除個別年份以外,大部分年份GM(1,1,t2)模型的RPE 值均小于GM(1,1)和GM(1,1,t)。同時,可計算出GM(1,1,t2)的MAPE 指標在訓練集和測試集上的數(shù)值分別為4.89%和2.43%,RMSE指標在訓練集和測試集上的數(shù)值分別為0.209 7 和0.053 2,在三個模型中均為最低。這說明GM(1,1,t2)預測性能要優(yōu)于其他兩種模型,也反映了在對單位產值能耗A的預測中,參數(shù)α在可能取值為0,1,2情況下,帶時間二次冪項的灰色模型預測性能最優(yōu)。
2.1.3 帶時間冪次項的灰色馬爾可夫模型預測
利用GM(1,1,t2)模型計算出1995—2018 年單位產值能耗對數(shù)值lnA的擬合值,以擬合值與真實值比例構建比率序列{s(k)},根據比率序列的具體數(shù)值,按照公式(10-11)將之劃分的馬爾可夫狀態(tài)區(qū)域為:第一,Q1狀態(tài)界限為[ 0 .8779,0.9667),屬于預測偏低情形;第二,Q2狀態(tài)界限為[0.9667,1.0555),屬于預測適中情形;第三,Q3狀態(tài)界限為[1 .0555,1.1444],屬于預測偏高情形。并以此將訓練集中每年的比率值進行分類,得出如表2所示的預測擬合狀態(tài)匯總表:
表2 預測擬合狀態(tài)匯總
按照上述分類匯總情況,可得到一步轉移概率矩陣為:
根據馬爾可夫鏈的預測原理,由P(1)獲得λ步轉移概率矩陣P(λ),基于訓練集的樣本數(shù)據和GM(1,1,t2)的擬合結果,利用公式(14)和逆自然對數(shù)轉換可計算出2019—2020年的擬合結果,經馬爾可夫鏈修正后的GM(1,1,t2)模型的RPE 絕對值均小于GM(1,1,t2),預測精度得到進一步提升。具體結果如表3、表4所示。
表3 帶二次時間冪項的灰色馬爾可夫模型預測結果
表4 四種模型的預測精度比較
從表3 和表4 可以看出,首先,經馬爾可夫鏈修正后的GM(1,1,t2)預測模型無論是RPE(相對誤差),還是MAPE(平均絕對誤差百分比)檢驗以及RMSE(均方根誤差)檢驗,均一致優(yōu)于其他三種模型,這說明在對單位產值能耗對數(shù)值lnA的預測中,帶時間二次冪項的灰色馬爾可夫模型預測精度最高,整體上優(yōu)于其他三種灰色預測模型。其次是GM(1,1,t2)模型,預測精度最差的是GM(1,1,t),在訓練集年份MAPE 超過了20%,測試集年份MAPE 則高達60.91%,從擬合度和變化態(tài)勢上均與現(xiàn)實情況存在明顯偏差,這說明其不適宜用來對中國歷年單位產值能耗變化進行擬合預測。
分別應用上述四個模型對2021 年反映中國單位產值能耗對數(shù)值進行預測,利用逆自然對數(shù)變換為標準預測值,并匯總測試集2019—2020年的預測結果以便于比較,具體如表5所示。
表5 2021年中國單位產值能耗預測值(單位:t/萬元)
灰色GM(1,1,t2)模型預測曲線與中國單位產值能耗原始數(shù)據的趨勢大致相同,可以較好地擬合中國單位產值能耗的變化態(tài)勢。帶時間二次冪項的灰色馬爾可夫模型通過轉移概率矩陣對灰色GM(1,1,t2)模型進行修正,得到了更為接近真實值的結果。按照預測精度=1-| |RPE的計算公式,其在2019 和2020 年的預測精度進一步提升至98.67%和99.15%。這表明了所提出的預測方法的科學性和合理性。同時,根據樣本數(shù)據可以合理預測2021 年中國單位產值能耗為1.805 8 t/萬元。
本文提出了一種新的帶時間冪次項的灰色馬爾可夫預測模型。基于中國1995—2020 年單位產值能耗數(shù)據序列進行了數(shù)值預測,并與傳統(tǒng)灰色GM(1,1)模型和帶時間冪次項的灰色GM(1,1,tα)(α=1,2)模型進行了比較分析。實驗結果發(fā)現(xiàn):第一,在灰色模型中,帶時間二次冪項的GM(1,1,t2)的預測精度最高,擬合曲線趨勢與實際情況較為吻合,預測效果最好;其實是灰色GM(1,1)模型;帶時間一次冪項的GM(1,1,t)模型預測值嚴重偏離真實值,預測效果最差。第二,在灰色GM(1,1,t2)模型預測的基礎上,借助馬爾可夫鏈在無后效性事件預測上的優(yōu)勢,利用轉移概率矩陣對GM(1,1,t2)的預測結果進行修正,修正后精度得到進一步提升,能更準確預測中國能源強度的變化趨勢,據此估計未來一年中國單位產值能耗數(shù)值。
總體來說,帶時間冪次項的灰色馬爾可夫模型集成了灰色GM(1,1,tα)模型,在有限樣本下的預測性能和非指數(shù)變化規(guī)律刻畫能力,以及馬爾可夫鏈針對預測結果的校準能力。根據樣本序列指數(shù)或非指數(shù)變動規(guī)律的問題特征選擇時間最優(yōu)冪次項,并利用馬爾可夫鏈對預測結果進行校正以縮小其偏差,這使其預測精度更高且應用場景更為廣泛。但需要指出的是,對單位產值能耗的中長期預測中,通常會受到更多不確定因素的影響。在實踐過程中,有必要在該模型基礎上適當附加其他條件,以彌補單一數(shù)據序列的缺陷,提高中長期預測的準確性。