吳萬勤,錢 紅
(1.云南民族大學(xué) 數(shù)學(xué)與計算機科學(xué)學(xué)院, 云南 昆明 650500; 2.云南師范大學(xué)文理學(xué)院 信息工程學(xué)院 ,云南 昆明 650231)
降水的分布與人類的生產(chǎn)生活密切相關(guān),對社會、經(jīng)濟和生態(tài)環(huán)境影響顯著.降水量在時間和空間上的非均勻分布,很大程度上決定了洪澇、干旱和暴雨等氣象災(zāi)害的強度,導(dǎo)致區(qū)域干旱事件的頻繁發(fā)生,地區(qū)水資源的嚴(yán)重短缺,以及洪澇和地質(zhì)災(zāi)害的加劇.昆明市位于我國云南省低緯高海拔地區(qū),在云貴高原的中心.昆明市近年干旱已成常態(tài),影響了中藥產(chǎn)業(yè),還給當(dāng)?shù)氐幕ɑ墚a(chǎn)業(yè)帶來了損失.科學(xué)準(zhǔn)確的降水預(yù)測,可以使農(nóng)業(yè)、水利等有關(guān)部門及時采取措施,防止旱澇災(zāi)害,降低不必要的損失.因而對昆明市降水量做出合乎實際的預(yù)測就顯得十分重要.
時間序列分析法對降雨量的預(yù)報有較高的精度,并且操作較方便, 所以該方法在降水量分析中運用逐漸普遍起來.馮子溪[1]在基于馬爾科夫鏈與灰色模型的昆明市降雨量預(yù)測中利用馬爾科夫鏈與灰色模型相結(jié)合的方法建立了合理的模型對昆明市的年降雨量進行了預(yù)測[1];程敏等[2]基于時間序列模型對濟南市降水量進行預(yù)測分析[2];宮晨[3]在基于ARIMA模型的拉薩降水量時間序列分析與預(yù)測中利用ARIMA模型對其進行建模和預(yù)測[3].王超華等[4]分別建立MA-GARCH模型和MA-EGARCH模型對降水量進行分析和預(yù)測[4].本論文主要針對昆明市月降水量進行分析和預(yù)測,基于2000—2019年昆明市月降水量數(shù)據(jù)擬合建立模型和相加模型,對2019年1—12月降水量數(shù)據(jù)預(yù)測,采用實際值與預(yù)測值誤差對比,驗證2種模型預(yù)測效果.相加模型預(yù)測精度相對較高,利用相加模型對昆明市月降水量進行3年預(yù)測,并分析預(yù)測結(jié)果.該模型對昆明市降水量短期預(yù)測中有一定參考價值.
基于中國統(tǒng)計年鑒,通過對2000—2019年昆明市月降水量數(shù)據(jù)分析,可以看出降水量數(shù)據(jù)具有周期波動性,并且以年為周期,可以明顯看出干、濕兩季,夏季降水量較多,冬季較少.
具有如下結(jié)構(gòu)的模型稱為求和自回歸移動平均模型,簡記為ARIMA(p,d,q)模型:
(1)
d階差分后序列可以表示為:
(2)
SARIMA模型建模步驟:
①觀察時間序列周期,確定周期長度S.
②通過差分保證時間序列的平穩(wěn)性,確定d值.
③通過自相關(guān)和偏自相關(guān)圖確定非季節(jié)性模型p、q值.
④通過差分平穩(wěn)后的序列圖,自相關(guān)和偏自相關(guān)圖確定季節(jié)模型D、P、Q值.
⑤將選定的p、q、d和P、Q、D的可能值代入SARIMA模型.
⑥根據(jù)Akaike信息準(zhǔn)則(AIC)最小值和t檢驗選取最優(yōu)模型[5].
由于昆明市月降水量數(shù)據(jù)具有明顯的周期波動性,表現(xiàn)出明顯的年度周期特征,為非平穩(wěn)序列.對于季節(jié)性波動穩(wěn)定的序列,為了提取季節(jié)波動信息,通常使用步長為周期長度的差分運算[6].鑒于此,本文對所研究的數(shù)據(jù)進行1階步長為12的差分運算.通過對差分運算后數(shù)據(jù)的時序分析.可以得出,1階12步差分可以較好地提取周期信息, 1階12步差分運算后序列呈現(xiàn)出明顯的平穩(wěn)性.通過統(tǒng)計學(xué)分析,數(shù)據(jù)符合ARIMA乘積季節(jié)模型對平穩(wěn)性的要求.
模型的建立需要進行定階和定參.
模型的定階其實就是確定ARIMA(p,d,q,P,D,Q)S模型適當(dāng)階數(shù),即p,d,q,P,D,Q的數(shù)值.由于對降水量數(shù)據(jù)進行了1階差分和周期為12的差分,因此d=D=1.基于一階12步差分后的自相關(guān)和偏自相關(guān)分析,1階12步差分后的序列,除了一階自相關(guān)系數(shù)在2倍標(biāo)準(zhǔn)差范圍外,其他階數(shù)的自相關(guān)系數(shù)都在2倍標(biāo)準(zhǔn)差內(nèi),偏自相關(guān)系數(shù)拖尾.因此取p=0,P=0,q=1或2再觀察季節(jié)性趨勢,可以看出,自相關(guān)系數(shù)每一季節(jié)效應(yīng)周期(12階)都在2倍標(biāo)準(zhǔn)差外,因此取Q=1或2[6-7].
得到的模型如下:
ARIMA(0,1,1)(0,1,1)12,ARIMA(0,1,2)(0,1,1)12,ARIMA(0,1,1)(0,1,2)12,ARIMA(0,1,2)(0,1,2)12.得到相關(guān)模型估計結(jié)果和檢驗結(jié)果.各個模型檢驗結(jié)果如表1.
由表1可知,僅有模型ARIMA(0,1,1)(0,1,1)12的參數(shù)均通過t檢驗.故選擇使用ARIMA(0,1,1)(0,1,1)12模型對昆明市降水量數(shù)據(jù)進行建模和預(yù)測.對該模型ARIMA(0,1,1)(0,1,1)12進行最小二乘法估計,估計結(jié)果為:
表1 模型檢驗結(jié)果
(1-B12)xt=(1-0.949 875B)(1-0.911 362B12)εt.
(3)
為了檢驗?zāi)P偷挠行?運用時間序列分析軟件建立殘差的自相關(guān)圖,對殘差進行純隨機性檢驗.經(jīng)過統(tǒng)計學(xué)分析表明擬合模型是有效的[5].經(jīng)過t檢驗,模型ARIMA(0,1,1)(0,1,1)12的參數(shù)統(tǒng)計量P值均小于顯著性水平(α=0.05).
該論文利用2000—2018年昆明市月降水量的數(shù)據(jù),對2019年1—12月降水量數(shù)據(jù)進行預(yù)測,結(jié)果如圖1,圖中2S.E為二倍標(biāo)準(zhǔn)差曲線.
圖1 擬合圖
結(jié)果表明:預(yù)測值均在2倍標(biāo)準(zhǔn)差的置信范圍內(nèi),可根據(jù)Theil不相等系數(shù)為0.220 312,以及協(xié)方差比例為0.941 907,得到模型的預(yù)測結(jié)果較為理想,預(yù)測效果較好[8].
通過預(yù)測值與實際值對比(見圖 2),圖中X為降水量的實際值,XF為預(yù)測值.可以看出該模型擬合較好.
圖2 預(yù)測值與實際值對比圖
Holt-Winters季節(jié)指數(shù)模型包括:Holt-Winters乘法模型和Holt-Winters加法模型2種.
對于Holt-Winters加法模型,序列通??梢员磉_為如下模型結(jié)構(gòu):
(4)
式中,{y}表示降水量序列,a為常數(shù)項;b為長期趨勢;c為加法模型的季節(jié)因子,t表示樣本取值時間,t+k表示將要預(yù)測的時期.a,b,c3個系數(shù)大小通過以下推倒公式來確定:
a(t)=α(yt-ct(t-s))+(1-α)(a(t-1))+b(t-1),b(t)=β(a(t)-a(t-1))+1-βb(t-1),ct(t)=γ(yi-a(t+1))-γct(t-s),
(5)
其中,α,β,γ是3個平滑因子;s表示周期長短.
對于Holt-Winters乘法模型,序列通??梢员磉_為如下模型結(jié)構(gòu):
(6)
式中,{y}表示降水量序列,a為常數(shù)項;b為長期趨勢;c為加法模型的季節(jié)因子,t表示樣本取值時間,t+k表示將要預(yù)測的時期.a,b,c3個系數(shù)大小通過以下推倒公式來確定:
(7)
其中,α,β,γ是3個平滑因子;s表示周期長短.
學(xué)者們在研究該方法時提出了許多有關(guān)α,β,γ的參數(shù)空間選擇的方法,本文要求所有的參數(shù)從區(qū)間[0,1]中選取.
由于降水量序列沒有長期趨勢,有季節(jié)效應(yīng).故可用Holt-Winters季節(jié)加法模型進行預(yù)測.
運用公式(4)、公式(5),利用2000—2018年昆明市月降水量的數(shù)據(jù),可以得到模型結(jié)果如下式
(8)
利用軟件進行分析,Holt-Winters季節(jié)加法模型Box-Ljung檢驗結(jié)果9.
表2 Holt-Winters加法模型模型統(tǒng)計
結(jié)果顯示Box-Ljung(18)=14.555,P=0.484,P>0.05,故通過白噪聲檢驗,說明預(yù)測較準(zhǔn)確.對殘差序列進行統(tǒng)計學(xué)分析,擬合模型顯著有效[12].通過預(yù)測值與真實值對比見圖3,圖中X為降水量的實際值,XF為預(yù)測值.可以看出該模型擬合較好.
圖3 預(yù)測值與真實值對比圖
采取2種模型對2019年1—12月昆明市月降水量進行預(yù)測,并于實際降水量數(shù)據(jù)進行對比.預(yù)測結(jié)果顯示:
表3 2種模型預(yù)測結(jié)果對比
在本文中發(fā)現(xiàn),在針對昆明市月降水量序列的預(yù)測建模過程中,通過誤差比較Holt-Winters相加模型對實際數(shù)據(jù)的擬合效果優(yōu)于ARIMA模型.
使用Holt-Winters相加模型基于2000—2019年昆明市月降水量數(shù)據(jù),對2020—2022年降水量進行預(yù)測.
表4 2020-2022年預(yù)測結(jié)果
從預(yù)測結(jié)果可以看出3年降水量預(yù)測結(jié)果具有季節(jié)周期性波動,與往期數(shù)據(jù)相類似.且在7、8月降水量達到最高,1月和12月降水量最低,農(nóng)業(yè)、水利等有關(guān)部門就可以及時采取防澇抗旱措施.
昆明市月降水量會隨季節(jié)周期性波動,SARIMA模型是針對平穩(wěn)時間序列進行擬合預(yù)測模型,綜合考慮了時間序列的趨勢、季節(jié)效應(yīng)、隨機誤差干擾等因素,可以更好的反應(yīng)原始序列的趨勢和變化.Holt-Winters相加模型則是根據(jù)數(shù)據(jù)在時間線上距離的遠近依次給予不同權(quán)重,近期數(shù)據(jù)影響較大則賦予更大的權(quán)重,遠期數(shù)據(jù)影響較小而被賦予較小權(quán)重,適合預(yù)測隨時間變化趨勢單一的數(shù)據(jù)[6].ARIMA模型和Holt-Winters模型都屬于短期預(yù)測模型,它們的預(yù)測效果會隨著時間的推移逐漸變差.從2種方法的預(yù)測結(jié)果中得出,短期預(yù)測效果都較好.本文中在針對昆明市月降水量序列的預(yù)測建模過程中,Holt-Winters相加模型對實際數(shù)據(jù)的擬合效果優(yōu)于SARIMA模型.通過預(yù)測結(jié)果,可以使農(nóng)業(yè)、水利等有關(guān)部門及時采取措施,防止旱澇災(zāi)害,降低不必要的損失.