周安琪1 高 松2 喻 丹34
(1.湖北千里目檢測技術(shù)有限公司,湖北 宜昌 443002;2.宜昌市環(huán)境保護監(jiān)測站,湖北 宜昌 443002;3.三峽大學(xué)水利與環(huán)境學(xué)院,湖北 宜昌 443002;4.水資源安全保障湖北省協(xié)同創(chuàng)新中心,湖北 武漢 4300742)
降雨作為一個區(qū)域主要的水資源補給,是目前水文和氣象研究中非常重要的一個關(guān)注項。降雨量的預(yù)測能夠為農(nóng)業(yè)、氣象和水利等多個部門的決策制定提供重要的數(shù)據(jù)支持和科學(xué)依據(jù)[1-3]。由于降雨量的多少受到多種氣象因素的綜合影響,表現(xiàn)出較強的隨機性[3],因此很難利用準確的數(shù)值計算方法得到某一時段內(nèi)的降雨量的值。長期以來,國內(nèi)外眾多學(xué)者針對降雨量的預(yù)測方法開展了大量的研究,主要形成了兩大類方法:一類是概率統(tǒng)計的方法,如一元線性回歸預(yù)測、馬爾可夫鏈模型、時間序列預(yù)測等;另一類是時間序列方法,如自回歸預(yù)測,非線性門限自回歸、滑動平均自回歸模型等[4-7]。其中,馬爾可夫鏈模型因其原理簡單、計算方法簡便,且對數(shù)據(jù)的隨機波動規(guī)律具有一定的適應(yīng)性,被廣泛應(yīng)用于降雨量的預(yù)測研究中[3-4,8-9]。
馬爾可夫過程是研究隨機過程中事物狀態(tài)以及狀態(tài)之間轉(zhuǎn)移規(guī)律的理論,基本原理是結(jié)合事物當前的狀態(tài)和狀態(tài)轉(zhuǎn)移概率來預(yù)測事物將來的變化趨勢。馬爾可夫過程最基本的特征是“無后效性”(也稱之為“馬氏性”),即認為事物將來的狀態(tài)只取決于事物當前的狀態(tài),而與過去的狀態(tài)無關(guān)。馬爾可夫鏈是狀態(tài)和時間都離散的一種特殊的馬爾可夫過程,水文要素如降雨、徑流的狀態(tài)序列屬于典型的馬爾可夫鏈,同樣也具有“無后效性”的特征。加權(quán)馬爾可夫鏈是在傳統(tǒng)馬爾可夫鏈的基礎(chǔ)上發(fā)展而來的,其基本思想是,對于一列相依的隨機變量,各階自相關(guān)系數(shù)刻畫了各種滯時的指標值的相關(guān)關(guān)系的強弱,因此可考慮先分別依其前面若干年的指標值所對應(yīng)的狀態(tài)對該時段的狀態(tài)進行預(yù)測,然后按前面各時段與該時段相依關(guān)系的強弱對絕對轉(zhuǎn)移概率加權(quán)求和。即通過各階馬爾可夫鏈轉(zhuǎn)移概率與相依隨機變量的相關(guān)分析,達到充分、合理地利用信息進行預(yù)測的目的[9-10]。
目前,關(guān)于加權(quán)馬爾可夫鏈預(yù)測降雨量的研究大多集中在方法的應(yīng)用上,然而在利用加權(quán)馬爾可夫鏈時,階數(shù)的選擇會影響各種滯時指標值的權(quán)重,從而影響最終的預(yù)測結(jié)果,現(xiàn)有的研究缺少對不同階數(shù)馬爾可夫鏈預(yù)測結(jié)果的對比分析。因此,本文以湖北省為研究區(qū),根據(jù)中國國家氣象局(China Meteorological Administration,CMA)[11]提供的氣象站點逐日降雨數(shù)據(jù),利用不同階數(shù)的加權(quán)馬爾可夫鏈預(yù)測年降雨狀態(tài),再結(jié)合模糊集理論預(yù)測對應(yīng)狀態(tài)下的年降雨量的值,通過對比研究分析加權(quán)馬爾可夫的階數(shù)對年降雨量預(yù)測精度的影響。
加權(quán)馬爾可夫鏈預(yù)測年降雨量狀態(tài)的一般步驟如下:
a.采用均值-均方差分級法對年降雨序列進行分級,計算年降雨序列的樣本均值s,據(jù)此建立分級標準,將歷年降雨量劃分為特旱、干旱、平水、偏豐和豐水共5個狀態(tài)。
b.對上一步得到的狀態(tài)序列進行統(tǒng)計計算,得到不同滯時(階數(shù))馬爾可夫鏈的轉(zhuǎn)移概率矩陣,這些矩陣決定了降雨量狀態(tài)轉(zhuǎn)移過程的概率法則。
c.進行“馬氏性”檢驗。
d.計算年降雨序列的各階自相關(guān)系數(shù)rk,計算公式為
(1)
e.對各階自相關(guān)系數(shù)進行規(guī)范化處理,作為各滯時(階數(shù))的馬爾可夫鏈的權(quán)重wk,即
(2)
式中:m為最大的階數(shù)。
(3)
則矩陣Pi中最大概率值所隸屬的狀態(tài)即為預(yù)測期的預(yù)測降雨量狀態(tài)。
馬爾可夫鏈采用最大概率隸屬原則來確定預(yù)測對象的狀態(tài),主要存在兩個方面的不足:?只考慮最大概率,忽略了其他概率的影響;?預(yù)測結(jié)果只能給出預(yù)測對象所屬的區(qū)間,而無法確定具體的預(yù)測值[9]。因此,吳林川等[3]、張偉[4]、王艷[10]等學(xué)者通過引入模糊集理論中的級別特征值來解決以上兩個問題。模糊集理論用于年降雨量預(yù)測的基本步驟如下:
a.首先根據(jù)預(yù)測年份降雨量的5個狀態(tài)概率Pi矩陣,計算各狀態(tài)的模糊數(shù)di:
(4)
式中:η為最大概率作用指數(shù),值越大越能突出最大概率的主導(dǎo)性,一般取值為2或4。
b.計算級別特征值H:
(5)
c.降雨量的預(yù)測x值為
(6)
式中:i為預(yù)測Pi最大概率對應(yīng)的狀態(tài);Ti和Bi分別為該狀態(tài)的上、下限。
本文以湖北省為研究區(qū),見圖 1。湖北省位于我國內(nèi)陸腹地長江中游地區(qū),總面積18.59萬km2。湖北省處于我國地勢第二級階梯向第三級階梯過渡地帶,地勢西高東低,地貌類型多樣,山地、丘陵崗地和平原兼?zhèn)?,分別占總面積的56%、24%和20%。湖北省地處亞熱帶,位于典型的季風區(qū)內(nèi),全省除高山地區(qū)外,大部分為亞熱帶季風性濕潤氣候,年平均氣溫為15~17℃。年平均降雨量在800~1600mm之間,降雨空間分布呈由南向北遞減的趨勢,降雨量表現(xiàn)出明顯的年內(nèi)季節(jié)性變化,一般夏季雨量較多,約為300~700mm,冬季雨量較少,約為30~190mm。本研究的日降雨數(shù)據(jù)來自中國氣象數(shù)據(jù)網(wǎng),研究區(qū)共包含27個氣象站點,由此得到1971—2018年各站的年降雨序列。
圖1 研究區(qū)湖北省概況
表1 氣象站點57251實測年降雨量
表2 氣象站點57251年降雨狀態(tài)劃分標準
再統(tǒng)計該站點1~5階的狀態(tài)轉(zhuǎn)移概率矩陣,分別表示為P(1)、P(2)、P(3)、P(4)和P(5):
(7)
該氣象站點年降雨量序列的1~5滯時的自相關(guān)系數(shù)為rk=[0.12,-0.08,0.04,-0.15,-0.07],根據(jù)式(2)計算得到1~5滯時的馬爾可夫鏈權(quán)重,見表3。
表3 氣象站點57251年降雨序列1~5滯時的馬爾可夫權(quán)重
根據(jù)式(3)可得不同階數(shù)的加權(quán)馬爾可夫鏈預(yù)測的2018年降雨量狀態(tài)概率矩陣,見表4。由表4可以看出,對于氣象站點57251,不同階數(shù)馬爾可夫鏈預(yù)測的2018年降雨量均是在狀態(tài)3(平水)的概率最大,說明對于該氣象站點而言,階數(shù)對加權(quán)馬爾可夫鏈預(yù)測的年降雨狀態(tài)影響不大。
表4 氣象站點57251不同階數(shù)加權(quán)馬爾可夫鏈預(yù)測2018年降雨量的狀態(tài)概率結(jié)果
結(jié)合表4中的結(jié)果和式(4)~式(6),可得預(yù)測的2018年降雨量的具體值,見表5。雖然不同階數(shù)馬爾可夫鏈預(yù)測的年降雨量狀態(tài)相同,但經(jīng)模糊集理論預(yù)測出的年降雨量的值是不同的,這說明除了最大概率占主導(dǎo)地位之外,其他狀態(tài)概率對年降雨量值預(yù)測的影響也不容忽視。根據(jù)表5中的誤差統(tǒng)計結(jié)果可以看出,隨著加權(quán)馬爾可夫鏈階數(shù)的增加,預(yù)測的年降雨量的相對誤差也逐漸增大。
表5 氣象站點57251基于模糊集理論預(yù)測的2018年降水量值
對研究區(qū)內(nèi)27個氣象站點均采用上述的多階數(shù)加權(quán)馬爾可夫鏈結(jié)合模糊集理論方法進行降雨量預(yù)測。首先統(tǒng)計馬爾可夫鏈預(yù)測的2018年降雨量狀態(tài)結(jié)果,同時與2018年實測年降雨量狀態(tài)進行對比,見圖2。由圖2(a)可以看出,當采用一階加權(quán)馬爾可夫鏈(即傳統(tǒng)馬爾可夫鏈)進行預(yù)測時,部分氣象站點預(yù)測的年降雨量狀態(tài)不唯一,給最終降雨量的數(shù)值預(yù)測帶來了一定的難度。由圖2(b)可以看出,二至五階的加權(quán)馬爾可夫鏈預(yù)測的各站點年降雨量狀態(tài)結(jié)果相同且具有唯一性,能夠有效避免一階預(yù)測中出現(xiàn)的預(yù)測狀態(tài)不唯一的問題。若降雨量的預(yù)測狀態(tài)和實測狀態(tài)完全吻合,則計為1;若降雨量預(yù)測的多個狀態(tài)之一與實測狀態(tài)吻合,則計為1/預(yù)測狀態(tài)個數(shù);若降雨量預(yù)測的狀態(tài)全都不與實測狀態(tài)吻合,則計為0。統(tǒng)計27個氣象站點年降雨量狀態(tài)預(yù)測的準確程度,計算可得一階加權(quán)馬爾可夫鏈預(yù)測的準確率為38.70%,二至五階預(yù)測的準確率為48.15%。由此可得,多階馬爾可夫鏈預(yù)測年降雨量狀態(tài)的準確性要明顯高于一階,這也充分說明了多階馬爾可夫鏈能夠有效利用年降雨序列的自相關(guān)性,從而提高預(yù)測精度。
圖2 不同階數(shù)的加權(quán)馬爾可夫鏈預(yù)測2018年降雨量狀態(tài)結(jié)果
由于一階預(yù)測的降雨量狀態(tài)不唯一,無法根據(jù)模糊集理論確定具體的降雨量值。因此,只統(tǒng)計研究區(qū)27個氣象站點多階數(shù)情況下模糊集理論預(yù)測的年降雨量數(shù)值的相對誤差,箱線圖結(jié)果見圖3。由圖3可以看出,二階、三階和四階預(yù)測的相對誤差比較接近,約在-30%~40%之間;當階數(shù)為五階時,年降水量預(yù)測的相對誤差最小,除個別極大極小值之外,其余氣象站點預(yù)測的相對誤差在-10%~25%之間,根據(jù)箱線圖的上下四分位數(shù)可以看出有超過一半的氣象站點降雨量相對誤差在0~20%之間。因此,從研究區(qū)所有氣象站點綜合來看,五階加權(quán)馬爾可夫鏈能夠保證更多的氣象站點預(yù)測的降雨量結(jié)果精度較高。這說明隨著馬爾可夫階數(shù)的增加,降雨序列各種滯時狀態(tài)間的相關(guān)關(guān)系(即rk和wk)以及前面若干年份降雨量狀態(tài)對目標年份降雨量狀態(tài)的影響被充分、合理地利用,有助于提高降雨量的預(yù)測精度。然而,根據(jù)單站點57251的預(yù)測結(jié)果(見表5)來看,隨著馬爾可夫階數(shù)的增加,該站點的預(yù)測精度卻逐漸降低,這說明馬爾可夫的階數(shù)并不是影響降雨量預(yù)測精度的唯一因素。
圖3 不同階數(shù)下研究區(qū)氣象站點預(yù)測年降雨量相對誤差箱線圖
采用克里金(Kriging)方法將不同階數(shù)預(yù)測情況下27個氣象站點的年降雨量插值到研究區(qū)空間上,并與2018年站點實測降雨量的克里金插值結(jié)果進行比較,根據(jù)式(8)計算空間年降雨量相對誤差,相對誤差空間分布見圖4。由圖4可以看出,整體上年降雨量高估的區(qū)域比低估的區(qū)域普遍要大,且高估的程度也比低估的程度要大。不同階數(shù)預(yù)測的年降雨量相對誤差呈現(xiàn)出明顯的空間分布趨勢,年降雨量的預(yù)測值在研究區(qū)東部和東北部比實測值要高,而在南部和西南部比實測值要低。在年降雨量的空間表達上,二至四階預(yù)測的空間年降雨量都出現(xiàn)了較大區(qū)域的過高和過低估計,五階預(yù)測的年降雨量空間分布與實測情況之間的誤差最小。
(8)
式中:Psim為預(yù)測的降雨量,mm;Pobs為實測的降雨量,mm;e為相對誤差,%。
圖4 不同階數(shù)預(yù)測年降雨量空間差值的相對誤差
為了研究年降雨量空間預(yù)測相對誤差的影響因素,從氣象和地形兩個方面考慮,分別選擇了多年平均降雨量和高程作為影響因子。由于預(yù)測的年降雨量相對誤差有正有負,故分為負相對誤差和正相對誤差兩種情況,繪制各階數(shù)預(yù)測的年降雨量空間相對誤差與多年平均降雨量、DEM的散點關(guān)系圖,見圖5,同時統(tǒng)計空間相關(guān)系數(shù),見表6。由圖5、表6可以看出,除二階預(yù)測的正相對誤差與多年平均降雨量之間的相關(guān)性沒有通過顯著性檢驗之外,不論是各階數(shù)預(yù)測的負相對誤差還是正相對誤差,都與研究區(qū)多年平均降雨量呈現(xiàn)負相關(guān),相關(guān)系數(shù)范圍在-0.83~-0.21。多年平均降雨量的大或小表征著區(qū)域所處位置降水的豐或枯。由此可以推斷,區(qū)域自身降水的豐或枯對多階加權(quán)馬爾可夫鏈預(yù)測結(jié)果偏離實測值的影響是不一致的,表現(xiàn)為多年平均降雨量越大,負相對誤差的數(shù)值越小、越偏離0,說明過低估計的程度越大、預(yù)測精度越差,而此時正相對誤差的數(shù)值越小、越接近0,說明過高估計的程度越小、預(yù)測精度越好。綜合來看,研究區(qū)過高估計區(qū)域以及程度都比過低估計的要大,從空間整體的預(yù)測精度來說,在多年平均降雨量較大(即降水充沛)的區(qū)域進行空間降雨量的預(yù)測能夠獲得更高的預(yù)測精度。各階數(shù)的預(yù)測結(jié)果中,五階預(yù)測的年降雨量空間相對誤差與多年平均量的相關(guān)關(guān)系最強,多年平均降雨量與負相對誤差的相關(guān)系數(shù)為-0.80,與正相對誤差的相關(guān)系數(shù)為-0.83。結(jié)合圖4中得出的五階預(yù)測的空間年降雨量精度最高這一結(jié)論,多年平均降雨量相關(guān)系數(shù)高又進一步說明了多年平均降雨量對加權(quán)馬爾可夫鏈預(yù)測精度的顯著影響。相比之下,高程與預(yù)測的降雨量正、負相對誤差之間的相關(guān)關(guān)系較弱,說明高程對加權(quán)馬爾可夫鏈預(yù)測精度的影響較弱。
圖5 不同階數(shù)預(yù)測的年降雨量相對誤差與實測降雨量、高程空間散點關(guān)系
表6 不同階數(shù)預(yù)測的年降雨量相對誤差與實測降雨、高程的空間相關(guān)系數(shù)
本文采用加權(quán)馬爾可夫鏈結(jié)合模糊集理論的方法對湖北省27個氣象站的年降雨量進行預(yù)測,研究了不同階數(shù)的選擇對年降雨量預(yù)測精度的影響。研究結(jié)果表明:一階馬爾可夫鏈預(yù)測的年降雨量狀態(tài)易出現(xiàn)不唯一的情況,從而無法預(yù)測出具體的降雨數(shù)值,而多階加權(quán)馬爾可夫鏈預(yù)測的年降雨量狀態(tài)則比較穩(wěn)定且一致,年降雨量狀態(tài)預(yù)測的準確性也更高;二至四階預(yù)測的年降雨量數(shù)值的相對誤差范圍比較接近,當階數(shù)增加到五階時,能夠保證更多的氣象站點的預(yù)測結(jié)果落在更小的誤差范圍內(nèi),因此降雨量值的預(yù)測精度最高。此外,從年降雨量相對誤差的空間分布來看,不同階數(shù)情況下空間趨勢較為一致,均表現(xiàn)為研究區(qū)東部和東北部高于實測值、南部和西南部低于實測值。在年降雨量的空間表達上,五階的預(yù)測結(jié)果 與實測的年降雨量空間分布之間的誤差最小。相關(guān)分析顯示,多年平均降雨量是影響年降雨量空間預(yù)測精度的主要因素,雨量充沛的區(qū)域其降雨預(yù)測的精度更高。本文的研究結(jié)果驗證了多階加權(quán)馬爾可夫鏈結(jié)合模糊集理論方法在研究區(qū)年降雨量狀態(tài)以及數(shù)值預(yù)測的適用性,為研究區(qū)年降雨量預(yù)測提供了科學(xué)的方法。然而對于部分氣象站點預(yù)測誤差較大的情況,在未來的研究中可以通過改進降雨數(shù)據(jù)序列分級、增加降雨數(shù)據(jù)樣本和改進模型等方法,獲得更加精確的預(yù)測結(jié)果。