占龍飛 , 陳佳義 , 李 婕 , 趙冠男 , 胡菊芳
1. 江西省氣候中心, 江西 南昌 360096
2. 淮安市淮陰區(qū)氣象局, 江蘇 淮安 223300
3. 江西省氣象臺, 江西 南昌 360096
降水是十分重要的氣象要素,氣象站觀測的降水?dāng)?shù)據(jù)僅代表其所處位置有限范圍內(nèi)的降水狀況,受經(jīng)濟、地形、觀測技術(shù)和臺站分布等客觀條件限制,氣象臺站降水?dāng)?shù)據(jù)難以滿足科研業(yè)務(wù)需求。高空間分辨率的降水?dāng)?shù)據(jù)在氣候評估、地質(zhì)災(zāi)害預(yù)警預(yù)報、水資源管理等方面具有巨大的應(yīng)用價值。
為獲取降水量的空間分布,通常結(jié)合統(tǒng)計學(xué)和地理信息科學(xué)將已知站點的觀測數(shù)據(jù)進行空間插值。近年來,一些學(xué)者圍繞降水?dāng)?shù)據(jù)插值方法的比較展開了一系列研究。一些學(xué)者(王國泰等,2018;王天華,2018;張仁平等,2018)對比了幾種常用插值方法,選出了適合研究區(qū)域的最佳降水插值方法。降水受地形條件尤其是高程的影響較大,通常高程越高降水越大(Daly et al,2008),基于地理因子的降水插值方法受到研究者們的關(guān)注。李麗娜(2009)引入地理影響因子的多元回歸插值結(jié)果能較好地反映降水的整體分布和局部細微特征。蔣育昊等(2018)對比了不同插值方法在北京西北山區(qū)的應(yīng)用效果,結(jié)果表明PRISM(Parameter-elevation Regression on Independent Slopes Model)插值模型比其他插值方法更能精確地表達降水的空間分布。
每種降水插值方法均存在局限性,同一種插值方法在不同下墊面上的插值效果可能存在很大差別(彭彬等,2011),同一地區(qū)不同時期可能適用不同降水插值方法。江西省地處季風(fēng)區(qū),東、西、南三面環(huán)山,北部為鄱陽湖平原,中部為丘陵和河谷平原,地形復(fù)雜多樣,高程梯度大,復(fù)雜的地貌特征致使降水分布呈現(xiàn)空間不均勻、局地性強等特點。本文基于數(shù)字高程模型(DEM),對江西省的地貌特征進行柵格化處理,提取影響降水空間分布的地理要素,建立多元線性回歸插值模型和PRISM降水插值模型,并與傳統(tǒng)的插值方法進行比較,討論不同降水空間插值方法在江西省的適用性,以期為江西省氣候資源的定量分析與評價提供技術(shù)支持。
降水資料來源于江西省氣象信息中心,經(jīng)數(shù)據(jù)質(zhì)量控制,剔除相應(yīng)時段內(nèi)缺測、空白及異常率高于1%的站點,最終篩選出1981—2020年江西境內(nèi)有效的83個國家氣象觀測站逐日20—20時降水?dāng)?shù)據(jù)。83個國家氣象觀測站分布江西全境,海拔介于21.1—1 164.5 m,其中位于海拔200 m以上的有15站,100 m以下的有45站。站址長期穩(wěn)定且四周空曠平坦,保證了觀測數(shù)據(jù)的連續(xù)性和代表性。
DEM數(shù)據(jù)采用Albert投影,空間分辨率為500 m,包含經(jīng)度、緯度、海拔、坡度及坡向等地理信息。站點地理位置及江西省地形高程如圖1所示。
圖1 江西省地形高程及83個國家氣象觀測站點分布
空間插值方法的理論依據(jù)是Tobler地學(xué)定律,即根據(jù)已知的離散數(shù)據(jù)或分區(qū)數(shù)據(jù),按照特定的數(shù)學(xué)關(guān)系推求出其他未知點或未知區(qū)域的數(shù)據(jù)(馬秀霞等,2017)。實際應(yīng)用中,以傳統(tǒng)的反距離權(quán)重法(Inverse Distance Weighted,IDW)和克里金插值法最為常見(蔡迪花等,2009;王麗等,2015)。文中將以上2種傳統(tǒng)插值方法與基于DEM的多元線性回歸(Multiple Linear Regression,MLR)插值方法和PRISM插值方法進行比較,探討4種降水空間插值方法在江西省復(fù)雜地形下的適用性。
1.2.1 反距離權(quán)重法
反距離權(quán)重法是一種基于相近相似原理的插值方法,用權(quán)重表示其影響程度,距離越大,對權(quán)重賦予權(quán)值越小,影響越小。計算式(占龍飛等,2018;黃少平等,2020)為
(1)
式中,Z為區(qū)域內(nèi)未知點的值;Zi為第i個已知點的值;di為第i個已知點到該未知點的距離;k為指定的冪;n為區(qū)域內(nèi)對未知點有影響(距未知點最近的n個站點均視為“有影響”)的已知點數(shù),默認n為12。
1.2.2 普通克里金插值方法
普通克里金方法(Ordinary Kriging,OK)是較早被提出的克里金方法,是一個線性估計系統(tǒng),適用于任何滿足各向同性假設(shè)的固有平穩(wěn)隨機場。使用普通克里金插值方法時,需先計算樣本變異函數(shù),再根據(jù)樣本變異函數(shù)的類型選擇合適的變異函數(shù)理論模型進行模擬,最后根據(jù)模擬的變異函數(shù)對待估計點進行線性估計并給出估計方差作為不確定性的度量指標(biāo)(彭彬等,2011)。
1.2.3 基于DEM的多元線性回歸插值方法
研究表明,影響降水的空間分布因素主要有經(jīng)度、緯度、坡度、坡向、海拔高度等(郭憶等,2013)。通過DEM各因子(經(jīng)度X1、緯度X2、海拔高度X3、坡度X4、坡向X5)的有效組合能夠更加精確地反映降水的空間分布?;贒EM的多元線性回歸插值(MLR)模型公式(蔡迪花等,2009;王麗等,2015;占龍飛等,2018)為
PRE=aX1+bX2+cX3+dX4+eX5+ε
(2)
式中,PRE為降水量,a、b、c、d、e為回歸系數(shù),ε為殘差項。
此外,為了應(yīng)用方便,插值模型中的變量應(yīng)盡可能少。因此,文中采用氣候分析中應(yīng)用廣泛的逐步回歸法,從一個自變量開始,按自變量對因變量作用的顯著程度從大到小逐個引入回歸方程,當(dāng)先引入的變量由于后面變量的引入而變得不顯著時,則將其剔除,從而建立“最優(yōu)”多元線性回歸插值模型。
1.2.4 PRISM空間插值理論模型
PRISM最早是由美國氣象學(xué)家Daly等(1994)提出的一種基于地理空間特征和回歸統(tǒng)計方法生成氣候圖的插值模型(Daly et al,1994),該方法認為高程是影響氣象要素分布的最重要因素(Daly et al,2002)。其中山區(qū)降水氣象要素的基本規(guī)律是,隨著海拔高度增加,降水量隨之增加,當(dāng)達到某一海拔高度后,降水量達到最大,這個高度為最大降水面,隨后海拔繼續(xù)增加,降水量隨之減少(李慧晴,等,2021)。PRISM插值模型基于DEM數(shù)據(jù),結(jié)合氣象觀測數(shù)據(jù),建立加權(quán)線性回歸方程,進行空間插值計算:
Y=aX+b
(3)
式中,Y為降水量插值結(jié)果;X為DEM柵格點上的高程值;a、b為回歸方程系數(shù)。其中:
(4)
(5)
(6)
(7)
在降水量的插值回歸模型中,各觀測站點數(shù)據(jù)根據(jù)目標(biāo)柵格空間位置分別賦予一個權(quán)重,根據(jù)站點氣象觀測值與對應(yīng)的權(quán)重值計算出目標(biāo)柵格的降水量。其權(quán)重值是多種因素的綜合反映,表示為
W=f(Wd,Wz,Wc,Wl,Wf,Wp,We)
(8)
式中,Wd、Wz、Wc、Wl、Wf、Wp、We分別是距離、高程、站點聚類權(quán)重、垂直分層權(quán)重、地形趨勢面權(quán)重、離海岸線距離權(quán)重和有效地形權(quán)重??紤]到研究區(qū)域的地理特點和資料限制的因素,本研究選取空間距離和高程2個因子,因此,調(diào)整后的綜合權(quán)重計算公式如下:
(9)
(10)
(11)
式中,W表示綜合權(quán)重;W(d)和W(z)分別是空間距離函數(shù)和海拔高度權(quán)重函數(shù)。Δz是柵格與站點高程差的絕對值,Δzm、Δzx分別為最小、最大高程差,a、b分別是距離和高程權(quán)重指數(shù)。參數(shù)Fd、Fz、a和b分別設(shè)置為0.8、0.2、2和1(Daly et al,2002)。
采用“交叉驗證法”對反距離權(quán)重法、普通克里金插值法、多元線性回歸插值方法和PRISM插值法進行精度檢驗。交叉驗證的思路是,首先假定任一個氣象站點降水量未知,采用剩余站點的觀測值來插值估算,依次計算n次(n為站點數(shù)目),最后計算所有站點實際觀測值與估算值的誤差,以此來對各種插值方法的優(yōu)劣進行評估。常用于評價精度的參數(shù)是均方根誤差(RMSE)。均方根誤差反映樣本數(shù)據(jù)的估值靈敏度和極值效應(yīng),值越小表明插值精度越高(蔡迪花等,2009; 王麗等,2015; 占龍飛等,2018)。RMSE的計算式:
(12)
式中,Toi和Tei分別為第i個站點的氣溫觀測值和氣溫預(yù)測值,n為站點數(shù)。
基于地理因子對江西省月和年降水量進行多元線性回歸擬合,得到回歸插值模型(表1)。模型決定系數(shù)R2為0.320 8—0.802 5,方程p值均小于0.05,說明該模型具有較好的回歸相關(guān)性。分析表1可知,江西省月降水量和年降水量與地理因子顯著相關(guān),值得一提的是,逐步回歸方程中并未出現(xiàn)坡度(X4)和坡向(X5)項。經(jīng)進一步研究發(fā)現(xiàn),坡度與海拔高度的相關(guān)系數(shù)為0.80(α=0.01),兩自變量之間存在近似線性關(guān)系,即存在復(fù)共線性關(guān)系,且坡度(X4)因子對插值模型的方差貢獻率小于海拔高度(X3)因子,因此,坡度(X4)因子被剔除。另外,按國家氣象站建站要求,氣象站均建于平坦空曠地面上,各月及年降水量與坡向的相關(guān)系數(shù)僅為-0.07— 0.18,無法較好地反映出降水量與坡向的相關(guān)性,因此,坡向(X5)因子也被剔除。
表1 1981—2020年江西省月和年降水量回歸插值模型
通常來說,海拔高度與降水量具有一定的正相關(guān)性,但從江西省海拔高度與降水量的回歸模型來看,僅在5月、7—10月和年降水量回歸方程中出現(xiàn)了海拔高度因子(X3),其中7月和10月出現(xiàn)了負相關(guān)性,這表明江西省降水垂直分布與海拔高度不一定呈正相關(guān)性。
文中利用交叉驗證方法比較不同空間插值方法的精度(圖 2),誤差越小表明插值精度越高。分析可知,基于地理因子的MLR和PRISM插值模型精度在3—9月明顯高于其他2種傳統(tǒng)插值方法。傳統(tǒng)插值方法在冬半年的插值精度略高于MLR和PRISM,這是由于冬半年降水量少,地形對降水量的影響不明顯,使得MLR和PRISM插值方法的優(yōu)勢無法體現(xiàn)。從年降水量來看,4種插值方法的精度排序為PRISM>MLR>OK>IDW,PRISM插值精度分別比MLR、OK以及IDW分別高出12.3%、41.6%和44.7%。在降水量較大的月份(年),PRISM和MLR的優(yōu)勢體現(xiàn)地更明顯。
圖2 1981—2020年江西省月、年平均降水量的4種插值方法交叉驗證結(jié)果
為進一步研究4種插值方法在不同海拔高度的插值精度,考慮到江西省地勢起伏變化大的特點,選取江西境內(nèi)所有海拔高度大于300 m的國家氣象站(共4個),以及處于平均和最低海拔高度處各2個國家氣象站點進行交叉驗證,即依次從8個國家站中取出一個站,用剩余的82個國家氣象站對該站點處的降水進行插值,交叉驗證結(jié)果見圖3。4種插值方法在300 m以下地區(qū)插值精度較高,但由于IDW和OK未考慮海拔高度對降水的影響,使得在高海拔地區(qū)插值精度遠低于MLR和PRISM。綜合來看,PRISM插值方法精度最高。
圖3 1981—2020年江西省年平均降水量各站點預(yù)測值與觀測值
分別利用4種插值方法繪制1981—2020年江西省年平均降水量(圖4),圖4a和圖4b由Arcgis軟件插值工具繪制,空間分辨率約為1.9 km,圖4c和圖4d基于DEM像元計算而成,空間分辨率為500 m。由圖4可知,4種插值結(jié)果的降水量空間分布具有一定的相似性,贛東北、贛中東部降水較多,贛南、贛北北部相對較少。IDW和OK插值方法受站點空間分布影響極大,站點周邊易出現(xiàn)降水值較周邊區(qū)域顯著大或小的奇異斑點(“牛眼”),相較之下,IDW插值方法“牛眼”現(xiàn)象比OK明顯;MLR和PRISM插值結(jié)果在準確展現(xiàn)江西降水空間分布的基礎(chǔ)上,還能夠精細地刻畫出DEM各格點的降水空間分布特征,可以較好地反映出降水量與地形的關(guān)系,插值效果優(yōu)于傳統(tǒng)的IDW和OK插值方法。
圖4 基于IDW(a)、OK(b)、MLR(c)和PRISM(d)方法的1981—2020年江西省年平均降水量
基于1981—2020年江西省降水?dāng)?shù)據(jù),在月和年尺度上對比分析了傳統(tǒng)插值方法(IDW和OK)和基于DEM數(shù)據(jù)的空間插值方法(MLR和PRISM)在江西復(fù)雜地形條件下的插值精度和效果,得到以下結(jié)論:
1) 江西省5月、7—10月降水量與海拔高度存在顯著的相關(guān)性,其中7月和10月降水量與海拔高度呈負相關(guān),5、8、9月呈正相關(guān)。江西省月和年降水量與坡度、坡向無明顯相關(guān)性。
2) 從插值精度來看,3—9月MLR和PRISM空間插值精度明顯優(yōu)于IDW和OK,而冬半年IDW和OK的插值精度略高于MLR和PRISM;4種插值方法的年降水量插值精度排序為PRISM>MLR>OK>IDW;PRISM和MLR在高海拔地區(qū)的插值精度遠高于IDW和OK。
3) 從插值效果來看,4種插值結(jié)果的降水空間分布具有一致性,但IDW和OK方法易出現(xiàn)“牛眼”,同時無法體現(xiàn)地形對降水量的影響,總體來說,MLR和PRISM優(yōu)于IDW和OK。
文中研究結(jié)果表明,MLR和PRISM空間插值方法能更精確地把離散點的數(shù)據(jù)內(nèi)插到研究區(qū)域中,從而表現(xiàn)出氣象要素空間分布特征,其優(yōu)越性體現(xiàn)在氣象要素空間分布與地形有強相關(guān)關(guān)系的插值計算中。由于降水空間分布還受到緯度位置(氣壓帶或風(fēng)帶)、大氣環(huán)流、海陸分布、人類活動等因素綜合作用的影響,任何一種空間插值方法都無法完全表達氣象要素的分布特征。每種空間插值方法有自身的適用性,應(yīng)根據(jù)實際情況,選擇最佳的空間插值方法。本文僅討論4種插值方法在江西的插值精度和適用性,在今后工作中還應(yīng)開展相應(yīng)的機理研究。