楊春華 鄭莉 黃河清 雷波 楊碩 劉建輝 張明陽 段秋宴
(1.重慶市生態(tài)環(huán)境科學研究院,重慶 401147;2.重慶市第八中學,重慶 400030;3.中國科學院亞熱帶農業(yè)生態(tài)研究所,湖南 長沙 410125;4.重慶市渝北區(qū)生態(tài)環(huán)境監(jiān)測站,重慶 401120)
氣象數(shù)據(jù)廣泛應用于氣象、環(huán)境、農業(yè)、林業(yè)等諸多領域[1-4],離散氣象觀測數(shù)據(jù)的空間化是其得以應用的關鍵[5-9]。獲取空間化氣象要素,一般可利用衛(wèi)星遙感數(shù)據(jù)反演和空間插值等手段。衛(wèi)星遙感數(shù)據(jù)反演能獲取空間分辨率較高的氣象要素,但當前僅能獲取部分氣象要素,且只能獲取衛(wèi)星過境時刻的數(shù)據(jù)[10],因此通過空間插值獲取空間化氣象數(shù)據(jù)仍是當前比較主流的方法之一。氣象觀測資料作為一種空間數(shù)據(jù),蘊含著復雜的非線性動力學機制,在時空分布上具有紛雜多變的時空特征[11],因此氣象數(shù)據(jù)空間插值方法一直是研究的熱點[12-13]。
氣象要素空間插值目前已有一系列方法,主要可歸納為整體插值法、局部插值法、混合插值法(整體插值法和局部插值法綜合)3類[14-15]。一般多采用局部擬合方法,即用鄰近未知點的少數(shù)已知樣點的特征值來估算該未知點的特征值,只考慮內插區(qū)域的局部特性而不受其他區(qū)域的影響[16]。眾多插值方法中,基于地質統(tǒng)計技術的克里金法和薄盤光滑樣條函數(shù)法較為通用,這些技術建模只將空間分布作為觀測數(shù)據(jù)的函數(shù)而不需要先驗知識和物理過程,能提高插值準確度[17-20]。然而大量研究表明,不同插值方法存在各自的優(yōu)劣[21-25],氣象要素變化十分復雜,區(qū)域內不同插值方法結果會有較大區(qū)別[12],同一插值方法在不同區(qū)域也會表現(xiàn)出不同差異。因此,并不存在一種插值方法適用于所有氣象要素,應根據(jù)特定的環(huán)境區(qū)域選取適宜的插值方法及參數(shù)[26-29]。
重慶地處大巴山斷褶帶、川東褶皺帶和川湘黔隆起褶皺帶三大構造單元交匯處的山區(qū),周邊區(qū)域海拔為5—3064 m,地形起伏大,地貌類型復雜多樣。該區(qū)域地形大勢由南北向長江河谷傾斜,東北部、東部、南部為大巴山山地、巫山山地、武陵山地、大婁山余脈構成的盆周中低山區(qū),中北部為平行嶺谷區(qū),西部為川中丘陵區(qū)。區(qū)域內陡峻的山地和復雜多變的自然環(huán)境,使之成為第四紀冰川時期生物的優(yōu)良避難地,珍稀瀕危和中國特有動植物物種極為豐富,尤其渝東北和渝東南更是位于中國17個具有全球意義的生物多樣性保護關鍵區(qū)域內。大巴山、武陵山兩個生物多樣性優(yōu)先保護區(qū)和舉世聞名的三峽庫區(qū)均位于此,是長江上游重要生態(tài)屏障。特殊山地環(huán)境決定了氣象要素空間分布的顯著異質性,加之生態(tài)地位突出而獨特,因此對其開展深入研究尤為重要。
本研究在重慶及周邊山地區(qū)域3.615×105km2的空間范圍,主要考慮高程因素,采用薄盤光滑樣條函數(shù)法、反距離加權法、普通克里金和協(xié)同克里金4種常用方法,分別從年、月兩種尺度對氣溫、降水和太陽總輻射三個氣象要素進行空間插值,以期對比分析復雜地形地貌條件下空間數(shù)據(jù)最優(yōu)插值方法,為重慶山地區(qū)域生態(tài)環(huán)境動態(tài)變化研究和提升區(qū)域生態(tài)評估精度提供科學參考。
重慶區(qū)域水熱條件好、年際變化不明顯,因此選取1999年、2018年較長時間間隔氣象數(shù)據(jù),研究正常、自然年份下插值方法的適用性。兩個年份月值氣象數(shù)據(jù)來自于國家氣象信息中心和重慶市氣象局,其中氣溫和降水要素1999年有163個國家氣象站點(圖1),2018年區(qū)域站點加密后共285個站點。太陽總輻射要素來源于國家氣象信息中心“中國國家地面站太陽總輻射估算值數(shù)據(jù)集(V1.0)”,1999年和2018年站點數(shù)分別為162個、165個。利用月值數(shù)據(jù)獲取年均溫、年降水量、年太陽總輻射,運用ANUSPLIN軟件先將氣象數(shù)據(jù)通過SPSS軟件處理成標準ASCII格式。高程數(shù)據(jù)來源于CGIAR-CSI SRTM中國區(qū)域數(shù)據(jù)(http://srtm.csi.cgiar.org/),首先在GIS軟件中對其進行拼接、裁剪,然后將其重采樣為250 m,投影轉換為UTMZONE48,最后將其轉成ASCII格式作為協(xié)變量參與插值。
圖1 研究區(qū)高程及1999年氣象站點分布Fig.1 Elevation and distribution ofmeteorological stations w ithin the studied region
1.2.1ANUSPLIN(ANUS)
澳大利亞科學家Hutchinson基于薄盤樣條理論編寫了針對氣候數(shù)據(jù)曲面擬合的專用軟件ANUSPLIN[30-31],它允許引進多元協(xié)變量線性子模型,自動確定模型系數(shù),可平穩(wěn)處理二維以上的樣條,可引入多個影響因子作為協(xié)變量[32]。其理論模型公式為
式(1)中,Zi為空間i處待插值點氣象要素值;xi為d維樣條的獨立變量,是位置i處周邊已知站點氣象要素值;f為關于xi的未知光滑函數(shù);yi為獨立協(xié)變量(本研究為高程);b為獨立協(xié)變量系數(shù);ei為隨機誤差。
光滑函數(shù)f和系數(shù)b利用控制點求得,將Zi設置在控制點上,根據(jù)周邊其他已知控制點插值該點,通過最小二乘來確定
式(2)中,Jm(f)是函數(shù)f(xi)的粗糙度測度函數(shù),定義為函數(shù)f的m階偏導(Anus稱樣條次數(shù));ρ是正的光滑參數(shù),在數(shù)據(jù)保真度與曲面粗糙度之間起平衡作用,通常由廣義交叉驗證GCV(Generalized cross validation)最小化來確定,也可用最大似然法GML(Generalised max likelood)或期望真實平方誤差MSE(expected true square error)最小化確定[31,33]。
本方法各氣象要素均以DEM作為協(xié)變量,根據(jù)GCV最小和Signal小于觀測站點一半的原則選取最優(yōu)模型。通過對樣條次數(shù)從2—6分別嘗試,樣條次數(shù)取3時,GCV最小,因此本研究樣條次數(shù)取3??紤]到降水隨機性強且值域范圍大的特點,對原始數(shù)據(jù)進行平方根變換降低數(shù)據(jù)值域范圍[33],太陽總輻射也參照降水進行平方根變換。
1.2.2反距離加權(Inverse DistanceWeighted,IDW)
IDW由Shepard最早提出并發(fā)展起來[34],其估計值由研究區(qū)內樣本點實測值加權決定,而權重由距離決定,樣本點離待插點越近影響越大,反之越小。公式為[15]
式(3)中,Z(x0)為x0處預測值;z(xi)為xi處觀測值;n為預測中使用的周圍站點數(shù);di0為預測點x0與各已知樣點xi間距離;p為距離的冪次數(shù)。
IDW插值中距離的冪次數(shù)和搜索范圍一般均取默認值2和12,同時為便于與其他研究成果比較[15],本研究取默認值。
1.2.3普通克里金(Ordinary Kriging,OK)
OK是利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結構特點,對未知樣點進行線性無偏、最優(yōu)估計的一種方法[35]。計算公式為
式(4)中,Z(x0)為未知點預測值;Z(xi)為未知點周圍氣象站點觀測值;ω為第i個已知站點對未知點的權重;N為已知氣象站點數(shù)量。
賦權重時OK不僅考慮距離,而且通過變異函數(shù)和結構分析,考慮已知樣本點的空間分布及與未知樣本點的空間方位關系[36]。ArcGIS軟件中OK半變異函數(shù)取默認值球面模型,搜索半徑取可變方式下的默認值12,為便于比較,本研究跟大多數(shù)研究一樣取此默認值。
1.2.4協(xié)同克里金(Co-Kriging,CK)
CK基本原理同OK,但它把區(qū)域化變量的最佳估值方法從單一屬性發(fā)展到二個以上的協(xié)同區(qū)域化屬性。溫度、降水等要素經(jīng)常受海拔影響,本研究將海拔作為第二屬性引入。公式表示為[15]
式(5)中,Z(x0)為x0點預測值;Z(xi)為第i站點測量值;y(x0)為x0點高程;N為已知氣象站點個數(shù);mY、mZ為高程和氣象數(shù)據(jù)的全局平均值;ω、σ為協(xié)同克里金插值權重系數(shù)。
為便于與OK比較,選擇默認球面模型作為變異函數(shù)理論模型,搜索范圍同樣取默認值12,即預測點鄰近的12個站點。
采用交叉驗證方法對預測結果進行對比分析,將原始樣本數(shù)據(jù)集分為兩部分:一部分作為“訓練集”,另一部分作為“驗證集”[13]。用訓練集樣本進行全范圍插值,將插值結果與“驗證集”站點(不參與插值)觀測數(shù)據(jù)對比。插值站點數(shù)量越多,插值結果精度越高[37],因此本研究將總樣本數(shù)的90%用于“訓練”,10%用于“驗證”。驗證站點設置以空間分布均勻性為主,同時考慮海拔(圖1)。使用平均絕對誤差(Mean Absolute Error,MAE)、平均相對誤差(Magnitude of Relative Error,MRE)和均方根誤差(Root Mean Square Error,RMSE)作為插值結果檢驗標準。MAE估算估計值可能的誤差范圍,MRE反映估計誤差相對于觀測數(shù)據(jù)的大小,RMSE反映利用樣點(氣象臺站)數(shù)據(jù)的估值靈敏度和極值效應[38]。表達式分別為
式(6)—式(7)中,Zio為第i站點觀測值;Zie為第i站點估計值;n為“驗證集”點位數(shù)。
研究區(qū)1999年平均氣溫四種方法插值結果見圖2。從目視效果看,四種插值結果在空間分布上大體一致,總體均呈現(xiàn)出氣溫在北部及中部、西南角落低,其余高的趨勢。ANUS因有高程作為協(xié)變量,結果與DEM表現(xiàn)出較高一致性,可反映復雜地形下溫度的空間差異;CK也考慮了DEM,但“組團”現(xiàn)象明顯且結果不如ANUS細膩;OK未考慮其他因子,結果表現(xiàn)出“魚鱗”斑塊狀,因OK利用周圍已知點,結合半方差分析建立統(tǒng)計模型,在站點少且氣象要素空間異質性大的區(qū)域容易產生這種現(xiàn)象;IDW明顯出現(xiàn)因高溫或低溫形成的“牛眼”現(xiàn)象。2018年空間分布規(guī)律(圖略)與1999年總體一致,但因站點數(shù)量更多,空間異質性增大,“牛眼”現(xiàn)象更明顯。
年尺度上,1999年和2018年年均氣溫MAE、MRE、RMSE均以ANUS最優(yōu)(表1)。月尺度上ANUS優(yōu)勢同樣明顯,MAE(℃)月均值1999年為ANUS(0.37)<IDW(0.55)<CK(0.58)<OK(0.61),2018年為ANUS(0.43)<IDW(0.74)<CK(0.80)<OK(0.87);MRE(%)月均值1999年為ANUS(2.79)<IDW(3.92)<CK(4.07)<OK(4.23),2018年為ANUS(3.20)<IDW(5.83)<CK(6.32)<OK(6.69);RMSE(℃)月均值1999年為ANUS(0.45)<IDW(0.93)<CK(0.95)<OK(0.97),2018年為ANUS(0.52)<IDW(0.97)<CK(1.05)<OK(1.08)。各月MAE、MRE、RMSE均以ANUS最小,其他為IDW<CK<OK但差別不大(表略)。不同時間尺度以及年內不同月份間觀測值均差異較大,MAE和RMSE缺乏可比性,因此用MRE比較不同尺度插值效果(降雨和太陽總輻射,下同)。兩年中最高氣溫均出現(xiàn)在5—9月,此時MRE全年最?。∕AE和RMSE處于最大),表明低氣溫月份插值結果誤差更大。四種方法1999年MRE月均值為3%—4%,平均3.75%,年尺度MRE在3%左右,平均3.03%;2018年MRE月均值為3%—7%,平均5.51%,年尺度MRE為2%—5%,平均3.68%。四種方法均表現(xiàn)出插值精度年尺度優(yōu)于月尺度,因此,本研究區(qū)時間尺度越小插值誤差越大。
綜上,研究區(qū)氣溫最優(yōu)插值方法為ANUS。通過ANUS,氣溫1999年的月、年尺度平均MRE分別為2.79%、1.86%,2018年分別為3.20%、2.03%。
圖2 1999年研究區(qū)年均氣溫ANUS(a)、CK(b)、OK(c)和IDW(d)插值結果Fig.2 Interpolation results of annual average air temperature based on methods of ANUS(a),CK(b),OK(c),and IDW(d)in the studied area in 1999
表1 研究區(qū)年均氣溫不同插值方法對比Table 1 Comparison of different interpolation methods for annual average air tem perature in the studied area
從目視效果看,研究區(qū)降水量1999年四種插值結果在空間分布上大體一致,都呈現(xiàn)出降水量北部區(qū)域低、其余尤其是東南緣高的分布趨勢(圖3)。因降水值域范圍跨度大,顯示效果上OK“魚鱗”效應和IDW“牛眼”現(xiàn)象均有所減弱。2018年降水量空間分布規(guī)律(圖略)與1999年基本一致,但站點數(shù)量更多,異質性增大,“魚鱗”和“牛眼”現(xiàn)象更明顯。
年尺度上1999和2018年降水量MAE、MRE、RMSE均以IDW最優(yōu),考慮了DEM的ANUS和CK并未顯示出優(yōu)越性(表2)。
月尺度上,四種方法MRE、MAE、RMSE變化規(guī)律與年尺度不盡相同(圖4)。
四種方法MAE(mm)月均值1999年為IDW(16.96)<CK(17.46)<ANUS(18.04)<OK(18.26),2018年為IDW(19.88)<CK(20.80)<ANUS(21.63)=OK(21.63);MRE(%)1999年為CK(16.78)<ANUS(17.24)<IDW(17.42)<OK(18.87),2018年為IDW(23.14)<CK(23.82)<ANUS(24.00)<OK(24.74);RMSE(mm)1999年為IDW(20.76)<CK(21.80)<ANUS(22.36)≈OK(22.38),2018年為IDW(26.41)<CK(27.52)<OK(28.78)<ANUS(29.83)。圖4直觀反映出IDW各月MAE、MRE、RMSE整體最低,總體效果最好。
圖3 1999年研究區(qū)累積降水ANUS(a)、CK(b)、OK(c)和IDW(d)插值結果Fig.3 Interpolation results of cumulative precipitation based on methods of ANUS(a),CK(b),OK(c),and IDW(d)in the studied area in 1999
表2 研究區(qū)年均累積降水量不同插值方法對比Table 2 Com parison of different interpolation methods for annualmean cumulative precipitation in the studied area
圖4 1999年逐月降水MAE(a)、MRE(b)、RSME(c)和2018年逐月降水MAE(d)、MRE(e)、RSME(f)各月累積降水不同插值方法對比Fig.4 Com parison of MAE(a),MRE(b),and RSME(c)ofmonthly cumulative precipitation using different interpolation methods in 1999 and in 2018(d-f)
四種方法各種誤差在不同月份變化趨勢基本一致,兩年中4—9月降水量多時,MRE總體高于其他月份(MAE、RMSE更明顯),表明多降水月份插值結果誤差更大。1999年四種方法的MRE月均值為17%左右,平均17.58%,年尺度MRE為7.00%左右,平均7.41%;2018年MRE月均值為23%左右,平均23.93%,年尺度MRE在12%左右,平均11.75%(圖4)。以上表明,四種方法均表現(xiàn)出降水插值精度年尺度優(yōu)于月尺度,時間尺度越小誤差越大。
綜上,研究區(qū)降水最優(yōu)插值方法為IDW。通過IDW,1999年降水的月、年尺度平均MRE分別為17.42%、6.87%,2018年分別為23.14%、11.20%。
圖5 1999年研究區(qū)太陽總輻射ANUS(a)、CK(b)、OK(c)和IDW(d)插值結果Fig.5 Interpolation results of total solar radiation based on methods of ANUS(a),CK(b),OK(c),and IDW(d)in the studied area in 1999
從目視效果看,研究區(qū)1999年四種插值結果空間分布上總體一致,太陽總輻射均呈西南及中部區(qū)域低,其余為東北緣高的分布趨勢(圖5)。太陽總輻射值域跨度較大,OK“魚鱗”效應和IDW“牛眼”現(xiàn)象均有所減弱。2018年空間分布規(guī)律(圖略)與1999年基本一致,站點數(shù)量一致使得“魚鱗”和“牛眼”現(xiàn)象也基本一致。
表3 研究區(qū)年均太陽總輻射不同插值方法對比Table 3 Com parison of different interpolation methods for annualmean total solar radiation in the studied area
年尺度下,兩個年份太陽總輻射誤差變化更加復雜,1999年3種誤差以IDW全面占優(yōu),2018年以ANUS占優(yōu)為主(表3)。月尺度上,四種方法MAE、MRE、RMSE變化規(guī)律與年尺度基本一致。MAE(MJ)月 均 值1999年 為IDW(16.28)<OK(16.49)≈CK(16.54)<ANUS(17.05),2018年為ANUS(14.85)<CK(16.08)<IDW(16.34)<OK(16.51);MRE(%)月均值1999年為IDW(5.45)<ANUS(5.82)<OK(5.63)≈CK(5.65),2018年為ANUS(4.88)<CK(5.27)≈IDW(5.29)≈OK(5.34);RMSE(MJ)月均值1999年為IDW(20.77)<CK(21.02)≈OK(21.05)<ANUS(21.45),2018年為ANUS(18.44)<CK(19.42)<IDW(19.87)<OK(20.13)。
不同月份四種方法的各種誤差波動趨勢基本一致(圖6)。1999年6—9月和2018年5—8月太陽總輻射較高,其MRE總體上位于全年最低(MAE、RMSE全年最大),全年太陽總輻射最低時(1月、2月、11月、12月)MRE最大,表明太陽總輻射值小的月份插值結果誤差更大。四種方法1999年太陽總輻射MRE月均值為5%—6%,平均5.64%;年尺度MRE為4%—5%,平均4.60%。2018年MRE月均值5%左右,平均5.19%;年尺度MRE為3%—4%,平均3.38%。四種方法插值精度均表現(xiàn)為年尺度優(yōu)于月尺度,表明研究區(qū)時間尺度越小結果誤差越大。
研究區(qū)2018年太陽總輻射最優(yōu)插值方法的年、月尺度基本均為ANUS,1999年雖為IDW,但值得注意的是四種方法差異極小。1999年月均值變化幅度MAE僅0.76 MJ、MRE僅0.37%、RMSE僅0.69 MJ(圖6),因此從誤差角度四種方法均可采用。但利用ANUS還可提供空間分布標準差、協(xié)變量誤差等一系列參數(shù)輔助判斷空間插值可靠性[10],更重要的是它能同時對多個表面進行插值,尤其適合時間序列的氣象數(shù)據(jù)[32],因此ANUS逐步成為空間插值的主要工具之一,越來越多地應用于山區(qū)[39]。
綜上,本研究太陽總輻射最優(yōu)插值模型采用ANUS方法。通過ANUS,太陽總輻射1999年的月、年尺度平均MRE分別為5.82%、4.60%,2018年分別為4.88%、3.03%。
圖6 1999年研究區(qū)太陽總輻射MAE(a)、RMSE(b)、MRE(c)和2018年太陽總輻射MAE(d)、RSME(e)、MRE(f)不同插值方法對比Fig.6 Comparison of MAE(a),MRE(b),and RSME(c)ofmonthly total solar radiation using different interpolation methods in 1999 and in 2018(d-f)
(1)1999年和2018年重慶山地區(qū)域三個要素插值誤差氣溫較小,太陽總輻射其次,降水量較大。三個要素插值精度均為年尺度優(yōu)于月尺度,但月尺度上氣溫和太陽總輻射精度在高值月份優(yōu)于低值月份,降水相反。氣溫和太陽總輻射最優(yōu)插值方法均為ANUS。該方法下氣溫1999年和2018年月均MRE分別為2.79%、3.2%,年尺度MRE分別為1.86%、2.03%;太陽總輻射1999年和2018年月均MRE分別為5.82%、4.88%,年尺度MRE分別為4.6%、3.03%。降水最優(yōu)插值方法為IDW,該方法下1999年和2018年月均MRE分別為17.42%、23.14%,年尺度MRE分別為6.87%、11.20%。
(2)由于氣象因素較復雜,插值精度多受插值范圍和插值方法的影響,插值方法的影響較為常見。任璇等[12]在新疆用90個站點7月平均降水量為指標進行插值時,發(fā)現(xiàn)ANUS精度比CK提高了46.78%,比IDW提高了56.77%;插值范圍即采用比研究區(qū)更大范圍內的氣象觀測數(shù)據(jù)通??商嵘?。譚劍波等[10]通過ANUS利用2010年96個氣象站點對青藏高原東南緣1.1646×106km2范圍插值時年降水和年均溫MRE分別為18%、4%,本研究區(qū)與青藏高原東南緣地理、氣象條件相似,主要差別是比譚劍波等[10]研究的外延范圍更大,利用1999年163個氣象站點在3.615×105km2范圍插值時,年降水和年均溫MRE分別達7.67%、1.86%,精度提升明顯。可見,引入比研究區(qū)更大范圍的氣象觀測數(shù)據(jù)是一種提升插值精度的有效方法。
(3)本研究氣溫和太陽總輻射的最優(yōu)插值方法為ANUS,降水為IDW。究其原因,氣溫影響因素較多,以海拔和地形影響最顯著[40],太陽總輻射在山區(qū)受地形起伏的影響顯著,占比可達20%—30%[41]。ANUS對氣溫和太陽總輻射插值時均將DEM作為協(xié)變量,加之自身特殊的模擬算法,因而插值結果表現(xiàn)最優(yōu)。降水空間異質性更明顯,不確定性更大[42],一方面,降水隨機性較大,不同方法插值結果均不盡理想[33];另一方面,降水與海拔關系復雜且不穩(wěn)定,部分區(qū)域兩者存在一定相關性[43],部分區(qū)域卻無明顯關系[44]。本研究ANUS和CK均引入DEM,但結果精度并無優(yōu)勢,表明本區(qū)域海拔因素對降水相關性不強,因此不考慮地形因素的IDW,結果反而表現(xiàn)更優(yōu)。
(4)2018年較1999年多用了108個重慶區(qū)域站加密,結果表明加密后站點密度效應對氣溫和降水的響應程度差異較大。氣溫對密度效應響應微弱,年尺度上呈微弱正效應,MRE僅增加0.3%,月尺度上呈微弱負效應,月均MRE僅降低了0.2%。降水對密度效應的響應相對明顯且均為負效應,年、月尺度MRE降幅分別達3.12%、4.68%。這與鄭小波等[45]在西南山地研究結果一致,即用于插值的臺站相對過多時,不一定會提高降水插值精度,這與復雜山地降水場空間分布的連續(xù)性較差有關;彭紅蘭等[46]在三江源地區(qū)的研究也表明,對數(shù)據(jù)來源不一致的站點,數(shù)據(jù)質量控制不好會大大降低插值精度。重慶共有區(qū)域站2000余個,本次研究僅從監(jiān)測數(shù)據(jù)是否異常、缺測等數(shù)據(jù)“可用性”方面選用了108個區(qū)域站,未從空間位置、海拔、坡向等對降水影響較大的因素綜合選取,加之降水事件自身隨機性大,引入重慶區(qū)域站可能導致精度下降。因此充分考慮數(shù)據(jù)自身質量,如何從影響降水的多個因素綜合選取區(qū)域站是其今后能否得到充分利用的關鍵。