徐謝親,祝明霞
(九江學院 旅游與地理學院,江西 九江 332005)
近年來高溫,洪澇災害等極端事件頻發(fā),為了更好地解決影響人們已久的氣候問題,不僅要掌握氣象要素的變化規(guī)律,還應能夠做到預測氣候的發(fā)展趨勢。這就需要借助實測站點提供真實可靠的觀測數(shù)據(jù),以便有關人員進行相關研究分析。但是在實際生活中,由于人力,物力等各方面的限制原因,我國氣象站點在密度上遠遠不夠,又因為地理位置的差異,空間分布也較為不均勻[1],尤其是在地形復雜多變的偏遠山區(qū)[2],有些省份即使氣象站點數(shù)量相對較多,但是仍然難以滿足全區(qū)域覆蓋的要求。為解決這一問題,需要對數(shù)量不足且分布不均的氣象站點的實測數(shù)據(jù)進行插值運算,以便得到整個研究地區(qū)的氣象數(shù)據(jù)。通過研究比較常用的空間插值算法,從中找出對江西地區(qū)的氣溫研究效果理想的空間插值方法。由于各地區(qū)的氣象站點分布情況不一,地形條件、自然環(huán)境有所差異,因此對于不同的空間插值技術,需要用不同的柵格化方法進行研究[3~6]。選取張力樣條函數(shù)法(Tension Spline)、反距離權重法(IDW)以及普通克里金法(OK)對江西省年平均氣溫進行空間插值,并進行精度驗證比較。
江西省位于中國東南部,處于24°29′~30°04′N至113°34′~118°28′E之間。主要地貌類型是山地和丘陵,平地較少,北部的地勢相對比較平坦,東西南部三面被山脈所包圍,中部丘陵高低起伏。全省氣候溫暖,四季分明,雨水充沛,亞熱帶濕潤氣候,十分適合農作物的生長。全省森林資源保護良好,森林覆蓋率位居全國前列。江西是一個重要的農業(yè)省份,降水量、氣溫等的變化對于江西地區(qū)農作物生長具有重要影響,因此研究江西地區(qū)氣溫的空間分布有著十分重要的意義。
主要數(shù)據(jù)為江西省氣象站點的歷史數(shù)據(jù),包含站點的經(jīng)度、緯度、海拔高程、年平均氣溫等,時間跨度為1981~2010年。數(shù)據(jù)來源于中國氣象數(shù)據(jù)網(wǎng)(http://data.cma.cn)。
首先將經(jīng)緯度數(shù)據(jù)在Excel表格中進行單位轉換,再匯總整理,后導入ArcGIS10.2,使用的地理坐標系為GCS_WGS_1984。剔除不連續(xù)、冗余等數(shù)據(jù),確保氣溫數(shù)據(jù)的準確性[7],最終選取研究區(qū)內83個站點以及鄰近省份49個站點的30年年平均氣溫數(shù)據(jù)參與插值運算,并且均勻選取江西境內20個氣象站點作為檢驗點,其余的112個氣象站點作為插值點。在軟件ArcGIS10.2中,加載江西省DEM,插值點和檢驗點,得到江西省內外氣象站點的空間分布圖(圖1)。
圖1 江西省及其鄰近省份氣象站點分布
2.3.1 空間插值方法
反距離權重法,簡稱IDW,其原理是相似相近[8],即已知點與插值點之間的距離越近,則已知點對插值點的影響就越大。反距離權重法容易受極值點的影響,產(chǎn)生“牛眼”現(xiàn)象,適合氣象站點數(shù)量較多且分布較為均勻的地方。
張力樣條函數(shù)法能夠根據(jù)建?,F(xiàn)象的特征調整插值的硬度,插值的結果更接近樣本點范圍,適用于溫度的研究,張力樣條函數(shù)法能夠反映出局部的特征,但是在氣象站點稀疏時插值效果不好。
普通克里金法,簡稱OK,屬于克里金法的一種,是最早被廣泛提出和進行系統(tǒng)研究的克里金法[9],亦被稱之為局部估計或是空間局部插值法,并且伴隨著當今世界各國的統(tǒng)計學技術的進步而衍生和發(fā)展出一系列的變體和改進算法。普通克里金法適用于空間自相關程度較高的數(shù)據(jù),能夠對已知的采樣點誤差做出理論上的估計。
2.3.2 插值結果驗證
為了比較上述幾種插值方法的插值效果,對江西省氣溫數(shù)據(jù)進行空間插值之后,采用實際驗證法進行精度比較。通過閱讀大量相關文獻,參考前人研究方法,選用平均絕對誤差(MAE)、平均相對誤差(MRE)和均方根誤差(RMSE)進行插值精度研究比較。由于插值點與檢驗點的比例過大或過小都將對驗證結果產(chǎn)生較大影響,導致驗證結果不夠準確,參考前人研究文獻,最終選取15%(20)的氣象站點作為檢驗點,其余的氣象站點(112)為插值點。MAE和MRE能夠定性地反映出誤差的范圍,插值結果比較直觀[10],RMSE同樣是衡量插值精準度的方法之一[11]。它們的計算公式被定義為:
(1)
(2)
(3)
式(1)~(3)中,n表示檢驗站點的數(shù)目;Oi表示實測值;Pi表示預測值。MAE、MRE、RMSE的值越小,表明擬合度越好,即插值效果越好。
運用2.2和2.3部分的方法,得到江西省近30年來年平均氣溫插值結果(圖2)。實現(xiàn)過程如下:打開軟件ArcGIS10.2,找到ArcToolbox工具箱,使用Spatial Analyst工具中的插值分析功能,選擇相應的插值方法,輸入插值點點要素,Z值字段設置為“累年平均氣溫”,得到江西省及其周邊的預測氣溫柵格圖,最后根據(jù)江西省DEM的輪廓掩膜提取出基于空間插值方法的江西省預測氣溫柵格圖。
圖2 江西省年平均氣溫插值
由圖2可知,使用這三種插值方法,得到的江西省年平均氣溫分布范圍相差并不大,說明,江西省的氣溫空間自相關程度較高,省內氣象站點的分布較為理想,能夠滿足插值研究。
使用反距離權重法(圖2a)得到的年平均氣溫的范圍為11.93~19.96 ℃。其中,贛州大部分地區(qū),如興國、于都、安遠、信豐等地年平均氣溫普遍較高,廬山和井岡山地區(qū)氣溫最低。利用反距離權重法插值得到的預測值與實測值的MAE為0.3505,MRE為1.9538,RMSE為0.4355,整體上誤差較小,IDW的插值效果較好。
使用張力樣條函數(shù)法(圖2b)得到的年平均氣溫的范圍為11.83~20.18 ℃??傮w上看,樣條函數(shù)法生成的擬合表面連續(xù)光滑,但是也容易產(chǎn)生過于理想化的偏差,導致誤差增大。由圖可知,都昌地區(qū)在插值圖中屬于18.64~20.18 ℃的溫度范圍,這與實際情況不符,根據(jù)氣象站點實測值,都昌地區(qū)的年平均氣溫為17.4 ℃。張力樣條函數(shù)法插值結果與預留站點實測值MAE為0.53,MRE為2.9704,RMSE為0.8441,整體誤差比反距離權重大,插值效果不如反距離權重法。
使用普通克里金法(圖2c)得到的年平均氣溫的范圍為12.12~20.17 ℃。普通克里金法的插值結果與氣象站點實測值的MAE為0.366,MRE為2.0394,RMSE為0.4675,插值效果介于IDW和Tension Spline之間。
反距離權重法、張力樣條函數(shù)法和普通克里金法都能夠大致地預測江西省的氣溫,反映出省內氣溫的變化趨勢。從總體上看,三種空間插值方法得到的江西省年平均氣溫在空間上具有一致性,年平均氣溫呈現(xiàn)出南高北低的趨勢,氣溫變化具有明顯的緯度地帶性,但是隨經(jīng)度的變化表現(xiàn)不明顯。其中,廬山和井岡山的氣溫居于全省最低,這與氣象站點的海拔高度有關,通常情況下海拔升高時溫度會降低,廬山氣象觀測站的海拔高度為1164.5 m,井岡山為843 m,為江西省內海拔高度最高的兩個氣象站,使得廬山和井岡山的年平均氣溫低于周圍其他地區(qū)。
基于3.1得到的不同插值方法的江西省預測氣溫柵格圖,采用GIS中的提取分析功能,提取出檢驗點的預測氣溫值。表1為20個預留檢驗氣象站點的實測值與不同空間插值方法得到的預測值的比較。
表1 預留站點實測值與插值結果對比分析 ℃
由表1不難發(fā)現(xiàn),使用反距離權重插值法,所有檢驗站點的插值結果與實測值誤差均小于1 ℃,其中,預測誤差在0.2 ℃以下的有7個氣象站點,取得了較高的預測精度,這主要是因為江西省氣象站點數(shù)量較多,分布較為均勻,使得反距離權重法能夠較為理想地表現(xiàn)氣溫要素的分布規(guī)律,減小插值誤差;使用張力樣條函數(shù)插值法,瑞昌、都昌、永新三個地區(qū)的插值結果與實測值誤差大于1 ℃,預測誤差在0.2 ℃以下的有9個氣象站點,由于張力樣條函數(shù)插值的局部地區(qū)氣溫誤差較大,甚至超過了2 ℃,增大了誤差,使得其整體誤差大于另外兩種插值方法,這主要是由于張力樣條函數(shù)法很大程度上依賴于插值數(shù)據(jù),且在邊界地區(qū)容易受到影響,加之擬合表面連續(xù)光滑,過于理想化,造成誤差偏大的結果;由于江西省地區(qū)的氣溫分布具有較好的空間自相關性,使用普通克里金法,只有永新地區(qū)的插值結果與實測值誤差大于1 ℃,預測誤差在0.2 ℃以下的有7個氣象站點,整體插值效果較好。
三種插值結果中,進賢站和鉛山站的預測誤差都較小,這說明:這三種插值方法對于上述兩個地方的插值研究都較為理想。作為檢驗點的十個觀測站的平均海拔為106.775 m,而進賢觀測站的海拔高度為34.2 m,鉛山觀測站為55.1 m,均遠小于平均海拔,海拔高度對于插值效果具有一定影響。余干地區(qū)的觀測站海拔為21.1 m,為十個觀測站中海拔最低的觀測站,但只在反距離權重法插值情況下誤差較小,從氣象站點分布情況來看,進賢站和鉛山站周圍氣象站點數(shù)量較多,余干地區(qū)氣象站雖然海拔最低,但周圍氣象站點數(shù)量不如進賢和鉛山地區(qū),導致誤差增大。
以表1的站點實測值與不同插值方法的預測值為基礎,在Excel表格中進行MAE、MRE和RMSE的計算得到不同空間插值模型的精度比較(表2)。
表2 不同空間插值模型的精度比較
從表2可以看出,不同的插值方法其預測結果存在的誤差明顯不同,張力樣條函數(shù)插值法無論是MAE還是MRE、RMSE,其對研究區(qū)的估算誤差均大于另外兩種插值方法。對于普通克里金法和反距離權重法的實際驗證結果,兩者的誤差大小比較接近,但是,基于空間距離加權的反距離權重法的預測誤差在整體上要更小,其氣溫數(shù)據(jù)分布更加平緩,在這三種插值方法之中整體精度最高,由此,反距離權重法的插值結果最符合江西省實際氣溫的分布。
江西省除北部較為平坦外,東、西、南三面環(huán)山,中部丘陵高低起伏,大部分地區(qū)海拔高度都在300 m以下,地形對氣溫的影響較弱。三種插值結果表明,江西省的年平均氣溫呈現(xiàn)出由北向南逐漸遞增的分布特征。驗證站點都昌站(58517)上張力樣條函數(shù)插值精度最低,這表明氣象站點較稀疏時對張力樣條函數(shù)影響較大;銅鼓站(57694)上反距離權重法插值精度最低,說明反距離權重法的插值精度很大程度上受已知點與插值點之間的距離所決定。由于研究區(qū)整體海拔不高,氣象站點數(shù)量較為可觀,且空間分布總體較為均勻,因此,三種插值方法誤差都不大,但反距離權重法更適宜用于江西省進行空間插值研究。
本文3.2部分對三種插值方法的插值精度進行了比較,可知在上述三種插值方法中,反距離權重法的插值效果最優(yōu),因此以反距離權重法的空間插值結果作為數(shù)據(jù)基礎,將20個預留的檢驗站點按觀測場海拔高度不同分為兩組(表3):第一組為觀測場海拔高度大于100 m的氣象站點,共10個;第二組為觀測場海拔高度不足100 m的氣象站點,同樣也是10個。分別計算第一二組的MAE、MRE和RMSE。
表3 海拔高度不同的實測氣溫與預測氣溫比較
由表3可知,MAE:第一組>第二組,分別為0.437、0.264;MRE:第一組>第二組,分別為2.4113、1.4963;RMSE:第一組>第二組,分為別0.5107、0.3443。第一組的MAE,MRE以及RMSE均大于第二組。由此可見,反距離權重法的插值效果在海拔較低的地方比較高的地方好,海拔高度在一定程度上會影響不同插值方法的插值精度,因此在選擇研究方法時也要考慮高程的因素。
(1)選取反距離權重法、張力樣條函數(shù)法以及普通克里金法,基于江西省內外30年的氣象站點實測氣溫數(shù)據(jù),對江西省年平均氣溫進行空間插值運算,以MAE、MRE和 RMSE作為插值結果精度評價的依據(jù)。結果表明,張力樣條函數(shù)插值法的誤差最大,反距離權重法和普通克里金法的誤差比較接近,都比較小,可以較好地應用于江西省氣溫的預測。
(2)綜合分析得出江西省氣溫空間插值方法的誤差排序為:IDWOK Tension Spline。因此,反距離權重法更適合于江西省的氣溫空間插值研究。
(3)反距離權重插值方法不能保證適用于其他省份的氣溫研究,對于如此之多的空間插值方法來說,不存在一種適合于所有地方的空間插值方法。在今后的氣溫研究中可以多去嘗試其他的方法,找出最適合的研究方法,為未來的氣象預報、環(huán)境研究、農業(yè)以及工業(yè)生產(chǎn)等領域提供數(shù)據(jù)支持。