何立恒,鮑其勝,王 慶
(1.南京大學地理與海洋科學學院,江蘇南京210046;2.南京林業(yè)大學土木工程學院,江蘇南京210037;3.南京市測繪勘察研究院有限公司,江蘇南京210019)
在地理空間信息領域,為了獲得空間信息,需要實測空間數(shù)據(jù),而實測的空間數(shù)據(jù)往往是離散點的形式,或者是分區(qū)數(shù)據(jù)的形式[1],這些實測的空間數(shù)據(jù)集被稱為已知的空間樣本,實測的點則被稱為已知樣本點。即使實測空間數(shù)據(jù)達到相當?shù)拿芏?,也不足以表示復雜的地理空間形態(tài),亦即常規(guī)方法無法對地理空間中所有點進行觀測,因此需要通過空間內(nèi)插來增補表達地理空間的空間數(shù)據(jù)。
空間數(shù)據(jù)內(nèi)插是用實測的空間數(shù)據(jù)來估算(預測)未知空間數(shù)值的過程[2]。根據(jù)已知的離散點數(shù)據(jù)或已知的分區(qū)數(shù)據(jù)來估計(推算)任意點或區(qū)域數(shù)據(jù)的方法稱為空間內(nèi)插,前者稱為點內(nèi)插,后者稱為面內(nèi)插[3]。通過內(nèi)插可以生成或補充已知數(shù)據(jù)的不足,廣泛應用于等值線制作、高程模型建立、數(shù)據(jù)格網(wǎng)化和地理區(qū)域空間分析與比較研究等。
1970年,美國地理學家W.R.Tobler提出地理學第一定律,指出“任何事物都是與其他事物相關的,但是距離近的事物比距離遠的事物相關性強”,這也是一切空間內(nèi)插方法的依據(jù)[4]。空間內(nèi)插方法眾多,各方法又有其本身的諸多前提、參數(shù)、適用范圍等,但從本質(zhì)上說,內(nèi)插均遵循的是臨近點之間具有相似性這一原則[5]。就目前的研究而言,大多數(shù)的內(nèi)插是根據(jù)周圍的已知數(shù)據(jù),從這些已知數(shù)據(jù)推求一個函數(shù)關系式,使該關系式最好地逼近這些已知的空間數(shù)據(jù),并能根據(jù)該函數(shù)關系式推求出區(qū)域范圍內(nèi)其他任意點或任意分區(qū)的值[6]。通常被熟知和利用得較多的就是點內(nèi)插。
在空間點內(nèi)插時,反距離加權插值(inverse distance weighting,IDW)具有計算相對簡單、操作便利等特點,是常用的幾何內(nèi)插方法之一。該方法認為與內(nèi)插點距離最近的若干個已知樣本點對內(nèi)插點值的貢獻最大,其貢獻大小與距離成反比[1-8]。其數(shù)學理論是加權平均,即將已知樣本點各數(shù)值乘以相應的單位數(shù)(權數(shù)),然后加總求和得到總體值,再除以單位數(shù)之和。假設xi為已知樣本點,wi為已知樣本點對應的權數(shù),y為加權算術平均數(shù)(即預測值或內(nèi)插值),則加權算術平均數(shù)的計算公式為
反距離加權法中的權數(shù)wi由式(2)來確定,為
式中,PDi為內(nèi)插點與已知樣本點之間的距離;u為距離PDi的冪。
由式(1)和式(2)可得反距離加權平均數(shù)的計算公式為
反距離加權法中,需要考慮距離的冪和鄰域搜索范圍兩個影響因素[7]。Husar等[9]的研究結果表明,冪越高,內(nèi)插結果越具有平滑的效果。u即為控制參數(shù),u值越大,權重隨距離增大衰減得越快;反之,u越小,權重隨距離增大衰減得越慢,一般u取1~3[3]。同時,在給定鄰域搜索范圍后,可利用的已知樣本點就具有確定性。從內(nèi)插方法的誤差公式可明顯得出,已知數(shù)據(jù)的間距大小是影響內(nèi)插精度的最重要因素,間距越小,精度越高[10]。
假定在內(nèi)插點所用的已知樣本點中,其中只有一個點距離內(nèi)插點很近,其他很多已知樣本點距離內(nèi)插點較遠,但這些較遠的已知樣本點差不多都在同一位置(也可認為是重復點)。這種情形運用反距離加權法將導致計算的內(nèi)插值不接近距離近點值。因此,探索新的加權因子,提高地理信息空間模擬的逼真性和合理性是非常必要的。
如圖1所示,假定已知樣本點A與內(nèi)插點P的距離為1個單位,點值為2.00,另10個已知樣本點B1、B2、…、B10與內(nèi)插點 P 的距離為10個單位,點值均為20.00。B系列點是彼此很近的點或者就是重復點,為了更好地反映重復點的影響,這里取冪值u為1(以下計算均取冪值u為1),依反距離加權算法,利用式(3)計算P點的內(nèi)插點值為=11.00,此值相對靠近較遠的B系列點的值,不接近距離近點A的值。
圖1 內(nèi)插點位圖1
實際上,由于點值為20.00的點基本在空間同一位置,相當于重復點或者就是重復點,在實際內(nèi)插作業(yè)中所發(fā)揮的作用應類同于一個點,則此時內(nèi)插點P的值應為3.64,此內(nèi)插值接近較近點A點值。
探索既考慮已知樣本點與內(nèi)插點之間的距離,又考慮已知樣本點在內(nèi)插點周邊的方位分布和密度的加權因子,將解決上述問題。
在土方工程量計算的野外數(shù)據(jù)采集時,地形規(guī)則的地區(qū),采點相對稀疏,而地形變化復雜的地區(qū),點位采集相對密集。除了距離這個因素影響內(nèi)插點外,再引入夾角作為定權要素,提出反距離夾角加權算法,可以解決已知樣本點在內(nèi)插點全圓方位上分布不均及已知樣本點疏密不勻?qū)?nèi)插值的影響。
距離定權方式不變,夾角則選擇以內(nèi)插點為頂點,內(nèi)插點與所有已知樣本點所構成的最小角為其權值。圖1 中,以P 點為頂點,P 點與B1、B2、…、B10這10 個點中任意兩點所構成的夾角顯然比P點與B1、B2、…、B10中任意一點和A點所構成的夾角要小得多。引入距離和夾角作為定權因子,樣本點的權值計算公式為
式中,pαi為夾角權因子,取內(nèi)插點與已知樣本點和其余已知樣本點中的最小夾角;pDi為距離權因子,取內(nèi)插點到已知樣本點的距離。
由式(1)和式(4)得反距離夾角加權平均數(shù)計算公式為
假定的距離值及樣本點的點值不變,設P點與A點和B1~B10點所構成夾角的最小角為120°,P點與B1、B2、…、B10中任意二點構成的最小夾角為0.5°,代入式(5),可得利用反距離夾角加權法計算內(nèi)插點的點值約為2.07。
此值更接近較近點A的值,減弱甚至消除已知樣本點密度不均和在內(nèi)插點全圓方位分布不勻?qū)?nèi)插值的影響。
反距離夾角加權算法進行幾何內(nèi)插的步驟如下:
1)設計內(nèi)插規(guī)則,確定內(nèi)插點的位置。在數(shù)據(jù)內(nèi)插處理中,一般是先設計內(nèi)插規(guī)則,內(nèi)插規(guī)則確定了內(nèi)插點的位置。DEM構建、數(shù)據(jù)的格網(wǎng)化、圖像變換處理等都是先設計內(nèi)插規(guī)則。圖2即為規(guī)則格網(wǎng)DEM矢量數(shù)據(jù)內(nèi)插圖,離散點為已知樣本點,方格頂點的值需內(nèi)插得出。
圖2 規(guī)則DEM內(nèi)插格網(wǎng)點及已知樣本點值圖
2)根據(jù)內(nèi)插點的數(shù)據(jù)特征,選定與內(nèi)插點具有相同數(shù)據(jù)特征的可利用已知樣本點,圖2中所有離散點即為可利用已知樣本點。
3)在已知樣本點中選取某一內(nèi)插點的可用點集S,已知樣本點的選取可以根據(jù)距離和數(shù)量等因素來確定,選取的原則有兩個方面:一是已知樣本點的位置相對內(nèi)插點應盡可能均勻分布;二是所選取的參與計算內(nèi)插值的已知樣本點數(shù)目應該適當。一般是以內(nèi)插點為圓心,給定搜索半徑,在搜索半徑內(nèi)找已知樣本中的該內(nèi)插點的可用點集S,總數(shù)為N;若不夠點數(shù),便加大搜索半徑,直至搜索半徑上限或顯示已知樣本點不夠。若是規(guī)則內(nèi)插,搜索半徑一般為規(guī)則內(nèi)插點間距的1~2倍,N≥3。
4)在S中選取任意已知樣本點Ni,計算此內(nèi)插點與已知樣本點Ni之間的距離Di,計算此內(nèi)插點與Ni和S中其余已知樣本N-1個點的夾角,在N-1個夾角值中篩選出最小值得αi。若出現(xiàn)樣本點重合或在同一方向線上,此夾角值為零。為了充分利用所有的樣本點,避免夾角權值為零而影響Wi,可以將αi給定一微小值,如10-6。
5)重復步驟4),分別求此內(nèi)插點與點集S中其余N-1個已知樣本點間的距離D和最小夾角α。
6)利用式(5)計算內(nèi)插點的內(nèi)插值。
7)重復步驟3)—步驟6),直至所有內(nèi)插點的內(nèi)插值計算結束。
用不同的內(nèi)插方法對圖1和圖3—圖7進行內(nèi)插值計算。假設圖中都只有一個點值為2.00的已知樣本點A,并與內(nèi)插點的距離都為1;其他已知樣本點B1—B10的值均為20.00,并與內(nèi)插點的距離為10或5;樣本點值的單位可以為米或其他,各方法計算出的內(nèi)插值的單位與樣本點值的單位相同;距離和角度的單位可以是任意長度單位和角度單位。計算結果見表1。
圖3 內(nèi)插點位圖3
圖4 內(nèi)插點位圖4
圖5 內(nèi)插點位圖5
圖6 內(nèi)插點位圖6
圖7 內(nèi)插點位圖7
在內(nèi)插理論中,當內(nèi)插點正好位于已知樣本點位置時,可認為內(nèi)插特征值就是該已知樣本點值,亦即此點不需要內(nèi)插。設計實例用反距離夾角加權法進行內(nèi)插時,充分考慮到內(nèi)插點P接近已知樣本點A,這樣,可假定內(nèi)插真值接近A點值。從表1可以看出,相對于算術平均值法和反距離加權法,反距離夾角加權法內(nèi)插結果波動范圍小,也更接近假定內(nèi)插真值,而鄰近點值法的值只跟最近點值有關,無論其他樣本點怎樣變化。當已知樣本點少于3個或在全圓方位上分布均勻時,反距離夾角加權法和反距離加權法推求的值是相等的。
表1 不同內(nèi)插算法計算結果表
空間內(nèi)插是用已知樣本點的數(shù)據(jù)來估算內(nèi)插點的數(shù)值過程,把離散數(shù)據(jù)轉換成規(guī)則數(shù)據(jù)或增加內(nèi)插數(shù)據(jù)。從反距離夾角加權算法應用在地理信息空間數(shù)據(jù)內(nèi)插中可以看出,當已知樣本點只有一個時,該算法相當于最鄰近值法;當只有兩個已知樣本點,或者多于兩個已知樣本點并且點位在全圓方位上分布均勻時,夾角權相等,該算法相當于反距離加權法;多于兩個已知樣本點,但已知樣本點密度和方位分布不均,反距離夾角加權法能減弱甚至消除其影響,保證內(nèi)插值接近近點值??梢哉f,反距離夾角加權法是鄰近值法和反距離加權法的改進和提伸,提出的距離加夾角的定權方法能有效減弱甚至消除在內(nèi)插過程中所選定的已知樣本點在內(nèi)插點全圓方位上分布不均及已知樣本點疏密不勻?qū)?nèi)插值的影響。基于加權平均理論,提出的反距離夾角加權算法將廣泛應用在建立DEM及圖像處理等地理空間信息數(shù)據(jù)內(nèi)插中。
[1]李新,程國棟,盧玲.空間內(nèi)插方法比較[J].地球科學進展,2000,15(3):260-265.
[2]CHANG K T著,地理信息系統(tǒng)導論[M].陳健飛,等譯.北京:科學出版社,2003.
[3]汪學兵,柳玲,吳中福.空間內(nèi)插方法在GIS中的應用[J].重慶建筑大學學報,2004,26(1):35-39.
[4]湯國安,劉學軍,閭國年.數(shù)字高程模型及地學分析的原理與方法[M].北京:科學出版社,2005.
[5]李胤,楊武年,楊容浩,等.基于移動曲面擬合算法和加權平均算法的DEM內(nèi)插算法改進[J].測繪,2010,33(4):168-171.
[6]朱求安,張萬昌,余鈞輝.基于GIS的空間插值方法研究[J].江西師范大學學報:自然科學版,2004,28(2):183-188.
[7]秦濤,付宗堂.ArcGIS中幾種空間內(nèi)插方法的比較[J].物探化探計算技術,2007,29(1):72-75.
[8]張靖.GIS空間內(nèi)插方法與應用研究[D].呼和浩特:內(nèi)蒙古師范大學,2008.
[9]HUSAR R B,F(xiàn)ALKE SR.Uncertainty in the Spatial Interpolation of PM10 Monitoring Data in Southern California[EB/OL].[2012-09-17].http:∥capita.Wustl.edu/CAPITA/CapitaReports/CaInterp/CaINTERP.html.
[10]胡海,游漣,胡鵬,等.數(shù)字高程模型內(nèi)插方法的分析和選擇[J].武漢大學學報:信息科學版,2011,36(1):82-85.