王金玲
摘 要:本文通過分析比較空間數(shù)據(jù)內(nèi)插中反距離加權(quán)法和謝別德法的基本原理,并利用SRTM數(shù)據(jù)對(duì)對(duì)算法進(jìn)行測(cè)試,結(jié)果表明,改進(jìn)謝別德法的插值效果優(yōu)于反距離加權(quán)法和原始謝別德法。
關(guān)鍵詞:反距離加權(quán)法;謝別德方法;SRTM
中圖分類號(hào):TB22 文獻(xiàn)標(biāo)識(shí)碼:A
一、 引言
空間數(shù)據(jù)是用來表示空間實(shí)體的位置、形狀、大小及其分布特征諸多方面信息的數(shù)據(jù),它可以用來描述來自現(xiàn)實(shí)世界的目標(biāo),它具有定位、定性、時(shí)間和空間關(guān)系等特性,在社會(huì)各行業(yè)、各部門,如城市規(guī)劃、交通、銀行、航空航天等領(lǐng)域廣泛應(yīng)用。隨著計(jì)算機(jī)技術(shù)的發(fā)展,空間數(shù)據(jù)的處理分析顯得尤為重要。通常觀測(cè)的空間數(shù)據(jù)是離散無規(guī)律的,而實(shí)際應(yīng)用中除了需要知道某個(gè)點(diǎn)的確定值之外,還需要獲取觀測(cè)數(shù)據(jù)區(qū)域或某個(gè)指定區(qū)域范圍內(nèi)均勻分布的格網(wǎng)值。因此,需要將離散觀測(cè)數(shù)據(jù)進(jìn)行內(nèi)插。空間數(shù)據(jù)內(nèi)插在海洋、氣候、石油等地球科學(xué)及相關(guān)學(xué)科廣泛使用,例如,地球科學(xué)中的DEM構(gòu)建、圖形圖像處理,地球重力場(chǎng)中位場(chǎng)數(shù)據(jù) 等都要進(jìn)行內(nèi)插。
常用的空間數(shù)據(jù)插值法很多,尤其在科學(xué)計(jì)算領(lǐng)域中的許多軟件均內(nèi)置了多種內(nèi)插算法,例如Sufer中就有12種插值算法(http://www.goldensoftware.com)。各種方法有各自優(yōu)點(diǎn)和缺點(diǎn),有些算法簡(jiǎn)單,如反(逆)距離加權(quán)法 、謝別德法、最近鄰點(diǎn)插值法等;有些算法復(fù)雜,計(jì)算耗時(shí),如最小曲率法、克里金插值法 、多項(xiàng)式回歸法、徑向基函數(shù)法 、線性插值三角網(wǎng)法等。其中,與距離倒數(shù)有關(guān)的反距離加權(quán)法和謝別德方法簡(jiǎn)單,計(jì)算省時(shí),在一般的工程應(yīng)用中極為廣泛。
本文就反距離加權(quán)法和謝別德方法,討論這兩種基本方法的特點(diǎn),并利用SRTM數(shù)據(jù)進(jìn)行分析比較。
二、 原理方法
空間數(shù)據(jù)插值就是根據(jù)已知點(diǎn)的觀測(cè)數(shù)據(jù) 內(nèi)插計(jì)算未知點(diǎn) 的數(shù)據(jù)處理過程。實(shí)際工作中一般要獲取規(guī)則格網(wǎng)數(shù)據(jù),因此,網(wǎng)格化就是根據(jù)一組已知點(diǎn)數(shù)據(jù) ,采用空間內(nèi)插方法生成網(wǎng)格數(shù)據(jù)的處理過程。這些空間內(nèi)插方法假設(shè)屬性值 是在研究區(qū)域內(nèi)是連續(xù)或分段連續(xù)的,也就是對(duì)于所有點(diǎn) 來說, 存在且是唯一的。此外,內(nèi)插模型可以是精確的,此時(shí),要求模型精確通過觀測(cè)點(diǎn)時(shí)。不管采用何種方法,數(shù)據(jù)的多少、間隔及分布方向?qū)?nèi)插結(jié)果有影響。網(wǎng)格生成其實(shí)就是根據(jù)附近點(diǎn)進(jìn)行加權(quán)平均的過程,一般假設(shè)每個(gè)網(wǎng)格單元或交叉點(diǎn)的值最有可能與其附近點(diǎn)的值接近。模型的一般形式為
式中 為第 個(gè)待內(nèi)插點(diǎn)的內(nèi)插估值; 為第 個(gè)位置在 處的已知或觀測(cè)值; 為已知點(diǎn)的總個(gè)數(shù); 為與 對(duì)應(yīng)的系數(shù)因子,一般滿足
反距離加權(quán)法(IDW:Inverse Distance Weight)是一個(gè)加權(quán)平均插值法,其系數(shù)為
其中,對(duì)于某個(gè)待插點(diǎn)來說, 為一常數(shù),根據(jù)式,該方法的一般形式為:
這是一種直觀的加權(quán)平均法。在IDW方法中,權(quán) 用已知點(diǎn) 到內(nèi)插點(diǎn) 的距離 倒數(shù)表示,故得名反(逆)距離加權(quán)法。通??梢员硎緸?/p>
式中 為乘方因子,一般選擇為一整數(shù),取值一般為0~5。
在利用加權(quán)函數(shù)求取待插點(diǎn)數(shù)值中,一般只有臨近點(diǎn)對(duì)未知點(diǎn)有顯著影響。同時(shí),為了節(jié)約計(jì)算時(shí)間,也不可能對(duì)所有觀測(cè)點(diǎn)都進(jìn)行計(jì)算。因此,實(shí)際計(jì)算中只需選取未知點(diǎn)周圍部分?jǐn)?shù)據(jù)進(jìn)行內(nèi)插即可,即內(nèi)插前需要選擇合適的搜索區(qū)域,并考慮該區(qū)域的形狀與大小。其中,大小可以選擇為一個(gè)固定值,即指定一個(gè)搜索半徑;也可以根據(jù)某種適合的方式確定,例如根據(jù)計(jì)算中設(shè)定一個(gè)最少觀測(cè)點(diǎn)數(shù),由此每個(gè)計(jì)算中動(dòng)態(tài)確定大小。搜索區(qū)域的形狀或搜索面積可以為圓形、橢圓形,或者上述這些形狀的分片組成。實(shí)際處理中,為了達(dá)到簡(jiǎn)化的目的,搜索區(qū)域形狀一般選取為圓形,由此可以考慮兩個(gè)基本準(zhǔn)則:一是距離準(zhǔn)則,即用來計(jì)算內(nèi)插點(diǎn)的觀測(cè)點(diǎn)離內(nèi)插點(diǎn)某個(gè)半徑范圍之內(nèi);二是點(diǎn)數(shù)準(zhǔn)則,即采用點(diǎn)數(shù)為離待插點(diǎn)最近的 個(gè)點(diǎn)。聯(lián)合考慮兩個(gè)準(zhǔn)則就可以避免各自的不足。假設(shè) 為搜索半徑, 為所有觀點(diǎn)總數(shù), 為 個(gè)數(shù)據(jù)點(diǎn)所包圍多邊形的最大面積,假設(shè)在搜索半徑 范圍內(nèi)最少點(diǎn)數(shù)為 ,那么搜索半徑與最少點(diǎn)數(shù)之間有以下簡(jiǎn)單關(guān)系
謝別德方法是南非地質(zhì)學(xué)家Shepard最早提出的方法,該方法本質(zhì)上是一種標(biāo)準(zhǔn)的距離倒數(shù)法。其權(quán)函數(shù)為[1]
另外一種改進(jìn)Shepard方法根據(jù)最遠(yuǎn)點(diǎn)距離來定權(quán),其中最遠(yuǎn)距離也就是指定的搜索半徑 ,與IDW公式相似,該方法的權(quán)函數(shù)公式為:
上述公式均為平面坐標(biāo)形式,如果在橢球坐標(biāo)系中,需要將距離 按橢球坐標(biāo)計(jì)算。本文使用數(shù)據(jù)即為橢球坐標(biāo)系下的數(shù)據(jù)。
三、 實(shí)例分析
為了分析IDW和Shepard方法的特性,以數(shù)字地形高程模型SRTM進(jìn)行測(cè)試。SRTM的全稱是Shuttle Radar Topography Mission,即航天飛機(jī)雷達(dá)地形測(cè)繪任務(wù),由美國太空總署和國防部國家測(cè)繪局聯(lián)合實(shí)施觀測(cè)。SRTM數(shù)據(jù)每經(jīng)緯度方格提供一個(gè)文件,分辨率有1″和3″兩種,其中3″數(shù)據(jù)大約為地面距離90米,每個(gè)文件包含1201×1201共1442401個(gè)采樣點(diǎn)的高度數(shù)據(jù)。本文選取SRTM中N25E100.hgt文件為例,共有1439898個(gè)觀測(cè)值,缺少2503個(gè)數(shù)據(jù),其影像如圖 1所示。該區(qū)域地形復(fù)雜,起伏大,最高4072米,最低1162米,平均高度2112.7米。除了有兩個(gè)區(qū)域(100°8′E,25°38′N)和(100°20′E,25°58′N)附近屬于高地,存在明顯的數(shù)據(jù)缺失外(白色),還有多個(gè)小區(qū)域缺少數(shù)據(jù)。由于SRTM本身是格網(wǎng)數(shù)據(jù),為了對(duì)算法進(jìn)行驗(yàn)證,從原始數(shù)據(jù)中提取少數(shù)數(shù)據(jù)作為已知觀測(cè)值,其余數(shù)據(jù)用來進(jìn)行檢驗(yàn)。如影像
圖 2所示,圓圈表示選取的已知數(shù)據(jù),共有360579個(gè),其它節(jié)點(diǎn)為未知點(diǎn)(實(shí)際已知數(shù)值用來檢核),需要進(jìn)行內(nèi)插,共有1081822個(gè)。因此,這是一個(gè)以少數(shù)已知點(diǎn)內(nèi)插多數(shù)未知點(diǎn)的內(nèi)插過程,而實(shí)際工作中,一般都是以多數(shù)已知點(diǎn)來內(nèi)插少數(shù)未知點(diǎn)。
內(nèi)插處理中,選取乘方因子 ,數(shù)據(jù)搜索半徑為20″,分別采用基本的IDW方法、Shepard方法和改進(jìn)的Shepard方法,將圖 2中圓圈點(diǎn)作為已知數(shù)據(jù),內(nèi)插其余節(jié)點(diǎn)的高程。將內(nèi)插結(jié)果與已知點(diǎn)聯(lián)合,可以得到如圖 3所示高程影像??梢钥闯?,采用內(nèi)插算法,可以有效填補(bǔ)原始數(shù)據(jù)的缺損。將內(nèi)插結(jié)果與原始數(shù)據(jù)相減,可以得到表 1所示的統(tǒng)計(jì)結(jié)果。可以看出,三種基于距離倒數(shù)的方法中,改進(jìn)謝別德方法最優(yōu),平均差異約為-0.6mm,標(biāo)準(zhǔn)差為±13.62m,而IDW方法結(jié)果最差,平均差異和標(biāo)準(zhǔn)差分別為-2.8mm和±27.07m。
將差值作地理分布直方圖(圖 4),其中左圖僅繪出差值大于60米的分布圖,右圖僅作出差值小于-60米的分布,在右圖中,為了作圖方便,將負(fù)值均轉(zhuǎn)換為正值作圖。從圖中可以看出,差值大的點(diǎn)位大部分均位于地形復(fù)雜變化大的地方。
四、 結(jié)語
空間數(shù)據(jù)插值在科學(xué)計(jì)算中極為普遍,各種方法均有其優(yōu)點(diǎn)和不足,實(shí)際處理中要根據(jù)數(shù)據(jù)的物理特性及對(duì)數(shù)據(jù)的具體需要來選取最優(yōu)的算法。在對(duì)海量數(shù)據(jù)處理中,簡(jiǎn)單的基于距離倒數(shù)的方法更能節(jié)約時(shí)間,但不一定是最優(yōu)的方法。為此,基于統(tǒng)計(jì)法的kriging方法在很多領(lǐng)域應(yīng)用更加靈活,但其計(jì)算量大,計(jì)算耗時(shí)。
本文針對(duì)距離倒數(shù)法中的反距離加權(quán)法和謝別德方法,通過實(shí)例分析和比較,指出改進(jìn)謝別德方法優(yōu)于傳統(tǒng)的反距離加權(quán)法和原始的謝別德法。在地形復(fù)雜、起伏大的地區(qū),插值精度較低,但算法簡(jiǎn)單,計(jì)算省時(shí),適宜對(duì)海量數(shù)據(jù)進(jìn)行內(nèi)插處理。