空間數(shù)據(jù)插值算法比較分析

2016-10-09 16:05王金玲

武昌理工學(xué)院學(xué)報(bào) 2016年2期

王金玲

摘要：本文通過分析比較空間數(shù)據(jù)內(nèi)插中反距離加權(quán)法和謝別德法的基本原理，并利用SRTM數(shù)據(jù)對(duì)對(duì)算法進(jìn)行測(cè)試，結(jié)果表明，改進(jìn)謝別德法的插值效果優(yōu)于反距離加權(quán)法和原始謝別德法。

關(guān)鍵詞：反距離加權(quán)法；謝別德方法；SRTM

中圖分類號(hào)：TB22 文獻(xiàn)標(biāo)識(shí)碼：A

一、引言

空間數(shù)據(jù)是用來表示空間實(shí)體的位置、形狀、大小及其分布特征諸多方面信息的數(shù)據(jù)，它可以用來描述來自現(xiàn)實(shí)世界的目標(biāo)，它具有定位、定性、時(shí)間和空間關(guān)系等特性，在社會(huì)各行業(yè)、各部門，如城市規(guī)劃、交通、銀行、航空航天等領(lǐng)域廣泛應(yīng)用。隨著計(jì)算機(jī)技術(shù)的發(fā)展，空間數(shù)據(jù)的處理分析顯得尤為重要。通常觀測(cè)的空間數(shù)據(jù)是離散無規(guī)律的，而實(shí)際應(yīng)用中除了需要知道某個(gè)點(diǎn)的確定值之外，還需要獲取觀測(cè)數(shù)據(jù)區(qū)域或某個(gè)指定區(qū)域范圍內(nèi)均勻分布的格網(wǎng)值。因此，需要將離散觀測(cè)數(shù)據(jù)進(jìn)行內(nèi)插。空間數(shù)據(jù)內(nèi)插在海洋、氣候、石油等地球科學(xué)及相關(guān)學(xué)科廣泛使用，例如，地球科學(xué)中的DEM構(gòu)建、圖形圖像處理，地球重力場(chǎng)中位場(chǎng)數(shù)據(jù) 等都要進(jìn)行內(nèi)插。

常用的空間數(shù)據(jù)插值法很多，尤其在科學(xué)計(jì)算領(lǐng)域中的許多軟件均內(nèi)置了多種內(nèi)插算法，例如Sufer中就有12種插值算法（http：//www.goldensoftware.com）。各種方法有各自優(yōu)點(diǎn)和缺點(diǎn)，有些算法簡(jiǎn)單，如反（逆）距離加權(quán)法、謝別德法、最近鄰點(diǎn)插值法等；有些算法復(fù)雜，計(jì)算耗時(shí)，如最小曲率法、克里金插值法、多項(xiàng)式回歸法、徑向基函數(shù)法、線性插值三角網(wǎng)法等。其中，與距離倒數(shù)有關(guān)的反距離加權(quán)法和謝別德方法簡(jiǎn)單，計(jì)算省時(shí)，在一般的工程應(yīng)用中極為廣泛。

本文就反距離加權(quán)法和謝別德方法，討論這兩種基本方法的特點(diǎn)，并利用SRTM數(shù)據(jù)進(jìn)行分析比較。

二、原理方法

空間數(shù)據(jù)插值就是根據(jù)已知點(diǎn)的觀測(cè)數(shù)據(jù) 內(nèi)插計(jì)算未知點(diǎn) 的數(shù)據(jù)處理過程。實(shí)際工作中一般要獲取規(guī)則格網(wǎng)數(shù)據(jù)，因此，網(wǎng)格化就是根據(jù)一組已知點(diǎn)數(shù)據(jù) ，采用空間內(nèi)插方法生成網(wǎng)格數(shù)據(jù)的處理過程。這些空間內(nèi)插方法假設(shè)屬性值是在研究區(qū)域內(nèi)是連續(xù)或分段連續(xù)的，也就是對(duì)于所有點(diǎn) 來說，存在且是唯一的。此外，內(nèi)插模型可以是精確的，此時(shí)，要求模型精確通過觀測(cè)點(diǎn)時(shí)。不管采用何種方法，數(shù)據(jù)的多少、間隔及分布方向?qū)?nèi)插結(jié)果有影響。網(wǎng)格生成其實(shí)就是根據(jù)附近點(diǎn)進(jìn)行加權(quán)平均的過程，一般假設(shè)每個(gè)網(wǎng)格單元或交叉點(diǎn)的值最有可能與其附近點(diǎn)的值接近。模型的一般形式為

式中為第個(gè)待內(nèi)插點(diǎn)的內(nèi)插估值；為第個(gè)位置在處的已知或觀測(cè)值；為已知點(diǎn)的總個(gè)數(shù)；為與對(duì)應(yīng)的系數(shù)因子，一般滿足

反距離加權(quán)法（IDW：Inverse Distance Weight）是一個(gè)加權(quán)平均插值法，其系數(shù)為

其中，對(duì)于某個(gè)待插點(diǎn)來說，為一常數(shù)，根據(jù)式，該方法的一般形式為：

這是一種直觀的加權(quán)平均法。在IDW方法中，權(quán) 用已知點(diǎn) 到內(nèi)插點(diǎn) 的距離倒數(shù)表示，故得名反（逆）距離加權(quán)法。通?？梢员硎緸?/p>

式中為乘方因子，一般選擇為一整數(shù)，取值一般為0～5。

在利用加權(quán)函數(shù)求取待插點(diǎn)數(shù)值中，一般只有臨近點(diǎn)對(duì)未知點(diǎn)有顯著影響。同時(shí)，為了節(jié)約計(jì)算時(shí)間，也不可能對(duì)所有觀測(cè)點(diǎn)都進(jìn)行計(jì)算。因此，實(shí)際計(jì)算中只需選取未知點(diǎn)周圍部分?jǐn)?shù)據(jù)進(jìn)行內(nèi)插即可，即內(nèi)插前需要選擇合適的搜索區(qū)域，并考慮該區(qū)域的形狀與大小。其中，大小可以選擇為一個(gè)固定值，即指定一個(gè)搜索半徑；也可以根據(jù)某種適合的方式確定，例如根據(jù)計(jì)算中設(shè)定一個(gè)最少觀測(cè)點(diǎn)數(shù)，由此每個(gè)計(jì)算中動(dòng)態(tài)確定大小。搜索區(qū)域的形狀或搜索面積可以為圓形、橢圓形，或者上述這些形狀的分片組成。實(shí)際處理中，為了達(dá)到簡(jiǎn)化的目的，搜索區(qū)域形狀一般選取為圓形，由此可以考慮兩個(gè)基本準(zhǔn)則：一是距離準(zhǔn)則，即用來計(jì)算內(nèi)插點(diǎn)的觀測(cè)點(diǎn)離內(nèi)插點(diǎn)某個(gè)半徑范圍之內(nèi)；二是點(diǎn)數(shù)準(zhǔn)則，即采用點(diǎn)數(shù)為離待插點(diǎn)最近的個(gè)點(diǎn)。聯(lián)合考慮兩個(gè)準(zhǔn)則就可以避免各自的不足。假設(shè) 為搜索半徑，為所有觀點(diǎn)總數(shù)，為個(gè)數(shù)據(jù)點(diǎn)所包圍多邊形的最大面積，假設(shè)在搜索半徑范圍內(nèi)最少點(diǎn)數(shù)為，那么搜索半徑與最少點(diǎn)數(shù)之間有以下簡(jiǎn)單關(guān)系

謝別德方法是南非地質(zhì)學(xué)家Shepard最早提出的方法，該方法本質(zhì)上是一種標(biāo)準(zhǔn)的距離倒數(shù)法。其權(quán)函數(shù)為[1]

另外一種改進(jìn)Shepard方法根據(jù)最遠(yuǎn)點(diǎn)距離來定權(quán)，其中最遠(yuǎn)距離也就是指定的搜索半徑，與IDW公式相似，該方法的權(quán)函數(shù)公式為：

上述公式均為平面坐標(biāo)形式，如果在橢球坐標(biāo)系中，需要將距離按橢球坐標(biāo)計(jì)算。本文使用數(shù)據(jù)即為橢球坐標(biāo)系下的數(shù)據(jù)。

三、實(shí)例分析

為了分析IDW和Shepard方法的特性，以數(shù)字地形高程模型SRTM進(jìn)行測(cè)試。SRTM的全稱是Shuttle Radar Topography Mission，即航天飛機(jī)雷達(dá)地形測(cè)繪任務(wù)，由美國太空總署和國防部國家測(cè)繪局聯(lián)合實(shí)施觀測(cè)。SRTM數(shù)據(jù)每經(jīng)緯度方格提供一個(gè)文件，分辨率有1″和3″兩種，其中3″數(shù)據(jù)大約為地面距離90米，每個(gè)文件包含1201×1201共1442401個(gè)采樣點(diǎn)的高度數(shù)據(jù)。本文選取SRTM中N25E100.hgt文件為例，共有1439898個(gè)觀測(cè)值，缺少2503個(gè)數(shù)據(jù)，其影像如圖 1所示。該區(qū)域地形復(fù)雜，起伏大，最高4072米，最低1162米，平均高度2112.7米。除了有兩個(gè)區(qū)域（100°8′E，25°38′N）和（100°20′E，25°58′N）附近屬于高地，存在明顯的數(shù)據(jù)缺失外（白色），還有多個(gè)小區(qū)域缺少數(shù)據(jù)。由于SRTM本身是格網(wǎng)數(shù)據(jù)，為了對(duì)算法進(jìn)行驗(yàn)證，從原始數(shù)據(jù)中提取少數(shù)數(shù)據(jù)作為已知觀測(cè)值，其余數(shù)據(jù)用來進(jìn)行檢驗(yàn)。如影像

圖 2所示，圓圈表示選取的已知數(shù)據(jù)，共有360579個(gè)，其它節(jié)點(diǎn)為未知點(diǎn)（實(shí)際已知數(shù)值用來檢核），需要進(jìn)行內(nèi)插，共有1081822個(gè)。因此，這是一個(gè)以少數(shù)已知點(diǎn)內(nèi)插多數(shù)未知點(diǎn)的內(nèi)插過程，而實(shí)際工作中，一般都是以多數(shù)已知點(diǎn)來內(nèi)插少數(shù)未知點(diǎn)。

內(nèi)插處理中，選取乘方因子，數(shù)據(jù)搜索半徑為20″，分別采用基本的IDW方法、Shepard方法和改進(jìn)的Shepard方法，將圖 2中圓圈點(diǎn)作為已知數(shù)據(jù)，內(nèi)插其余節(jié)點(diǎn)的高程。將內(nèi)插結(jié)果與已知點(diǎn)聯(lián)合，可以得到如圖 3所示高程影像?？梢钥闯?，采用內(nèi)插算法，可以有效填補(bǔ)原始數(shù)據(jù)的缺損。將內(nèi)插結(jié)果與原始數(shù)據(jù)相減，可以得到表 1所示的統(tǒng)計(jì)結(jié)果。可以看出，三種基于距離倒數(shù)的方法中，改進(jìn)謝別德方法最優(yōu)，平均差異約為-0.6mm，標(biāo)準(zhǔn)差為±13.62m，而IDW方法結(jié)果最差，平均差異和標(biāo)準(zhǔn)差分別為-2.8mm和±27.07m。

將差值作地理分布直方圖（圖 4），其中左圖僅繪出差值大于60米的分布圖，右圖僅作出差值小于-60米的分布，在右圖中，為了作圖方便，將負(fù)值均轉(zhuǎn)換為正值作圖。從圖中可以看出，差值大的點(diǎn)位大部分均位于地形復(fù)雜變化大的地方。

四、結(jié)語

空間數(shù)據(jù)插值在科學(xué)計(jì)算中極為普遍，各種方法均有其優(yōu)點(diǎn)和不足，實(shí)際處理中要根據(jù)數(shù)據(jù)的物理特性及對(duì)數(shù)據(jù)的具體需要來選取最優(yōu)的算法。在對(duì)海量數(shù)據(jù)處理中，簡(jiǎn)單的基于距離倒數(shù)的方法更能節(jié)約時(shí)間，但不一定是最優(yōu)的方法。為此，基于統(tǒng)計(jì)法的kriging方法在很多領(lǐng)域應(yīng)用更加靈活，但其計(jì)算量大，計(jì)算耗時(shí)。

本文針對(duì)距離倒數(shù)法中的反距離加權(quán)法和謝別德方法，通過實(shí)例分析和比較，指出改進(jìn)謝別德方法優(yōu)于傳統(tǒng)的反距離加權(quán)法和原始的謝別德法。在地形復(fù)雜、起伏大的地區(qū)，插值精度較低，但算法簡(jiǎn)單，計(jì)算省時(shí)，適宜對(duì)海量數(shù)據(jù)進(jìn)行內(nèi)插處理。

武昌理工學(xué)院學(xué)報(bào)2016年2期

武昌理工學(xué)院學(xué)報(bào)的其它文章: 論素質(zhì)學(xué)分（二）; BIM與高校土建類應(yīng)用型人才的培養(yǎng); 美國大學(xué)教授協(xié)會(huì)對(duì)我國大學(xué)學(xué)術(shù)自由的啟示; 小議大學(xué)生讀“書”和大學(xué)教學(xué); 高職大學(xué)生核心競(jìng)爭(zhēng)力探析; 基于情感認(rèn)同的高校思想政治教育的實(shí)現(xiàn)路徑

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

空間數(shù)據(jù)插值算法比較分析