摘要: 空間插值對土地價(jià)格、降雨量、人口分布,等進(jìn)行估計(jì)是最常用也是最有效的方法。空間插值的理論假設(shè)是空間位置上越靠近的點(diǎn),越可能具有相似的特征值;而距離越遠(yuǎn)的點(diǎn),其特征值相似的可能性越小。Kriging插值方法以統(tǒng)計(jì)學(xué)理論為基礎(chǔ)。如果采樣點(diǎn)數(shù)據(jù)比較少的情況下,可設(shè)計(jì)出對Kriging插值的半變異函數(shù)進(jìn)行擬合的實(shí)驗(yàn)方案,并從中選出誤差最小的估計(jì)模型。
關(guān)鍵詞: 地統(tǒng)計(jì)分析; Kriging插值;誤差分析
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)09-2142-03
空間插值對土地價(jià)格、降雨量、人口分布,等進(jìn)行估計(jì)是最常用也是最有效的方法。利用Kriging插值法對。該文通過誤差分析得到精度最高的估計(jì)模型,為各種應(yīng)用選擇最優(yōu)模型。
1 Kriging空間插值模型
土地價(jià)格估計(jì)模型確定的基本流程中,最重要的是半變異函數(shù)的系數(shù)估計(jì)。而半變異函數(shù)與Kriging插值模型參數(shù)的確定具有直接的關(guān)系,為此,需要確定插值模型的具體參數(shù)以確保土地價(jià)格的空間內(nèi)插估計(jì)。
1.1 Kriging空間插值方法的特點(diǎn)
Kriging法是一種空間插值方法,也是地統(tǒng)計(jì)學(xué)的主要方法,它基于變量相關(guān)性和變異性,在有限區(qū)域內(nèi)對區(qū)域化變量的取值進(jìn)行無偏、最優(yōu)估計(jì)。它具有2個(gè)明顯優(yōu)勢:①在數(shù)據(jù)網(wǎng)格化過程中考慮了被描述對象的空間相關(guān)性質(zhì),使估計(jì)結(jié)果更科學(xué)、更接近實(shí)際情況;②給出了估計(jì)誤差,使估值精度更明了。Kriging插值法以空間統(tǒng)計(jì)學(xué)作為基礎(chǔ),可以得到內(nèi)插過程中的誤差,而且對于密度較小、分布不均勻的數(shù)據(jù),使用Kriging插值法有一定的優(yōu)勢
Kriging插值方法以統(tǒng)計(jì)學(xué)理論為基礎(chǔ),利用半變異函數(shù)計(jì)算數(shù)據(jù)點(diǎn)之間的空間關(guān)系。半變異函數(shù)以區(qū)域化變量理論為基礎(chǔ),通過對變異函數(shù)的計(jì)算以及變異曲線的分析,判斷數(shù)據(jù)的變異特征和變異類型【5】;同時(shí),半變異函數(shù)還可以得到較準(zhǔn)確的精度。
使用Kriging插值法,對于區(qū)域中某一個(gè)估計(jì)點(diǎn)
式中:[λi]為加權(quán)系數(shù)。[λi]可由公式(2)確定【3】:
1.2 模型估計(jì)數(shù)據(jù)預(yù)分析
確定出空間插值方法及半變異函數(shù)模型后,需要對半變異函數(shù)的系數(shù)進(jìn)行估計(jì),而系數(shù)的確定與數(shù)據(jù)的分布特征和統(tǒng)計(jì)學(xué)特征有著密切的關(guān)系,因此,分布特征分析、趨勢分析和相關(guān)性分析這些數(shù)據(jù)特征的分析方法便可以用于估計(jì)系數(shù)的確定。
1.2.1 分布特性分析
數(shù)據(jù)的空間分布特性對空間插值方法的選擇和估計(jì)模型的預(yù)測均有重要作用。因此需要首先了解數(shù)據(jù)的空間分布狀況。從住宅用地土地價(jià)格直方圖中可以看出土地價(jià)格分布特征類似于指數(shù)函數(shù)。另外,還可以對原始數(shù)據(jù)做正態(tài)變換,觀察插值結(jié)果的精度變化。數(shù)據(jù)變換主要方法有對數(shù)法、Box-Cox法。經(jīng)過試驗(yàn),系數(shù)為0.06的Box-Cox方法得到的變換效果更好。變換前后的分布情況如圖2。變換后圖像趨近于正太分布,有利于對數(shù)據(jù)結(jié)構(gòu)進(jìn)行進(jìn)一步分析。Box-Cox變換如公式(4)
1.2.2 趨勢性分析
如果數(shù)據(jù)的分布在空間上與某種曲面相似,則可以利用數(shù)學(xué)公式對這樣的分布進(jìn)行表達(dá)。但是有時(shí)數(shù)據(jù)表面并不是數(shù)學(xué)公式擬合后的平滑表面,會有許多的起伏。想要研究這些起伏對數(shù)學(xué)模型的影響,就需要將數(shù)據(jù)中所包含的有規(guī)律的曲面(也稱趨勢面)去除,之后再對剔除趨勢面的差值進(jìn)行分析,便可以得到數(shù)據(jù)在空間分布中的微小變化規(guī)律。本例中土地價(jià)格數(shù)據(jù)的空間分布特征是以市中心為最高點(diǎn),向周圍逐漸遞減,在三維空間中形成一個(gè)具有最大值的二次曲面,因此可以用二次多項(xiàng)式來表示這種趨勢。
1.3 模型系數(shù)估計(jì)
確定了空間插值方法后,需要得到模型的最佳參數(shù),Kriging插值法的參數(shù)主要為半變異函數(shù)的系數(shù),分別稱為塊金值、自相關(guān)閾值及基臺值。估計(jì)半變異函數(shù),首先要確定一個(gè)合適的步長大小。為了減少無關(guān)的數(shù)據(jù)在計(jì)算中可能的合并運(yùn)算而將數(shù)據(jù)點(diǎn)對分成不同的距離級,該距離級的大小就是步長,這種方法稱為步氏分組【4】。步長的確定與實(shí)際使用的數(shù)據(jù)相關(guān),因此利用不同的數(shù)據(jù)進(jìn)行價(jià)格估計(jì)前均需要確定步長大小。通過計(jì)算,實(shí)驗(yàn)數(shù)據(jù)最合適步長為900米,步長組數(shù)為12。給出步長大小后,便可以利用實(shí)驗(yàn)數(shù)據(jù)估計(jì)出半變異函數(shù)。
通過對數(shù)據(jù)進(jìn)行預(yù)分析,可以得出五種變換方案,這些方案用于對半變異函數(shù)的系數(shù)進(jìn)行估計(jì)。第一種方法利用地統(tǒng)計(jì)分析模塊的缺省值進(jìn)行估計(jì),也就是不采用數(shù)據(jù)轉(zhuǎn)換和趨勢剔除;第二種方法對數(shù)據(jù)進(jìn)行轉(zhuǎn)換,根據(jù)前文所得到的結(jié)果,使數(shù)據(jù)最接近正態(tài)分布的轉(zhuǎn)換方法為Box-Cox,參數(shù)為0.06;第三中方法使用趨勢剔除,根據(jù)前文得到的結(jié)果,采用二次多項(xiàng)式進(jìn)行剔除;第四種方法則是將二、三方法聯(lián)合起來,同時(shí)進(jìn)行數(shù)據(jù)轉(zhuǎn)換和趨勢剔除;第五種方法是將Box-Cox的參數(shù)進(jìn)行修正后再與第三種方法聯(lián)合起來。對比分析這五種方案的估計(jì)誤差,其中誤差最小的結(jié)果便是最佳模型的估計(jì)方案。五種方案的誤差結(jié)果如表1:
對于一個(gè)預(yù)測模型的精確性,其平均標(biāo)準(zhǔn)差接近于0,均方根標(biāo)準(zhǔn)差接近于1,則預(yù)測結(jié)果的精確性越高。從表1中可以看到,Box-Cox轉(zhuǎn)換方法對于平均標(biāo)準(zhǔn)差的精度有較好的提高,但均方根標(biāo)準(zhǔn)差則相差較大;二次多項(xiàng)式趨勢剔除方法較好的提高了預(yù)測模型的精度;第四種方法產(chǎn)生了較大的誤差結(jié)果分析原因是由于趨勢剔除后數(shù)據(jù)的分布方式發(fā)生了一定的變化,導(dǎo)致原來的變換形式無法使數(shù)據(jù)達(dá)到較好的正態(tài)性,因此需要對Box-Cox變換方法進(jìn)行修正。從表1中可以看出,第2種方法平均標(biāo)準(zhǔn)差最小,均方根標(biāo)準(zhǔn)差處于中等水平,考慮到平均標(biāo)準(zhǔn)差是衡量誤差大小的直接數(shù)據(jù),收到誤差傳播的影響較小,因此選擇這種方法得到的結(jié)果作為半變異函數(shù)的最佳系數(shù),選擇的變換方法為Box-Cox,系數(shù)為0.06。
1.4 模型檢驗(yàn)
對估計(jì)結(jié)果進(jìn)行對比,發(fā)現(xiàn)方法3和方法5在平均標(biāo)準(zhǔn)差和均方根標(biāo)準(zhǔn)差兩項(xiàng)精度指標(biāo)中各有優(yōu)勢,還需要對兩種方法對土地價(jià)格進(jìn)行估計(jì)的結(jié)果進(jìn)行檢驗(yàn)。利用空間插值得到的結(jié)果對原始數(shù)據(jù)的土地價(jià)格進(jìn)行估計(jì),再將估計(jì)值與原始數(shù)據(jù)進(jìn)行對比。計(jì)算估計(jì)值與實(shí)測值間的方差,計(jì)算結(jié)果為空間插值最優(yōu)估計(jì)模型的研究-7AA\image30.png由此可見方法三的估計(jì)精度更高。
根據(jù)上文的分析,最終采用第3種方法得到預(yù)測模型為最佳估計(jì)值。由這種方法得到的估計(jì)參數(shù)為:塊金值23196,偏基臺值為118690,閾值為4881.72,步長900,半變異函數(shù)模型為球狀模型。最終得到半變異函數(shù)的估計(jì)模型為:
2 結(jié)論
本文根據(jù)半變異函數(shù)的特征將數(shù)據(jù)的空間分布與統(tǒng)計(jì)學(xué)分布相結(jié)合,確立了模型估計(jì)的思路。同時(shí)利用誤差分析的方法在幾種模型估計(jì)方案中選擇出估計(jì)誤差最小的方案,從而得到了最佳估計(jì)模型。通過上文的分析,可以得到以下結(jié)論:該文采用了五種方法對半變異函數(shù)的系數(shù)進(jìn)行估計(jì)。并通過誤差檢驗(yàn)得到五種方法估計(jì)結(jié)果的精度以及數(shù)據(jù)分布情況。最終得到經(jīng)過Box-Cox變換處理后的估計(jì)結(jié)果最佳。
參考文獻(xiàn):
[1] 王霞,朱道林.基于Kriging插值方法和GIS技術(shù)的地價(jià)時(shí)空格局研究[J]. 重慶建筑大學(xué)學(xué)報(bào),2007,29(1): 101-105 .
[2] 曾懷恩,黃聲享.基于Kriging方法的空間數(shù)據(jù)插值研究[J].測繪工程.2007,16(5):5-9.
[3] 鄭光輝,黃克龍,張志宏,等. 運(yùn)用Kriging空間插值技術(shù)進(jìn)行土地級別劃分[J].南京師大學(xué)報(bào)[J].2007,30(1):112-116.
[4] 劉光孟,汪云甲,張海榮.空間分析中幾種插值方法的比較研究[J].地理信息世界[J].2011,9(3):41-45.
[5] 胡小榮.變異函數(shù)球狀模型的擬合研究[J].本溪冶金高等??茖W(xué)校學(xué)報(bào),2000,2(4):41-43.
[6] 曹庭校,秦俊華.半變異函數(shù)分析法的初步實(shí)踐[DB/OL].[2007-6-15],[2011-12-15].中國科技論文在線.