苗則朗,馮永興,張書(shū)畢,張秋昭
(1.中國(guó)礦業(yè)大學(xué)環(huán)境與測(cè)繪學(xué)院,江蘇徐州 221008;2.江蘇省資源環(huán)境信息工程重點(diǎn)實(shí)驗(yàn)室,江蘇徐州 221008)
隨機(jī)線元落入緩沖區(qū)內(nèi)的概率分布函數(shù)研究
苗則朗1,2,馮永興1,張書(shū)畢1,張秋昭1
(1.中國(guó)礦業(yè)大學(xué)環(huán)境與測(cè)繪學(xué)院,江蘇徐州 221008;2.江蘇省資源環(huán)境信息工程重點(diǎn)實(shí)驗(yàn)室,江蘇徐州 221008)
通過(guò)仿真計(jì)算出隨機(jī)線元落入其“真實(shí)值”緩沖區(qū)內(nèi)的比例,并采用柯氏檢驗(yàn)法對(duì)其進(jìn)行分布擬合檢驗(yàn),得出隨機(jī)線元落入緩沖區(qū)內(nèi)的比例服從正態(tài)分布的結(jié)論,從而完善線元誤差不確定帶模型。
隨機(jī)線元;緩沖區(qū);正態(tài)分布;柯氏檢驗(yàn)法
線狀地形物的特征一般包括長(zhǎng)度和曲率,通常線狀地形物的真實(shí)位置不容易獲得或者獲得的方式比較困難[1],因此不容易對(duì)線元整體精度作出評(píng)價(jià)。有關(guān)線狀地形物精度評(píng)價(jià)目前已有多種模型。Perkal于 1956年首先提出了應(yīng)用 Epsilon帶模型來(lái)建立線元不確定性模型[2],圍繞“真實(shí)”的位置建立寬度相等的緩沖區(qū),比較測(cè)量值與“真值”之間的關(guān)系;Blakemore定義了點(diǎn)與線段的緩沖區(qū)之間的五種位置關(guān)系:絕對(duì)在、有可能在、模棱兩可、可能不在、絕對(duì)不在[3];Skidmore和 Turner通過(guò)查找測(cè)量與參考線元之間的數(shù)目估計(jì)線元的精度[4];Goodchild和Hunter利用隨機(jī)線元落入緩沖區(qū)內(nèi)的比例評(píng)價(jià)隨機(jī)線元的精度[5];Tveite、Langass和張永彬等通過(guò)緩沖區(qū)疊置分析,評(píng)價(jià)測(cè)量數(shù)據(jù)精度[6-7]。但以上方法均假設(shè)參考線元與測(cè)量線元之間不存在偏移,僅考慮方差的影響。為克服以上方法的不足,Joon Heo等在考慮偏移、方差的綜合影響下,提出了非線性最小二乘方法[1],并將該方法應(yīng)用于海岸線退化研究[8]。
以上模型與方法,均直接假設(shè)隨機(jī)線元落入緩沖區(qū)內(nèi)的比例服從高斯正態(tài)分布,但沒(méi)有給出具體的原因或者推導(dǎo)過(guò)程,體系稍欠完善。本文基于計(jì)算機(jī)仿真和分布擬合檢驗(yàn)的方法,采用柯?tīng)柲炅_夫(KolmogorovA N)檢驗(yàn)法對(duì)假設(shè)的正態(tài)分布進(jìn)行分布擬合檢驗(yàn),給出了隨機(jī)線元落入緩沖區(qū)內(nèi)的比例服從高斯正態(tài)分布的結(jié)論及證明過(guò)程。
在數(shù)學(xué)中,誤差函數(shù) erf(x)(也稱為高斯誤差函數(shù))是一個(gè)特殊的函數(shù) (非初等函數(shù)),在概率、統(tǒng)計(jì)、材料科學(xué)和偏微分方程等領(lǐng)域廣泛應(yīng)用。erf(x)定義為
誤差函數(shù)與標(biāo)準(zhǔn)正態(tài)分布累積函數(shù) (記為Φ)基本相同,可以通過(guò)比例和旋轉(zhuǎn)運(yùn)算等同。即
柯氏檢驗(yàn)法由前蘇聯(lián)數(shù)學(xué)家柯?tīng)柲炅_夫首先提出,對(duì)于連續(xù)型的隨機(jī)變量,柯氏檢驗(yàn)法較χ2檢驗(yàn)法更好。設(shè) X的分布函數(shù) F(x)是未知的;X1,…,Xn是樣本;F0(x)是給定的某個(gè)分布函數(shù);作如下假設(shè)
首先從樣本出發(fā)求出經(jīng)驗(yàn)分布函數(shù) Fn(x),計(jì)算分歧度
取否定域?yàn)?/p>
當(dāng)計(jì)算出分歧度 Dn的值小于臨界值λ時(shí),則接受 H0。臨界值λ的取值可以由柯?tīng)柲炅_夫檢驗(yàn)臨界值表查知[9]。
1.模擬步驟
隨機(jī)線元及其使用“真實(shí)值”建立的緩沖區(qū)示意圖如圖 1所示,隨機(jī)線元的分布受偏移和方差的影響,文獻(xiàn)[1]論述了偏移和方差對(duì)隨機(jī)線元分布的影響。綜合考慮偏移和方差的影響,得出計(jì)算機(jī)仿真的步驟如下:
1)生成隨機(jī)線元。模擬的點(diǎn)分別為 Z1、Z2,并假設(shè) Z1、Z2相互獨(dú)立。其分布依次為
利用Matlab生成上述兩組隨機(jī)點(diǎn),連接兩個(gè)隨機(jī)點(diǎn),即得到該線段一組隨機(jī)線元。
2)圍繞“真實(shí)”線段建立緩沖區(qū)。
3)計(jì)算隨機(jī)線元落入緩沖區(qū)內(nèi)的比例
4)采用蒙特卡羅方法重復(fù)以上三個(gè)步驟10 000次,將平均值作為該緩沖區(qū)帶寬下隨機(jī)線元落入帶寬為緩沖區(qū)內(nèi)的比例。
5)以一定的步長(zhǎng)(如 0.5 m)增加緩沖區(qū)帶寬,重復(fù)以上四個(gè)步驟,得到一系列不同緩沖區(qū)帶寬下隨機(jī)線元落入緩沖區(qū)內(nèi)的比例。
圖1 隨機(jī)線元落入緩沖區(qū)示意圖
2.模擬結(jié)果
隨機(jī)線元落入緩沖區(qū)內(nèi)的長(zhǎng)度與隨機(jī)線元長(zhǎng)度的比值如表 1所示;隨機(jī)線元落入緩沖區(qū)內(nèi)的比例曲線圖如圖2所示。
表 1 隨機(jī)線元落入緩沖區(qū)內(nèi)的比例
從圖 2中可以發(fā)現(xiàn)隨機(jī)線元落入緩沖區(qū)內(nèi)的比例曲線圖與誤差函數(shù) erf(x)曲線圖很接近,為了驗(yàn)證,采用柯氏檢驗(yàn)法進(jìn)行假設(shè)檢驗(yàn)。
圖 2 隨機(jī)線元落入緩沖區(qū)內(nèi)的比例
3.分布擬合檢驗(yàn)
采用柯氏檢驗(yàn)法進(jìn)行假設(shè)檢驗(yàn)。從圖 2可以看出,該曲線的形態(tài)與正態(tài)分布的誤差函數(shù)曲線相似,因此作如下假設(shè)
參數(shù)μ、σ的最大似然估計(jì)值
計(jì)算分歧度Dn
計(jì)算臨界值λ
可知
故認(rèn)為 H0成立。因此,隨機(jī)線元落入“真實(shí)值”緩沖區(qū)內(nèi)的比例服從高斯正態(tài)分布的誤差函數(shù)。
本文通過(guò)計(jì)算機(jī)仿真,驗(yàn)證了隨機(jī)線元落入緩沖區(qū)內(nèi)的比例與正態(tài)分布有著密切的聯(lián)系即其比例符合正態(tài)分布的誤差函數(shù),從體系上完善了 Epsilon帶的應(yīng)用。但文章不足之處在于:①模擬分析是在假設(shè)線元端點(diǎn)分布獨(dú)立的情況下研究的,可以推廣到誤差相關(guān)的一般情形;②研究對(duì)象主要是線元,樣本量較小,可以推廣至折線、曲線等更加一般的情況,這是下一步工作的重點(diǎn)。
[1] JOON H,J IN W K,J I S P,et al.A New Line Accuracy Assess ment Methodology Using Nonlinear Least Squares Estimation[J].Journal of Surveying Engineering,2008, 134(1):13-20.
[2] PERKAL J.On Epsilon Length[J].Bulletin de l′Academic Polonaise des Sciences,1956(4):399-403.
[3] BLAK MORE M.Generalization and Error in Spatial Databases[J].Cartographica,1984,21(2-3):131-139.
[4] SK IDMORE A K,TURNER B J.Map Accuracy AssessmentUsingLine Intersect Sampling[J],Photogrammetric Engineering and Remote Sensing,1992,58(10): 1453-1457.
[5] GOODCH ILD M F,HUNTER G J.A Simple Positional AccuracyMeasure forLinear Features[J].International Journal on GeographicalInfor mation Science,1997, 11(3):299-306.
[6] TVEITE H,LANGASS S.An Accuracy Assess ment Method for Geographical Line Datasets Based on Buffering[J]. International Journal of Geographical Infor mation Science,1999,13(1):27-47.
[7] 張永彬,范愛(ài)民.基于誤差熵不確定帶的空間數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo) [J].河北理工學(xué)院學(xué)報(bào),2002(2): 121-127.
[8] JOON H,JUNG H K,J IN W K.A New Methodology for Measuring Coastline Recession Using Buffering and NonlinearLeast Squares Estimation[J]. International Journal of Geographical Information Science,2009,23(9): 1165-1177.
[9] 陳家鼎,孫山澤,李東風(fēng).數(shù)理統(tǒng)計(jì)學(xué)講義[M].北京:高等教育出版社,2006:132-135.
Research on Probability D istribution Function of Random L ine within the Buffer Zone
M IAO Zelang,FENG Yongxing,ZHANG Shubi,ZHANGQiuzhao
0494-0911(2011)02-0029-02
P208
B
2010-05-07
苗則朗(1988—),男,安徽碭山人,博士生,主要研究方向?yàn)榈乩硇畔⑾到y(tǒng)算法及遙感圖像處理及模式識(shí)別。