王延停 歸慶明 張倩倩
(1)解放軍信息工程大學理學院,鄭州 450001 2)解放軍信息工程大學測繪學院,鄭州450052)
基于Kullback-Leiber距離粗差探測的Bayes方法*
王延停1)歸慶明1,2)張倩倩1)
(1)解放軍信息工程大學理學院,鄭州 450001 2)解放軍信息工程大學測繪學院,鄭州450052)
從影響分析角度,基于Kullback-Leiber距離提出了粗差探測的Bayes方法。對非等權獨立觀測情形,在一定先驗分布下,對數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型進行了比較分析,給出3種模型相應的Kullback-Leiber距離的計算公式,建立了粗差探測的判別法則。最后將該方法應用于邊角網(wǎng)的粗差探測,取得了較好的效果。
Bayes方法;影響分析;Kullback-Leiber距離;粗差探測;方差膨脹模型
在我國,就粗差探測研究而言,起步較晚,相應成果發(fā)表甚少[1]。歸慶明等[2,3]提出的基于事件后驗概率的粗差探測法和基于真誤差的后驗概率法,沒有給出判別粗差的閾值且運算復雜,計算效率低下,從而使這些方法還只停留在理論研究上。李新娜等[4]提出的基于識別變量的后驗概率法,解決了多個粗差的探測問題,并討論了粗差的掩蓋和淹沒現(xiàn)象,同時引入MCMC等現(xiàn)代統(tǒng)計計算方法,大大提高了計算效率。衡廣輝等[5]提出的相關觀測粗差探測的Bayes方法,對相關觀測數(shù)據(jù)的粗差探測進行了討論??疾爝@些粗差探測方法[2-10],都不是從影響分析的角度進行研究。為此,本文從影響分析角度,基于Kullback-Leiber距離,根據(jù)測量平差實際,運用Bayes統(tǒng)計理論和方法[11],給出了數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型相應的距離計算公式,建立了粗差探測的判別法則,提出了基于Kullback-Leiber距離的粗差探測的Bayes方法。最后將該方法應用于邊角網(wǎng)的粗差探測,取得了很好的效果。
其中L=(L1,L2,…,Ln)T為n×1觀測值向量,A= (a1,…,an)T為n×1設計矩陣且列滿秩,X為t×1未知參數(shù)向量,Δ=(Δ1,…,Δn)T為n×1觀測誤差向量為未知單位權方差。記P=diag(p1,…,pn),τ=
假定參數(shù)(X,τ)服從正態(tài)-伽瑪先驗分布,即{X |τ}~Nt(X0,τ-1),τ~Γ(α0,α1),其中X0為給定的t×1向量,Σ0為給定的t×t階正定矩陣,α0和α1為給定的常數(shù)。
定理1 參數(shù)X、τ的后驗分布以及X的邊緣后驗分布分別為
將上式在X的參數(shù)空間內(nèi)積分,即可證式(3)。同理將上式對τ積分,即可證式(4)。
考慮測量平差的Gauss-Markov模型,第i個觀測值相應的數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型分別為:
定理2 在上述假定下,關于參數(shù)X、τ的后驗分布以及X的邊緣后驗分布結(jié)果有:
其中,τ的后驗分布為Gamma分布,各變量的具體表達式為:
證明過程類似定理1,在此忽略。
設p1、p2分別為兩個分布的密度函數(shù),定義兩個分布的Kullback-Leiber距離為
K(p1,p2)是衡量兩個分布接近程度的一種很好的度量,因此可應用這個距離作為Bayes估計的影響度量。
定義
Ki(X)反映了第i個觀測值刪除前后對于X的Bayes估計的影響。它的值越大,則基于L求得的X的Bayes估計和基于L(i)求得的X的Bayes估計的差異越大,因而第i個觀測值對于X的Bayes估計的影響也越大。定義
它反映了第i個觀測值方差膨脹前后對于參數(shù)X的Bayes估計的影響。定義
它反映了第i個觀測值均值漂移前后對于參數(shù)X的Bayes估計的影響。
定理3 在上述假定下,第i個觀測值關于Bayes估計的影響度量有:
1)對于數(shù)據(jù)刪除模型
2)對于方差膨脹模型
3)對于均值漂移模型
因此3種擾動模型的影響度量在形式上是統(tǒng)一的,都是Cook距離與協(xié)方差統(tǒng)計量形成的距離的疊加。又因為3種擾動模型的有關參數(shù)的統(tǒng)計性質(zhì)相同,所以用它們研究第i個觀測值關于Bayes估計的影響度量的推斷結(jié)果也相同。
在實際應用中,首先計算得到每個觀測值的Kullback-Leiber距離的大小,然后相互比較各個觀測值之間的距離大小,如果一個觀測值的Kullback-Leiber距離相對較大,就認為該觀測值的影響較大。但大到何種程度,該點才能稱為粗差?該方法中沒有一個客觀而明確的基準值作為判斷標準。為解決這一問題,我們對Kullback-Leiber距離的基準值作如下探討。
假定每一觀測值的Kullback-Leiber距離相同,也即影響相同,那么
如果第i個觀測值的Kullback-Leiber距離滿足
算例取自文獻[12]中的邊角網(wǎng)。網(wǎng)中共觀測了12個角度和6個邊長,測角中誤差為±1.5″,測邊中誤差為±2.0 cm。為檢驗本文提出的Bayes方法的粗差定位性能,我們對第14個觀測值加上-14.0 cm的模擬粗差,并按照文中方法進行計算(表1)。通過表1我們可以看到,當α=0.05,c=1.64時,對于數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型,均可判定第14個觀測值為粗差。
表1 按3個模型進行的粗差探測計算Tab.1 Computation of gross error detection with the three models
1)本文從影響分析角度,在非等權獨立觀測情形及正態(tài)-伽瑪先驗分布下,給出了基于Kullback-Leiber距離的粗差探測的Bayes方法;
2)對基于Kullback-Leiber距離的影響度量給出了一種確定粗差的方法;
3)根據(jù)3種擾動模型的影響度量的計算公式及有關參數(shù)的統(tǒng)計性質(zhì),得出它們研究第個觀測值關于Bayes估計的影響度量相同。
1 韋博成,魯國斌,史建清.統(tǒng)計診斷引論[M].南京:東南大學出版社,1991.(Wei Bocheng,Lu Guobin and Shi Jianqing.Introduction to statistical diagnostics[M].Nanjing:Publishing House of Dongnan University,1991)
2 歸慶明,等.粗差探測的Bayes方法[J].測繪學報,2006,35(4):303-307.(Gui Qingming,et al.Bayesian method for detection of gross errors[J].Acta Geodaetica et Cartographic Sinica,2006,35(4):303-307)
3 歸慶明,等.基于觀測誤差后驗分布的粗差探測的Bayes方法[J].測繪科學技術學報,2007,24(2):87-89.(Gui Qingming,et al.Bayesian approach to detection of gross errors based on posterior distribution of observation error[J].Journal of Zhengzhou Institude of Surveying and Mapping,2007,24(2):87-89)
4 李新娜,歸慶明,許阿裴.基于識別變量的粗差探測的Bayes方法[J].測繪學報,2008,37(3):355-360.(Li Xinna,Gui Qingming and Xu Apei.Bayesian method for detection of gross errors based on classification variable[J].Acta Geodaetica et Cartographic Sinica,2008,37(3):355 -360)
5 衡廣輝.相關觀測粗差探測的Bayes方法及其在GPS網(wǎng)平差中的應用[D].解放軍信息工程大學,2009.(Heng guanghui.Bayesian methods for gross errors detection of correlated observations and its application in GPS network adjustment[D].Information Engineering University,2009)
6 Abraham B and Box G E P.Linear models and spurious observations[J].Appl Statist.,1978:131-138.
7 Ethrog U.Statistical test of significance for testing outlying observations[J].Survey Review,1991,31(240):62-70.
8 Baarda W A.Test procedure for use in geodetic networks[J].Neth Geod Comm Publ Geod,New Ser.,1968,2 (5):27-55.
9 Box G E P and Tiao G C.A Bayesian approach to some outlier problems[J].Biometrika,1968,55:119-129.
10 Cox D R and Weisberg S.Diagnostics for heteroscedasticity in regression[J].Biome-trika,1983,70:1-10.
11 茆詩松.貝葉斯統(tǒng)計[M].北京:中國統(tǒng)計出版社,1999.(Mao Shisong.Bayesian statistics[M].Beijing:Publishing House of Chinese Statistics,1999)
12 崔希璋,於宗儔,陶本藻.廣義測量平差(新版)[M].武漢:武漢測繪科技大學出版社,2001.(Cui Xizhang,Yu Zhougchou and Tao benzao.Generalized surveying adjustment(new edition)[M].Wuhan:Publishing House of Wuhan Technical University of Surveying and Mapping,2001)
BAYESIAN APPROACH TO DETECTION OF GROSS ERRORS BASED ON DIVERGENCE OF KULLBACK-LEIBER
Wang Yanting1),Gui Qingming1,2)and Zhang Qianqian1)
With the view of influence analysis,a new Bayesian method for gross errors detection based on divergence of Kullback-Leiber is proposed.Under the condition of unequal weight and independent observations,a comparison among the data deletion model,the variance inflation model and the mean shift model based on certain prior distribution is made,and the computational formula of divergence of Kullback-Leiber about the three models is given and a judge rule of gross error detection is established.Finally,the method is used for gross error detection in triangulateration network and a good result is obtained.
Bayesian method;influence analysis;Kullback-Leiber divergence;gross errors detection;variance inflation model
1671-5942(2012)02-0051-05
2011-11-24
國家自然科學基金(40974009);鄭州市科技計劃攻關項目(0910SGYG21198)
王延停,男,1986年生,碩士研究生,主要從事誤差理論和測量數(shù)據(jù)處理等方面的研究.E-mail:wangyanting454799@163.com
P227;P207
A
(1)Institute of Science,Information Engineering University,Zhengzhou 450001 2)Institute of Surveying and Mapping,Information Engineering University,Zhengzhou 450052)