潘家寶 戴吾蛟 章浙濤 黃大偉
1)中南大學(xué)測繪與國土信息工程系,長沙 410083
2)湖南省精密工程測量與形變?yōu)暮ΡO(jiān)測重點(diǎn)實(shí)驗(yàn)室,長沙 410083
變異函數(shù)模型參數(shù)估計(jì)的信息熵加權(quán)回歸法*
潘家寶1,2)戴吾蛟1,2)章浙濤1,2)黃大偉1,2)
1)中南大學(xué)測繪與國土信息工程系,長沙 410083
2)湖南省精密工程測量與形變?yōu)暮ΡO(jiān)測重點(diǎn)實(shí)驗(yàn)室,長沙 410083
將熵權(quán)理論引入到變異函數(shù)理論模型的參數(shù)估計(jì)中,對加權(quán)多項(xiàng)式回歸的加權(quán)方法進(jìn)行改進(jìn),以信息熵定權(quán),并用實(shí)際變形監(jiān)測數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該方法綜合了距離和樣本點(diǎn)對數(shù)對權(quán)重的影響,加權(quán)回歸確定的變異函數(shù)模型更準(zhǔn)確,插值預(yù)報(bào)效果更優(yōu)。
信息熵;變異函數(shù);加權(quán)回歸;變形監(jiān)測;交叉驗(yàn)證
克里金插值在地學(xué)領(lǐng)域已經(jīng)得到了廣泛的應(yīng)用,其中變異函數(shù)模型參數(shù)的估計(jì)是克里金插值的關(guān)鍵。最初使用的方法是人工擬合法,但是該方法耗時(shí)費(fèi)力,效率低,而且主觀性強(qiáng),缺乏統(tǒng)一客觀的標(biāo)準(zhǔn)[1-2]。最小二乘法則無法反映變異函數(shù)曲線中前幾個(gè)點(diǎn)的重要性,但前幾個(gè)點(diǎn)距離較小,它們在反映變量的空間相關(guān)性方面極為重要,其可靠性比后面點(diǎn)的可靠性強(qiáng)得多。許多學(xué)者提出了一些相應(yīng)的處理方法[2-4]。在鉆探領(lǐng)域,鉆孔一般是等間距或近似等間距的,步長較小時(shí)樣本點(diǎn)對數(shù)就多,權(quán)重就大,反之則樣本點(diǎn)對數(shù)就少,權(quán)重就小。而在變形監(jiān)測領(lǐng)域,監(jiān)測點(diǎn)之間的距離各不相等,樣本點(diǎn)的對數(shù)無法反映出變異函數(shù)曲線前面幾個(gè)點(diǎn)的重要性,此時(shí)以樣本點(diǎn)的對數(shù)為權(quán)重則不能很好地反映權(quán)重的實(shí)際情況。熵權(quán)法全面考慮幾種因素的共同影響,合理分配各因素的比例,定權(quán)更加全面和科學(xué)。本文首先對變異函數(shù)理論模型進(jìn)行線性化[5],隨后以信息熵作為衡量權(quán)重的因子進(jìn)行加權(quán)回歸來估計(jì)模型的參數(shù),最終得到基于信息熵的加權(quán)回歸模型,并以實(shí)際變形監(jiān)測的數(shù)據(jù)驗(yàn)證了該方法的可靠性。
常用的變異函數(shù)理論模型主要有球狀模型、指數(shù)模型和高斯模型[1]。球狀模型為:
當(dāng)0<h<3a時(shí),對式中exp(-h(huán)/a)進(jìn)行泰勒級數(shù)展開,隨著泰勒級數(shù)階數(shù)的增加,參數(shù)的變化將逐漸減小,參數(shù)趨于穩(wěn)定。因此,只需展開到二階平方項(xiàng):
同球狀模型類似,此時(shí)γ(h)可以線性化為γ(h)=b0+b1x1+b2x2。高斯模型為:
同指數(shù)模型線性化過程類似,γ(h)可以線性化為γ(h)=b0+b1x1+b2x2。冪函數(shù)模型為:
兩邊取對數(shù)則可以得到:
對于球狀模型、指數(shù)模型和高斯模型,令y=γ(h),得到多元線性回歸方程為:
參數(shù)求解公式為:
冪函數(shù)模型線性化后為一元回歸模型,其參數(shù)求解公式為:
式中W(i)為權(quán)重,距離小的樣點(diǎn)比距離大的樣點(diǎn)在反映變量空間相關(guān)性方面更為重要,權(quán)重也更大。
若系統(tǒng)處于多個(gè)不同的狀態(tài),而每種狀態(tài)出現(xiàn)的概率為 pi(i=1,2,…,m),則其熵定義為[6]:
設(shè)有m個(gè)待評價(jià)項(xiàng)目,n個(gè)評價(jià)指標(biāo)構(gòu)成的評價(jià)矩陣 R=(rij)m×n,熵權(quán)法定權(quán)的步驟如下[7-9]:
1)根據(jù)評價(jià)矩陣計(jì)算每個(gè)待評價(jià)項(xiàng)目出現(xiàn)的概率:
2)計(jì)算第j個(gè)指標(biāo)的熵:
3)計(jì)算第j個(gè)指標(biāo)的熵權(quán):
4)確定變異函數(shù)的最終權(quán)重:
以天津市GPS監(jiān)測的2006~2007年12個(gè)點(diǎn)的沉降量為例,首先根據(jù)坐標(biāo)計(jì)算出每兩個(gè)GPS點(diǎn)之間的距離,然后對距離進(jìn)行分組[2,10]。若距離落入[kh±ε(h)](k為常數(shù),ε(h)為容差)范圍內(nèi)就分在同一組,認(rèn)為這些點(diǎn)間的距離為kh,統(tǒng)計(jì)落入[kh±ε(h)]范圍內(nèi)的距離數(shù)目,記為N(k)。然后分別求出距離為kh時(shí)的實(shí)驗(yàn)變異函數(shù)值γ(h),繪制實(shí)驗(yàn)變異函數(shù)散點(diǎn)圖,如圖1可以看出,變異函數(shù)大致服從冪函數(shù)分布,選擇冪函數(shù)模型進(jìn)行加權(quán)回歸估計(jì)模型參數(shù)。
圖1 實(shí)驗(yàn)變異函數(shù)散點(diǎn)圖Fig.1 Scattergram of experimental variogram
分別以距離kh和距離kh的數(shù)目N(k)為影響因子構(gòu)造評價(jià)矩陣 R,令 k=1,2,…,n,ε =1/3,最終將距離分成了18組,得到的評價(jià)矩陣為:
由式(11)~(14)求得最終的權(quán)重Wi如表1。
表1 評價(jià)指標(biāo)權(quán)重Tab.1 Weights of evaluating indicator
加權(quán)回歸求得的冪函數(shù)模型參數(shù)A=0.998 4,θ=2.055 6。當(dāng) θ≥2 時(shí),令 θ=1.999 9,變異函數(shù)的冪函數(shù)模型為:
用加權(quán)回歸得到的冪函數(shù)模型進(jìn)行克里金插值,用交叉驗(yàn)證法檢驗(yàn)各點(diǎn)的插值結(jié)果(表2)。交叉驗(yàn)證法將觀測值中的一個(gè)點(diǎn)剔除,用剩余觀測點(diǎn)的值估算被剔除點(diǎn)的值,然后再把該點(diǎn)還原,重復(fù)以上步驟得到每個(gè)觀測點(diǎn)上的估計(jì)值。然后用統(tǒng)計(jì)學(xué)的方法將測點(diǎn)上的估計(jì)值和實(shí)測值兩組數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,評價(jià)插值方法的精度。
常用的評價(jià)指標(biāo)有[11,12]平均估計(jì)誤差百分比(PAEE)、相對均方差RMSE、均方根預(yù)報(bào)誤差RMSPE以及殘差分析(殘差均值RM以及殘差標(biāo)準(zhǔn)差RSTD)等。
平均估計(jì)誤差百分比為:
式中,Z*(Xi)為位置Xi處的克里金插值,Z(Xi)為實(shí)測值,ˉZ為所有沉降值的平均值,s2為所有沉降值的方差。
由表2可以看出,信息熵加權(quán)回歸方法建立變異函數(shù)模型得到的克里金插值明顯優(yōu)于最小二乘法。其中tja2點(diǎn)使用新方法的預(yù)報(bào)殘差值有異常,與真實(shí)值差距較大,比最小二乘的預(yù)報(bào)結(jié)果差,這可能是因?yàn)閠ja2點(diǎn)所在地區(qū)的構(gòu)造運(yùn)動(dòng)或含水砂層逐漸恢復(fù)引起的[13],也可能是由于該地區(qū)地處丘陵地帶,相對封閉且海拔較高,與其他點(diǎn)的空間相關(guān)性有所降低造成的。再分別計(jì)算兩種方法交叉驗(yàn)證的各項(xiàng)指標(biāo),由表3可看出,除殘差均值外,加權(quán)回歸的各項(xiàng)指標(biāo)均明顯優(yōu)于最小二乘方法。
表2 交叉驗(yàn)證表(單位:m)Tab.2 Cross validation table(unit:m)
表3 交叉驗(yàn)證指標(biāo)統(tǒng)計(jì)(單位:m)Tab.3 Statistics of cross validation Indicators(unit:m)
對變異函數(shù)模型參數(shù)估計(jì)的加權(quán)回歸方法進(jìn)行改進(jìn),提出了以信息熵為權(quán)重的加權(quán)回歸法。熵權(quán)法減少了人為主觀性對評價(jià)過程的干擾,更客觀地反映了樣本數(shù)目和距離對變異函數(shù)權(quán)重的貢獻(xiàn)率。在變形監(jiān)測中的應(yīng)用表明,使用信息熵來確定變異函數(shù)的權(quán)重是一種比較可靠的加權(quán)方法,建立的變異函數(shù)模型更準(zhǔn)確,插值結(jié)果也比最小二乘法更優(yōu)。
1 劉愛利,王培法,丁園圓.地統(tǒng)計(jì)學(xué)概論[M].北京:科學(xué)出版社,2012.(Liu Aili,Wang Peifa,Ding Yuanyuan.Introduction to geostatistics[M].Beijing:Science Press,2012)
2 王仁鐸,胡光道.線性地質(zhì)統(tǒng)計(jì)學(xué)[M].北京:地質(zhì)出版社,1988.(Wang Renduo,Hu Guangdao.Linear geostatistics[M].Beijing:Geological Press,1988)
3 矯希國,劉超.變差函數(shù)的參數(shù)模擬[J].物探化計(jì)算機(jī)技術(shù),1996,18(2):157 - 161.(Jiao Xiguo,Liu Chao.Estimation of variation parameter[J].Computing Techniques for Geophysical and Geochemical Exploration,1996,16(2):157 -161)
4 李冠林,等.改進(jìn)的克里金法在海面風(fēng)場計(jì)算中的應(yīng)用[J].氣象水文海洋儀器,2013(1):73 -76.(Li Guanlin,et al.Application of improved Kriging to calculating sea wind field[J].Meteorological,Hydrological and Marine Instruments,2013(1):73 -76)
5 李玲,等.變異函數(shù)線性化的統(tǒng)一參數(shù)估計(jì)方法研究[J].長江大學(xué)學(xué)報(bào):理工卷,2010(2):127 -129.(Li Ling,et al.Study on the unity parameter estimation method of linear variogram[J].Journal of Yangtze University:Nat Sci Edit,2010(2):127-129)
6 周訪濱,朱建軍,陳永奇.基于熵的數(shù)據(jù)污染率估算[J].大地測量與地球動(dòng)力學(xué),2013(4):92-95.(Zhou Fangbin,Zhu Jianjun,Chen Yongqi.Contamination rate estimation based on entropy[J].Journal of Geodesy and Geodynamics,2013(4):92-95)
7 謝赤,鐘贊.熵權(quán)法在銀行經(jīng)營績效綜合評價(jià)中的應(yīng)用[J].中國軟科學(xué),2002,9(4):60 - 63.(Xie Chi,Zhong Zan.Entropy method and its application in comprehensive evaluation of bank’s performance[J].China Soft Science,2002,9(4):60 -63)
8 王永弟,許承權(quán).熵權(quán)理論在測量平差中的應(yīng)用[J].測繪通報(bào),2012(11):52 - 54.(Wang Yongdi,Xu Chengquan.Application of entropy theory to measurement adjustment[J].Bulletin of Surveying and Mapping,2012(11):52 -54)
9 劉玉成.熵法確定權(quán)重的地基沉降組合預(yù)測模型[J].中國科技論文在線,2010,5(11):875 -878.(Liu Yucheng.A combined prediction model for foundation subsidence using the entropy weight method[J].Sciencepaper Online,2010,5(11):875-878)
10 程勖,等.變異函數(shù)在異??臻g插值中的應(yīng)用[J].世界地質(zhì),2007,26(3):298 - 303.(Cheng Xu,et al.Application of variogram in interplation of abnormal space[J].Global Geology,2007,26(3):298 -303)
11 顧春雷,楊漾,朱志春.幾種建立 DEM模型插值方法精度的交叉驗(yàn)證[J].測繪與空間地理信息,2011,34(5):100 -102.(Gu Chunlei,Yang Yang,Zhu Zhichun.Accuracy cross-validation of several interpolation methods of DEM[J].Geomatics & Spatial Information Technology,2011,34(5):100-102)
12 張曉明,趙剡.基于克里金插值的局部地磁圖的構(gòu)建[J].電子測量技術(shù),2009,32(4):122 -125.(Zhang Xiaoming,Zhao Yan.Local geomagnetic field mapping based on Kriging interpolation method[J].Electronic Measurement Technology,2009,32(4):122 -125)
13 易長榮,王淼,徐冬.GPS連續(xù)站監(jiān)測天津市地面沉降的初步結(jié)果[J].現(xiàn)代測繪,2009(1):12.(Yi Changrong,Wang Miao,Xu Dong.Preliminary results of land subsidence monitored by continuous GPS stations in Tianjin[J].Modern Surveying and Mapping,2009(1):12)
PARAMETER ESTIMATION OF VARIOGRAM MODEL BY USING INFORMATION ENTROPY WEIGHTED REGRESSION
Pan Jiabao1,2),Dai Wujiao1,2),Zhang Zhetao1,2)and Huang Dawei1,2)
1)Department of Survey Engineering and Geomatics,Central South University,Changsha 410083
2)Key Laboratory of Precise Engineering Surveying & Deformation Disaster Monitoring of Hunan Province,Changsha410083
The information entropy theory was introduced into parameter estimation of variogram model,to improve weighting method of weighted polynomial regression using the entropy weight method.An experiment was taken with real deformation monitoring data,considering the influence of both distance and the number of point pairs at the same distance.The experimental results show that the variogram model determined by information entropy weighted regression is more reasonable,and interpolating prediction is more accurate.
information entropy;variogram;weighted regression;deformation monitoring;cross validation
P207
A
1671-5942(2014)03-0125-04
2013-09-24
國家自然科學(xué)基金項(xiàng)目(41074004);國家973計(jì)劃項(xiàng)目(2013CB733303)。
潘家寶,1989年生,男,碩士研究生,主要從事變形監(jiān)測和時(shí)空Kalman濾波方法的研究。E-mail:story_cn@163.com;panjiabao@csu.edu.cn。