孫佳龍,焦明連,梁青科
(1.淮海工學(xué)院測繪工程學(xué)院,江蘇連云港222001;2.山東里能魯西礦業(yè)有限公司,山東濟(jì)寧272053)
隨著GPS測量技術(shù)的不斷發(fā)展和完善,求取高精度的高程異常在實(shí)際工程應(yīng)用中越來越重要[1]。目前常用的高程異常擬合方法主要有多項(xiàng)式擬合法、移動(dòng)二次曲面擬合法和多面函數(shù)擬合法等[2-3]。在擬合區(qū)域較小的情況下,一般擬合方法可以達(dá)到較高的精度,但由于這些方法未顧及似大地水準(zhǔn)面的物理性質(zhì),擬合出的曲面只是高程異常的趨勢面,與高程異常的實(shí)際數(shù)值存在一定差異[4]。多面函數(shù)在理論上可以以任意精度逼近任意復(fù)雜曲面,因此可以更加逼近實(shí)際的高程異常曲面[5]。但由于多面函數(shù)中心點(diǎn)的個(gè)數(shù)及中心點(diǎn)的選擇對擬合精度影響較大,而其選擇目前又尚無可靠的理論依據(jù),為此本文提出了基于聚類分析的多面函數(shù)擬合法,對中心點(diǎn)的個(gè)數(shù)和中心點(diǎn)進(jìn)行有效選取,使不同的中心點(diǎn)建立不同的多面函數(shù)模型,并從中選取最優(yōu)模型作為最后的擬合模型。
多面函數(shù)的理論依據(jù)是:任意數(shù)學(xué)表面與任意不規(guī)則的圓滑表面,總可以利用一系列的有規(guī)則的數(shù)學(xué)表面總和,以任意精度逼近。因此,由多面函數(shù)表示的殘差高程異常為[4-5]
式中,aj是待定系數(shù);q(x,y,xj,yj)是x和y的二次函數(shù),其中心點(diǎn)在(xj,yj)處;n是中心點(diǎn)的個(gè)數(shù);ζ可由二次式的和確定,故稱多面函數(shù)。
用一組簡單的解析函數(shù)的線性組合對這個(gè)曲面進(jìn)行逼近,通常選擇多元二次函數(shù)作為解析函數(shù),其形式為[6]
式中,δ為圓滑因子,也稱光滑系數(shù),通??扇∫恍≌龜?shù)或零;b可選取某個(gè)非零實(shí)數(shù),通常為或。
將式(2)寫成誤差方程,并用矩陣表示為
待定系數(shù)A可根據(jù)已知GPS/水準(zhǔn)數(shù)據(jù)和地球重力場模型得到的殘差高程異常,按最小二乘法計(jì)算,即
由此可根據(jù)系數(shù)A和式(1)求解其他點(diǎn)的殘差高程異常。
在式(1)中,由于選擇的中心點(diǎn)個(gè)數(shù)n小于或等于已知的高程異常值的個(gè)數(shù),因此需要對所有的高程異常值進(jìn)行選取。人為選取高程異常值既耗時(shí)又費(fèi)力,且容易出錯(cuò)。因此,合理有效地選取高程異常值,使這些高程異常能很好地表示該區(qū)域的高程異常變化就顯得尤為必要。聚類分析是對樣本進(jìn)行分類的一種多元統(tǒng)計(jì)方法,是從樣本中發(fā)現(xiàn)有用信息的一種有效手段[7-8]。由于聚類分析能夠發(fā)現(xiàn)全局的分布模式及數(shù)據(jù)屬性之間相互關(guān)系,因此,本文利用聚類分析方法,以歐氏距離作為相似性統(tǒng)計(jì)量。考慮到高程異常曲面不僅與樣本點(diǎn)的地理位置有關(guān),還與該點(diǎn)的高程異常值的大小有關(guān),因此,本文以三維歐氏距離作為相似性統(tǒng)計(jì)量[7],即
式中,xi、yi、ξi為Pi點(diǎn)的坐標(biāo)和高程異常;d 為距離。由于高程異常的單位與坐標(biāo)單位不同,在進(jìn)行聚類分析之前需將高程異常數(shù)據(jù)進(jìn)行規(guī)格化處理[9-10]
式中,i=1、2、3;P為規(guī)格化處理后的高程異常所對應(yīng)的坐標(biāo)和高程異常值。以某地區(qū)12個(gè)高程異常數(shù)據(jù)點(diǎn)為例,規(guī)格化處理后的各點(diǎn)的坐標(biāo)和高程異常值如圖1所示。
圖1 規(guī)格化后的高程異常
從圖1中可以看出,1、2和8號(hào)點(diǎn)的高程異常圖形基本一致,4、5和6號(hào)點(diǎn)的殘差高程異常圖形也基本一致,而9和10號(hào)點(diǎn)的殘差高程異常值的變化趨勢也基本相同。因此,將以上幾類數(shù)據(jù)分別聚類是合適的。11、12號(hào)點(diǎn)的殘差高程異常與其他各點(diǎn)差異較大,當(dāng)分類數(shù)較多時(shí)不宜歸入其他類中。利用聚類分析,得到的聚類結(jié)果如圖2所示。
圖2 高程異常聚類樹
從高程異常聚類樹圖中可以看出,1、2,4、5和9、10被首先歸入一類,說明這幾組數(shù)據(jù)相似性較大;8號(hào)點(diǎn)與1和2號(hào)點(diǎn)相似性也較大,因此8號(hào)點(diǎn)也被歸入1和2號(hào)點(diǎn)這一類中;6號(hào)點(diǎn)與4和5號(hào)點(diǎn)也較為相似,因此6號(hào)點(diǎn)也被歸入到4和5號(hào)點(diǎn)這一類;11和12號(hào)點(diǎn)相似性較小,直到最后所有數(shù)據(jù)被分為兩類時(shí),這兩點(diǎn)才被歸入一類。由此可以看出,聚類分析的結(jié)果與實(shí)際各點(diǎn)的相似情況基本吻合,因此利用聚類分析可以有效地對高程異常數(shù)據(jù)進(jìn)行分類。
某地區(qū)D級(jí)GPS控制網(wǎng)布設(shè)了17個(gè)觀測點(diǎn),對其進(jìn)行了GPS觀測和三等水準(zhǔn)測量,利用GPS獲得的大地高和水準(zhǔn)測量得到正常高,以及17個(gè)GPS/水準(zhǔn)點(diǎn)的高程異常。利用其中12個(gè)數(shù)據(jù)進(jìn)行聚類分析,得到的分類數(shù)作為多面函數(shù)中心點(diǎn)的個(gè)數(shù);從每個(gè)聚類中選取歐氏距離最長的高程異常作為多面函數(shù)中心點(diǎn),構(gòu)建多面函數(shù)。以另外5個(gè)點(diǎn)的數(shù)據(jù)作為外部檢核。外符合精度為
式中,νi為檢核點(diǎn)實(shí)測高程異常與擬合高程異常的差值;m為檢核點(diǎn)個(gè)數(shù)。檢核結(jié)果見表1。
表1 基于聚類分析的多面函數(shù)外部檢核結(jié)果 mm
從表1中可以看出,分類數(shù)從2開始增大時(shí),多面函數(shù)擬合的精度有所提高;當(dāng)分類數(shù)為5時(shí),精度最高,達(dá)到3.5 mm;隨著分類數(shù)繼續(xù)增加,精度又開始下降;當(dāng)分類數(shù)為11時(shí),精度最低,為152.8 mm。由此說明,通過對樣本數(shù)據(jù)進(jìn)行有效分類,并依此選取多面函數(shù)的中心點(diǎn),可以有效地提高多面函數(shù)的擬合精度。為了綜合評價(jià)基于聚類分析的多面函數(shù)的擬合精度,本文還利用同樣的數(shù)據(jù),以多項(xiàng)式曲面擬合、移動(dòng)曲面擬合和多面函數(shù)擬合這3種常用的曲面擬合模型作為參考模型,比較各種模型之間的擬合精度(見表2)。
表2 擬合結(jié)果殘差比較m
從表2中可以看出,移動(dòng)二次曲面擬合的結(jié)果中,殘差最大值為0.15 m,為各種擬合函數(shù)中的最大值,其標(biāo)準(zhǔn)差和外符合精度也都最大,說明移動(dòng)二次曲面擬合的精度在4種方法中最差。5種評價(jià)指標(biāo)都顯示,聚類分析多面函數(shù)擬合的精度是最高的,其外符合精度最高,達(dá)到0.003 5 m。各個(gè)檢核點(diǎn)的高程異常殘差值如圖3所示。
圖3 4種擬合方法得到的高程異常殘差值
從圖3中可以看出,移動(dòng)二次曲面在5個(gè)檢核點(diǎn)的高程異常殘差值波動(dòng)較大,說明該函數(shù)模型未能很好地表示該區(qū)域的高程異常變化趨勢。而聚類分析多面函數(shù)在檢核點(diǎn)的高程異常殘差變化很小,說明聚類分析多面函數(shù)比較準(zhǔn)確地反映了該區(qū)域高程異常的變化趨勢,是一種比較好的擬合方法。
本文研究了基于聚類分析的多面函數(shù)擬合法,其將差異較小的數(shù)據(jù)歸入同類,將聚類分析的分類個(gè)數(shù)作為中心點(diǎn)的個(gè)數(shù),將差異明顯的數(shù)據(jù)作為中心點(diǎn),使多面函數(shù)中心點(diǎn)的選取更為合理和有效,在一定程度上提高了多面函數(shù)的擬合精度。
[1]馮林剛,郅軍義,寶因?yàn)趿?應(yīng)用EGM2008模型和GPS/水準(zhǔn)數(shù)據(jù)確定局部似大地水準(zhǔn)面[J].測繪通報(bào),2011(1):18-20.
[2]王昶,王旭.GPS大地水準(zhǔn)面擬合模型研究[J].測繪工程,2009,18(4):43-46.
[3]馮林剛,趙軍,趙鎖志.EGM2008模型在GPS高程轉(zhuǎn)換中的應(yīng)用研究[J].測繪信息與工程,2009(5):6-7.
[4]劉經(jīng)南,施闖,姚宜斌,等.多面函數(shù)擬合法及其在建立中國地殼平面運(yùn)動(dòng)速度場模型中的應(yīng)用研究[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2001,26(6):500-503.
[5]馬洪濱,董仲宇.多面函數(shù)GPS水準(zhǔn)高程擬合中光滑因子求定方法[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2008,29(8):1176-1178.
[6]李國鵬,劉站科,柏華崗.用MLS多面函數(shù)擬合法求解高程異常[J].測繪工程,2011,20(5):33-35.
[7]陳黎飛,姜青山,王聲瑞.基于層次劃分的最佳聚類數(shù)確定方法[J].軟件學(xué)報(bào),2008,19(1):62-72.
[8]楊圣云,袁德輝,賴國明.一種新的聚類初始化方法[J].計(jì)算機(jī)應(yīng)用與軟件,2007,24(8):50-52.
[9]毛韶陽,林肯立.優(yōu)化K-means初始聚類中心研究[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(22):179-181.
[10]劉帥,王禮江,朱建軍,等.GPS高程擬合模型的優(yōu)選[J].測繪工程,2006,15(4):17-19.
[11]石昕,彭文.基于加權(quán)最小二乘曲面擬合的規(guī)則格網(wǎng)DEM 建立[J].海洋測繪,2008(3):41-44.