周 浩 汪海洪 羅志才 周波陽 周林兵
(1)武漢大學測繪學院,武漢 430079 2)海島(礁)測繪技術國家測繪局重點實驗室,青島 266510 3)武漢大學地球空間環(huán)境與大地教育部重點實驗室,武漢 430079 4)中國地震局地震研究所,武漢430071)
基于動態(tài)聚類分析的衛(wèi)星測高波形分類*
周 浩1)汪海洪1,2,3)羅志才1,3)周波陽1)周林兵4)
(1)武漢大學測繪學院,武漢 430079 2)海島(礁)測繪技術國家測繪局重點實驗室,青島 266510 3)武漢大學地球空間環(huán)境與大地教育部重點實驗室,武漢 430079 4)中國地震局地震研究所,武漢430071)
結合衛(wèi)星測高回波波形特征,以移動最小歐氏距離為相似度統(tǒng)計量,提出了一種基于動態(tài)聚類分析原理的雷達測高波形分類算法——最短距離法,實現(xiàn)了對雷達測高波形的有效分類。利用穿過臺灣海峽的T/P波形數(shù)據(jù),對比分析Beta-5和脈沖峰值方法分類結果,驗證了該分類方法的可行性,并確定了近海測高波形合理分類的K值。
衛(wèi)星測高;波形分類;T/P衛(wèi)星;動態(tài)聚類分析;最短距離法
波形分類是衛(wèi)星測高數(shù)據(jù)處理中的一項重要工作。隨著波形重定技術的發(fā)展,近海或非海洋表面的測高數(shù)據(jù)質(zhì)量得以改善和廣泛利用。由于目前的幾種波形重定方法或改進方法對不同反射面的返回波形不具有普適性,要最大限度地提高非開闊海域的測高數(shù)據(jù)質(zhì)量,必須根據(jù)波形特征對回波波形進行分類,從而選擇適應的波形重定方法,提高該區(qū)域下的衛(wèi)星雷達測高精度。因此,波形分類的好壞將直接影響波形重定結果。波形分類還可以用于確定反射面的性質(zhì),例如Yang等[1]利用測高波形確定南極海冰密集度。
針對衛(wèi)星雷達測高波形分類研究,Lee等[2]提出了脈沖峰值作為波形分類的指標。Dabo-Niang等[3]提出了利用模型曲線對雷達測高波形進行分類的方法,推動了波形分類方法的研究。楊元德等[4]對照Beta-5和脈沖峰值(PP)分類法,給出了波形相關移動分析法,將波形區(qū)分為鏡面波形和散射波形兩類。汪海洪等[5]嘗試應用聚類分析進行測高波形分類,驗證了系統(tǒng)聚類方法的可行性,并取得了較好的分類結果。本文在此基礎上利用動態(tài)聚類分析理論,提出了一種基于最短距離算法的分類方法,對臺灣近岸海域T/P衛(wèi)星測高波形數(shù)據(jù)進行分類,通過與Beta-5分類法及PP分類法進行綜合比較,驗證了該方法的可行性,并確定了波形分類的最佳K值。
衛(wèi)星測高回波波形是雷達回波功率隨時間變化的曲線,與反射面之間存在對應關系,當反射面的反射性質(zhì)接近,相應的兩回波波形接近,屬于相同波形類型,反之屬于不同的波形類型[6]。測高最初應用在海洋方面,波形比較規(guī)則,可用 Brown(1977)、Hayne(1980)模型函數(shù)模型表達,稱為海洋波形;而非海洋波形主要來自非開闊海面,一般存在多個反射面,如近岸、極地冰蓋、陸地等,波形呈現(xiàn)不同的形狀。圖1給出了近岸海域幾個不同特征的測高回波波形,其中橫軸表示距離門(range gate),可以轉(zhuǎn)換為時間或者距離,縱坐標為規(guī)格化后的回波功率。根據(jù)不同的分類標準,測高波形形狀有不同的劃分,如可分為海洋型(圖1(a))、尖錐型,或陸地型(圖1 (b))、寬峰型(圖1(c))、多峰型(圖1(d))等4類[5],也可簡單分為海洋型、非海洋型(除圖1(a)外的另3種波形),或依Laxon(1994)方法[7]分為漫射波和鏡面波,還可根據(jù)按波形中峰值的個數(shù)分為:單一斜面波形,雙斜面波形和多子波波形等[8]。
圖1 4種雷達波形參考樣本Fig.1 Four reference radar waveforms
動態(tài)聚類的主要思想是事先將樣品進行粗略分類,然后按照某種最優(yōu)聚類準則反復修改不合理的分類,直至達到合理的分類結果為止[9]。動態(tài)聚類必須先確定一批具有代表性的凝聚點,即聚類中心[10]。
動態(tài)聚類方法在確定聚類中心時,以距離作為相似程度,計算各個樣本到聚類中心的距離,其公式為[11]:
式中,Di為第i個樣本到各個聚類中心間的最小距離,S代表樣本數(shù)據(jù)集,d(Xi,Cj)為第i個樣本到第j個聚類中心間的距離,一般取歐氏距離。
由于測高波形是一個多維的數(shù)據(jù)集,部分波形因反射面性質(zhì)及衛(wèi)星至反射面的距離的影響有可能在時間上(橫軸方向)有位移現(xiàn)象,若按經(jīng)典動態(tài)聚類分析算法確定聚類中心,將會導致一些形狀相似的波形不能正確歸類,聚類中心也會因此發(fā)生改變而不具備代表性。為避免上述因素影響,使分類達到全局最優(yōu)。本文采用最短距離算法,取代K均值算法確定聚類中心。
假設現(xiàn)有兩個測高波形Xi、Xj,其第p個閥門上的功率值分別為Xi,p、Xj,p,閥門總數(shù)為N,位移參數(shù)為s,取值為±s0之間的整數(shù),則移動最小歐氏距離計算公式為[5]:
對于T/P衛(wèi)星波形數(shù)據(jù),閥門總數(shù)為N=64,位移參數(shù)取s0=10,顧及到各個測高波形的振幅不同,為避免尺度不一致問題,在計算距離值時采用規(guī)格化后的功率值?Xi,p進行計算,規(guī)格化公式為:
顧及初始中心受制于樣本輸入順序進而影響聚類結果[12],在選取初始聚類中心時,依據(jù)式(2)計算各波形樣本間的距離矩陣。選取最大距離值對應的兩個波形作為兩個不同類的初始聚類中心,然后再以這兩個聚類中心為基礎,在剩余波形樣本中找出與前兩個聚類中心距離之和最大的那個波形作為第3個聚類中心,再以與這3個中心距離之和最大的準則尋找第4個聚類中心,依此反復,直到選取K個初始聚類中心。具體過程按如下式遞推,則第K個聚類中心選取原則為:
式中,d(Xck,Xcr)為初始聚類中心遞推函數(shù)值;Xck為需要尋找的第k個聚類中心,d(Xi,Xcr)為其余樣本與第r個聚類中心的距離。值得注意的是,此處的距離均為移動最小歐氏距離。
由于是選用波形樣本間距離作為相似度統(tǒng)計量,很顯然距離越大的兩個波形差別越大,距離越小的反而越相似越容易聚為一類。對歸類后的類內(nèi)樣本,我們以最小距離平方和為原則逐步選取各類下一次的聚類中心,依次反復,當聚類目標誤差不超過給定閥值時,迭代過程中止,聚類完成。
判別函數(shù)為:
聚類目標誤差函數(shù)為:
式中,d2(X)為聚類中心判別函數(shù)值,X為類內(nèi)選取的新的聚類中心,Nr為第類內(nèi)的樣本個數(shù);Err為聚類目標誤差,d為移動最小歐氏距離,、分別表示第r個聚類中心經(jīng)it+1次迭代前后的聚類中心。當Err不大于給定閥值時,聚類過程結束,得到最終分類結果。
以AVISO提供的T/P衛(wèi)星觀測數(shù)據(jù)為例,選取穿過臺灣海峽的第30周第164號路徑上的近岸波形數(shù)據(jù)進行分類實驗,實驗區(qū)覆蓋范圍為24°03'~25°30'N,119°43'~120°30'E(圖2)。衛(wèi)星測高波形數(shù)據(jù)經(jīng)編輯處理后,共計280個波形,每個波形經(jīng)壓縮后為64個功率采樣值,圖3為280個連續(xù)波形序列圖,其中時間軸上閥門間隔為3.125納秒。
顧及到實驗區(qū)非海洋波形所占的少數(shù)比例,這里將280個波形進行了K=2、3、4、5各種K值的聚類,圖4給出了不同K值下的各個類的聚類中心,每個聚類中心代表該類的波形特征,其中橫軸表示時間,閥門間隔為3.125納秒,縱軸為規(guī)格化的回波功率。
圖2 通過臺灣海峽的T/P衛(wèi)星的地面軌跡Fig.2 Ground trajactory of T/P pass164 over coastal Taiwan strait
圖3 Pass164經(jīng)過實驗區(qū)域的所有波形Fig.3 All T/P altimeter waveforms over test area
圖4 各類聚類中心Fig.4 Clustering centers for different K
由于一個聚類分析可以產(chǎn)生很多類,因此必須采用一個聚類評價標準確定最小分類數(shù)量,即所謂K值??紤]到波形的幾何結構特征,這里采用常用的Dunn指數(shù)相對指標[13],對聚類的有效性進行評價。Dunn指數(shù)是基于類間分離度與類內(nèi)緊密度比值的幾何度量,計算公式為[14]:
表1 聚類有效性評價Tab.1 Evaluation of clustering validity
圖4是不同K值下的各類別的聚類中心,每一個聚類中心代表一類特征波形。從圖中可看出,當分類越少時,波形差異越明顯。如分為兩類時,只有散射波形和鏡面波形。分類越多,波形差異越小,如K=5時,圓圈線所代表的波形與菱形線所代表的波形差異不大,實際上可歸為一類。
從表1統(tǒng)計的結果可看出,類數(shù)為K=2時,Dunn指數(shù)最高,聚類結果最好,不同特征的波形越易區(qū)分開,但損失的波形特征信息也多;K=4時,Dunn指數(shù)最低,不同特征的波形區(qū)分較為困難,但可獲取更多不同特征的波形分類信息,有利于依據(jù)波形特征選擇各類適應的波形重定方法。值得注意的是K=5時,理論上分類信息應比K=4時更具體,指數(shù)應比上述更小,然而有部分特征相似的波形被分成了兩類,造成評價指標值出現(xiàn)異常誤差。
為驗證該方法在雷達波形分類研究上的可行性,將上述結果與Beta-5和PP方法的分類結果進行比較。以Beta-5成功率作為判斷Brown模型波的指標,Beta-5成功率越高,則回波波形是Brown模型波的可能性越大,對應的分類結果越可靠;以PP<1.8的波形占所有散射波形的比例作為脈沖峰值分類法的判斷指標(比例越大,分類結果越可靠)??紤]到兩種分類方法僅限于判斷散射波形和鏡面波形,這里僅對文中方法所分離出的Brown模型波進行檢驗。
表2統(tǒng)計了最短距離法在不同分類情況下對應的Beta-5成功率和PP確定的散射波形的比例。結果顯示,Beta-5成功率均在96%以上,分類越多,成功率越高,表明最短距離法能夠準確分離出Brown模型波,分類方法可行;采用PP指標波形分類的檢驗結果也表明,最短距離法分類結果是有效的。
當分類到K=4時,分類信息較豐富,能獲取較多的波形特征,從而為每類波形準確匹配特定的最佳波形重定方法,對提高近海測高精度起到積極作用,分類最佳。盡管分為兩類波形,聚類有效性最高,這是因為Brown模型波相對于非Brown模型波的特征較為明顯最容易區(qū)分,但是這種分類無法區(qū)分非Brown模型波所包含的各種特征波形,不利于最佳波形重定技術的確定。
表2 最短距離法波形分類檢驗結果Tab.2 Verified results of classification based on minimum distance methods
通過Beta-5算法和PP波形分類方法對比分析,驗證了基于最短距離算法的動態(tài)聚類分析應用于雷達波形分類的可行性。本文提出的最短距離聚類法充分發(fā)揮了其無監(jiān)督自學習能力,不僅能夠準確區(qū)分海洋波形(Brown模型波)和非海洋波形,而且可以更加細致客觀地劃分復雜的非海洋波形,有利于為不同特征的波形匹配最佳的波形重定方法。實驗結果表明,測高波形分為4類較為合理。不過對于具體的定量分類指標,還需要根據(jù)測高波形的復雜程度和實際應用需要作進一步研究,針對海況復雜程度不同的非開闊海域,最佳K值會有所不同。
測高回波波形的特征取決于地面類型,地面類型主要有開闊海面、海-陸反射面、海-冰反射面和冰面等,這些不同類型地面反射波形可能具有不同的幾何特征和物理特征。在目前的波形分類方法中一般只依據(jù)波形幾何特征,為了實現(xiàn)更準確的波形重跟蹤,在后續(xù)工作中還需進一步結合不同類型地面回波波形的物理特征開展波形分類研究。
1 Yang Yuande,et al.Sea ice concentration over the Antarctic ocean from satellite pulse altimetry[J].Sci China Earth Sci.,2010,DOI:10.1007/s11430-010-4108-7.
2 Lee H,et al.Application of TOPEX altimetry for solid earth deformation studies[J].Terr Atmos Ocean Sci.,2008,19:1-2,37-46.
3 Sophie Dabo-Niang,F(xiàn)rédéric Ferraty and Philippe Vieu.On the using of modal curves for radar waveforms classification[J].Computational Statistics&Data Analysis,2007,51:4 878-4 890.
4 楊元德,等.復雜海域ERS-1衛(wèi)星測高波形的波形分類方法研究[J].武漢大學學報(信息科學版),2011,36 (1):48-50.(Yang Yuande,et al.Altimeter waveform classification over non-open oceans[J].Geomatics and Information Science of Wuhan University,2011,36(1):48-51)
5 汪海洪,等.基于聚類分析的衛(wèi)星雷達測高波形分類研究[J].武漢大學學報(信息科學版),2010,35(1):833 -835.(Wang Haihong,et al.Classification of radar altimeter waveforms based on cluster a nalysis[J].Geomatics and Information Science of Wuhan University,2010,35(1):833-835)
6 褚永海.衛(wèi)星測高波形處理理論研究及應用[D].武漢大學,2007.(Chu Yonghai.The research of satellite altimetry waveform theory and application[D].Wuhan University,2007)
7 Laxon S.Sea ice altimeter processing scheme at the EODC[J].Int J Remote Sens.,1994,15:915-924.
8 高永剛,等.湖泊范圍內(nèi)TOPEX/Poseidon衛(wèi)星測高波形分析[J].大地測量與地球動力學,2008,(1):45-49.( Gao Yonggang,et al.Waveform analysis of TOPEX/Poseidon satellite altimeter over lake[J].Journal of Geodesy and Geodynamics,2008(1):45-49)
9 高惠璇.應用多元統(tǒng)計分析[M].北京:北京大學出版社,2005.(Gao Huixuan.Applied multivariate statistical analysis[M].Beijing:Peking University Press,2005)
10 Cuesta-Albertos J A and Fraiman R.Impartial trimmed K-means for functional data[J].Computational Statistics&Data Analysis,2007,51:4 864-4 877.
11 但漢輝,張玉芳,張世勇.一種改進的K均值聚類算法[J].重慶工商大學學報(自然科學版),2009,26(2):144-147.(Dan Hanhui,et al.An improved K-means cluster algorithm[J].Journal of Chongqing Technology and Business University,2009,26(2):144-147)
12 連鳳娜,吳錦林,唐琦.一種改進的K-means聚類算法[J].電腦與信息技術,2008,16(1):38-40.(Lian Fengna,Wu Jinlin and Tang Qi.An improved K-means cluster algorithm[J].Computer and Information Technology,2008,16(1):38-40)
13 楊燕,靳蕃,Kamel Mohamed.聚類有效性評價綜述[J].計算機應用研究,2008,25(6):1 630-1 632.(Yang Yan,Qin Fan and Mohamed K.Survey of clustering validity evaluation[J].Application Research of Computers,2008,25(6):1 630-1 632)
14 Vendramin L,Campello R J G B and Hruschka E R.Relative clustering validity criteria:A comparative overview[J].Statistical Analysis&Data Mining,2010,3:209-235.
CLASSIFICATION OF SATELLITE ALTIMETER WAVEFORMS BASED ON DYNAMIC CLUSTER ANALYSIS
Zhou Hao1),Wang Haihong1,2,3),Luo Zhicai1,3),Zhou Boyang1)and Zhou Linbin4)
(1)School of Geodesy and Geomatics,Wuhan University,Wuhan 430079 2)Key Laboratory of Surveying and Mapping Technology on Island and Reef,SBSM,Qingdao 266510 3)Key Laboratory of Geospace Environment and Geodesy,Ministry of Education,Wuhan University,Wuhan 430079 4)Institute of Seismology,CEA,Wuhan430071)
According to the characteristics of satellite altimeter waveforms,a new classification of radar altimeter waveforms,called minimum distance,is presented.The method based on the principle of dynamic cluster analysis can efficiently classify the radar waveforms by using moving minimum Euclidean for similarity index.Topex/ Poseidon coastal waveforms across Taiwan strait are applied to comparatively analyze the classification results of pulse peakiness and Beta-5,and the feasibility of the classification is verified,and K value of reasonable coastal altimeter waveforms classification is determined.
satellite altimetry;waveforms classification;T/P satellite;dynamic cluster analysis;minimum distance
1671-5942(2011)05-0101-05
2011-03-19
國家自然科學基金(41174021);海島(礁)測繪技術國家測繪局重點實驗室資助項目(2009B04)
周浩,男,1985年生,碩士研究生,目前主要從事衛(wèi)星測高研究.E-mail:zhouhao249@163.com
P207
A