文化立,金澤林,范榮雙,王崇兵,李浩然,劉依倫
HKDE-EEMDAN的CORS站高程時(shí)間序列分析方法
文化立1,2,金澤林3,范榮雙2,王崇兵1,2,李浩然1,劉依倫1
(1. 遼寧工程技術(shù)大學(xué)測(cè)繪與地理科學(xué)學(xué)院,遼寧 阜新 123000;2. 中國(guó)測(cè)繪科學(xué)研究院,北京 100036;3. 中國(guó)能源建設(shè)集團(tuán)遼寧電力勘測(cè)設(shè)計(jì)院有限公司,沈陽(yáng) 110000)
針對(duì)傳統(tǒng)整體經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)方法進(jìn)行信號(hào)分解時(shí)整體平均的結(jié)果未能完全消除隨機(jī)噪聲影響使分解信噪比降低、信號(hào)重構(gòu)效果差的問題,結(jié)合距離評(píng)價(jià)函數(shù)和熵的聚類算法提出了一種改進(jìn)的噪聲自適應(yīng)整體經(jīng)驗(yàn)?zāi)B(tài)分解方法。在經(jīng)驗(yàn)?zāi)B(tài)分解處理時(shí),添加白噪聲分解的模態(tài)分量并對(duì)迭代過(guò)程中各階本征模函數(shù)(IMF)分量進(jìn)行聚類分析。采用該方法和EEMD方法對(duì)2個(gè)連續(xù)運(yùn)行參考站(CORS)站近20 a高程時(shí)間序列進(jìn)行分解,基于信噪比、正交指數(shù)以及均方根誤差指標(biāo)對(duì)2種方法的分解精度進(jìn)行分析比較。實(shí)驗(yàn)結(jié)果表明:該方法提高信噪比5%以上,提高分解精度26%以上,降低重構(gòu)信號(hào)均方根誤差21%以上,降低了隨機(jī)噪聲對(duì)時(shí)間序列分解和信號(hào)重構(gòu)的影響。
自適應(yīng)噪聲;聚類分析;高程時(shí)間序列;信息熵;信號(hào)重構(gòu)
全球衛(wèi)星導(dǎo)航系統(tǒng)(global navigation satellite system, GNSS)連續(xù)運(yùn)行參考站(continuously operating reference stations, CORS)運(yùn)動(dòng)特征分析是維持我國(guó)2000國(guó)家大地坐標(biāo)系(China geodetic coordinate system 2000, CGCS2000)現(xiàn)勢(shì)性和動(dòng)態(tài)性的重要基礎(chǔ)[1-2]。CORS站坐標(biāo)時(shí)間序列高程方向表現(xiàn)為復(fù)雜的周期和非線性運(yùn)動(dòng)。目前常采用固定模型描述CORS站高程坐標(biāo)時(shí)間序列,這種方法限制了測(cè)站本身的運(yùn)動(dòng)規(guī)律,可能會(huì)偏離甚至違背其實(shí)際運(yùn)動(dòng)情況[3-4]。因此,找到一種基于序列本身的方法對(duì)序列進(jìn)行分析更具實(shí)際意義[5]。
文獻(xiàn)[6]采用經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)的思想[7],先對(duì)獲取到的預(yù)報(bào)電離層總電子含量(total electric contents,TEC)時(shí)間序列采取分解變換,然后對(duì)分解得到的時(shí)間序列進(jìn)行模型的建立,通過(guò)模型可以提升對(duì)TEC時(shí)間序列值預(yù)測(cè)的精度。文獻(xiàn)[8]在EMD基礎(chǔ)上提出了整體經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)方法;該方法采用白噪聲的統(tǒng)計(jì)特性,使信號(hào)在其真解鄰域內(nèi)發(fā)生擾動(dòng),達(dá)到目的后又進(jìn)行自消,最終得到真實(shí)的結(jié)果;該方法在信號(hào)分析領(lǐng)域得到廣泛應(yīng)用。文獻(xiàn)[9]將自適應(yīng)時(shí)序分析技術(shù)引入衛(wèi)星導(dǎo)航定位基準(zhǔn)站高程時(shí)間序列分析領(lǐng)域,并對(duì)該方法進(jìn)行了一定程度的改進(jìn),但存在著某些不足。
本文結(jié)合距離評(píng)價(jià)函數(shù)和熵的聚類(hierarchical-means clustering algorithm based on distance evaluation function and entropy, HKDE)算法[10]提出了一種改進(jìn)的噪聲自適應(yīng)整體經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition of adaptive noise,EEMDAN)方法,即HKDE-EEMDAN方法,并用2個(gè)CORS站20 a的高程時(shí)間序列對(duì)該方法的適用性進(jìn)行驗(yàn)證。
EEMD是在EMD的基礎(chǔ)上提出的改進(jìn)算法,該算法是一種引用白噪聲輔助的數(shù)據(jù)分析方法,其核心是有限次地向原始時(shí)間序列中添加等長(zhǎng)有限幅值的白噪聲構(gòu)成新的待分解信號(hào),并對(duì)新生成的待分解信號(hào)獨(dú)立進(jìn)行EMD分解為
假設(shè)添加隨機(jī)白噪聲構(gòu)成待分解信號(hào)的次數(shù)為,對(duì)次待分解信號(hào)分別進(jìn)行EMD分解,得到次分解的各階IMF分量后,取相同階數(shù)的IMF分量均值作為EEMD分解的IMF分量,即
式中:為EEMD分解得到的IMF的個(gè)數(shù);()為EEMD分解后的殘余分量。
相關(guān)研究表明,EEMD較好地彌補(bǔ)了EMD方法的不足,但由于信號(hào)中間歇性高頻信號(hào)的影響,整體平均的結(jié)果未能完全消除隨機(jī)高斯白噪聲的影響[11-14],使得分解后序列信噪比(signal noise ratio, SNR)降低、模態(tài)混疊現(xiàn)象明顯、進(jìn)而影響了信號(hào)重構(gòu)效果。
HKDE算法[10]是針對(duì)傳統(tǒng)聚類算法聚類準(zhǔn)確度低且對(duì)噪聲敏感的問題提出的一種基于距離評(píng)價(jià)函數(shù)和熵的聚類算法。該方法首先構(gòu)建距離評(píng)價(jià)函數(shù)算法確定最佳聚類數(shù),其次利用熵這種相似度衡量指標(biāo)指導(dǎo)簇的合并,能有效地降低噪聲和孤立點(diǎn)對(duì)聚類效果的影響。
本文提出的HKDE-EEMDAN方法主要思想:①添加白噪聲后經(jīng)過(guò)EMD分解僅獲取一階分量IMF1,對(duì)次分解得到的IMF1分量集進(jìn)行聚類分析。首先,基于距離評(píng)價(jià)函數(shù)確定最優(yōu)分類數(shù)完成劃分聚類;其次,以信息熵為相似度評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行層次聚類;最后,保留樣本數(shù)最多的一類取均值作為HKDE-EEMDAN方法的IMF1分量。②從原始序列中剔除IMF1得到剩余信號(hào),向剩余信號(hào)中添加白噪聲經(jīng)EMD分解的IMF分量后再進(jìn)行分解,同樣只分解出一階模態(tài)分量并進(jìn)行聚類分析,直至求解出所有的IMF分量。本文方法主要步驟如下。
保留樣本數(shù)最多(記樣本數(shù)為1)的一類IMF1進(jìn)行均值處理,得到經(jīng)過(guò)HKDE-EEMDAN方法獲得的IMF1分量為
4)為獲取原始信號(hào)()的第階IMF重復(fù)上述步驟直至求解出各階IMF分量,則原始信號(hào)可表達(dá)為
可以看出,HKDE-EEMDAN方法的改進(jìn)主要有:①利用自適應(yīng)白噪聲調(diào)節(jié)參考尺度,消除高斯白噪聲對(duì)序列的影響;②采用聚類分析方法降低了隨機(jī)添加白噪聲時(shí)產(chǎn)生的孤立點(diǎn)數(shù)據(jù)對(duì)整體平均結(jié)果的影響[15]。
判斷CORS站高程時(shí)間序列分解方法的優(yōu)劣程度需要采用一定指標(biāo)進(jìn)行定性、定量分析,可以從3個(gè)方面進(jìn)行考慮:①信號(hào)分解后各階IMF分量中是否存在明顯的模態(tài)混疊現(xiàn)象;②相鄰IMF分量間的正交指數(shù)(index of orthogonality, IO)分析;③利用部分IMF分量進(jìn)行信號(hào)重構(gòu)后求解重構(gòu)信號(hào)的均方根誤差(root mean square error, RMSE)及信噪比。
衡量分解后各分量間正交性常用指標(biāo)為正交指數(shù)。正交指數(shù)越小,說(shuō)明分量間正交性越好,即分解精度越高。在HKDE-EEMDAN分解結(jié)果中,任意2個(gè)IMF分量間的正交指數(shù)計(jì)算公式為
信噪比是指信號(hào)序列與噪聲序列的比值大小。信噪比越高,則說(shuō)明序列中信號(hào)所占的比例較大,得到的有用信息較多。CORS站高程時(shí)間序列的信噪比計(jì)算公式為
均方根誤差反映了重構(gòu)信號(hào)與原始序列的差異性。均方根誤差數(shù)值越大,則說(shuō)明重構(gòu)信號(hào)效果越不理想;數(shù)值越小,則說(shuō)明重構(gòu)信號(hào)效果越理想。均方根誤差由重構(gòu)信號(hào)和原始時(shí)間序列定義為
本文實(shí)驗(yàn)選取斯克里普斯軌道和常駐陣列中心(Scripps Orbit And Permanent Array Center, SOPAC)網(wǎng)站提供的BJFS站和LHAZ站2000—2020年Clean產(chǎn)品中高程方向時(shí)間序列進(jìn)行實(shí)驗(yàn),該序列經(jīng)數(shù)據(jù)中心處理已經(jīng)剔除了粗差,并且不存在明顯的階躍突變。但大量研究表明該數(shù)據(jù)中仍存在粗差信號(hào)[16-17],因此對(duì)原始信號(hào)利用3倍中誤差法剔除粗差,利用3次樣條插值法進(jìn)行插值,并進(jìn)行去常數(shù)處理。BJFS站和LHAZ站的原始高程時(shí)間序列如圖1所示。本文對(duì)2個(gè)測(cè)站分別進(jìn)行EEMD和HKDE-EEMDAN實(shí)驗(yàn)。
圖1 CORS站原始高程時(shí)間序列
根據(jù)文獻(xiàn)[17],本文實(shí)驗(yàn)設(shè)置EEMD與HKDE-EEMDAN方法中添加白噪聲與信號(hào)標(biāo)準(zhǔn)差之比為0.1,添加噪聲次數(shù)為100次。圖2、圖3為2個(gè)測(cè)站分別采用2種方法的分解結(jié)果,本文僅給出分解得到的中低頻部分IMF分量,余項(xiàng)表示為residual。
圖2和圖3中,可以直觀看出2種分解方法均得到了明顯的周期變化項(xiàng)。為分析高程時(shí)間序列中主要周期運(yùn)動(dòng)的貢獻(xiàn)項(xiàng),統(tǒng)計(jì)中低頻IMF分量的方差貢獻(xiàn)率為判斷指標(biāo),如表1所示。
BJFS站的結(jié)果為:EEMD分解所得分量中IMF6與IMF7所占的方差貢獻(xiàn)率分別為9.00%和37.78%,是周期運(yùn)動(dòng)的主要貢獻(xiàn)項(xiàng),IMF6和IMF7分別呈現(xiàn)出季節(jié)性和年周期變化;HKDE-EEMDAN分解所得分量中IMF7與IMF8所占的方差貢獻(xiàn)率分別為9.53%和43.29%,是周期運(yùn)動(dòng)的主要貢獻(xiàn)項(xiàng),IMF7和IMF8分別呈現(xiàn)出季節(jié)性和年周期變化。2種方法均判定BJFS站主要表現(xiàn)為季節(jié)性和年周期運(yùn)動(dòng)形式。
LHAZ站的結(jié)果為:EEMD分解所得分量中IMF6與IMF7所占的方差貢獻(xiàn)率分別為10.11%和38.53%,是周期運(yùn)動(dòng)的主要貢獻(xiàn)項(xiàng),IMF6整體呈現(xiàn)出半年周期變化,IMF7整體呈現(xiàn)出年周期變化;HKDE-EEMDAN分解所得分量中IMF7與IMF8所占的方差貢獻(xiàn)率分別為13.50%和36.55%,是周期運(yùn)動(dòng)的主要貢獻(xiàn)項(xiàng),IMF7整體呈現(xiàn)出半年周期變化,IMF8整體呈現(xiàn)出年周期變化。2種方法得到的結(jié)論一致,LHAZ站的周期運(yùn)動(dòng)形式主要表現(xiàn)為季節(jié)性半年周期和年周期。
圖2 BJFS站分解中低頻IMF分量
圖3 LHAZ站分解中低頻IMF分量
表1 BJFS和LHAZ站IMF6至IMF11方差貢獻(xiàn)率
計(jì)算2種方法分解得到的IMF分量中相鄰兩項(xiàng)的正交指數(shù),以衡量EEMD和HKDE-EEMDAN的分解精度。正交指數(shù)如表2所示。
表2 正交指數(shù)統(tǒng)計(jì)
HKDE-EEMDAN方法得到的周期運(yùn)動(dòng)主要貢獻(xiàn)項(xiàng)滯后于EEMD方法,分別以2種方法主要周期運(yùn)動(dòng)的貢獻(xiàn)項(xiàng)間正交指數(shù)衡量分解精度。BJFS站經(jīng)HKDE-EEMDAN處理得到的正交指數(shù)78相較于EEMD方法67減少39.8%,LHAZ站經(jīng)HKDE-EEMDAN處理得到的正交指數(shù)78相較于EEMD方法67減少26.8%。
GNSS連續(xù)運(yùn)行導(dǎo)航定位基準(zhǔn)站高程時(shí)間序列經(jīng)2種方法分解后得到一系列頻率由高到低的IMF分量,BJFS站和LHAZ噪聲主要分布于高頻分量IMF1至IMF5中。本文以主要周期項(xiàng)IMF6為信噪分界點(diǎn)進(jìn)行信號(hào)重構(gòu),重構(gòu)信號(hào)如圖4所示。
圖4 重構(gòu)信號(hào)效果
圖4中黑色實(shí)線為HKDE-EEMDAN部分IMF重構(gòu)序列,帶有“+”標(biāo)記符的虛線為EEMD部分IMF重構(gòu)序列,可以看出HKDE-EEMDAN重構(gòu)效果更貼近原始時(shí)間序列的變化趨勢(shì)。為定量分析高程時(shí)間序列重構(gòu)效果,計(jì)算重構(gòu)信號(hào)的信噪比和均方根誤差如表3所示。
表3 信噪比和均方根誤差
由BJFS站和LHAZ站20a的高程時(shí)間序列重構(gòu)信號(hào)經(jīng)2種分解方法處理后的信噪比和均方根誤差值對(duì)比可知:HKDE-EEMDAN方法處理下的信噪比明顯大于EEMD方法,兩站分別提高5.2%和7.7%;HKDE-EEMDAN方法處理下的均方根誤差明顯小于EEMD方法,兩站分別降低31.6%和21.7%。采用HKDE-EEMDAN方法對(duì)CORS站高程時(shí)間序列處理后,信號(hào)重構(gòu)的效果優(yōu)于EEMD方法。
1)本文結(jié)合距離評(píng)價(jià)函數(shù)和熵的聚類算法提出了一種改進(jìn)的噪聲自適應(yīng)整體經(jīng)驗(yàn)?zāi)B(tài)分解方法。2個(gè)CORS站近20a高程時(shí)間序列實(shí)驗(yàn)結(jié)果表明,該方法改善了傳統(tǒng)EEMD方法進(jìn)行信號(hào)分解時(shí)整體平均的結(jié)果未能完全消除隨機(jī)噪聲影響使分解信噪比降低、模態(tài)混疊現(xiàn)象明顯、影響信號(hào)重構(gòu)效果的問題。
2)本文提出方法還原了CORS站高程時(shí)間序列的真實(shí)運(yùn)動(dòng)情況,為高程方向非線性建模奠定了基礎(chǔ),但算法計(jì)算效率較低,如何提高算法計(jì)算效率并對(duì)序列中的噪聲進(jìn)行定性和定量分析是進(jìn)一步研究的課題。
[1] 姜衛(wèi)平. GNSS基準(zhǔn)站網(wǎng)數(shù)據(jù)處理方法與應(yīng)用[M]. 武漢: 武漢大學(xué)出版社, 2017.
[2] 程鵬飛, 成英燕, 秘金鐘, 等. 2000國(guó)家大地坐標(biāo)系建立的理論與方法[M]. 北京: 測(cè)繪出版社, 2014.
[3] 張鵬, 蔣志浩, 秘金鐘, 等. 我國(guó)GPS跟蹤站數(shù)據(jù)處理與時(shí)間序列特征分析[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2007,32(3): 251-254.
[4] 徐健, 周志祥, 唐亮, 等. 基于總體平均經(jīng)驗(yàn)?zāi)B(tài)分解算法的自適應(yīng)改進(jìn)[J]. 振動(dòng)與沖擊, 2017, 36(11): 215-223.
[5] 武曙光. 區(qū)域 CORS 站坐標(biāo)時(shí)間序列特征分析[D]. 武漢: 武漢大學(xué), 2017.
[6] 湯俊, 姚宜斌, 陳鵬, 等. 利用EMD方法改進(jìn)電離層TEC預(yù)報(bào)模型[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2013, 38(4): 408-411, 444.
[7] WU Z H, HUANG N E. A study of the characteristics of white noise using the empirical mode decomposition method[J]. Proceedings of the Royal Society of London Series A: Mathematical Physical & Engineering Sciences, 2004, 460(2046): 1597-1611.
[8] WU Z H, HUANG N E. Ensemble empirical mode decomposition: a noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis, 2009, 1(1): 1-41.
[9] 張恒璟, 齊昕, 文漢江. 基于均值聚類EEMD的CORS高程時(shí)間序列信號(hào)分析方法[J]. 大地測(cè)量與地球動(dòng)力學(xué), 2019, 39(10): 1053-1057.
[10] 李鵬. 基于層次均值的聚類算法的研究[D]. 哈爾濱: 哈爾濱工程大學(xué), 2015.
[11] 明鋒, 楊元喜, 曾安敏, 等. 中國(guó)區(qū)域IGS站高程時(shí)間序列季節(jié)性信號(hào)及長(zhǎng)期趨勢(shì)分析[J]. 中國(guó)科學(xué)(地球科學(xué)), 2016, 46(6): 834-844.
[12] 李忠盼, 趙冬青, 向民志, 等. 一種加速GNSS信號(hào)捕獲的短時(shí)傅里葉變換算法[J]. 測(cè)繪科學(xué)技術(shù)學(xué)報(bào), 2019, 36(1): 23-27.
[13] 雷亞國(guó), 孔德同, 李乃鵬, 等. 自適應(yīng)總體平均經(jīng)驗(yàn)?zāi)J椒纸饧捌湓谛行驱X輪箱故障檢測(cè)中的應(yīng)用[J]. 機(jī)械工程學(xué)報(bào), 2014, 50(3): 64-70.
[14] 李長(zhǎng)偉, 雷文平, 龐博, 等. 基于EEMD的相關(guān)排列熵的滾動(dòng)軸承故障診斷[J]. 組合機(jī)床與自動(dòng)化加工技術(shù), 2020(8): 1-4.
[15] 唐東明. 聚類分析及其應(yīng)用研究[D]. 成都: 電子科技大學(xué), 2010.
[16] 羅權(quán). GPS坐標(biāo)時(shí)間序列的功率譜分析研究[D]. 武漢: 武漢大學(xué), 2017.
[17] 張恒璟. 國(guó)家CORS基準(zhǔn)站高程時(shí)間序列非線性時(shí)變研究[D]. 阜新: 遼寧工程技術(shù)大學(xué), 2013.
Time series analysis method of CORS station elevation based on HKDE-EEMDAN
WEN Huali1,2, JIN Zelin3, FAN Rongshuang2, WANG Chongbing1,2, LI Haoran1, LIU Yilun1
(1. School of Geomatics, Liaoning Technical University, Fuxin, Liaoning 123000, China; 2. Chinese Academy of Surveying and Mapping, Beijing 100036, China;3. China Energy Engineering Group Liaoning Electric Power Survey and Design Institute Co., Ltd., Shenyang 110000, China)
To address the problem that the impact of random noise cannot be completely eliminated when the traditional Ensemble Empirical Mode Decomposition (EEMD) method is used for signal decomposition and the signal noise ratio is reduced and the effect of signal reconstruction is not satisfactory, this paper proposed an improved ensemble empirical mode decomposition of adaptive noise using clustering algorithm based on distance evaluation function and entropy. In the Empirical Mode Decomposition (EMD) processing, the modal components of white noise decomposition were added, and clustering analysis was implemented on the Intrinsic Mode Function (IMF) components of orders in the iterative process. This method and the EEMD method were used to decompose the elevation time series of two Continuously Operating Reference Stations (CORS) for the past 20 years. Based on the signal noise ratio, index of orthogonality and root mean square error index, the decomposition accuracies of these two methods were analyzed and compared. The final experimental result showed that this method could increase the signal noise ratio by more than 5%, improve decomposition accuracy by more than 26%, and reduce the root mean square error of reconstructed signal by more than 21%, thus it was capable of reducing the impact of random noise on time series decomposition and signal reconstruction.
adaptive noise; cluster analysis; elevation time series; information entropy; signal reconstruction
P228
A
2095-4999(2021)06-0077-07
文化立,金澤林,范榮雙,等. HKDE-EEMDAN的CORS站高程時(shí)間序列分析方法[J]. 導(dǎo)航定位學(xué)報(bào), 2021, 9(6): 77-83.(WEN Huali, JIN Zelin, FAN Rongshuang, et al. Time series analysis method of CORS station elevation based on HKDE-EEMDAN[J]. Journal of Navigation and Positioning, 2021, 9(6): 77-83.)
10.16547/j.cnki.10-1096.20210612.
2021-01-25
國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2016YFC0803100);遼寧省教育廳遼寧省高等學(xué)?;究蒲许?xiàng)目(LJ2017QL008)。
文化立(1994—),男,河南濮陽(yáng)人,碩士研究生,研究方向?yàn)榭臻g大地測(cè)量數(shù)據(jù)處理與GNSS高程非線性運(yùn)動(dòng)、地理信息系統(tǒng)應(yīng)用。
金澤林(1996—),男,遼寧撫順人,碩士,研究方向?yàn)榇蟮販y(cè)量學(xué)與工程測(cè)量學(xué)。