雷 雨,蔡宏兵
(1. 中國(guó)科學(xué)院國(guó)家授時(shí)中心,陜西 西安 710600;2. 中國(guó)科學(xué)院時(shí)間頻率基準(zhǔn)重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710600;3. 中國(guó)科學(xué)院大學(xué),北京 100049)
?
顧及最小二乘擬合端點(diǎn)效應(yīng)的日長(zhǎng)變化預(yù)報(bào)*
雷雨1,2,3,蔡宏兵1,2
(1. 中國(guó)科學(xué)院國(guó)家授時(shí)中心,陜西 西安710600;2. 中國(guó)科學(xué)院時(shí)間頻率基準(zhǔn)重點(diǎn)實(shí)驗(yàn)室,陜西 西安710600;3. 中國(guó)科學(xué)院大學(xué),北京100049)
針對(duì)日長(zhǎng)(Length Of Day, LOD)變化預(yù)報(bào)中最小二乘(Least Squares, LS)擬合存在端點(diǎn)效應(yīng)的問(wèn)題,采用時(shí)間序列分析方法對(duì)日長(zhǎng)變化序列進(jìn)行端點(diǎn)延拓,形成一個(gè)新序列,然后用新序列建立最小二乘模型,最后再結(jié)合最小二乘模型和自回歸(Autoregressive, AR)模型對(duì)原始日長(zhǎng)變化序列進(jìn)行預(yù)報(bào)。實(shí)驗(yàn)結(jié)果表明,在日長(zhǎng)變化序列兩端增加統(tǒng)計(jì)延拓?cái)?shù)據(jù),能有效減小最小二乘擬合序列的端點(diǎn)畸變,從而提高日長(zhǎng)變化的預(yù)報(bào)精度,尤其對(duì)中長(zhǎng)期預(yù)報(bào)精度提高明顯。
日長(zhǎng)變化;預(yù)報(bào);最小二乘擬合;端點(diǎn)效應(yīng);時(shí)間序列分析
日長(zhǎng)變化是表征地球自轉(zhuǎn)運(yùn)動(dòng)的一個(gè)重要參量,反映了地球自轉(zhuǎn)速率的快慢。日長(zhǎng)變化與極移(Polar Motion, PM)的兩個(gè)分量統(tǒng)稱為地球自轉(zhuǎn)參數(shù)(Earth Rotation Parameters, ERP)。地球自轉(zhuǎn)參數(shù)是實(shí)現(xiàn)地球參考系與天球參考系相互轉(zhuǎn)換的必需參數(shù),在衛(wèi)星導(dǎo)航、深空探測(cè)以及天文地球動(dòng)力學(xué)研究等領(lǐng)域有重要應(yīng)用[1]。衛(wèi)星激光測(cè)距(Satellite Laser Ranging, SLR)、甚長(zhǎng)干涉基線測(cè)量(Very Long Baseline Interferometry, VLBI)與全球衛(wèi)星導(dǎo)航系統(tǒng)(Global Navigation Satellite System, GNSS)等現(xiàn)代空間測(cè)地技術(shù)是獲取地球自轉(zhuǎn)參數(shù)的主要手段,但復(fù)雜的資料處理過(guò)程使得地球自轉(zhuǎn)參數(shù)的獲取存在一定延遲,因此對(duì)地球自轉(zhuǎn)參數(shù)進(jìn)行高精度預(yù)報(bào)是一項(xiàng)必要工作。
當(dāng)前預(yù)報(bào)日長(zhǎng)變化的方法有多種,這些方法大多是最小二乘外推模型和其他模型的組合,如最小二乘外推與自回歸(Autoregressive, AR)模型的組合(LS+AR)[2]、最小二乘外推與神經(jīng)網(wǎng)絡(luò)(Neural Network, NN)技術(shù)的組合(LS+NN)[3-5]和最小二乘外推與高斯過(guò)程回歸(Gaussian Process Regression, GPR)模型的組合(LS+GPR)[6-7]等。這些組合方法均是首先建立最小二乘外推模型,得到日長(zhǎng)變化序列趨勢(shì)項(xiàng)和周期項(xiàng)的外推值,再利用其他方法對(duì)最小二乘擬合殘差序列進(jìn)行預(yù)報(bào),而日長(zhǎng)變化預(yù)測(cè)值為最小二乘外推值和殘差序列預(yù)測(cè)值的疊加。
實(shí)際工作中發(fā)現(xiàn),在利用最小二乘模型對(duì)日長(zhǎng)變化序列進(jìn)行擬合時(shí),在擬合序列的兩端存在發(fā)散畸變現(xiàn)象(在數(shù)據(jù)處理中稱作端點(diǎn)畸變效應(yīng),簡(jiǎn)稱端點(diǎn)效應(yīng)),致使趨勢(shì)項(xiàng)、周期項(xiàng)和殘差序列的預(yù)報(bào)值出現(xiàn)偏差,最終導(dǎo)致日長(zhǎng)變化序列的最終預(yù)測(cè)值不準(zhǔn)確。本文針對(duì)日長(zhǎng)變化預(yù)報(bào)中最小二乘擬合存在端點(diǎn)效應(yīng)的問(wèn)題,在利用最小二乘模型擬合日長(zhǎng)變化序列之前,先采用時(shí)間序列分析方法對(duì)日長(zhǎng)變化序列進(jìn)行數(shù)據(jù)延拓,即在觀測(cè)序列的兩端增加用統(tǒng)計(jì)學(xué)方法延拓出的若干數(shù)據(jù)點(diǎn),形成一個(gè)新序列,然后用新序列求得最小二乘模型系數(shù),最后再利用最小二乘外推與自回歸組合模型對(duì)日長(zhǎng)變化原始序列進(jìn)行預(yù)測(cè)。算例表明,通過(guò)對(duì)觀測(cè)序列兩端的數(shù)據(jù)延拓,可以有效消除端點(diǎn)效應(yīng)的影響,從而提高日長(zhǎng)變化預(yù)報(bào)的精度。
1.1資料預(yù)處理
本文所用日長(zhǎng)變化資料源自國(guó)際地球自轉(zhuǎn)與參考系服務(wù)(International Earth Rotation and Reference Systems Service, IERS)組織發(fā)布的EOP 05 C04序列,采樣間隔為1 d。日長(zhǎng)變化序列中包含多種周期性變化成分,其中對(duì)周期為5 d~18.6 a的62個(gè)固體地球帶諧潮汐項(xiàng)利用IERS協(xié)議給出的經(jīng)驗(yàn)?zāi)P徒o予扣除[8],而扣除這些固體潮汐項(xiàng)后的日長(zhǎng)變化稱為ΔLODR。本文對(duì)日長(zhǎng)變化的預(yù)報(bào)均是針對(duì)ΔLODR的預(yù)報(bào)。
1.2最小二乘外推模型
日長(zhǎng)變化序列扣除固體潮汐項(xiàng)后,還含有長(zhǎng)期趨勢(shì)項(xiàng)和周年項(xiàng)、半周年項(xiàng)等季節(jié)性變化成分,這些趨勢(shì)項(xiàng)和周期項(xiàng)采用下述最小二乘模型進(jìn)行擬合和外推:
(1)
其中,T1和T2分別表示周年項(xiàng)和半周年項(xiàng)的振蕩周期,本文取T1=365.24 d、T2=182.62 d;a和b表示長(zhǎng)期趨勢(shì)項(xiàng)參數(shù);c1和d1表示周年項(xiàng)參數(shù);c2和d2表示半周年項(xiàng)參數(shù)。這6個(gè)未知參數(shù)可以通過(guò)最小二乘法求得。
1.3自回歸模型
自回歸模型是對(duì)平穩(wěn)時(shí)間序列{zt,t=1, 2, …,n}建立的一個(gè)概率統(tǒng)計(jì)模型,它根據(jù)變量自身過(guò)去的變化規(guī)律來(lái)建立預(yù)報(bào)模型,其數(shù)學(xué)模型為
(2)
其中,p為模型階次;εt為白噪聲;φ1,φ2, …,φp為模型參數(shù),可以采用Yule-Walker方程求解。
使用自回歸模型的關(guān)鍵在于選取模型階次p。常用的定階準(zhǔn)則有信息論準(zhǔn)則、傳遞函數(shù)準(zhǔn)則與最終預(yù)報(bào)誤差準(zhǔn)則,這3種準(zhǔn)則在實(shí)際應(yīng)用中是等效的[9]。本文選用赤池信息量準(zhǔn)則(Akaike Information Criterion, AIC)確定階次p,準(zhǔn)則函數(shù)可以表示為
(3)
當(dāng)模型階次p和模型參數(shù)φ1, φ2, …, φp確定時(shí),可根據(jù)下述方式進(jìn)行時(shí)間序列的多步外推預(yù)報(bào)。
(4)
(5)
(6)
1.4預(yù)報(bào)流程
本文預(yù)報(bào)方法與常規(guī)方法的區(qū)別在于,本文方法在對(duì)ΔLODR序列建立趨勢(shì)項(xiàng)和周期項(xiàng)最小二乘外推模型之前,首先利用時(shí)間序列分析方法在ΔLODR序列首尾兩端進(jìn)行數(shù)據(jù)延拓,以削弱最小二乘擬合端點(diǎn)效應(yīng)的影響,具體方法如下:
(1)首先根據(jù)(1)式對(duì)ΔLODR序列進(jìn)行最小二乘擬合,建立趨勢(shì)項(xiàng)和周期項(xiàng)外推模型,然后利用自回歸模型對(duì)最小二乘殘差序列進(jìn)行預(yù)報(bào),最后利用最小二乘外推與自回歸組合模型在ΔLODR序列首尾兩端分別外推若干數(shù)據(jù)點(diǎn),這樣原始ΔLODR序列加上首尾兩端外推的數(shù)據(jù)形成了一個(gè)新序列。
(2)利用新序列確定最小二乘模型系數(shù),即用新序列重新建立趨勢(shì)項(xiàng)和周期項(xiàng)最小二乘外推模型,然后再結(jié)合最小二乘模型和自回歸模型對(duì)原始ΔLODR序列進(jìn)行預(yù)報(bào)。
需要說(shuō)明的是,新序列只用來(lái)求解最小二乘模型系數(shù),而在后續(xù)預(yù)報(bào)中仍然使用原始ΔLODR序列。
選用1999年1月1日至2011年10月22日期間的日長(zhǎng)變化數(shù)據(jù)進(jìn)行實(shí)驗(yàn),其中2010年1月1日至2011年10月22日作為預(yù)報(bào)期,建模序列長(zhǎng)度取為10a。
為了驗(yàn)證端點(diǎn)數(shù)據(jù)延拓方法對(duì)端點(diǎn)效應(yīng)的改善效果,首先對(duì)比端點(diǎn)延拓前后最小二乘擬合效果。圖1繪出了端點(diǎn)延拓前后最小二乘擬合的殘差序列,其中圖1(a)為最小二乘擬合序列首端前50個(gè)歷元的殘差序列,圖1(b)為最小二乘擬合序列尾端最后50個(gè)歷元的殘差序列,擬合時(shí)段為2000年10月26日至2010年10月25日,端點(diǎn)延拓?cái)?shù)據(jù)個(gè)數(shù)為360,即在首尾兩端各外推360個(gè)數(shù)據(jù)點(diǎn)。
圖1端點(diǎn)延拓前后最小二乘擬合效果對(duì)比
Fig.1ComparisonofLSfittingwithandwithoutedgeextension
從圖1可以看到,與端點(diǎn)延拓前相比,端點(diǎn)延拓后最小二乘擬合殘差在序列首尾兩端更接近于0,即端點(diǎn)延拓后最小二乘擬合的ΔLODR序列更為準(zhǔn)確,這說(shuō)明端點(diǎn)延拓方法能有效抑制最小二乘擬合出現(xiàn)的端點(diǎn)效應(yīng)問(wèn)題。為了進(jìn)一步說(shuō)明端點(diǎn)延拓方法對(duì)端點(diǎn)效應(yīng)的改善作用,本文選取1999年1月1日至2009年12月31日期間的日長(zhǎng)變化數(shù)據(jù)進(jìn)行擬合實(shí)驗(yàn),將擬合長(zhǎng)度取為10 a,每隔1 d擬合1次,即擬合滑動(dòng)窗口為10 a,總共擬合300次,并統(tǒng)計(jì)每次端點(diǎn)延拓前后首部和尾部50個(gè)歷元?dú)埐钚蛄械木礁`差(Root Mean Square Error, RMSE),其中端點(diǎn)延拓前首部和尾部50個(gè)歷元?dú)埐钚蛄械?00次平均均方根誤差分別為0.29 ms和0.30 ms,端點(diǎn)延拓后首部和尾部50個(gè)歷元?dú)埐钚蛄械?00次平均均方根誤差分別為0.22 ms和0.23 ms,實(shí)驗(yàn)結(jié)果可以說(shuō)明端點(diǎn)延拓方法對(duì)端點(diǎn)畸變的抑制效果。
為了驗(yàn)證本文方法相對(duì)于常規(guī)最小二乘外推與自回歸組合模型對(duì)日長(zhǎng)變化預(yù)報(bào)精度的改善情況,分別利用這兩種方法對(duì)日長(zhǎng)變化進(jìn)行1~360 d跨度預(yù)報(bào),選用均方根誤差作為精度評(píng)估指標(biāo),其計(jì)算公式為
(7)
其中,Pj、Oj分別表示j點(diǎn)的日長(zhǎng)變化預(yù)測(cè)值和觀測(cè)值;l為預(yù)報(bào)跨度;N為預(yù)報(bào)期數(shù)。本文總共進(jìn)行了300期的預(yù)報(bào),每次預(yù)報(bào)時(shí)建模序列長(zhǎng)度始終取為10 a,每隔1 d滑動(dòng)預(yù)報(bào)1次,即N=300。
圖2給出了本文方法和常規(guī)最小二乘外推與自回歸組合模型的日長(zhǎng)變化預(yù)報(bào)均方根誤差對(duì)比圖,表1統(tǒng)計(jì)了兩種方法在各種跨度的預(yù)報(bào)均方根誤差情況。結(jié)合圖2和表1可以看出,本文方法的預(yù)報(bào)精度相對(duì)于常規(guī)最小二乘外推與自回歸組合模型在各個(gè)預(yù)報(bào)跨度有不同程度的改善,其中,對(duì)于1~30 d短期預(yù)報(bào),預(yù)報(bào)精度改善不明顯,在10%以內(nèi);從第30 d開始,本文方法的預(yù)報(bào)精度明顯優(yōu)于常規(guī)最小二乘外推與自回歸組合模型,精度最大改善了15.80%,且一直保持在13%左右,這說(shuō)明本文方法對(duì)于中長(zhǎng)期跨度預(yù)報(bào)具有更明顯的優(yōu)勢(shì),同時(shí)也從側(cè)面說(shuō)明端點(diǎn)效應(yīng)對(duì)日長(zhǎng)變化中長(zhǎng)期預(yù)報(bào)的影響更大。
圖2本文方法和常規(guī)最小二乘外推與自回歸組合模型的日長(zhǎng)變化預(yù)報(bào)均方根誤差對(duì)比
Fig.2 Comparison of the prediction RMSE between the LS+AR and the proposed method
本文提出了一種顧及最小二乘擬合端點(diǎn)效應(yīng)的日長(zhǎng)變化預(yù)報(bào)方法,其實(shí)質(zhì)是在原始序列兩端增加統(tǒng)計(jì)延拓?cái)?shù)據(jù),以將最小二乘擬合出現(xiàn)的端點(diǎn)效應(yīng)移至模擬序列的兩端,從而減小原始序列的端點(diǎn)畸變。算例表明,通過(guò)在觀測(cè)序列的兩端增加用時(shí)間序列分析方法延拓的模擬數(shù)據(jù)點(diǎn),然后再進(jìn)行最小二乘擬合,可以有效削弱端點(diǎn)效應(yīng)的影響;相對(duì)于常規(guī)最小二乘外推與自回歸組合預(yù)報(bào)模型,本文方法的日長(zhǎng)變化預(yù)報(bào)精度有明顯改善,對(duì)于中長(zhǎng)期預(yù)報(bào)其精度提高尤為明顯。此外,在實(shí)驗(yàn)中發(fā)現(xiàn),端點(diǎn)延拓長(zhǎng)度對(duì)本文方法的預(yù)報(bào)精度具有較大影響,本文對(duì)此并未進(jìn)行深入研究,而僅僅選取了相對(duì)較優(yōu)的預(yù)報(bào)結(jié)果,因此,本文方法仍有提升空間。對(duì)于如何選取最佳的端點(diǎn)延拓長(zhǎng)度,將進(jìn)行深入研究。
[1]Gambis D, Luzum B. Earth rotation monitoring, UT1 determination and prediction[J]. Metrologia, 2011, 48(4): 165-170.
[2]Xu Xueqing, Zhou Yonghong. EOP prediction using least square fitting and autoregressive filter over optimized data intervals[J]. Advances in Space Research, 2015, 56(10): 2248-2253.
[3]Wang Qijie, Du Yanan, Liu Jian. Introducing atmospheric angular momentum into prediction of length of day change by generalized regression neural network model[J]. Journal of Central South University, 2014, 21(4): 1396-1401.
[4]Lei Yu, Zhao Danning, Cai Hongbing. Prediction of length-of-day using extreme learning machine[J]. Geodesy and Geodynamics, 2015, 6(2): 151-159.
[5]雷雨, 蔡宏兵, 趙丹寧. 樣本輸入方式對(duì)極端學(xué)習(xí)機(jī)預(yù)報(bào)日長(zhǎng)變化的影響[J]. 天文研究與技術(shù), 2015, 12(3): 299-305.
Lei Yu, Cai Hongbing, Zhao Daning. Effects of training patterns on predictions of variations of length of day using an extreme learning machine neural network[J]. Astronomical Research & Technology, 2015, 12(3): 299-305.
[6]雷雨, 趙丹寧, 高玉平, 等. 基于高斯過(guò)程的日長(zhǎng)變化預(yù)報(bào)[J]. 天文學(xué)報(bào), 2015, 56(1): 53-62.
Lei Yu, Zhao Daning, Gao Yuping, et al. The prediction of length-of-day variations based on Gaussian processes[J]. Acta Astronomica Sinica, 2015, 56(1): 53-62.
[7]Lei Yu, Guo Min, Cai Hongbing, et al. Prediction of length-of-day using Gaussian process regression[J]. The Journal of Navigation, 2015, 68(3): 563-575.
[8]Petit G, Luzum B. IERS conventions (2010) [R]. Frankfurt am Main: Verlag des Bundesamts für Kartographie und Geod?sie, 2011: 123-131.
[9]丁月蓉, 鄭大偉. 天文數(shù)據(jù)處理方法[M]. 南京: 南京大學(xué)出版社, 1998: 307-308.
Enhancing the Prediction Accuracy of the Length of Day Change by Eliminating the Edge-effect of Least Squares Fitting
Lei Yu1,2,3, Cai Hongbing1,2
(1. National Time Service Center, Chinese Academy of Sciences, Xi’an 710600, China, Email: leiyu@ntsc.ac.cn;2. Key Laboratory of Time and Frequency Primary Standards, Chinese Academy of Sciences, Xi’an 710600, China;3. University of Chinese Academy of Sciences, Beijing 100049, China)
In order to eliminate the edge-effect of least squares (LS) fitting for the length of day change (ΔLOD), the time-series analysis model is first used to extrapolate ΔLOD series forward and backward and then generate a new series. Subsequently, the cofficients of a LS model are estimated using the new generated series. As a result, the edge-effect is changed to the edge of the new series, and thus the original fitted ΔLOD series can be free from the edge-effect. Finally, a combination of LS and autoregressive (AR) models (LS+AR) is employed to predict the original ΔLOD data. The results indicate that the proposed method can efficiently eliminate the edge-effect, and thus improve the prediction accurcy of the LS+AR model, especially for medium- and long-term prediction.
Length Of Day (LOD) change; Prediction; Least Squares (LS) fitting; Edge-effect; Time-series analysis
中國(guó)科學(xué)院 “西部之光” 人才培養(yǎng)計(jì)劃聯(lián)合學(xué)者項(xiàng)目(201491) 資助.
2015-12-29;
2016-01-19
雷雨,男,博士. 研究方向:地球自轉(zhuǎn)變化監(jiān)測(cè)與預(yù)報(bào). Email: leiyu@ntsc.ac.cn
P227.1
A
1672-7673(2016)04-0441-05
CN 53-1189/PISSN 1672-7673