徐鵬飛, 蔣濤, 章傳銀, 芮明勝, 劉宇
1 中國(guó)測(cè)繪科學(xué)研究院, 北京 100830 2 山東科技大學(xué)測(cè)繪與空間信息學(xué)院, 山東青島 266590
陸地水是不可或缺的重要自然資源,與人類活動(dòng)密切相關(guān),由于水資源的分布不均,制約著國(guó)家和地區(qū)的高速發(fā)展,嚴(yán)重影響我國(guó)可持續(xù)發(fā)展戰(zhàn)略(Zhong et al.,2009).因此,陸地水儲(chǔ)量異常TWSA(Terrestrial Water Storage Anomaly)的長(zhǎng)期可持續(xù)監(jiān)測(cè),對(duì)于研究水循環(huán)過(guò)程,合理配置水資源,預(yù)防洪澇、干旱等自然災(zāi)害等有相當(dāng)重要的科學(xué)意義和參考價(jià)值(Chen et al.,2009).
2002年初,GRACE(Gravity Recovery and Climate Experiment)衛(wèi)星開(kāi)始運(yùn)行,基于GRACE獲取空間中長(zhǎng)尺度的時(shí)變重力場(chǎng)信息,可反演TWSA,使TWSA的長(zhǎng)期可持續(xù)監(jiān)測(cè)成為可能,國(guó)內(nèi)外學(xué)者基于GRACE數(shù)據(jù)對(duì)區(qū)域TWSA進(jìn)行了大量研究(Tapley et al.,2004;Yeh et al.,2006;Tiwari et al.,2009;Chen et al.,2014;Long et al.,2016).直至2017年10月,GRACE任務(wù)結(jié)束,CSR(Center for Space Research)、GFZ(Helmholtz-Centre Potsdam-German Research Centre for Geosciences)、JPL(Jet Propulsion Laboratory)三所機(jī)構(gòu)最新發(fā)布的GRACE Level-2 RL06(Release 06)數(shù)據(jù)更新至2017年6月,但由于衛(wèi)星后期運(yùn)行存在的質(zhì)量問(wèn)題,一般2016年8月之后的數(shù)據(jù)不再使用.2018年5月,為延續(xù)GRACE任務(wù),GRACE-FO(GRACE Follow-On)成功發(fā)射升空,該衛(wèi)星將繼續(xù)監(jiān)測(cè)全球重力場(chǎng)的變化.近期CSR、GFZ、JPL公布了最新的GRACE-FO Level-2 RL06球諧系數(shù)數(shù)據(jù),下文簡(jiǎn)稱GRACE-FO SH,截至2021年1月10日,數(shù)據(jù)的時(shí)間段為2018年6月至2020年11月,由此GRACE與GRACE-FO之間存在了20多個(gè)月的數(shù)據(jù)空窗期.為得到長(zhǎng)期連續(xù)的TWSA監(jiān)測(cè)結(jié)果,更準(zhǔn)確的研究TWSA的年際變化與長(zhǎng)期趨勢(shì)特征,從而合理利用配置水資源,一種有效的針對(duì)GRACE/GRACE-FO數(shù)據(jù)空窗期的TWSA間斷補(bǔ)償方法是十分必要的.
數(shù)據(jù)間斷的補(bǔ)償可通過(guò)時(shí)間序列分析或機(jī)器學(xué)習(xí)等方法預(yù)測(cè)實(shí)現(xiàn),國(guó)內(nèi)外學(xué)者針對(duì)水儲(chǔ)量變化的預(yù)測(cè)開(kāi)展了大量研究工作.Mirzavand和Ghazavi(2015)利用ARMA(Autoregressive Moving Average)、ARIMA(Autoregressive Integrated Moving Average)、SARIMA(Seasonal Autoregressive Integrated Moving Average)對(duì)伊朗喀山平原的地下水位進(jìn)行預(yù)測(cè)試驗(yàn),研究表明可提前60個(gè)月對(duì)地下水位取得較好的預(yù)測(cè)效果.Adamowski和Chan(2011)利用小波神經(jīng)網(wǎng)絡(luò)WNN(Wavelet Neural Network)預(yù)測(cè)加拿大魁北克的地下水位,并與ARIMA方法比較,驗(yàn)證了該方法的有效性及潛力.Dos Santos和Pereira Filho(2014)利用ANN(Artificial Neural Network),并引入天氣變量,預(yù)測(cè)圣保羅地區(qū)的用水需求,發(fā)現(xiàn)天氣對(duì)用水消耗存在反饋?zhàn)饔?另外還有WA-ANN(Wavelet Analysis-Artificial Neural Network)、SVR(Support Vector Regression)等其他方法(Adeli and Jiang,2006;Moosavi et al.,2013;王宇譜等,2013;Tiwari and Adamowski,2015;Al-Zahrani and Abo-Monasar,2015;Mukherjee and Ramachandran,2018).傳統(tǒng)的時(shí)間序列分析方法實(shí)現(xiàn)簡(jiǎn)單,基于最小二乘原理構(gòu)造隨時(shí)間變化的函數(shù),向后遞推,從而預(yù)測(cè)后續(xù)序列.然而該方法對(duì)于信號(hào)成分復(fù)雜的時(shí)間序列的預(yù)測(cè)效果較差,且易受到信號(hào)中噪聲成分的影響,從而預(yù)測(cè)失真.相較而言,ANN、WA-ANN、SVR算法的精度較高,但需額外的物理變量進(jìn)行約束(如氣象數(shù)據(jù)等),實(shí)現(xiàn)困難,計(jì)算效率較低.綜上所述,本文將引入奇異譜分析SSA(Singular Spectrum Analysis)+ARMA組合方法(Shen et al.,2018;牛余朋等,2020),預(yù)測(cè)GRACE/GRACE-FO空窗期的TWSA,從而對(duì)TWSA的間斷進(jìn)行補(bǔ)償.GRACE運(yùn)行多年,積累了較為充足的樣本,且近期GRACE-FO數(shù)據(jù)的發(fā)布,為間斷補(bǔ)償?shù)木仍u(píng)定提供了可靠依據(jù).
SSA作為一種時(shí)間序列信號(hào)的處理方法,在GNSS(Global Navigation Satellite System)數(shù)據(jù)處理等領(lǐng)域應(yīng)用較多(王解先等,2013;Kondrashov and Berloff,2015;肖勝紅等,2016),但在水儲(chǔ)量變化的預(yù)測(cè)方面應(yīng)用較少,從有限時(shí)間序列的動(dòng)態(tài)重構(gòu)出發(fā),結(jié)合特征向量分析(Eigenvector Analysis),SSA方法可充分識(shí)別并提取信號(hào)中不同成分(如周期、趨勢(shì)、噪聲等),且無(wú)需引入額外的物理變量,實(shí)現(xiàn)較為簡(jiǎn)易,特別適合分析預(yù)測(cè)具有周期特征的TWSA時(shí)間序列.Li等(2019)利用SSA方法預(yù)測(cè)了中國(guó)多個(gè)地區(qū)的水儲(chǔ)量變化,取得了較好的效果,但關(guān)于如何選擇訓(xùn)練樣本、檢驗(yàn)樣本提高預(yù)測(cè)模型精度的討論尚不充分.因此,本文將選取TWSA周期特征明顯的全球典型流域?yàn)槔?,?yàn)證SSA方法在典型流域的適用性及間斷補(bǔ)償效果,并進(jìn)一步討論如何選擇訓(xùn)練樣本、檢驗(yàn)樣本構(gòu)建更適用于間斷補(bǔ)償?shù)念A(yù)測(cè)模型,從而提高GRACE/GRACE-FO數(shù)據(jù)空窗期TWSA間斷補(bǔ)償結(jié)果的精度.此外,雖然SSA方法可以有效對(duì)TWSA序列的周期項(xiàng)等主要成分進(jìn)行分解與重構(gòu),但剩余隨機(jī)序列中依然存在部分有效信息,而剩余隨機(jī)序列可以利用ARMA模型進(jìn)行擬合遞推.為此,本文引入了SSA+ARMA組合方法進(jìn)一步提高間斷補(bǔ)償結(jié)果的精度.從全球選取亞馬遜流域、多瑙河流域、恒河流域、密西西比河流域、尼日爾河流域、伏爾加河流域、葉尼塞河流域、長(zhǎng)江流域這八個(gè)典型流域進(jìn)行試驗(yàn),并分別利用SSA+ARMA、SSA、ARMA和WNN算法進(jìn)行對(duì)比分析,驗(yàn)證SSA+ARMA方法的適用性和有效性.后續(xù)采用GRACE-FO SH反演TWSA、Mascons、GLDAS(Global Land Data Assimilation System)數(shù)據(jù),評(píng)定基于SSA+ARMA方法的TWSA間斷補(bǔ)償結(jié)果精度,驗(yàn)證方法的可靠性.
本文使用CSR的GRACE/GRACE-FO RL06 大地水準(zhǔn)面球諧模型GSM(Geoid Spherical Harmonic Model)球諧系數(shù)文件,階數(shù)為60階,下文簡(jiǎn)稱GRACE SH.選取GRACE SH的時(shí)間段為:2003年1月—2016年8月,共計(jì)149個(gè)月數(shù)據(jù)(部分月數(shù)據(jù)缺失).截至2021年1月10日,新發(fā)布的GRACE-FO SH時(shí)間段為:2018年6月—2020年11月,共計(jì)28個(gè)月數(shù)據(jù)(2018年8月、2018年9月數(shù)據(jù)缺失).與RL05數(shù)據(jù)一樣,這些數(shù)據(jù)扣除了固體潮汐、海洋潮汐、非潮汐的大氣和海洋信號(hào)(Bettadpur,2003).與RL05相比,RL06數(shù)據(jù)在參數(shù)選擇、算法設(shè)計(jì)、數(shù)據(jù)編輯、背景場(chǎng)模型構(gòu)建等方面進(jìn)行了優(yōu)化,“條帶”誤差與截?cái)嗾`差有明顯的改善(Save,2018;G?ttl et al.,2018).數(shù)據(jù)預(yù)處理階段分別用SLR(Satellite Laser Ranging)提供的C20項(xiàng)和來(lái)自Swenson的一階項(xiàng),替換GSM中的C20項(xiàng)、一階項(xiàng)(Swenson and Wahr,2002;Cheng and Tapley,2004).此外,冰川均衡調(diào)整(GIA)引起的重力場(chǎng)長(zhǎng)期變化趨勢(shì)利用了三維壓縮地表負(fù)荷滯彈響應(yīng)模型進(jìn)行扣除(Geruo et al.,2013).
為驗(yàn)證GRACE SH反演TWSA的可靠性及對(duì)間斷補(bǔ)償結(jié)果進(jìn)行精度評(píng)定,本文選取JPL、CSR、GFZ的Mascons RL05以及JPL、CSR的Mascons RL06數(shù)據(jù)進(jìn)行比較.Mascons RL05數(shù)據(jù)的分辨率為1°×1°,每月一值,數(shù)據(jù)時(shí)間段為2003年1月至2017年1月.JPL發(fā)布的Mascons RL06數(shù)據(jù)的分辨率為0.5°×0.5°,每月一值.CSR發(fā)布的Mascons RL06數(shù)據(jù)的分辨率為0.25°×0.25°,每月一值.截至2021年1月10日,基于GRACE-FO數(shù)據(jù)的Mascons RL06結(jié)果已經(jīng)更新至2020年10月.經(jīng)過(guò)泄漏誤差的修復(fù)、GIA改正等一系列處理后,具有更好的精度,因此廣泛應(yīng)用于GRACE SH反演TWSA結(jié)果精度的驗(yàn)證分析(Scanlon et al.,2016).其中Mascons RL05采用的GIA改正模型為三維壓縮地表負(fù)荷滯彈響應(yīng)模型,與本文對(duì)GRACE SH的處理一致.而Mascons RL06采用的ICE6G-D模型(Purcell et al.,2016).二者模型存在差異,但差異主要體現(xiàn)在南極地區(qū),在本文所選的研究流域中差異較小(馬超等,2016).
本文選用GLDAS V2.1的NOAH模型,時(shí)間段為2003年1月—2020年2月,其分辨率為0.25°×0.25°.該模型考慮了0~200 cm的土壤水、植物冠層地表水、雪水當(dāng)量,不包含地下水部分.本文將利用GLDAS數(shù)據(jù)求解單尺度因子,一定程度上修復(fù)球諧系數(shù)濾波引起的泄漏誤差,以及驗(yàn)證補(bǔ)償結(jié)果的可靠性.
GRACE SH可反演流域內(nèi)等效水高EWH(Equivalent Water Height)變化,然而GRACE重力場(chǎng)模型中存在高階噪聲及“條帶”誤差,因此本文引入了半徑300 km的FAN濾波和P3M15的去相關(guān)濾波的組合濾波方法,從而反演得到八個(gè)典型流域的TWSA,具體公式如下(Wahr et al.,1998; Han et al.,2005;Zhang et al.,2009;詹金剛等,2011):
×[ΔCn mcos(mλ)+ΔSn msin(mλ)]
(1)
SSA本質(zhì)是針對(duì)一維時(shí)間序列的主成分分析方法,對(duì)于X=(x1,x2,…,xN),SSA方法時(shí)間序列分析過(guò)程主要分為分解與重構(gòu)兩個(gè)方面,具體過(guò)程如下(Vautard et al.,1992;Chen et al.,2013):
(1)軌跡矩陣
(2)
式中Xi=(xi,…,xi+M-1)T(1≤i≤K).X為M×K階軌跡矩陣.
(2)奇異值分解
X=X1+X2+…+Xd,
(3)
(3)分組
將d個(gè)初等矩陣分成m個(gè)互不相交的子集I1,I2,…,Im,設(shè)I={i1,i2,…,ip},則對(duì)應(yīng)于子集I的合成矩陣可表示為:
XI=Xi1+Xi2+…+Xip,
(4)
將矩陣X以合成矩陣形式表示為:
X=XI1+XI2+…+XIm,
(5)
因此,分組的過(guò)程即是對(duì)I1,I2,…,Im的確定過(guò)程.
(4)時(shí)間序列重構(gòu)
(6)
重構(gòu)成分能夠反映時(shí)間序列的變化特征,各重構(gòu)成分功率譜密度的相對(duì)關(guān)系可用于有效信號(hào)提取與信噪分離.
本文采用的SSA迭代預(yù)測(cè)算法由SSA迭代插值法發(fā)展而來(lái),二者的原理是一樣的(Schoellhamer,2001;Beckers and Rixen,2003;Kondrashov et al.,2010;郭金運(yùn)等,2018).將GRACE SH反演的TWSA時(shí)間序列作為訓(xùn)練樣本,通過(guò)SSA分解對(duì)時(shí)間序列進(jìn)行重構(gòu).迭代預(yù)測(cè)的具體步驟如下:
(1)設(shè)定預(yù)測(cè)時(shí)長(zhǎng)n,將n個(gè)0值加到訓(xùn)練樣本(長(zhǎng)度為N)的末尾處,構(gòu)建總長(zhǎng)度為N+n的新序列.
(2)對(duì)長(zhǎng)度為N+n的新序列進(jìn)行SSA分解,將第一個(gè)重構(gòu)成分(RC1)末尾處的n個(gè)值替換新序列,作為預(yù)測(cè)數(shù)據(jù).之后循環(huán)該過(guò)程,最終前后兩次SSA分解的RC1之間的殘差小于閾值,根據(jù)經(jīng)驗(yàn)閾值取0.01 mm(Shen et al.,2018;周茂盛等,2018).
(3)當(dāng)步驟(2)循環(huán)過(guò)程結(jié)束時(shí),繼續(xù)通過(guò)SSA分解添加RC2,通過(guò)線性疊加RC1和RC2末尾處的n個(gè)預(yù)測(cè)值構(gòu)建新序列,循環(huán)該過(guò)程直至前后兩次分解的RC1+RC2之間的差值小于閾值.
(4)重復(fù)上述過(guò)程,直至用K個(gè)RC線性疊加(RC1+RC2+…+RCk)末尾處的n個(gè)預(yù)測(cè)值,且滿足閾值條件,則序列末尾n個(gè)值即為T(mén)WSA的預(yù)測(cè)值.
以預(yù)測(cè)時(shí)序與檢驗(yàn)樣本符合精度最高為準(zhǔn)則,結(jié)合W-correlation(Weighted Correlation)及FFT(Fast Fourier Transform)方法進(jìn)行有效性和適用性檢驗(yàn)(見(jiàn)3.2節(jié)),測(cè)試最佳窗口長(zhǎng)度M和重構(gòu)階數(shù)K,并以此窗口長(zhǎng)度M與重構(gòu)階數(shù)K,可以得到基于SSA方法TWSA預(yù)測(cè)結(jié)果.同時(shí)RC1+RC2+…+RCk的前N個(gè)值為與訓(xùn)練樣本對(duì)應(yīng)的SSA重構(gòu)序列,將訓(xùn)練樣本扣除SSA重構(gòu)序列后得到剩余隨機(jī)序列,建立ARMA(p,q)對(duì)剩余序列進(jìn)行外推預(yù)測(cè),SSA預(yù)測(cè)結(jié)果與ARMA外推結(jié)果之和為SSA+ARMA的間斷補(bǔ)償結(jié)果,此為SSA+ARMA方法(Shen et al.,2018;牛余朋等,2020).
RMSE(Root Mean Square Error):
(7)
RMSE數(shù)值越小,表示模擬值序列與觀測(cè)值序列的誤差越小,精度越高.
相關(guān)系數(shù)R(Correlation Coefficient):
(8)
R取值在[-1,1]之間,數(shù)值越大,表明兩個(gè)序列的周期相位相關(guān)性越高.
納什效率系數(shù)NSE(Nash-Sutcliffe Efficiency Coefficient):
(9)
NSE取值在(-∞,1]之間,越接近1,表示預(yù)測(cè)模型可信度高.與R相比,NSE更能反映振幅相關(guān)性,因此被廣泛應(yīng)用于水文模型模擬結(jié)果的驗(yàn)證(Merz and Bl?schl,2004).
為方便表述,本文以相關(guān)代號(hào)表示各流域——亞馬遜流域(AZRB)、多瑙河流域(DNRB)、恒河流域(GNRB)、密西西比河流域(MSRB)、尼日爾河流域(NGRB)、伏爾加河流域(VGRB)、葉尼塞河流域(YNSRB)、長(zhǎng)江流域(YZRB).八個(gè)流域邊界范圍如圖1所示,數(shù)據(jù)來(lái)自HydroSHEDS數(shù)據(jù)集(https:∥hydrosheds.org/page/overview).
首先利用CSR提供的2003年1月—2016年8月的GRACE RL06 SH反演各流域的TWSA序列.其中有15個(gè)月的球諧系數(shù)數(shù)據(jù)缺失,需對(duì)其進(jìn)行插值補(bǔ)全.傳統(tǒng)方法為利用前后兩年或多年該月份球諧系數(shù)的均值代替,而本文將采用SSA迭代插值方法對(duì)TWSA結(jié)果進(jìn)行插值補(bǔ)全(Shen et al.,2018;周茂盛等,2018).以MSRB為例,結(jié)果如圖2所示,圖中為傳統(tǒng)的前后兩年球諧系數(shù)均值替代法與SSA迭代插值方法的對(duì)比,可以看出SSA方法的插值結(jié)果更符合周期變化的特征,這有利于后續(xù)SSA方法的周期分解與重構(gòu).而傳統(tǒng)方法有明顯的跳變,引入了較大的誤差,特別2012年10月二者結(jié)果的差值達(dá)6.53 cm.為此,本文將采用SSA迭代插值方法對(duì)GRACE SH反演TWSA和Mascons結(jié)果的缺失數(shù)據(jù)補(bǔ)全.
圖2 基于SSA方法與SH平均方法的TWSA插值結(jié)果Fig.2 The interpolation results of TWSA using SSA and SH Mean
前文已知,本文采用組合濾波方法來(lái)抑制噪聲和“條帶”誤差,但也造成了信號(hào)幅值的減小,空間分布衰減,即泄漏誤差.為了恢復(fù)相對(duì)真實(shí)的TWSA,本文采用基于GLDAS數(shù)據(jù)的單尺度因子法,修復(fù)泄漏誤差,該方法將GLDAS格網(wǎng)數(shù)據(jù)球諧展開(kāi)并截取至60階,采用與GRACE相同的處理流程得到區(qū)域TWSA序列,基于最小二乘原理求解TWSA時(shí)間序列與該區(qū)域原始GLDAS時(shí)間序列的比例系數(shù)(馮偉等,2012).由表1可知,不同流域的尺度因子存在差異,將研究流域GRACE SH反演的TWSA序列乘以對(duì)應(yīng)的尺度因子,作為最終的反演結(jié)果.為驗(yàn)證GRACE SH反演TWSA結(jié)果的準(zhǔn)確性和可靠性,本文將八個(gè)典型流域的TWSA分別與三所機(jī)構(gòu)的Mascons RL05和JPL、CSR的Mascons RL06結(jié)果進(jìn)行比較.
表1 不同研究區(qū)域的單尺度因子Table 1 Single scale factor in different study areas
如圖3所示,GRACE SH反演的TWSA結(jié)果與Mascons結(jié)果相比,無(wú)論是振幅還是周期相位均有較強(qiáng)的一致性,這表明二者結(jié)果吻合性良好,驗(yàn)證了本文GRACE SH反演TWSA結(jié)果的有效性和可靠性,且三所機(jī)構(gòu)不同版本間的Mascons結(jié)果差異也不明顯.八個(gè)流域TWSA序列均有一定的周期信號(hào)特征,其中AZRB、NGRB(圖3a,e)的TWSA序列周期特征最為明顯,規(guī)律性更強(qiáng),而DNRB、MSRB、YZRB(圖3b,d,h)的信號(hào)成分復(fù)雜、周期特征相對(duì)較弱,序列中蘊(yùn)含了更多的頻率信息.
圖3 GRACE SH反演研究區(qū)域的TWSA與Mascons結(jié)果比較Fig.3 Comparison of TWSA derived from GRACE SH with Mascons in study areas
本文通過(guò)計(jì)算八個(gè)流域的RMSE(cm)、NSE、R,定量評(píng)價(jià)GRACE SH反演TWSA結(jié)果與Mascons結(jié)果的符合精度.表2可知,GRACE SH反演TWSA結(jié)果與Mascons結(jié)果有較高的符合精度,大多數(shù)流域的RMSE在2 cm以內(nèi),且NSE、R在0.95以上.其中在AZRB、NGRB的符合精度最高,NSE、R都達(dá)到了0.99,RMSE也在1.5 cm之內(nèi).由NSE可知,在MSRB中,GRACE SH反演的TWSA與Mascons結(jié)果有較明顯的差異,特別是RL06的Mascons結(jié)果.綜合考慮,CSR的Mascons RL05、Mascons RL06結(jié)果與GRACE SH反演結(jié)果吻合程度最高,這與本文選取CSR的GRACE SH數(shù)據(jù)反演TWSA有關(guān).由于Mascons RL05數(shù)據(jù)的時(shí)間范圍所限,后續(xù)將采用CSR的Mascons RL06數(shù)據(jù)與TWSA間斷補(bǔ)償結(jié)果對(duì)比驗(yàn)證.
表2 GRACE SH反演研究區(qū)域的TWSA的精度評(píng)定Table 2 Accuracy assessment of regional TWSA derived from GRACE SH
前文已知,在利用SSA方法預(yù)測(cè)前,需確定最佳窗口長(zhǎng)度M和重構(gòu)階數(shù)K,本文以周期特征明顯的AZRB的TWSA為例,詳細(xì)說(shuō)明該過(guò)程.為此將2003年1月至2012年12月的GRACE SH反演TWSA結(jié)果作為訓(xùn)練樣本,共計(jì)120個(gè)數(shù)據(jù).根據(jù)經(jīng)驗(yàn),GRACE SH反演的TWSA結(jié)果中可能存在3個(gè)月周期信號(hào),因此在SSA分解時(shí),將窗口長(zhǎng)度M設(shè)置為3的倍數(shù),連續(xù)測(cè)試窗口長(zhǎng)度M,從而對(duì)分解的重構(gòu)成分進(jìn)行周期對(duì)分離.以預(yù)測(cè)時(shí)序與檢驗(yàn)樣本(2013年1月至2016年8月數(shù)據(jù))符合精度最高為準(zhǔn)則,不斷測(cè)試,確定AZRB區(qū)域的最佳窗口長(zhǎng)度M為48,重構(gòu)階數(shù)K為8.為定量描述各重構(gòu)成分之間的相關(guān)性,檢驗(yàn)?zāi)P偷挠行院瓦m用性,本文采用W-correlation進(jìn)行分析,結(jié)果如圖4所示,圖4a可知,前8階的兩兩相鄰的重構(gòu)成分相關(guān)系數(shù)均高于0.71,故前8階重構(gòu)成分中,相鄰的兩個(gè)階項(xiàng)可能為周期對(duì)(如RC1與RC2、RC3與RC4、RC5與RC6等均具有相同的周期).圖4b中,前8階特征值的貢獻(xiàn)率達(dá)98.29%.
圖4 TWSA時(shí)序SSA分解RCs的 W-correlation分析結(jié)果Fig.4 W-correlation analysis of the RCs of TWSA with SSA
本文采用FFT方法探測(cè)各重構(gòu)成分的周期特征,將具有相同周期信號(hào)特征的重構(gòu)成分進(jìn)行分組(Kay and Marple,1981).圖5左側(cè)為相鄰兩個(gè)RC之和的重構(gòu)序列,右側(cè)為該序列的功率譜密度.由圖可知,RC1+RC2為具有年周期特征的信號(hào),且其功率譜密度最大,對(duì)TWSA序列的貢獻(xiàn)率最高,其振幅為:-21.92至22.35 cm;RC3+RC4為具有36個(gè)月周期特征的信號(hào);RC5+RC6為具有18個(gè)月周期特征信號(hào);RC7+RC8為具有6個(gè)月周期特征信號(hào).因此本文選取前8階重構(gòu)成分對(duì)AZRB區(qū)域2003年1月至2012年12月的TWSA序列進(jìn)行重構(gòu)是適用的.
圖5 TWSA時(shí)序SSA分解RCs的FFT周期探測(cè)結(jié)果Fig.5 FFT period detection results of the RCs of TWSA with SSA
如圖6所示,將訓(xùn)練樣本TWSA序列與SSA重構(gòu)序列進(jìn)行對(duì)比,兩種結(jié)果吻合很好,特別是在周期相位上有很強(qiáng)的一致性,殘差振幅也在2 cm左右,其符合精度分別為RMSE=1.71 cm、NSE=0.99、R=0.99.表明窗口長(zhǎng)度M為48、重構(gòu)階數(shù)K為8的重構(gòu)模型在AZRB是有效的,利用該重構(gòu)模型繼續(xù)生成新的序列,即SSA的預(yù)測(cè)值,驗(yàn)證了SSA迭代預(yù)測(cè)方法的可行性.同時(shí),圖6中殘差序列即為SSA+ARMA方法中的剩余隨機(jī)序列,利用ARMA模型對(duì)其進(jìn)行外推,并與SSA方法的預(yù)測(cè)值相加,即為SSA+ARMA的間斷補(bǔ)償結(jié)果.不同流域的SSA預(yù)測(cè)模型窗口長(zhǎng)度M和重構(gòu)階數(shù)K存在差異,根據(jù)以上過(guò)程最終確定各流域的SSA預(yù)測(cè)模型參數(shù)詳見(jiàn)表4的預(yù)測(cè)模型A.
圖6 AZRB區(qū)域TWSA序列與其SSA重構(gòu)序列 結(jié)果對(duì)比Fig.6 Comparison of SSA reconstruction results with TWSA in AZRB
同樣以AZRB流域2003年1月至2012年12月的TWSA序列為樣本,描述預(yù)測(cè)模型ARMA(p,q)的構(gòu)建過(guò)程.首先對(duì)TWSA時(shí)間序列進(jìn)行零均值處理,因?yàn)锳RMA方法主要針對(duì)的是平穩(wěn)時(shí)間序列,所以本文采用了ADF(Augmented Dickey-Fuller)檢驗(yàn)對(duì)TWSA時(shí)間序列的平穩(wěn)性進(jìn)行檢測(cè),若序列不滿足平穩(wěn)性要求則需要進(jìn)行差分處理,直至序列平穩(wěn)(Luo et al.,2012;Mirzavand and Ghazavi,2015;牛余朋等,2020).利用AIC(Akaike Information Criterion)準(zhǔn)則確定p、q,之后基于最小二乘原理求解模型的未知參數(shù).構(gòu)建模型后,還需有效性檢驗(yàn),有效性檢驗(yàn)標(biāo)準(zhǔn)為擬合樣本序列提取后的殘差序列應(yīng)與白噪聲相似.本文在AZRB流域所構(gòu)建ARMA(6,8)模型的有效性檢驗(yàn)結(jié)果如圖7所示.圖7a為反映擬合序列與樣本序列偏差的殘差序列,振幅在-5.06 cm至7.02 cm之間.圖7b為殘差序列的正態(tài)QQ(Quantile-Quantile)圖,殘差的數(shù)值均分布在紅線附近,且該殘差序列滿足顯著性水平為0.05的Lilliefors假設(shè)檢驗(yàn),因而具有近似正態(tài)分布的特征.圖7c、圖7d中橫軸表示滯后階數(shù),縱軸表示相關(guān)系數(shù)大小,當(dāng)滯后階數(shù)大于1時(shí),殘差序列的自相關(guān)函數(shù)、偏自相關(guān)函數(shù)數(shù)值很小,均在隨機(jī)區(qū)間之內(nèi),且不隨滯后階數(shù)增大而下降,具有獨(dú)立無(wú)關(guān)的隨機(jī)特性.綜上,殘差序列為服從近似正態(tài)分布的獨(dú)立無(wú)關(guān)隨機(jī)變量,滿足白噪聲特性,所以AZRB流域構(gòu)建的ARMA(6,8)是有效的,可以用于預(yù)測(cè).
圖7 AZRB區(qū)域ARMA(6,8)模型檢驗(yàn)結(jié)果Fig.7 Test results of the ARMA(6,8) model in AZRB
不同流域的ARMA(p,q)模型存在差別,本文對(duì)不同流域的參數(shù)p、q進(jìn)行測(cè)試,并進(jìn)行有效性檢驗(yàn),最終確定了八個(gè)流域的ARMA模型:AZRB采用ARMA(6,8),DNRB采用ARMA(7,6),GNRB采用ARMA(6,7),MSRB采用ARMA(8,8),NGRB采用ARMA(9,8),VGRB采用ARMA(8,8),YNSRB采用ARMA(10,10),YZRB采用ARMA(9,10).在SSA+ARMA方法中,各流域剩余隨機(jī)序列的信號(hào)成分已發(fā)生變化,ARMA模型需要重新確定.
為比較SSA方法在典型流域的適用性,將前期120個(gè)月(2003年1月至2012年12月)的GRACE SH反演TWSA結(jié)果作為訓(xùn)練樣本,分別用SSA+ARMA、SSA、ARMA與WNN方法預(yù)測(cè)后續(xù)44個(gè)月(2013年1月至2016年8月)的TWSA(Chen et al.,2006).并以同期的GRACE SH反演TWSA作為真值檢驗(yàn),評(píng)估不同方法的預(yù)測(cè)效果,從而選擇適用于預(yù)測(cè)TWSA的方法.
如表3所示,四種方法TWSA預(yù)測(cè)序列均與真值序列有一定程度的吻合,但不同方法、不同流域之間還存在差異.SSA與SSA+ARMA方法的預(yù)測(cè)值與真值的吻合效果最好,且二者相差不大,ARMA方法效果最差.八個(gè)流域中,NGRB的TWSA預(yù)測(cè)結(jié)果精度是最高的,而DNRB、MSRB、YZRB預(yù)測(cè)結(jié)果精度相對(duì)較差.NGRB的TWSA時(shí)間序列的周期特征明顯,規(guī)律性強(qiáng),因而四種方法的預(yù)測(cè)結(jié)果均與真值時(shí)間序列吻合得較好.相反,DNRB、MSRB、YZRB地區(qū)的TWSA序列更加復(fù)雜多變,蘊(yùn)含更多的信息,因而預(yù)測(cè)結(jié)果與真值序列符合相對(duì)較差.綜合考慮三種精度指標(biāo),SSA與SSA+ARMA方法的預(yù)測(cè)精度較高且相對(duì)穩(wěn)定,除AZRB外,其他多數(shù)流域的RMSE在4 cm以內(nèi),所有流域的NSE值在0.7以上,R值在0.85以上.WNN方法預(yù)測(cè)結(jié)果也有較高的精度,在DNRB、VGRB流域的預(yù)測(cè)精度還略優(yōu)于SSA和SSA+ARMA方法,但在MSRB、YNSRB、YZRB預(yù)測(cè)精度較低,構(gòu)建的預(yù)測(cè)模型適用性較差.相較而言,除在NGRB外,ARMA模型的預(yù)測(cè)精度最差,特別是在YZRB中,ARMA模型預(yù)測(cè)結(jié)果的NSE只有0.46.
表3 基于不同方法的TWSA預(yù)測(cè)精度評(píng)定Table 3 Evaluation of TWSA′s prediction accuracy based on different methods
圖8為四種方法不同時(shí)段的預(yù)測(cè)精度,對(duì)多數(shù)流域來(lái)說(shuō),隨預(yù)測(cè)時(shí)間與訓(xùn)練樣本時(shí)間間隔越來(lái)越大,四種方法的預(yù)測(cè)精度逐漸下降,前兩年的預(yù)測(cè)精度優(yōu)于后兩年的預(yù)測(cè)精度.不同時(shí)段中,SSA與SSA+ARMA方法在各流域均有較高的預(yù)測(cè)精度,且受預(yù)測(cè)時(shí)間長(zhǎng)度逐漸增加的影響較小,特別是在YNSRB和YZRB中,2016年SSA+ARMA方法的RMSE分別為2.72 cm和1.59 cm,明顯優(yōu)于ARMA與WNN方法.ARMA方法預(yù)測(cè)精度較差,且受預(yù)測(cè)時(shí)間長(zhǎng)度的影響較大,2016年AZRB的RMSE達(dá)到了14.25 cm.在MSRB、YNSRB、YZRB中,WNN方法2016年的預(yù)測(cè)精度較差,而AZRB、MSRB中,2016年的預(yù)測(cè)精度較高.大部分流域中所有時(shí)段SSA+ARMA方法的預(yù)測(cè)精度均略優(yōu)于SSA方法,但二者差異較小.
圖8 不同方法的TWSA預(yù)測(cè)結(jié)果對(duì)比Fig.8 Comparison of TWSA prediction results by different methods
綜上所述,ARMA方法對(duì)于周期特征較弱的時(shí)間序列預(yù)測(cè)效果并不理想,易受到序列中噪聲成分的干擾,導(dǎo)致預(yù)測(cè)結(jié)果精度降低.WNN方法為機(jī)器學(xué)習(xí)方法,通過(guò)不斷調(diào)試學(xué)習(xí)速率、隱含層節(jié)點(diǎn)數(shù)等參數(shù)構(gòu)建預(yù)測(cè)模型,計(jì)算效率較低,且因?yàn)槿鄙傧嚓P(guān)約束,某些流域構(gòu)建的預(yù)測(cè)模型并不適用.在后續(xù)的研究中,若引入降水等氣象數(shù)據(jù)作為約束,WNN方法構(gòu)建模型的效率及預(yù)測(cè)精度可能會(huì)進(jìn)一步提升,同樣具有很大的潛力.而結(jié)合特征向量分析,SSA方法可有效識(shí)別并提取時(shí)間序列中不同成分,受噪聲的影響小,能從復(fù)雜的信號(hào)成分中提取更多有用信息,特別適合分析預(yù)測(cè)具有復(fù)雜成分或信號(hào)周期特征明顯的TWSA時(shí)間序列.
由表3可知,SSA與SSA+ARMA方法相比,SSA+ARMA方法要略優(yōu)于SSA方法,且主要反映在RMSE上,其精度有0.01至0.1 cm量級(jí)的提升.這主要與各流域SSA重構(gòu)序列的重構(gòu)階數(shù)有關(guān),如圖4b和圖6所示,AZRB的前8階重構(gòu)成分的貢獻(xiàn)率達(dá)98.29%,因此剩余時(shí)間序列包含的信息較少,精度提升并不明顯.但各流域的SSA預(yù)測(cè)模型存在差異,對(duì)于SSA重構(gòu)序列貢獻(xiàn)率較低的流域,SSA+ARMA方法會(huì)有較明顯的提升,如GNRB的重構(gòu)階數(shù)K為4(表4中預(yù)測(cè)模型A),因而SSA重構(gòu)成分的貢獻(xiàn)率會(huì)較低,與SSA方法相比,其RMSE降低了0.35 cm,NSE、R均提升了0.2.
SSA+ARMA方法的預(yù)測(cè)精度主要還是由SSA方法的預(yù)測(cè)精度影響的.因而本文將討論如何選擇訓(xùn)練樣本、檢驗(yàn)樣本構(gòu)建更適用的SSA預(yù)測(cè)模型,提高GRACE/GRACE-FO數(shù)據(jù)空窗期TWSA補(bǔ)償結(jié)果的精度.在之前的預(yù)測(cè)試驗(yàn)中,SSA迭代預(yù)測(cè)方法構(gòu)建的各流域預(yù)測(cè)模型如表4中預(yù)測(cè)模型A所示,但該模型存在一定的局限性,訓(xùn)練樣本選取的2003年1月至2012年12月的120個(gè)樣本,并未充分考慮全部164個(gè)樣本,且訓(xùn)練樣本與GRACE/GRACE-FO間斷期的時(shí)間跨度較大.因此構(gòu)建的預(yù)測(cè)模型并不一定適用于數(shù)據(jù)間斷的補(bǔ)償.GRACE-FO數(shù)據(jù)作為GRACE的延續(xù),本文對(duì)二者的數(shù)據(jù)處理過(guò)程一致,因此本文將GRACE-FO SH反演TWSA結(jié)果看作真值.為確定更準(zhǔn)確、更適用于GRACE/GRACE-FO空窗期TWSA間斷補(bǔ)償?shù)腟SA模型,本文引入GRACE-FO SH反演TWSA及Mascons RL06結(jié)果作為檢驗(yàn)樣本,提出了另外兩種構(gòu)建預(yù)測(cè)模型的方案,三種方案區(qū)別如圖9.預(yù)測(cè)模型A與預(yù)測(cè)模型B和C相比,分析了訓(xùn)練樣本對(duì)預(yù)測(cè)模型構(gòu)建的影響,其中預(yù)測(cè)模型B和C充分考慮了164個(gè)訓(xùn)練樣本.預(yù)測(cè)模型B和C的區(qū)別在于檢驗(yàn)樣本的選擇,上文已知,隨預(yù)測(cè)時(shí)間與訓(xùn)練樣本時(shí)間間隔越來(lái)越大,預(yù)測(cè)精度逐漸下降.因而預(yù)測(cè)模型B引入GRACE-FO SH反演TWSA結(jié)果作為檢驗(yàn)樣本,對(duì)間斷補(bǔ)償結(jié)果序列的末尾進(jìn)行約束,從而得到更適用于間斷補(bǔ)償?shù)念A(yù)測(cè)模型.相較而言,預(yù)測(cè)模型C除了引入GRACE-FO SH反演TWSA結(jié)果,同時(shí)還考慮了Mascons RL06結(jié)果,可以對(duì)間斷補(bǔ)償結(jié)果序列的首尾兩端均進(jìn)行約束.以預(yù)測(cè)序列與檢驗(yàn)樣本符合精度最高為準(zhǔn)則,確定了各流域的預(yù)測(cè)模型A、B、C的參數(shù),即窗口長(zhǎng)度M和重構(gòu)階數(shù)K.如表4所示,多數(shù)流域依據(jù)不同方案構(gòu)建的SSA預(yù)測(cè)模型參數(shù)存在差異,特別是重構(gòu)階數(shù)K,在預(yù)測(cè)模型B和C中,AZRB的K為4,表示該流域SSA的重構(gòu)序列中有4個(gè)重構(gòu)成分,因而剩余隨機(jī)序列中會(huì)包含較多的有效信息,相反NGRB的K為12,SSA方法對(duì)該流域TWSA序列的分解與重構(gòu)更加充分,剩余隨機(jī)序列中包含的有效信息較少.在VGRB、YZRB中,方案二和方案三構(gòu)建的預(yù)測(cè)模型B與C是一樣的.
圖9 三種方案的流程圖Fig.9 Flow chart of the three programmes
表4 基于不同方案的SSA預(yù)測(cè)模型Table 4 Prediction models of SSA based on different programmes
本文將GRACE SH反演的2003年1月至2016年8月TWSA序列作為樣本,基于SSA方法分別采用預(yù)測(cè)模型A、B、C,補(bǔ)償2016年9月至2020年2月的TWSA間斷結(jié)果.為檢驗(yàn)補(bǔ)償結(jié)果的準(zhǔn)確性及可靠性,受限于數(shù)據(jù)的包含范圍,本文選取2016年9月至2017年6月的CSR的Mascons RL06結(jié)果,2016年9月至2020年2月的GLDAS結(jié)果,2018年10月至2020年2月的GRACE-FO SH反演TWSA結(jié)果進(jìn)行對(duì)比驗(yàn)證.其中,GLDAS結(jié)果為對(duì)下載的格網(wǎng)序列球諧展開(kāi)并截取至60階后,進(jìn)行與GRACE數(shù)據(jù)一樣的處理流程后的結(jié)果.同樣的,各類數(shù)據(jù)均扣除了對(duì)應(yīng)數(shù)據(jù)2003年1月至2016年8月的均值,其中CSR提供的GRACE-FO RL06 SH扣除了該機(jī)構(gòu)GRACE RL06 SH的2003年1月至2016年8月均值.三種方案在間斷數(shù)據(jù)補(bǔ)償階段是一樣的,均采用2003年1月至2016年8月的164個(gè)TWSA結(jié)果為樣本,GRACE-FO SH結(jié)果與Mascons結(jié)果未參與實(shí)際預(yù)測(cè)過(guò)程,因此依據(jù)GRACE-FO SH結(jié)果與Mascons結(jié)果評(píng)定補(bǔ)償結(jié)果精度是有意義的.
圖10可知,除YZRB中預(yù)測(cè)模型A的補(bǔ)償結(jié)果外,其他間斷補(bǔ)償結(jié)果均取得了較好的效果.基于SSA方法的TWSA間斷補(bǔ)償結(jié)果與Mascons、GRACE-FO SH結(jié)果吻合得較好,這驗(yàn)證了補(bǔ)償結(jié)果的可靠性.表5中RMSE可知,TWSA間斷補(bǔ)償結(jié)果與GLDAS結(jié)果在振幅上有明顯的差異,但由R可知,GLDAS結(jié)果與TWSA間斷補(bǔ)償結(jié)果在周期和相位變化上有較強(qiáng)的一致性,這亦能反映間斷補(bǔ)償結(jié)果的可靠性.振幅的偏差相對(duì)較大是因?yàn)镚LDAS中只包含了0~200 cm土壤水、植物冠層地表水、積雪的變化,不包含地下水變化,而GRACE則反映了陸地總儲(chǔ)水量的變化和固體地球可能的物理遷移(Chao,2016).因而在后續(xù)主要依據(jù)GRACE-FO SH反演的TWSA及Mascons結(jié)果進(jìn)行精度評(píng)定.
圖10 基于SSA方法TWSA間斷補(bǔ)償結(jié)果與GRACE-FO SH,Mascons和GLDAS結(jié)果的比較Fig.10 Comparison of TWSA gap compensation results by SSA with GRACE-FO SH,Mascons and GLDAS results
表5可知,各流域中預(yù)測(cè)模型A、B、C的間斷補(bǔ)償結(jié)果精度存在差異.預(yù)測(cè)模型A的符合精度相對(duì)較差,表明在構(gòu)建預(yù)測(cè)模型過(guò)程中,采用更充足的訓(xùn)練樣本有利于構(gòu)建更適用的預(yù)測(cè)模型.預(yù)測(cè)模型B、C均取得了較好的預(yù)測(cè)效果,但在細(xì)節(jié)上存在差異,預(yù)測(cè)模型B與GRACE-FO SH結(jié)果的符合精度最高,但可能會(huì)導(dǎo)致間斷補(bǔ)償結(jié)果序列的前部分失真,如DNRB的間斷補(bǔ)償結(jié)果與Mascons結(jié)果的NSE僅為-0.02;在GNRB中RMSE達(dá)10.60 cm.相較而言,預(yù)測(cè)模型C對(duì)間斷補(bǔ)償結(jié)果的首尾兩端均進(jìn)行了約束,不會(huì)出現(xiàn)這種問(wèn)題.但值得注意的是,在MSRB中,比較NSE可得,預(yù)測(cè)模型B的補(bǔ)償結(jié)果要優(yōu)于預(yù)測(cè)模型C.這與本文GRACE SH反演的TWSA在該流域與Mascons結(jié)果存在較大差異有關(guān)(見(jiàn)表2).因此當(dāng)引入Mascons RL06結(jié)果作為檢驗(yàn)樣本約束間斷補(bǔ)償結(jié)果時(shí),反而會(huì)降低補(bǔ)償精度.本文采用的GRACE/GRACE-FO SH均為CSR提供的RL06版本,且進(jìn)行了相同的數(shù)據(jù)處理流程,可以看為同種數(shù)據(jù),相反作為成熟產(chǎn)品的Mascons結(jié)果無(wú)法保證這一點(diǎn).因而當(dāng)預(yù)測(cè)模型B、C的補(bǔ)償結(jié)果符合精度相當(dāng)時(shí),本文優(yōu)先考慮預(yù)測(cè)模型B間斷補(bǔ)償結(jié)果.綜上所述,AZRB、DNRB、GNRB、NGRB采用預(yù)測(cè)模型C的SSA間斷補(bǔ)償結(jié)果,MSRB、YNSRB采用預(yù)測(cè)模型B的SSA間斷補(bǔ)償結(jié)果,在VGRB、YZRB構(gòu)建的預(yù)測(cè)模型B與C是一樣的.
表5 基于SSA方法的TWSA間斷補(bǔ)償結(jié)果精度評(píng)定Table 5 Accuracy assessment of TWSA gap compensation results by SSA
續(xù)表5
根據(jù)上文選取的基于SSA方法的間斷補(bǔ)償結(jié)果,本文進(jìn)一步采用SSA+ARMA方法提升補(bǔ)償精度.表6可得,SSA+ARMA方法的間斷補(bǔ)償結(jié)果整體優(yōu)于SSA方法,且主要體現(xiàn)在RMSE上.其中AZRB的間斷補(bǔ)償結(jié)果的精度提升最為明顯,基于GRACE-FO SH結(jié)果的精度評(píng)定中,RMSE降低了1.35 cm,基于Mascons結(jié)果的精度評(píng)定中,RMSE降低了1.01 cm.除AZRB外,DNRB、NGRB、VGRB、YZRB的預(yù)測(cè)精度也有相對(duì)明顯的提升.
表6 基于SSA+ARMA方法的TWSA間斷補(bǔ)償結(jié)果 精度評(píng)定Table 6 Accuracy assessment of TWSA gap compensation results by SSA+ARMA
綜上所述,基于SSA+ARMA方法的TWSA間斷補(bǔ)償結(jié)果有較高的精度,與同期GRACE-FO SH結(jié)果相比,除AZRB的RMSE為4.96 cm外,其他流域的RMSE均在4 cm以內(nèi);除YZRB的NSE、R分別為0.61、0.80外,其他流域的NSE值均在0.80以上,R值均在0.90以上.對(duì)TWSA序列相對(duì)復(fù)雜多變的DNRB、YZRB(圖3b,h),間斷補(bǔ)償結(jié)果也取得了較好的效果,特別是YZRB(圖10h)的2018年10月—2019年7月周期特征不明顯,而SSA間斷補(bǔ)償結(jié)果與GRACE-FO SH結(jié)果卻有很強(qiáng)的一致性,這充分體現(xiàn)了SSA方法能識(shí)別、提取復(fù)雜成分信號(hào)中有用信息的特性.在八個(gè)典型流域中,NGRB的間斷補(bǔ)償結(jié)果精度最高,這可能與該流域受人類活動(dòng)影響少,TWSA序列具有強(qiáng)周期特征有關(guān).
上文三種方案的預(yù)測(cè)模型構(gòu)建中,由于部分流域GRACE SH反演的TWSA與Mascon結(jié)果符合較差,因而預(yù)測(cè)模型B和C互有優(yōu)勢(shì).但在實(shí)際應(yīng)用中,若采用同種數(shù)據(jù)作為訓(xùn)練樣本與檢驗(yàn)樣本,方案三構(gòu)建的預(yù)測(cè)模型取得的間斷補(bǔ)償效果更好.截至2021年1月,基于GRACE-FO的CRS RL06 Mascon數(shù)據(jù)結(jié)果已經(jīng)更新至2020年10月,對(duì)基于SSA+ARMA方法的TWSA間斷補(bǔ)償?shù)膶?shí)際應(yīng)用提供了充足的數(shù)據(jù)支持.
本文采用方案三的預(yù)測(cè)模型構(gòu)建思路,利用2003年1月至2016年8月的Mascon結(jié)果為訓(xùn)練樣本,2016年9月至2017年6月及2018年10月至2020年2月的Mascon結(jié)果作為檢驗(yàn)樣本構(gòu)建SSA預(yù)測(cè)模型.構(gòu)建預(yù)測(cè)模型后,在實(shí)際應(yīng)用中為得到精度更高的間斷補(bǔ)償結(jié)果,無(wú)需考慮精度評(píng)定的問(wèn)題,間斷補(bǔ)償階段應(yīng)盡可能選擇充足的樣本.因而采用2003年1月至2016年8月及2018年10月至2020年10月的Mascon結(jié)果作為樣本,利用SSA+ARMA方法對(duì)2016年9月至2018年9月的結(jié)果進(jìn)行補(bǔ)償.如圖11所示,各流域的TWSA間斷補(bǔ)償結(jié)果均取得了較好的效果,補(bǔ)償結(jié)果與CSR RL06 Mascon結(jié)果連接較為緊密,且無(wú)論是趨勢(shì)項(xiàng)還是周期特征均與原始時(shí)序符合得較好.對(duì)于典型流域,利用SSA+ARMA方法可以對(duì)GRACE/GRACE-FO空窗期的TWSA間斷進(jìn)行有效補(bǔ)償.表7為SSA+ARMA與SSA方法補(bǔ)償結(jié)果的統(tǒng)計(jì)信息對(duì)比.由標(biāo)準(zhǔn)差和均方根值可知,SSA+ARMA方法的補(bǔ)償結(jié)果整體略優(yōu)于SSA方法,相較SSA方法,SSA+ARMA方法可以顧及到SSA方法未能充分重構(gòu)的剩余有效信息.
圖11 基于SSA+ARMA方法的TWSA間斷補(bǔ)償結(jié)果Fig.11 TWSA gap compensation results by SSA+ARMA
表7 基于SSA+ARMA和SSA的TWSA間斷 補(bǔ)償結(jié)果統(tǒng)計(jì)信息(單位:cm)Table 7 The statistics of TWSA gap compensation results by SSA+ARMA and SSA (Unit: cm)
FFT及W-correlation方法均為提高構(gòu)建預(yù)測(cè)模型效率的輔助方法,本文最終的模型參數(shù)確定以預(yù)測(cè)序列與檢驗(yàn)樣本的符合精度最高作為準(zhǔn)則(包括WNN、ARMA方法).各典型流域均有明顯的周年信號(hào),但半年信號(hào)在不同流域存在差異,在構(gòu)建各流域的SSA預(yù)測(cè)模型時(shí),重構(gòu)階數(shù)K是否考慮半年信號(hào)還應(yīng)以預(yù)測(cè)序列與檢驗(yàn)樣本的符合精度最高為準(zhǔn)則.因而本文提出了三種方案來(lái)討論如何選取訓(xùn)練樣本、檢驗(yàn)樣本,構(gòu)建更適用于間斷補(bǔ)償?shù)腟SA預(yù)測(cè)模型.引入GRACE-FO SH反演TWSA、Mascons結(jié)果作為檢驗(yàn)樣本,不僅能使訓(xùn)練樣本更加充足,還能對(duì)間斷補(bǔ)償結(jié)果進(jìn)行約束,防止間斷補(bǔ)償結(jié)果失真.方案一構(gòu)建的預(yù)測(cè)模型A與方案二和方案三構(gòu)建的預(yù)測(cè)模型相比表明,充足的訓(xùn)練樣本有助于構(gòu)建更適用于間斷補(bǔ)償?shù)腟SA預(yù)測(cè)模型.方案二的預(yù)測(cè)模型B的補(bǔ)償結(jié)果與GRACE-FO SH反演的TWSA符合得更好,但可能會(huì)導(dǎo)致補(bǔ)償結(jié)果前部分失真(如表5中DNRB、GNRB).方案三的預(yù)測(cè)模型C對(duì)補(bǔ)償結(jié)果的首尾兩端均進(jìn)行約束,但在3.5節(jié)中,由于GRACE SH反演的TWSA與Mascons符合精度存在差異的問(wèn)題,部分流域引入Mascons結(jié)果作為檢驗(yàn)樣本反而可能會(huì)導(dǎo)致得不到最佳的預(yù)測(cè)模型(如表5中MSRB、YNSRB).而3.6節(jié)中,當(dāng)訓(xùn)練樣本及檢驗(yàn)樣本均采用Mascon結(jié)果或同種數(shù)據(jù)時(shí),采用方案三構(gòu)建預(yù)測(cè)模型的思路能取得更好的間斷補(bǔ)償效果.方案三的主要思想為引入檢驗(yàn)樣本對(duì)間斷補(bǔ)償結(jié)果的首尾兩端進(jìn)行約束,從而構(gòu)建更適用的預(yù)測(cè)模型.在實(shí)際應(yīng)用中,訓(xùn)練樣本與檢驗(yàn)樣本的長(zhǎng)度可以根據(jù)研究目的及需求的不同進(jìn)行調(diào)節(jié).
SSA+ARMA方法的間斷補(bǔ)償結(jié)果整體優(yōu)于SSA方法,且主要體現(xiàn)在RMSE上,其精度有0.01至1 cm量級(jí)的提升.表6可得,SSA+ARMA方法對(duì)AZRB、DNRB、VGRB、YZRB的精度提升相對(duì)明顯,特別是AZRB,基于GRACE-FO SH結(jié)果的精度評(píng)定中,該流域的RMSE降低了1.01 cm,基于Mascons結(jié)果的精度評(píng)定中,RMSE降低了1.35 cm.表4可知,AZRB的SSA預(yù)測(cè)模型C重構(gòu)階數(shù)K為4,扣除SSA重構(gòu)序列后的剩余隨機(jī)時(shí)間序列還保留了更多的有效信息,因而再利用ARMA進(jìn)行外推可以有效提升最終的間斷補(bǔ)償結(jié)果的精度.在DNRB、VGRB、YZRB中,預(yù)測(cè)模型的重構(gòu)階數(shù)K同樣較小.相反,NGRB的預(yù)測(cè)模型的K為12,因?yàn)樵摿饔虻腡WSA信號(hào)周期特征最為顯著,SSA方法能充分分解與重構(gòu)TWSA時(shí)間序列,剩余隨機(jī)時(shí)間序列包含的有效信號(hào)較少,所以SSA+ARMA方法的補(bǔ)償結(jié)果精度沒(méi)有明顯的提升.當(dāng)SSA方法無(wú)法充分的重構(gòu)TWSA信號(hào),即預(yù)測(cè)模型的重構(gòu)階數(shù)K較小,剩余信號(hào)中保留更多的有效信息時(shí),SSA+ARMA方法能更明顯的提升間斷補(bǔ)償結(jié)果的精度.如表7所示,由最大值、最小值及均值可知,SSA與SSA+ARMA補(bǔ)償結(jié)果的振幅差異較小,大部分差異在0.1 cm的量級(jí).由標(biāo)準(zhǔn)差和均方根值可知, SSA+ARMA方法的補(bǔ)償結(jié)果整體略優(yōu)于SSA方法,精度提升量級(jí)在0.01至0.1 cm,其中在AZRB的精度提升最為明顯,標(biāo)準(zhǔn)差降低了0.78 cm,均方根值降低了0.79 cm.相較SSA方法,SSA+ARMA方法可以顧及到SSA方法未能充分重構(gòu)的剩余有效信息.在以后的實(shí)際應(yīng)用中,對(duì)于周期特征弱的非典型流域地區(qū)的TWSA序列進(jìn)行間斷補(bǔ)償時(shí),與SSA方法相比,SSA+ARMA方法可能會(huì)取得更好的補(bǔ)償精度提升效果.
本文引入了SSA+ARMA方法對(duì)GRACE/GRACE-FO空窗期的TWSA間斷結(jié)果補(bǔ)償?shù)姆椒?聯(lián)合GRACE SH、GRACE-FO SH、Mascons、GLDAS數(shù)據(jù),在AZRB、DNRB、GNRB、MSRB、NGRB、VGRB、YNSRB、YZRB八個(gè)流域進(jìn)行了不同方法的預(yù)測(cè)試驗(yàn)及SSA+ARMA方法的TWSA間斷補(bǔ)償試驗(yàn),分別驗(yàn)證了SSA+ARMA方法的適用性及有效性.結(jié)論如下:
(1)傳統(tǒng)利用多年或前后兩年球諧系數(shù)均值替代缺失數(shù)據(jù)的方法會(huì)引入較大的誤差,而本文采用SSA迭代插值方法的插值結(jié)果更符合TWSA序列周期變化的特征,更利于后續(xù)SSA方法的周期分解與重構(gòu).本文GRACE SH反演的TWSA與CSR、JPL、GFZ的Mascons結(jié)果有較好的一致性,大多數(shù)流域的RMSE在2 cm以內(nèi),NSE、R在0.95以上,驗(yàn)證了反演結(jié)果的準(zhǔn)確性及可靠性.CSR的Mascons RL05、Mascons RL06結(jié)果與GRACE SH反演TWSA結(jié)果吻合程度最高.
(2)通過(guò)四種方法的預(yù)測(cè)對(duì)比試驗(yàn)發(fā)現(xiàn),在多數(shù)流域中,隨預(yù)測(cè)時(shí)間長(zhǎng)度的增加,四種方法的預(yù)測(cè)精度逐漸下降,但SSA與SSA+ARMA方法受其影響較小.SSA與SSA+ARMA方法的預(yù)測(cè)精度較高且相對(duì)穩(wěn)定,相較而言ARMA模型的精度最差.ARMA方法對(duì)于周期特征較弱的序列預(yù)測(cè)效果并不理想(如DNRB、MSRB、YZRB),而SSA與SSA+ARMA方法取得了較好的效果,這充分體現(xiàn)SSA方法能識(shí)別、提取復(fù)雜成分信號(hào)中有用信息的特性.
(3)SSA+ARMA方法的補(bǔ)償精度主要受SSA方法補(bǔ)償精度的影響.引入GRACE-FO SH反演TWSA或Mascons結(jié)果作為檢驗(yàn)樣本,采用更充足的訓(xùn)練樣本,可以構(gòu)建更適用于間斷補(bǔ)償?shù)腟SA預(yù)測(cè)模型,進(jìn)而能有效提高最終TWSA間斷補(bǔ)償結(jié)果的精度.在實(shí)際應(yīng)用中,若引入同種數(shù)據(jù)作為檢驗(yàn)樣本,對(duì)間斷補(bǔ)償結(jié)果的首尾兩端進(jìn)行約束,構(gòu)建的預(yù)測(cè)模型能取得更好的間斷補(bǔ)償效果.
(4)基于SSA+ARMA方法的TWSA間斷補(bǔ)償結(jié)果有較高的精度,與GRACE-FO SH結(jié)果有很強(qiáng)的一致性.除AZRB的RMSE為4.96 cm外,其他流域的RMSE均在4 cm以內(nèi);除YZRB的NSE、R分別為0.61、0.80外,其他流域的NSE值均在0.80以上,R值均在0.90以上.
(5)在實(shí)際應(yīng)用的試驗(yàn)中,SSA+ARMA方法的間斷補(bǔ)償結(jié)果優(yōu)于SSA方法,且主要體現(xiàn)在標(biāo)準(zhǔn)差和均方根值上,其精度提升可達(dá)0.1 cm量級(jí).相較SSA方法,SSA+ARMA方法可以顧及到SSA方法未能充分重構(gòu)的剩余有效信息.
綜上,本文提出基于SSA+ARMA方法的TWSA間斷補(bǔ)償是可行且有效的,對(duì)實(shí)現(xiàn)TWSA的長(zhǎng)期持續(xù)監(jiān)測(cè)有重要的參考價(jià)值和科學(xué)意義.
致謝感謝匿名審稿專家對(duì)本文提出的寶貴意見(jiàn).