畢旋旋,任 超,鄧開元,于志文
(桂林理工大學(xué) a.測繪地理信息學(xué)院;b.廣西空間信息與測繪重點實驗室,廣西 桂林 541006)
沉降預(yù)測是隧道變形監(jiān)測的重要環(huán)節(jié)之一。 通過對已有沉降數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,可以把握沉降序列的變化規(guī)律,了解變形特征,以此為施工和運營提供參考依據(jù)和信息保障。 如何利用收集到的數(shù)據(jù)進(jìn)行統(tǒng)計分析,研究隧道變形規(guī)律并進(jìn)行準(zhǔn)確的趨勢預(yù)測已成為一個研究重點,并會對隧道工程的相關(guān)研究產(chǎn)生重大意義[1-2]。 由于諸多隨機(jī)性因素的影響,沉降數(shù)據(jù)表現(xiàn)出非線性和時變性的特征,從而讓準(zhǔn)確的沉降預(yù)測變得十分困難。目前,國內(nèi)外關(guān)于沉降預(yù)測的研究已較為深入,并產(chǎn)生了較多的預(yù)測方法,如BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)、自回歸移動平均模型(ARIMA)等。BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法過分強調(diào)克服學(xué)習(xí)錯誤而泛化能力不強,同時,采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行非線性擬合預(yù)測,當(dāng)訓(xùn)練樣本不足或質(zhì)量不佳時,會出現(xiàn)陷入局部極值、過度擬合和結(jié)構(gòu)設(shè)計盲目等問題[3]。而SVM避免了過度擬合的出現(xiàn),很大程度地增加了全局尋優(yōu)的能力,適合小樣本的快速預(yù)測; 然而,SVM也存在一定的局限性,對復(fù)雜的非線性、季節(jié)性和長期性數(shù)據(jù)的預(yù)測精度會有所下降[4]。 ARIMA考慮到監(jiān)測數(shù)據(jù)對時間序列的依賴性,對于小樣本預(yù)測精度較高,可以將非平穩(wěn)時間序列轉(zhuǎn)換為平穩(wěn)時間序列,是對非平穩(wěn)時間序列進(jìn)行預(yù)報的一種常用方法[5], 但ARIMA對數(shù)據(jù)質(zhì)量要求較高,建模選取參數(shù)較為困難。 而小波分析對數(shù)據(jù)具有良好的局部化特性,可以提取數(shù)據(jù)的任何細(xì)節(jié),能更好獲取有用信息,改善數(shù)據(jù)質(zhì)量。
基于此,本文提出一種基于小波分析(wavelet analysis)的ARIMA算法。 使用小波對原始序列進(jìn)行分解、重構(gòu),然后對重構(gòu)序列的趨勢項和隨機(jī)項分別構(gòu)建ARIMA參數(shù)并進(jìn)行預(yù)測,最終疊合預(yù)測結(jié)果以實現(xiàn)對隧道沉降的預(yù)測。
(1)
則可稱Ψ(t)為基本小波(母小波)。Ψ(t)通過尺度伸縮和平移生成函數(shù)族
(2)
式中:a是伸縮參量,b是平移參量(a,b∈R),a≠0。a、b取連續(xù)變量時,Ψa,b(t)即為依賴a、b的連續(xù)小波函數(shù)[6-8]。本文采用的分析方法是基于Mallat算法支持的小波對沉降序列的分解與重構(gòu)。Mallat算法是對小波變換的一種改進(jìn),是小波變換的快速實現(xiàn)算法,核心是引入多分辨率分析的思想[9]。
自回歸移動平均模型(ARIMA)是一個可以衡量內(nèi)生變量與其滯后性與改變量關(guān)系的一個系統(tǒng)模型,是對移動平均模型(ARMA)的擴(kuò)展[10-11]。ARIMA(p,d,q)的實質(zhì)是ARMA(p,q) 的d階單整(d次差分),該效果將一個非平穩(wěn)的時間序列轉(zhuǎn)化為平穩(wěn)時間序列。將隧道沉降序列yt進(jìn)行差分
ut=Δdyt=(1-B)dyt,
(3)
式中:B為后移算子,u為差分算子。 在經(jīng)過d次差分后變?yōu)槠椒€(wěn)序列,即可建立ARIMA(p,d,q)模型的一般形式:
ut=Φ1(yt-1-yt-2)+Φ2(yt-2-yt-3)+…+Φp·
(xt-p-xt-p-1)+εt-θ1εt-1-θ2εt-2-…-θqεt-qΦ1(ut-1)+Φ2(ut-2)+…+Φput-p+
εt-θ1εt-1-θ2εt-2-…-θqεt-q,
(4)
式中:Φ為自回歸系數(shù);p為自回歸階次;q為滑動平均階次;εt是白噪聲序列。
小波-ARIMA(下文稱W-ARIMA)模型的優(yōu)勢在于,將經(jīng)過小波分解的序列轉(zhuǎn)化為一個概貌序列和一個細(xì)節(jié)序列,且分解后有良好的平穩(wěn)性和平滑性。因此,對于一些非平穩(wěn)時間序列,經(jīng)過小波分解后便可以使用傳統(tǒng)的時間序列方法建模預(yù)測。在對沉降序列采用小波分解后,對不同特征的波形可以選擇不同的p、d、q參數(shù),以最優(yōu)方式進(jìn)行擬合預(yù)測[12]。本文結(jié)合模型自身特點,按照如下步驟進(jìn)行建模:1)利用Mallat算法小波對沉降序列進(jìn)行分解與重構(gòu),得到低頻分量A1與高頻分量D1,同時考慮多層分解的可能性;2)引入ADF單位根檢驗法以檢驗序列的平穩(wěn)性,在序列不滿足平穩(wěn)性條件時,通過d次差分變換使得序列滿足平穩(wěn)性條件; 3)計算序列的自相關(guān)系數(shù)(ACF)和偏相關(guān)系數(shù)(PACF),對模型進(jìn)行初步識別; 4)通過赤池信息準(zhǔn)則(AIC)和SBC準(zhǔn)則來確定最優(yōu)模型參數(shù);5)估計模型未知數(shù),并通過參數(shù)的t統(tǒng)計量檢驗其顯著性以及模型合理性;6)對沉降序列進(jìn)行預(yù)測,并檢驗殘差序列是否為白噪聲序列,若不滿足,返回步驟3); 若滿足,則通過; 7)利用所構(gòu)建的模型對序列進(jìn)行擬合和預(yù)測,并疊加得到最終預(yù)測結(jié)果。
W-ARIMA模型的建模流程如圖1所示。
圖1 W-ARIMA隧道沉降建模流程Fig.1 Modelling process of W-ARIMA tunnel subsidence
以貴廣高鐵桂林-恭城路段某隧道斷面為例,并展示斷面DK 0520+441的建模預(yù)測過程。該隧道穿越山體,地形起伏較大,地表植被茂盛。坡面土層較薄,絕對高程300~1 200 m,自然坡度20°~55°,洞身主要為花崗巖,地質(zhì)條件較好。此隧道的監(jiān)測周期為7 d,本文選取其中2013年5月6日—2014年3月10日共45期觀測數(shù)據(jù)進(jìn)行分析。兩斷面的原始觀測數(shù)據(jù)如圖2所示。
在進(jìn)行擬合預(yù)測前,應(yīng)對ARIMA模型進(jìn)行定階。本文擬對該斷面沉降序列前35期數(shù)據(jù)進(jìn)行ARIMA建模,預(yù)測后10期數(shù)據(jù)。首先,對建模數(shù)據(jù)進(jìn)行小波分解,文獻(xiàn)[13-14]指出,db小波能夠較好地分解沉降數(shù)據(jù)非平穩(wěn)信號,所以本文擬采用db4小波基函數(shù)對建模數(shù)據(jù)進(jìn)行分解,同時文獻(xiàn)[15]中指出由于預(yù)測結(jié)果是對小波分解所得系數(shù)序列的預(yù)測結(jié)果進(jìn)行重構(gòu)而獲得,為避免重構(gòu)過程中預(yù)測誤差的累積,本文擬采用一次分解即可滿足實驗要求。對前35期原始數(shù)據(jù)進(jìn)行小波分解,將高頻系數(shù)序列與低頻系數(shù)序列繪成圖3。分別對子序列進(jìn)行ARIMA建模分析,以數(shù)據(jù)高頻分量為例,進(jìn)行模型構(gòu)建分析。先引入ADF單位根檢驗法,判斷序列平穩(wěn)性[14]。ADF檢驗?zāi)P蜑?c,t,2),ADF檢驗結(jié)果見表1。
圖2 隧道斷面原始觀測數(shù)據(jù)Fig.2 Original observation data of tunnel section
可知,該序列能夠滿足ADF在1%檢驗水平下的臨界值,故可以認(rèn)為其平穩(wěn),選擇零次差分,d取0。為確定p、q值,此處作出該高頻序列滯后16階的ACF、PACF(圖4)。
圖3 小波分解的DK 0520+441隧道斷面觀測數(shù)據(jù)Fig.3 Observation data of DK 0520+441 tunnel section by wavelet transform
表1 序列ADF檢驗結(jié)果Table 1 ADF test results
圖4 隧道沉降序列ACF、PACF函數(shù)Fig.4 ACF and PACF test functions of tunnel settlement sequence
分析可知,ACF函數(shù)與PACF函數(shù)均表現(xiàn)出拖尾性。ACF函數(shù)2步截尾,PACF函數(shù)3步截尾。根據(jù)ARMA(p,q)模型識別原則,可以分別對p、q初步定階。為獲取p、q確定值,引入赤池信息量準(zhǔn)則(AIC),選擇初步定階參數(shù)一定鄰域內(nèi)整數(shù)進(jìn)行驗證,滿足AIC最小原則時,可以確定p=2、q=3。因此可以對序列高頻分量構(gòu)建ARIMA(2,0,3)模型,并以此進(jìn)行回歸,再進(jìn)行殘差白噪聲檢驗,由殘差的ACF、PACF函數(shù)(圖5)可知,殘差為白噪聲序列,平均值接近于0,服從零均值,故可認(rèn)為該模型可靠。同理,對其他序列構(gòu)建ARIMA模型。
依據(jù)2.2節(jié)定階的ARIMA模型,分別對小波分解的序列進(jìn)行建模預(yù)測,得到高頻序列與低頻序列的預(yù)測值,再將二者的預(yù)測值重構(gòu),進(jìn)而得到最終的預(yù)測值,并與直接使用ARIMA建模預(yù)測得到的預(yù)測值進(jìn)行比對分析,二者精度詳見表2。
圖5 殘差的ACF、PACF函數(shù)Fig.5 Residual of ACF and PACF
表2 各模型精度評定
Table 2 Precision comparison of all models mm
期數(shù)實測值A(chǔ)RIMA模型預(yù)測值殘差相對誤差/%W-ARIMA模型預(yù)測值殘差相對誤差/%361.401.48-0.085.701.48-0.085.70 371.281.43-0.1511.701.35-0.075.50 381.251.31-0.064.801.29-0.043.20 391.301.280.021.501.260.043.00 401.381.330.053.601.39-0.010.70 411.341.41-0.075.201.37-0.032.20 421.341.37-0.032.201.38-0.042.90 431.361.41-0.053.701.40-0.042.90 441.311.39-0.086.101.34-0.032.20 451.341.41-0.075.201.37-0.032.20
同時,為更好地評定二者的預(yù)測精度,本文引入精度指標(biāo)均方根誤差(RMSE)、平均絕對誤差(MAE)、平均相對誤差(MRE)和相對誤差δ
(5)
(6)
(7)
(8)
表3 模型計算結(jié)果對比
Table 3 Calculation results comparison of all models mm
圖6 模型計算結(jié)果對比Fig.6 Calculation results comparison of all models
綜合可見,改進(jìn)模型捕捉了高、低頻率分離的波形特征,進(jìn)行了具有針對性的建模,完善了原模型的預(yù)測性能。雖然極個別期數(shù)發(fā)生了改進(jìn)模型失穩(wěn),預(yù)測精度低于原模型的情況,但占比極低,就整體而言,改進(jìn)模型精度(RMSE)提高了66.2%。
本文利用ARIMA和W-ARIMA模型對高鐵隧道沉降數(shù)據(jù)進(jìn)行建模分析,探討了其在高鐵隧道沉降監(jiān)測中的應(yīng)用,結(jié)合貴廣高鐵隧道沉降監(jiān)測數(shù)據(jù),對兩種方法進(jìn)行了比較分析。 得出以下結(jié)論:
(1)無異常波動情況下,兩模型均有較好的擬合精度,MRE均不超過5%。
(2)沉降序列發(fā)生較大波動時,W-ARIMA的預(yù)測曲線穩(wěn)定性更強,此時ARIMA模型雖能保持一定的沉降曲線趨勢,但預(yù)測精度發(fā)生明顯下降。
(3)在實際高鐵隧道斷面監(jiān)測工作中,W-ARIMA模型可以較好地預(yù)測沉降趨勢,為安全施工和運行提供參考依據(jù)。