康俊鋒,胡祚晨,陳優(yōu)良
(江西理工大學(xué)土木與測繪工程學(xué)院,江西 贛州 341000)
截至2018年,中國已擁有水庫98 000多座,其中多為小型水庫[1].小型水庫建設(shè)早、管理水平低,有著很大的安全隱患,一旦發(fā)生潰壩會對周邊造成巨大的生命財產(chǎn)損失.
對大壩變形進(jìn)行準(zhǔn)確監(jiān)測和預(yù)警可保障大壩安全運(yùn)行[2-3].大壩變形受到諸如氣溫、水壓和地質(zhì)條件等因素的影響[4],由于管理經(jīng)費(fèi)不足及缺乏變形監(jiān)測設(shè)備,小型水庫大壩一般很難獲取到各類監(jiān)測數(shù)據(jù).將機(jī)器學(xué)習(xí)與行業(yè)數(shù)據(jù)結(jié)合已在旅游預(yù)測[5]、風(fēng)力發(fā)電預(yù)測[6]、航空旅客出行指數(shù)預(yù)測[7]和PM2.5污染物濃度預(yù)測[8]等很多領(lǐng)域得到驗證.但機(jī)器學(xué)習(xí)與大壩變形預(yù)測結(jié)合相關(guān)的研究還較少,SU等[9]建立了支持向量機(jī)大壩變形預(yù)測模型;WANG等[10]提出了一種優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)對大壩變形進(jìn)行預(yù)測.已有大壩變形研究大都采用人工測量或半人工的自動測量機(jī)器人數(shù)據(jù)開展研究,難以實現(xiàn)實時的全自動監(jiān)測.物聯(lián)網(wǎng)和衛(wèi)星定位技術(shù)的發(fā)展為壩體變形提供了一種新的監(jiān)測手段,可實時獲取水平位移及沉降位移等變形數(shù)據(jù).另外大壩變形數(shù)據(jù)具有趨勢性、周期性、隨機(jī)性和非線性等特點(diǎn)[11].雖然已有研究考慮了大壩變形數(shù)據(jù)非線性特點(diǎn),但都忽略了數(shù)據(jù)的趨勢性、周期性和隨機(jī)性特征.
文中提出一種STL-CS-LSTM組合模型,通過基于局部加權(quán)回歸的周期趨勢分解方法將大壩變形數(shù)據(jù)分解成趨勢分量、余項分量和周期分量,采用基于布谷鳥搜索算法優(yōu)化的LSTM模型對趨勢分量和余項分量進(jìn)行預(yù)測,并通過簡單周期估計方法對周期分量進(jìn)行預(yù)測,再將得到的3個分量預(yù)測值進(jìn)行求和得到大壩變形預(yù)測結(jié)果.
研究區(qū)選取位于浙江省湖州市利山水庫.大壩變形監(jiān)測數(shù)據(jù)使用華測H3普適型GNSS接收機(jī)測量獲取.大壩設(shè)置6個水平位移觀測點(diǎn)和3個沉降觀測點(diǎn),獲取的數(shù)據(jù)包括測量時間和位移長度等.
試驗數(shù)據(jù)包括2018年12月15日—2019年12月13日間的水平位移數(shù)據(jù)和2018年12月10日—2019年8月20日間的沉降數(shù)據(jù).將數(shù)據(jù)通過重采樣處理成間隔為1 h的時間序列數(shù)據(jù),剔除2組異常數(shù)據(jù),再用插值對產(chǎn)生的缺失值進(jìn)行填補(bǔ),其中水平位移數(shù)據(jù)有654條數(shù)據(jù),沉降數(shù)據(jù)有6 000條數(shù)據(jù).選水平位移數(shù)據(jù)的前500條數(shù)據(jù)作為訓(xùn)練集,后154條數(shù)據(jù)作為測試集;而沉降數(shù)據(jù)前5 000條數(shù)據(jù)為訓(xùn)練集,后1 000條數(shù)據(jù)為測試集.
STL是用來對時間序列進(jìn)行分解的一種常用方法,可以任意選擇周期分量的變化率以及控制趨勢分量的平滑度,有較好的魯棒性.該方法利用局部加權(quán)回歸來分解數(shù)據(jù),有加性模型和乘性模型2種方法.文中使用加性模型,其中加性模型分解算法的計算式為
Yt=Tt+St+Rt,t∈[1,N],
(1)
式中:Yt,Tt,St和Rt分別為t時刻的時間序列數(shù)據(jù)、趨勢分量、周期分量和余項分量.
LSTM模型是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN.LSTM每個記憶細(xì)胞中都有遺忘門、輸入門和輸出門,這使得LSTM能夠記住需要的信息和遺忘不需要的信息,解決了RNN訓(xùn)練過程中經(jīng)常會出現(xiàn)梯度爆炸和梯度消失等問題.
對數(shù)據(jù)進(jìn)行歸一化處理后,使用布谷鳥搜索算法對于不同分量進(jìn)行預(yù)測的LSTM模型的時間步長和第一、二層隱含層神經(jīng)元個數(shù)n1,n2參數(shù)進(jìn)行優(yōu)化,其參數(shù)優(yōu)化的結(jié)果如表1所示.
表1 LTSM模型參數(shù)優(yōu)化結(jié)果Tab.1 Optimization results of LSTM model parameters
參數(shù)優(yōu)化后,將LSTM模型對2組數(shù)據(jù)的趨勢分量和余項分量分別進(jìn)行預(yù)測.
首先將時間序列數(shù)據(jù)采用STL方法分解為趨勢分量、周期分量和余項分量,其中趨勢分量和余項分量使用優(yōu)化的LSTM模型分別進(jìn)行預(yù)測;使用簡單周期估計方法對周期分量進(jìn)行預(yù)測,其中數(shù)據(jù)周期設(shè)置為24,因此t時刻的序列值等于(t+24)時刻的;最后對得到的3個分量預(yù)測值進(jìn)行求和,得到大壩變形預(yù)測結(jié)果.模型構(gòu)建方法如圖1所示.
圖1 STL-CS-LSTM模型構(gòu)建方法Fig.1 STL-CS-LSTM model building method
文中選擇3種評價指標(biāo)對預(yù)測模型的性能進(jìn)行評價,分別為相關(guān)系數(shù)R2、平均絕對誤差MAE和均方差RMSE.選取多個指標(biāo)可以克服選擇單個評價指標(biāo)的局限,從而得到較為客觀的評價結(jié)果.
設(shè)置STL周期參數(shù)為24,2組數(shù)據(jù)分解結(jié)果如圖2所示,圖中ta為時隙,d1為水平位移值,d2為沉降值.
圖2 數(shù)據(jù)分解結(jié)果Fig.2 Data decomposition results
從圖2可以看出,趨勢分量平滑且波動較?。恢芷诜至砍手芷谛裕抑芷跒?4;余項分量波動大且不平滑,具有非線性特征.
使用LSTM,ANN,SVR這3個單一模型,與STL-CS-LSTM模型分別預(yù)測大壩的水平位移和沉降位移.
圖3為水平位移預(yù)測結(jié)果和實測值d1m對比.其中STL-CS-LSTM模型和LSTM模型預(yù)測值基本和實測值變化趨勢保持一致,精度較高;SVR模型預(yù)測值出現(xiàn)了一定的滯后性導(dǎo)致預(yù)測精度較低;ANN模型的預(yù)測值趨勢和實測值相似,但誤差很大,預(yù)測效果最差.
圖3 水平位移預(yù)測結(jié)果Fig.3 Prediction results of horizontal displacement
表2為水平位移預(yù)測評價結(jié)果,STL-CS-LSTM模型和LSTM模型的R2都超過了0.900,精度較高.
表2 水平位移值預(yù)測評價結(jié)果Tab.2 Evaluation results of horizontal displacement prediction model
圖4為水平位移值的實測值d1m與預(yù)測值d1c對比散點(diǎn)圖,結(jié)果表明水平位移預(yù)測性能最好的是STL-CS-LSTM模型,之后分別為LSTM模型、SVR模型、ANN模型.
圖4 水平位移值的實測值與不同模型預(yù)測值對比散點(diǎn)圖Fig.4 Comparison between real value and predicted value of horizontal displacement value with different models
圖5為沉降值預(yù)測結(jié)果和實測值d2m對比.其中STL-CS-LSTM模型預(yù)測表現(xiàn)最好.LSTM模型和ANN模型的預(yù)測值雖然也能保持在實測值上下波動,但誤差較大,SVR模型預(yù)測值與實測值相差非常大.
圖5 沉降數(shù)據(jù)預(yù)測結(jié)果Fig.5 Settlement data prediction results
各個沉降值數(shù)據(jù)預(yù)測模型評價結(jié)果如表3所示.沉降實測值d2m與不同模型預(yù)測值d2c對比散點(diǎn)圖如圖6所示.
圖6 沉降實測值與不同模型預(yù)測值對比散點(diǎn)圖Fig.6 Scatter plot of comparison between real value of settlement value and predicted value of different models
表3 沉降值預(yù)測評價結(jié)果Tab.3 Evaluation results of settlement value prediction model
從沉降變形預(yù)測試驗結(jié)果分析可知,LSTM模型和ANN模型的性能相對較差,SVR模型的各項指標(biāo)都為最差.沉降值預(yù)測性能最好的是STL-CS-LSTM模型,該模型的R2達(dá)到了0.984,之后從高到低依次為ANN模型、LSTM模型、SVR模型.
從試驗結(jié)果分析可知:ANN模型和SVR模型泛化能力不夠,ANN模型在預(yù)測水平位移值的時候和SVR模型在預(yù)測沉降值的時候出現(xiàn)了較大的誤差;LSTM相較于其他2個單一模型的預(yù)測精度和泛化能力都相對較好,在單一模型中綜合表現(xiàn)最好;STL-CS-LSTM 模型對于位移數(shù)據(jù)和沉降數(shù)據(jù)預(yù)測的精度都比單一模型要更高,且預(yù)測值一直在實測值附近上下波動.
1) 對于周期向量,利用其數(shù)據(jù)呈周期性的特點(diǎn)使用簡單周期估計方法對其進(jìn)行預(yù)測,對不同分量分別建模預(yù)測能最大化利用數(shù)據(jù)線性和非線性特征,從而提高機(jī)器學(xué)習(xí)模型預(yù)測精度.
2) 試驗結(jié)果表明STL-CS-LSTM模型的預(yù)測精度比3個單一模型要更加優(yōu)異.