王亞飛, 韓 靜, 郭 凰, 廖 聰, 王立新
1(長安大學 信息工程學院, 西安 710064)
2(中鐵第一勘察設(shè)計院集團有限公司, 西安 710043)
隨著社會的發(fā)展, 國民經(jīng)濟的快速增長, 地鐵、隧道、橋梁等大型建筑已蓬勃興起, 并在社會發(fā)展中起到城市脊梁的作用.但當這些建筑的結(jié)構(gòu)出現(xiàn)事故時,不僅會造成巨大的經(jīng)濟損失, 阻礙城市的發(fā)展, 而且還會帶來人員的傷亡, 給社會的穩(wěn)定形成激烈地沖擊.因此, 為建筑結(jié)構(gòu)進行自動化監(jiān)測, 推測結(jié)構(gòu)變形數(shù)據(jù)的趨勢, 在出現(xiàn)安全隱患及時預(yù)警, 對保障生命財產(chǎn)安全、社會健康發(fā)展具有重要意義.
傳統(tǒng)的結(jié)構(gòu)變形預(yù)測方法有回歸分析、灰色模型和時間序列模型, 根據(jù)監(jiān)測數(shù)據(jù)的特點, 選擇合適的預(yù)測模型.劉波等[1]采用多元線性回歸模型, 對實際高層建筑的結(jié)構(gòu)變形進行了分析和預(yù)測, 取得了較好的預(yù)測效果.回歸分析模型屬于靜態(tài)模型, 而實際結(jié)構(gòu)變形數(shù)據(jù)是動態(tài)數(shù)據(jù), 數(shù)據(jù)之間存在依賴關(guān)系, 回歸分析模型的預(yù)測結(jié)果無法準確反映結(jié)構(gòu)未來變形趨勢.Xiao等[2]建立一種基于最佳時間位移的二次襯砌施工灰色模型來預(yù)測隧道頂板變形.該模型利用邊界條件對GM(1,1)的權(quán)重系數(shù)進行優(yōu)化, 準確地預(yù)測隧道的頂板位移.灰色模型對于不確定因素的復雜系統(tǒng)預(yù)測效果較好, 但其要求累加得到的新數(shù)據(jù)滿足指數(shù)特性, 限制了灰色模型在實際工程中的廣泛應(yīng)用.斯建寧等[3]利用ARIMA預(yù)測隧道結(jié)構(gòu)變形, 通過分析監(jiān)測數(shù)據(jù)的時域特性, 推測隧道的結(jié)構(gòu)形變.時間序列模型要求數(shù)據(jù)是線性的和穩(wěn)定的, 而實際結(jié)構(gòu)形變數(shù)據(jù)具有復雜的非線性特征, 不適合工程結(jié)構(gòu)變形數(shù)據(jù)預(yù)測.
神經(jīng)網(wǎng)絡(luò)和機器學習在結(jié)構(gòu)變形預(yù)測方面具有普適性, 已經(jīng)在實際工程中得到應(yīng)用廣泛.吳杰等[4]提出了用小波神經(jīng)網(wǎng)絡(luò)(WNN)擬合并預(yù)測大橋位移與其原因之間非線性關(guān)系的方法, 該方法可以確定網(wǎng)絡(luò)隱含層最優(yōu)節(jié)點數(shù), 具有良好的局部特性、較強的學習能力和任意函數(shù)逼近能力, 實現(xiàn)了大橋變形的精確擬合及預(yù)測, 但參數(shù)的隨機初始化會導致WNN收斂速度慢甚至不收斂現(xiàn)象[5].李帥等[6]利用BP神經(jīng)網(wǎng)絡(luò)模型對基坑樁體位移進行預(yù)測, 精確地反映了實際變形趨勢.Pourtaghi等[7]利用小波-人工神經(jīng)網(wǎng)絡(luò)預(yù)測最大地表沉降, 采用不同的小波作為激活函數(shù)來預(yù)測隧道開挖引起的最大地表沉降, 使預(yù)測誤差值有所降低.但樣本和模型參數(shù)對該模型影響較大, 訓練時容易陷入局部最優(yōu).Yang等[8]利用長短時記憶網(wǎng)絡(luò)(LSTM)預(yù)測滑坡的周期性位移.Xu等[9]提出了基于ARIMA-LSTM的預(yù)測模型, 解決了單一預(yù)測算法無法同時求解大壩變形數(shù)據(jù)中的線性分量和非線性分量的問題.該模型采用ARIMA模型預(yù)測大壩變形數(shù)據(jù)中的線性分量,采用長短期記憶LSTM模型預(yù)測大壩變形數(shù)據(jù)中的非線性分量, 準確反映大壩變形趨勢.結(jié)果表明, LSTM能夠記憶歷史信息, 對未來結(jié)構(gòu)數(shù)據(jù)進行準確預(yù)測, 但模型僅利用前向信息預(yù)測當前數(shù)據(jù), 忽略時間點之后的結(jié)構(gòu)變形數(shù)據(jù)的變化規(guī)律對當前數(shù)據(jù)的影響, 無法充分挖掘監(jiān)測數(shù)據(jù)的時間特征信息, 導致預(yù)測精確度有待進一步提高.
因此, 針對LSTM模型僅利用時間序列前向信息預(yù)測當前數(shù)據(jù)的不足, 本文提出一種基于Bi-LSTM的結(jié)構(gòu)變形預(yù)測模型, 研究時間節(jié)點前后的結(jié)構(gòu)變形規(guī)律對當前時刻數(shù)據(jù)的影響, 并以實際沉降數(shù)據(jù)為實驗依據(jù), 通過和不同模型進行對比, 結(jié)果表明, Bi-LSTM模型充分提取了數(shù)據(jù)的時間特征, 有效地提高了模型的預(yù)測準確性.
LSTM[10,11]是為了解決RNN長時間依賴問題被提出的, 解決了循環(huán)神經(jīng)網(wǎng)絡(luò)的“梯度消失”和“梯度爆炸”問題.LSTM利用“記憶塊”代替了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的隱含節(jié)點, “記憶塊”增加了“細胞狀態(tài)”和“門”結(jié)構(gòu).細胞狀態(tài)完成了LSTM的記憶功能, “遺忘門”(ft)、“輸入門”(it)和“輸出門”(ot)對細胞更新和數(shù)據(jù)輸出進行控制, 其內(nèi)部結(jié)構(gòu)如圖1所示.
圖1 LSTM記憶模塊結(jié)構(gòu)圖
LSTM模塊中的細胞狀態(tài)Ct對線性信息的進行傳遞, 同時隱藏層的外部結(jié)構(gòu)ht對Ct處理, 完成非線性信息輸出, 具體公式如下:
LSTM及RNN都是通過前向信息推測后向數(shù)據(jù),但對于時間序列, 利用前向和后向的信息對當前時刻進行預(yù)測, 增強特征信息和預(yù)測值的聯(lián)系, 提高了模型預(yù)測精度.LSTM預(yù)測模型僅通過單側(cè)數(shù)據(jù)的規(guī)律進行預(yù)測, 不能充分的挖掘時間特征信息, 預(yù)測精確度需要進一步提高.針對LSTM模型的這一不足, 提出了Bi-LSTM的預(yù)測模型.Bi-LSTM[12-14]利用兩個不相關(guān)的LSTM模型, 分別從前向和后向進行數(shù)據(jù)預(yù)測, 兩個模型隱含層的輸出作為輸出層的輸入, 最后由輸出層的內(nèi)置函數(shù)輸出最終的預(yù)測值.如圖2所示.
圖2 Bi-LSTM模型結(jié)構(gòu)
Bi-LSTM的隱含層有兩個LSTM組成, 分別是前向隱含向量, 后向隱含向量, 將正向輸入序列和反向輸入序列在網(wǎng)絡(luò)輸出層結(jié)合, 則yt為最終輸出值:
為了確保建筑結(jié)構(gòu)安全, 通過自動化的監(jiān)測設(shè)備對地下空間沉降進行實時監(jiān)測, 利用采集的結(jié)構(gòu)變形數(shù)據(jù), 科學地預(yù)測結(jié)構(gòu)未來變形趨勢.本文結(jié)合Bi-LSTM的優(yōu)點, 提出一種基于Bi-LSTM的結(jié)構(gòu)變形預(yù)測模型.
假設(shè)傳感器監(jiān)測的一組數(shù)據(jù)為XN=[x1,x2,x3,···,xN](N為采樣點數(shù)), 通過分析結(jié)構(gòu)變形數(shù)據(jù)和Bi-LSTM模型特點, 確定前M個監(jiān)測數(shù)據(jù)為預(yù)測模型訓練集,后N-M個監(jiān)測數(shù)據(jù)為預(yù)測模型測試集.
其中,L是模型輸入層節(jié)點個數(shù),Xtr為訓練輸入,Ytr為目標輸出,XT為測試輸入.
對于模型正向LSTM單元, 訓練集第i輸入Xtr(i),代入式(1)至式(3)中, 得到一組狀態(tài)輸出.
對于模型反向LSTM單元, 訓練集第i輸入Xtr(i)按照反向順序代入式(1)至式(3)中, 得到一組狀態(tài)輸出
得到的兩組狀態(tài)輸出具有相同的特征維度, 把二者進行拼接得到Hi∈R2×L:
拼接向量通過輸出層激活函數(shù)處理, 得到第i個訓練輸出.
模型的訓練及測試過程如圖3.在模型訓練時, 為了防止模型出現(xiàn)過擬合, 在隱含層增加正則化, 模型利用梯度下降算法更新網(wǎng)絡(luò)權(quán)重矩陣和偏置向量.首先,對模型的所有參數(shù)初始化; 然后Bi-LSTM提取時間序列的前向和后向信息作為全連接層的輸入, 分別計算前向隱含層和后向隱含層的輸出, 并通過拼接、線性運算得出權(quán)值訓練集輸出; 其次利用損失函數(shù)反向傳播, 對模型參數(shù)進行更新, 得出最優(yōu)解; 最后利用測試集數(shù)據(jù)對訓練后的模型進行測試, 把模型預(yù)測結(jié)果和真實數(shù)據(jù)進行對比, 通過預(yù)測誤差評價模型的預(yù)測精確度.
圖3 Bi-LSTM預(yù)測模型
具體步驟如下:
步驟1.把實驗沉降數(shù)據(jù)劃分為訓練集和測試集,并對數(shù)據(jù)進行歸一化;
步驟2.初始化模型參數(shù), 設(shè)置模型輸入層節(jié)點數(shù),前向、后向隱含層數(shù)及節(jié)點數(shù), 學習步長和訓練輪數(shù);
步驟3.利用訓練集數(shù)據(jù)對模型進行訓練, 確定模型最優(yōu)解;
步驟4.通過測試集數(shù)據(jù)對訓練后的模型進行測試, 利用預(yù)測誤差評價模型預(yù)測精確度.
本實驗利用國內(nèi)某隧道沉降數(shù)據(jù)驗證模型的有效性.監(jiān)測時間為2016年3月10日至2016年12月29日, 經(jīng)過處理的實驗數(shù)據(jù)為1310個點, 如圖4所示.
圖4 實驗沉降數(shù)據(jù)
對沉降數(shù)據(jù)進行歸一化, 可以加快梯度下降, 適應(yīng)激活函數(shù), 減少預(yù)測誤差, 使其映射到[- 1,1]區(qū)間內(nèi).再將數(shù)據(jù)70%劃分為訓練集, 30%為測試集.歸一化具體公式如下:
其中,x為 原始數(shù)據(jù),為歸一化后的數(shù)據(jù),xmin和xmax原始數(shù)據(jù)的最小值和最大值.
常用來衡量預(yù)測模型性能指標有: 均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MARE)等, 在本實驗采用RMSE、MAE和MAPE指標衡量Bi-LSTM模型的預(yù)測效果.
本實驗為了檢驗Bi-LSTM模型的精準度, 利用測試輸入數(shù)據(jù)預(yù)測沉降值, 并將預(yù)測結(jié)果和真實值進行對比, 對比結(jié)果如圖5所示:
由圖5可知, Bi-LSTM模型的預(yù)測結(jié)果和真實值在整體上擬合度很高, 并且曲線的各個峰值處, 兩者的數(shù)據(jù)值很接近, 預(yù)測模型的RMSE、MAE、MAPE分別是0.0890、0.0728和0.0073.綜合可知, Bi-LSTM模型預(yù)測結(jié)構(gòu)沉降具有良好的準確性.
圖5 Bi-LSTM預(yù)測結(jié)果
本實驗把Bi-LSTM模型和WNN、LSTM、GRU模型進行對比分析, 結(jié)果如圖6所示.WNN模型的預(yù)測結(jié)果整體上反映了沉降數(shù)據(jù)的變化趨勢, 但和真實值仍存在較大誤差.LSTM模型相比WNN模型預(yù)測結(jié)果具有更高的準確性, 但GRU模型通過對LSTM門結(jié)構(gòu)進行優(yōu)化, 能夠更加有效地保留時間序列有用信息, 預(yù)測結(jié)果更加接近真實值.基于Bi-LSTM結(jié)構(gòu)變形預(yù)測模型的MAPE、RMSE和MAE最小, 擬合度最高, 預(yù)測效果最好.充分說明Bi-LSTM模型通過提取時間序列前向和后向的規(guī)律, 更加準確地預(yù)測沉降數(shù)據(jù)變化趨勢, 彌補了其他模型僅利用單側(cè)信息進行預(yù)測的不足, 在實際數(shù)據(jù)預(yù)測中具有更好的可行性.為了明確不同預(yù)測方法的具體誤差值, 不同的性能比較如表1所示.
圖6 不同模型對比試驗
表1 模型性能比較
由表1可知, 對比WNN、LSTM、GRU預(yù)測模型, 本實驗提出的基于Bi-LSTM的結(jié)構(gòu)變形預(yù)測模型,預(yù)測結(jié)果在MAPE、RMSE、MAE三個指標上均為最優(yōu)結(jié)果.實驗結(jié)果表明本實驗提出的Bi-LSTM預(yù)測模型和現(xiàn)有預(yù)測方法相比, 誤差更小, 預(yù)測準確性更高.
針對現(xiàn)有的結(jié)構(gòu)變形預(yù)測模型僅通過時間序列單側(cè)規(guī)律進行預(yù)測的不足, 本實驗提出一種基于Bi-LSTM的結(jié)構(gòu)變形預(yù)測模型, 同時提取變形數(shù)據(jù)前向和后向信息, 預(yù)測當前結(jié)構(gòu)變形數(shù)據(jù), 提高了預(yù)測的準確性.最后通過和現(xiàn)有的WNN、LSTM、GRU模型進行對比, 有效地說明了Bi-LSTM模型具有更高的預(yù)測精度,為結(jié)構(gòu)變形預(yù)測提供更加科學的依據(jù).