錢建固,吳安海,季 軍,成 龍,徐 巍
(1.同濟大學土木工程學院,上海 200092;2.同濟大學巖土及地下工程教育部重點實驗室,上海200092;3.上海城投水務(集團)有限公司,上海 200002;4.上海勘察設計研究院(集團)有限公司,上海 200093)
由于巖土體材料的特殊性、實際影響因素的復雜性,巖土工程應力、變形等的時間序列通常表現出十分明顯的非線性特征[1],且其演化過程具有隨機性、模糊性和高度復雜性的特點。
傳統(tǒng)的分析方法如理論分析、數值模擬和經驗公式法等等[2-4]雖然具備預測的能力,但由于理論計算方法的不成熟,往往只適用于特定工況,在實際工程應用時通常存在比較大的誤差,預測精度難以滿足要求。
伴隨著大數據科學與人工智能技術的發(fā)展,智能預測已逐漸成為巖土工程領域的發(fā)展趨勢。常用的智能分析方法有:灰色預測、時間序列分析、優(yōu)化算法和BP(反向傳播)神經網絡等[5-6]。但是這些算法都存在一些局限性。監(jiān)測數據為動態(tài)數據,其隨時間的推移不斷更新變換,同時由于影響因素的復雜多變,還往往具有高度非線性和非平穩(wěn)性的特征。而灰色預測和時間序列分析均不具備滾動預測的能力,無法以當前的預測結果為基礎繼續(xù)進行下一步的預測。優(yōu)化算法如遺傳算法、蟻群算法等則存在局部極值的問題,容易陷入局部最優(yōu)點從而無法找到全局最優(yōu)的預測結果。BP神經網絡是一種多層前饋神經網絡,層與層之間通過導數連乘來傳遞和更新信息,當導數很小或者很大時,BP神經網絡便容易出現梯度消失和梯度爆炸的問題從而造成結果的不收斂。為了更好地分析時間序列,Hochreite和Schmidhuber[7]于1997年提出了長短時記憶神經網絡(long short-term memory neural network,LSTM)。同BP神經網絡相比,它不僅解決了梯度消失和梯度爆炸的問題,同時還對高度非線性的數據有著極強的映射能力,能夠對巖土工程應力、變形等的時間序列做出高精度的預測。
當前智能方法在巖土工程領域中的應用大致可以分為兩類。一類為基于模型的反演方法,在基本土體模型的基礎上,通過對少部分數據的學習,修正基本土體模型參數,從而得到較為準確的預測結果[8]。該類方法已經較為成熟,在預測土體變形、強度等方面都得到了較為廣泛的運用[9]。另一類為基于大數據的智能算法,該類方法不考慮土力學原理,直接通過相關工程數據的學習,找出不同對象間的隱藏規(guī)律,進而做出準確預測[10]。該類方法對數據的要求更高,但是技術卻尚未成熟,因此在實際工程中的應用并不普及。如何改進第二類方法,使其預測結果能更好地指導生產實踐便是本文的主要研究目的。
另一方面,實際工程由于受到施工、自然天氣等各種隨機因素的干擾,采集到的監(jiān)測數據往往包含了各種噪聲。噪聲即高頻誤差,它的存在將會影響LSTM神經網絡對數據的學習,最終造成預測結果的不準確。為了充分考慮噪聲的影響,本文提出了基于小波優(yōu)化(Wavelet Optimized)的長短時記憶神經網絡-自回歸滑動平均(LSTM-ARMA)預測模型。先通過小波變換提取原始監(jiān)測時間序列的噪聲,得到噪聲項,扣除噪聲項后剩余的部分即為趨勢項。其中,趨勢項真實反映了實際工程中應力、變形等的演化趨勢,而噪聲項則體現了各種隨機因素的綜合干擾。長短時記憶神經網絡(long short-term memory network,LSTM)擅長學習階梯性與趨勢性的時間序列,自回歸滑動平均模型(autoregressive moving average,ARMA)模型擅長模擬平穩(wěn)時間序列(均值、方差恒定)。因此,本文分別使用LSTM神經網絡和ARMA模型學習并預測趨勢項和噪聲項。最終將趨勢項預測值和噪聲項預測值之和作為總的時間序列預測值。
小波分析、LSTM神經網絡與ARMA模型的結合使用在巖土工程預測分析領域比較鮮見,為了檢驗該組合模型的有效性與可行性,本文將其運用于上海云嶺超深基坑工程的地表沉降預測中。工程實例表明,該預測方法相對誤差小、預測精度穩(wěn)定,具有較好的工程實用性。
基于小波優(yōu)化的LSTM-ARMA時序預測模型可按照以下幾個步驟進行:
(1)對監(jiān)測得到的非線性時間序列進行處理,剔除異常數據并且通過線性插值等方式將監(jiān)測時間序列變成等距時間序列。
(2)選取適當的小波基函數和分解層數,對時間序列進行小波降噪,將其分解成趨勢項和噪聲項。
常用的小波基函數有db小波基(如db5、db6等)、haar小波基和sym小波基等。通過小波變換,可將原始時間序列f(t)分解成各個子信號的疊加:
其中:φj,k為近似信號;ψj,k為細節(jié)信號;cj,k與dj,k為相應的系數。近似信號與細節(jié)信號分別描述原始時間序列的低頻與高頻部分,但僅為相對概念,并不代表頻率的絕對大小。原始信號經小波多層次分解后,每一層級上均可獲得一個低頻子信號與一個高頻子信號[11]。
接著設置合理的閾值T,若某一時刻的子信號值低于該閾值,則認為其是由噪聲產生,將其置為零從而實現去噪。常用的閾值計算方法[11]如式(2)所示:
其中:n為信號的采樣長度;σ為噪聲信號的方差,可根據魯棒中值定理[11]進行計算。
最終可將原始時間序列f(t)分解成趨勢項trend(t)與噪聲項noise(t)之和:
(3)趨勢項采用LSTM神經網絡進行滾動預測。
LSTM神經網絡的結構為鏈式結構,由一個個重復單元串聯而成。重復單元的內部構造如圖1所示。前已述及,BP神經網絡由于結構問題,容易出現梯度消失或者梯度爆炸,從而導致結果的不收斂。而LSTM神經網絡特色性地加入了細胞狀態(tài)Ct用于記錄長期信息、隱藏狀態(tài)ht用于記錄短期信息,同時設置了“門”的結構(遺忘門、輸入門和輸出門)用于時刻更新和丟棄信息,這使得LSTM神經網絡在時間序列預測上表現優(yōu)異,同時還避免了梯度消失和梯度爆炸的問題。
圖1 LSTM重復單元示意圖Fig.1 Architecture of LSTM neural network
滾動預測趨勢項前,需要先構造樣本用于訓練LSTM神經網絡。樣本構造方式如表1所示,其中u代表監(jiān)測變形序列中的趨勢項。
表1 LSTM神經網絡的輸入與輸出Tab.1 Input and output of LSTM neural network
m的取值從3到10不等[12],并且可以隨著可構造樣本的數量進行調整,在本文中m統(tǒng)一取為5。后續(xù)采用滾動預測的方式進行預測,比如使用u(1),u(2),u(3),…,u(m)預測u*(m+1),然后再使用u(2),u(3),u(4),…,u(m),u*(m+1)預測u*(m+2),通過這種方式可實現多個時刻變形值的預測。
(4)噪聲項采用ARMA(p,q)模型預測。
自回歸移動平均模型(簡稱ARMA),是用來預測平穩(wěn)時間序列的一種方法。令Xt為t時刻的觀測值,假設Xt不僅與t時刻之前的觀測值Xt-1,Xt-2,…,Xt-p有關,還與t時刻之前的擾動值εt-1,εt-2,…,εt-q相關,則Xt可寫成如下形式:
其中:φ1,φ2,…,φp與θ1,θ2,…,θq均為該線性組合的系數。
當Xt為平穩(wěn)時間序列,εt為白噪聲序列,且滿足式(5)時,稱{Xt}為p階自回歸與q階滑動平均混合序列,記為ARMA(p,q)。
其中:E表示的是數學期望。ARMA模型的使用前提是序列的平穩(wěn)性。因此,首先要使用增廣迪基-富勒檢驗(augmented Dickey-Fuller test,ADF)單位根判別噪聲序列是否平穩(wěn),若平穩(wěn),則可采用ARMA模型進行預測,否則需要調整小波基函數和分解層數,直至噪聲序列為平穩(wěn)時間序列。
隨后需計算不同p、q組合下該噪聲序列的信息準則值,如常用的赤池信息準則(akaike information criterion,AIC)與 貝 葉 斯 信 息 準 則(Bayesian information criterion,BIC)等,用以評估擬合模型優(yōu)劣的衡量標準,進而實現對模型中的變量起到優(yōu)化選擇[13]。信息準則值越小則表示相應(p、q)階的ARMA模型越好。
(5)將趨勢項預測值與噪聲項預測值相加得到總的時間序列預測值yi(i=1,2,…,n),并與監(jiān)測值fi對比,分析誤差情況。常用的誤差評價指標有均方根誤差(RMSE)與平均百分比誤差(MAPE):
式中:RMAPE為均方根誤差;RRMSE為平均百分比誤差。
預測流程如圖2所示。預測前后趨勢項與噪聲項的曲線示意圖如圖3所示。趨勢項與噪聲項求和便可得到總的時間序列。
圖2 預測流程圖Fig.2 Flowchart of the forecast model
圖3 預測前后趨勢項與噪聲項的曲線示意圖Fig.3 Curves of trend term and noise term before and after prediction
云嶺基礎設施基坑為上海蘇州河段深層排水調蓄管道系統(tǒng)工程的一部分?;映蕡A形,直徑34 m,目標深度57.84 m,超過國內基坑最大開挖深度51 m。支護結構采用1 500 mm連續(xù)墻,地連墻采用銑接頭,逆作內襯墻?;拥靥幧虾\浲羺^(qū)域,地質條件復雜,且深層土體力學特性不明,因此周邊布置了大量監(jiān)測點?;油獾乇沓两禍y線布設和基坑剖面分別如圖4、圖5所示。
圖4 超深基坑平面及地表沉降測線布置Fig.4 Plan and monitoring arrangement of the ultradeep foundation pit
圖5 超深基坑剖面圖(單位:m)Fig.5 Profile of ultra-deep foundation pit(unit:m)
基坑周圍布設了4條沉降測線,分別為DB1、DB2、DB3和DB4,其與圖4水平方向的夾角依次為11.6°、86.2°、8.3°和87.2°。本文選取每條測線上的第一個監(jiān)測點(即DB1-1、DB2-1、DB3-1、DB4-1)的沉降監(jiān)測數據用于訓練和檢驗該預測模型。這4個監(jiān)測點與豎井間的距離均約為4.8 m。
需指出的是,目前基坑開挖尚未完工,以下選取了自開工2017.11.6至最近2020.8.24期間共計10個工況,記為工況1~工況10,具體情況如表2所示。其中,測點DB4-1在工況8中由于施工原因被毀,相應的監(jiān)測數據只更新至2020.6.7為止。
表2 施工工況Tab.2 Construction conditions
現場采集的監(jiān)測數據并非等時間間隔,需要進行插值處理。為了減少插值的影響,維持原始時間序列的變化規(guī)律,本文選用分段線性插值的方法。插值起始時間為2017.11.21,間距為6 d。插值后的沉降監(jiān)測點DB1-1、DB2-1、DB3-1和DB4-1的數據如圖6所示,從左到右依次為工況1~工況10,分別對應120、8、3、10、6、3、4、7、3、4組數據,如表2所示。
圖6 地表沉降時程曲線Fig.6 Ground surface deformation
現以DB1-1沉降監(jiān)測數據為例,詳細描述如何建立LSTM-ARMA時序預測模型。
首先利用工況1的監(jiān)測數據建模預測工況2的沉降變形,接著利用工況1和工況2的監(jiān)測數據建模預測工況3的沉降變形,依此類推,最后利用工況1~工況10的監(jiān)測數據建模預測未來工況的沉降變形。
2.3.1 工況2沉降變形的預測
(1)小波降噪分析
實際工程由于受到各種因素的干擾,所采集的監(jiān)測數據將會包含一定的噪聲,需要對其進行小波降噪從而獲得真實的歷史沉降信息。去噪步驟為:首先,分別選用小波基函數db10、db15和db20對工況1的監(jiān)測數據依次進行3層、4層和5層的小波分解;提取出高頻噪聲后分別計算信噪比SNR和均方根誤差RMSE,信噪比越大、均方根誤差越小則代表分解效果越好[14]。計算結果如表3所示。
表3 小波降噪結果對比Tab.3 Comparison of different wavelet denoises
在小波基函數為db20且分解層數為3的情況下,信噪比為23.802 5,均方根誤差為0.550 3,去噪效果最為理想。此時,提取的趨勢項與噪聲項如圖7所示。
圖7 DB1-1工況1的趨勢項與噪聲項Fig.7 Trend and noise term of DB1-1 in working condition 1
(2)趨勢項預測
趨勢項采用LSTM網絡進行預測,樣本構造采用“5+1”模式,即采用當前時刻以及前4個時刻的值不斷滾動預測下一時刻的值。
(3)噪聲項預測
噪聲項采用ARMA模型進行預測。圖7表明噪聲曲線直觀上為平穩(wěn)時間序列,需要經過ADF單位根進行進一步的平穩(wěn)性檢驗。經過計算,ADF值為-7.343 3,由表4可知,該噪聲序列在99%的置信概率下為平穩(wěn)時間序列,因此可使用ARMA模型。
表4 不同置信區(qū)間對應的臨界ADF值Tab.4 Critical ADF values corresponding to different confidence intervals
根據AIC準則[13]繪制噪聲序列的熱力圖,如圖8所示。圖中,信息準則值與熱力圖顏色深淺的對應關系參照圖右方的色帶。當p(即AR系數)取2、q(即MA系數)取5時,圖中小矩形的顏色最深,表示此時的信息準則值最小、模型最優(yōu)。
圖8 噪聲項熱力圖Fig.8 Thermograph of noise term
(4)總的變形預測
將趨勢項的預測結果和噪聲項的預測結果之和作為總的預測值,如圖9所示。為了證明該組合模型的優(yōu)越性,在不采用小波降噪與ARMA模型的前提下,直接使用LSTM模型預測工況2的沉降變形,結果如圖10所示。
2.3.2 后續(xù)工況沉降變形的預測
按照同樣的方法,分別利用工況1~2、1~3、1~4、1~5、1~6、1~7、1~8、1~9與1~10的監(jiān)測數據建模預測工況3、4、5、6、7、8、9、10與未來工況的沉降變形,結果如圖9所示。同時,也只使用LSTM模型對后續(xù)工況進行了預測,預測結果如圖10所示。
圖9 DB1-1工況2~工況10的LSTM-ARMA預測結果Fig.9 LSTM-ARMA prediction results of DB1-1 in working conditions 2-10
圖10 DB1-1工況2~工況10的LSTM預測結果Fig.10 LSTM prediction results of DB1-1 in working conditions 2-10
圖9 表明,工況2的預測精度最差,最大相對誤差高達8.00%,而其余工況的最大相對誤差均不超過4.20%。這主要是由于工況2為抽水試驗和疏干降水,其引起監(jiān)測點變形的速率要大于工況1中的圍護墻施工,而工況2的預測采用的是工況1的變形數據進行建模,LSTM網絡所學習的變形規(guī)律均為工況1監(jiān)測點的變形規(guī)律,所以不能很好地預測工況2的沉降變形。相比之下,工況3~工況10階段產生的變形較小,預測也更加準確。
圖9說明,當使用基于小波優(yōu)化的LSTMARMA模型時,相對誤差在0.30%~8.00%之間,平均值為2.66%,方差為2.64。而根據圖10,只使用LSTM模型進行預測時,相對誤差在0.09%~8.78%之間,平均值為2.89%,方差為3.16。雖然在少部分期數中(如第122期、第123期等),后者的預測誤差稍低,但從整體上看,前者的預測誤差在平均值和方差上都比后者更小,因此LSTM-ARMA模型的預測效果更加理想。
基于同樣的方法和步驟,對插值后DB2-1、DB3-1和DB4-1的沉降數據進行建模預測,結果如圖11、圖12和圖13所示。
圖11 DB2-1工況2~工況10的LSTM-ARMA預測結果Fig.11 LSTM-ARMA prediction results of DB2-1 in working conditions 2-10
圖12 DB3-1工況2~工況10的LSTM-ARMA預測結果Fig.12 LSTM-ARMA prediction results of DB3-1 in working conditions 2-10
圖13 DB4-1工況2~工況7的LSTM-ARMA預測結果Fig.13 LSTM-ARMA prediction results of DB4-1 in working conditions 2-7
顯然,4個監(jiān)測點的沉降規(guī)律基本一致,且工況2的預測誤差都比較大,最大相對誤差超過18%;而工況3~工況10的預測誤差均比較小,最大相對誤差不超過6%。這與監(jiān)測點在工況1和工況2下的變形速率相差過大有關。
此外,利用LSTM-ARMA模型預測DB2-1、DB3-1和DB4-1的平均相對誤差分別為2.91%、3.80%和4.61%,方差分別為12.91、19.39和22.21。而只采用LSTM模型預測的平均相對誤差為4.35%、6.14%和4.18%,方差為20.17、42.73和16.95。綜合來看,LSTM-ARMA模型取得了更好的預測結果。
樣本數量對于LSTM正確學習序列規(guī)律具有較大的影響,樣本數量若過少,LSTM則難收斂,甚至得不到最優(yōu)解,為此,以下將探討樣本數量對LSTM-ARMA模型預測精度的影響。以測點DB1-1為示例,分別用最新30期、60期、90期和120期工況1的沉降監(jiān)測數據訓練ARMA-LSTM模型,并使用訓練完畢的模型預測工況2的沉降值。預測誤差結果如圖14所示。
圖14 不同樣本數量下的模型預測誤差對比Fig.14 Comparison of prediction errors in different sample quantities
不難看出,樣本數量的增加能提高模型的預測精度。當樣本數量為30,即僅使用工況1最新30期數據預測工況2沉降值時,最大預測誤差高達18%;而當樣本數量增加至60時,最大誤差減小一半,約為9%;此后繼續(xù)增加樣本數量,預測精度可以進一步提高,但是提高幅度減小。由此可見,依據預測精度要求,有必要合理地選擇樣本數量;在滿足工程需求的條件下,繼續(xù)增大樣本數量,對提高預測精度非常有限,反之還將顯著降低計算效率。
為了說明LSTM-ARMA智能預測模型的有效性,這里將地表總沉降分成兩部分,即基坑開挖誘發(fā)沉降與非開挖誘發(fā)沉降,其中,基坑開挖誘發(fā)的地表沉降采用彈塑性有限元預測,而非開挖因素(降水、圍護墻施工、地表堆載等)誘發(fā)的沉降變形則仍采用智能預測模型預測,二者疊加之后便與現場實測的真實變形作對比驗證,計算剖面為DB1-1。
有限元數值模型如圖15所示,考慮圓形基坑的軸對稱性,建立軸對稱準三維模型。土層剖面按圖5確定,土體模型采用適用于軟土應力應變響應的HS(Hardening-Soil)模型[15],參數如表5所示,取值參考文獻[16]。有限元模型的結構參數如表6所示,其中包括地連墻、圍檁與內襯墻,當土體開挖至指定深度時,便將圍檁與內襯墻相應范圍內的剛度附加至地連墻中,以模擬圍檁與內襯墻的施工。以DB1-1工況1的沉降監(jiān)測序列預測工況2~工況10的沉降變形為例,該過程具體如下所示。
表6 有限元模型結構參數Tab.6 Structure parameters of finite element model
圖15 有限元模型網格劃分(單位:m)Fig.15 Mesh generation of finite element model(unit:m)
表5 有限元模型土體參數Tab.5 Soil parameters of finite element model
整個基坑開挖全過程對應于表2中的工況2~工況10,預測的最大開挖深度35 m,考慮軟土地層滲透性小,且施工期相對較短,數值分析忽略開挖期間的排水固結效應。開挖有限元預測、非開挖人工智能模型預測及二者疊加如圖16所示,對比實測結果可以看出,不僅二者的發(fā)展趨勢上吻合較好,同時在數量上也較為接近,其最大相對誤差不超過9%,平均相對誤差也僅為5%左右。值得一提的是,開挖初期采用有限元預測與人工智能預測的疊加結果,要好于單一的人工智能模型預測,而隨著后期工況的發(fā)展,兩類預測結果差異性逐漸減小,表明單一的人工智能預測在工況突變階段(對應于本案例為非開挖到開挖過渡階段),可能引起較大的約誤差。
圖16 DB1-1工況2-10的模型預測結果Fig.16 Prediction results of DB1-1 in working conditions 2-10
針對巖土工程領域的非線性時間序列預測問題,本文提出了基于小波優(yōu)化的LSTM-ARMA模型。作為案例,將其運用到上海云嶺超深基坑工程的地表沉降預測中,通過與沉降監(jiān)測值的比較,得到以下結論:
(1)實際工程由于受到各種隨機因素的干擾,所采集的監(jiān)測數據將會包含噪聲信號。通過小波降噪提取的趨勢項可以更真實地反映基坑變形規(guī)律;
(2)將原始時間序列小波分解成趨勢項與噪聲項,并分別使用LSTM模型與ARMA模型進行預測,預測值之和作為總的變形預測值。該組合模型同時綜合了LSTM與ARMA的優(yōu)勢。工程案例表明,LSTMARMA模型比單純使用的LSTM模型預測誤差更小、精度更穩(wěn)定,從而效果更加理想;
(3)案例分析表明:若后續(xù)工況與前置工況沉降規(guī)律相近,則預測誤差較小;若二者沉降規(guī)律相差過大,預測誤差則會明顯變大。
(4)采用彈塑性有限元對開挖誘發(fā)的地表沉降進行了預測,驗證了人工智預測模型的合理性。在非開挖工況向開挖工況突變階段,單一人工智能預測模型預測可能產生較大的誤差,隨著后續(xù)開挖工況的發(fā)展,人工智能預測誤差將逐漸減小。
(5)該組合模型適用于非線性時間序列的分析,在巖土工程領域,可實測的應力與變形指標均都具有非線性的特點。因此,該流程分析也可推廣預測工程中應力與變形等變量的演化規(guī)律。
作者貢獻說明:
錢建固:課題研究與論文撰寫的指導。
吳安海:課題研究與論文撰寫。
季軍:提供相關工程資料。
成龍:提供相關工程資料。
徐?。壕幊讨笇?。