徐勇斌 汪鋒 施倩紅
摘要:研究地鐵隧道施工引起的沉降一直是隧道研究中的熱點問題。但是由于地層復(fù)雜性和施工參數(shù)多變性,用經(jīng)驗公式或者數(shù)值模擬預(yù)測隧道掘進引發(fā)的地面最大沉降難以兼顧易用性和準確性。近幾年隨著機器學(xué)習(xí)理論的深入研究、計算機軟硬件技術(shù)的快速發(fā)展,機器學(xué)習(xí)等新興算法正在被越來越多地運用于預(yù)測地面最大沉降。本文采用兩種機器學(xué)習(xí)算法(隨機森林和BP神經(jīng)網(wǎng)絡(luò)),以隧道幾何參數(shù)、盾構(gòu)機施工參數(shù)和地質(zhì)參數(shù)作為輸入,對隧道施工過程中引發(fā)的地面最大沉降進行預(yù)測分析。結(jié)果顯示,兩種機器學(xué)習(xí)算法均能實現(xiàn)較高質(zhì)量的預(yù)測,并且隨機森林模型的穩(wěn)定性優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型。
關(guān)鍵詞:地鐵隧道?沉降預(yù)測?機器學(xué)習(xí)?隨機森林?BP神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP181;U456.3
Prediction?Methods?for?the?Maximum?Surface?Settlement?of?Subway?Tunnels?Based?on?Machine?Learning
XU?Yongbin1??WANG?Feng2*??SHI?Qianhong2
1.?Hangzhou?Construction?Engineering?Quality?and?Safety?Supervision?Station,?Hangzhou,?Zhejiang?Province,?310005?China;?2.PowerChina?Huadong?Engineering?Co.,?Ltd.,?Hangzhou,?Zhejiang?Province,?311122?China
Abstract:?It?has?always?been?a?hot?topic?to?study?the?settlement?caused?by?subway?tunnel?construction?in?tunnel?research.?However,?due?to?the?complexity?of?the?geological?strata?and?the?variability?of?construction?parameters,?it?is?difficult?to?balance?ease?of?use?and?accuracy?to?predict?the?maximum?ground?settlement?caused?by?tunneling?by?empirical?formulas?or?numerical?simulations.?In?recent?years,?with?in-depth?research?on?the?machine?learning?theory?and?the?rapid?development?of?computer?software?and?hardware?technology,?emerging?algorithms?such?as?machine?learning?are?increasingly?being?applied?to?predict?maximum?ground?subsidence.?This?article?uses?two?machine?learning?algorithms?(the?random?forest?and?the?BP?neural?network)?to?predict?and?analyze?the?maximum?ground?settlement?caused?by?tunnel?construction?by?taking?the?geometric?parameters?of?the?tunnel,?the?construction?parameters?of?the?shield?machine?and?geological?parameters?as?inputs.?The?results?show?that?the?two?machine?learning?algorithms?can?both?achieve?higher-quality?prediction,?and?that?the?stability?of?the?random?forest?model?is?better?than?that?of?the?BP?neural?network?model.
Key?Words:?Subway?tunnel;?Settlement?prediction;?Machine?learning;?Random?forest;?BP?neural?network
城市地鐵隧道緊鄰周邊建筑物、市政管線,并且施工時地面交通仍正常運行。當隧道施工造成過大的變形可能引起鄰近構(gòu)筑物、管線的破壞,并且影響路面交通安全。因此準確沉降的預(yù)測和控制成為地鐵隧道研究中的重要問題。
早期,工程中主要采用經(jīng)驗公式法對隧道施工引起的最大地表沉降進行預(yù)測分析[1-5]。然而,由于經(jīng)驗性和簡化性的局限,這種方法的預(yù)測準確度很難達到要求。隨著數(shù)值模擬技術(shù)的不斷深入研究和計算機硬件性能的提升,采用有限元等數(shù)值計算方法來模擬盾構(gòu)隧道在復(fù)雜地層環(huán)境中施工的動態(tài)過程,成為預(yù)測最大地表沉降的重要手段。諸多數(shù)值模擬研究已對土體本構(gòu)模型參數(shù)、盾構(gòu)施工參數(shù)、隧道設(shè)計參數(shù)以及地下水等影響因素進行了綜合分析和評估[6-7]。然而,數(shù)值模擬方法仍主要適用于特殊工點和重要工點的精細研究,難以廣泛應(yīng)用于通用的工程問題。
近年來,機器學(xué)習(xí)算法如人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(SVM)和隨機森林(RF)等的興起和發(fā)展,已經(jīng)引起了國內(nèi)外許多研究人員的關(guān)注,并逐步將這些算法應(yīng)用于預(yù)測盾構(gòu)施工中的復(fù)雜非線性巖土問題。其中,人工神經(jīng)網(wǎng)絡(luò)較早地被應(yīng)用于預(yù)測和探究盾構(gòu)施工引發(fā)的地表沉降量、沉降槽寬度和掘進參數(shù)等大小和內(nèi)在關(guān)系[8-10]。這些方法通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,可以根據(jù)輸入的掘進參數(shù)和其他相關(guān)因素,預(yù)測地表沉降的量級和變化趨勢。同時,一些研究將神經(jīng)網(wǎng)絡(luò)與優(yōu)化算法如遺傳算法和粒子群算法等相結(jié)合,通過優(yōu)化神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置,進一步提高了預(yù)測模型的準確度[11,?12]。此外,基于決策樹結(jié)構(gòu)的計算原理,隨機森林(RF)在預(yù)測結(jié)果中同時集成了多個決策樹的計算結(jié)果,是一種可以在短時間內(nèi)處理大量數(shù)據(jù)并擁有較高的預(yù)測準確性的機器學(xué)習(xí)算法[13]。王祥等[14]基于隨機森林-支持向量基(RF-SVM)建立訓(xùn)練模型,對隧道盾構(gòu)引起的建筑物沉降進行了預(yù)測研究,獲得了準確性和可靠性較高的預(yù)測結(jié)果。陳仁朋等[15]通過粒子群算法確定神經(jīng)網(wǎng)絡(luò)和隨機森林算法的最優(yōu)超參數(shù),并對比了兩種機器算法的預(yù)測準確度。林廣東等[16]基于隨機森林算法對隧道建成初期的累計沉降量進行了預(yù)測分析,結(jié)果表明其預(yù)測精度較神經(jīng)網(wǎng)絡(luò)模型更高。張文濤等[17]利用隨機森林算法給出了盾構(gòu)改良渣土的滲透系數(shù)預(yù)測模型,并將其應(yīng)用于實際工程。
本文以杭州地鐵3號線一期工程百家園路站—花塢路站區(qū)間為例,基于土層沉降的多種影響因素選取預(yù)測模型訓(xùn)練參數(shù),然后分別采用隨機森林和BP神經(jīng)網(wǎng)絡(luò)兩個模型對最大地表沉降進行預(yù)測,尋找最優(yōu)模型。
1?工程概況
本工點為杭州地鐵3號線一期工程百家園路站—花塢路站區(qū)間,起止里程K18+920.707~K20+100.610,區(qū)間長度1?179.9?m,采用土壓平衡盾構(gòu)法施工,盾構(gòu)外徑6.2?m。圖1為隧道典型的地質(zhì)縱斷面圖。隧道穿越范圍內(nèi)上覆土層為雜填土、素填土、粉質(zhì)黏土、淤泥質(zhì)黏土、碎石混黏性土、泥質(zhì)粉砂巖,隧道埋深范圍為19~28?m。各土層物理力學(xué)性質(zhì)如表1所示。
為準確監(jiān)測施工過程中的最大地表沉降,在右線隧道中軸線的正上方地面每隔6?m設(shè)置了沉降監(jiān)測點。本研究選取了區(qū)間內(nèi)101個監(jiān)測點,并結(jié)合相關(guān)地質(zhì)和施工參數(shù),進行了機器學(xué)習(xí)預(yù)測分析。
2?機器學(xué)習(xí)模型
2.1隨機森林
隨機森林(Random?Forest)是一種集成算法,它由多棵決策樹組成并結(jié)合了決策樹和bagging算法的優(yōu)點。圖2為隨機森林算法的基本框架。隨機森林通過在不同樣本上構(gòu)建多個決策樹,可以并行地在不同主機上進行訓(xùn)練,從而提高效率。最后,將所有決策樹的計算結(jié)果進行平均,這種方法避免了單個決策樹造成的過擬合問題。
2.2?BP神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)通過模擬動物神經(jīng)網(wǎng)絡(luò)的行為特征,進行分布式并行信息處理,能夠有效地解決非線性問題。BP神經(jīng)網(wǎng)絡(luò)(Back-propagation?Neural?Network)(如圖3所示)是一種常見的人工神經(jīng)網(wǎng)絡(luò)。其主要特點是利用誤差的反向傳播來修正權(quán)值和閾值,直到預(yù)測值與實測值之間的誤差小于預(yù)先給定的標準。這種修正過程通過迭代進行,逐步提高神經(jīng)網(wǎng)絡(luò)的預(yù)測準確性。
3?模型訓(xùn)練與結(jié)果分析
3.1特征工程
通常認為影響地表沉降的因素可以分為三類:隧道幾何參數(shù)、盾構(gòu)掘進參數(shù)和地質(zhì)參數(shù),如圖4所示。由于本文只研究單條線路,隧道直徑不發(fā)生變化,直徑不作為輸入?yún)?shù)。隧道的埋深會影響到盾構(gòu)掘進過程中地層沉降的發(fā)展模式以及最終沉降的大小,故選取隧道埋深為幾何參數(shù)。同時,選擇6個盾構(gòu)機掘進參數(shù)作為施工參數(shù),包括注漿壓力、注漿量、土倉壓力、推進速度、總推力和刀盤扭矩。這些參數(shù)對地層的擾動程度有直接影響??偼屏?、刀盤扭矩和推進速度影響盾構(gòu)機在掘進過程中對地層的擾動程度,土倉壓力則會影響掌子面的穩(wěn)定性。而漿壓力和注漿量則影響盾尾空隙的沉降以及后期的沉降。這6個掘進參數(shù)不僅對地層沉降有直接影響,而且可以實時獲取,并且其精度可靠。此外,地質(zhì)參數(shù)包含不同土層的厚度,與盾構(gòu)隧道的相對位置以及巖土體本身的物理參數(shù)。當前研究中一般將土層的c,?φ值作為參數(shù)直接輸入[18],或者用數(shù)字表示土層的類別[19],這些方法雖然能夠一定程度上考慮不同的巖土層的特性,但是物理意義不明確。因此,本文通過定義一個修正因子(見圖5)綜合考慮土層深度、厚度、物理力學(xué)性質(zhì),得到加權(quán)過后的c,?φ,?kh,?kv作為新的輸入?yún)?shù)。具體計算公式如下:
基于本文選取的?101個地表沉降測點,按照上述方法獲取機器學(xué)習(xí)的樣本數(shù)據(jù),部分數(shù)據(jù)見表2。
3.2最優(yōu)模型
本文采用Python中scikit-learn第三方庫實現(xiàn)隨機森林和BP神經(jīng)網(wǎng)絡(luò)算法。決策樹的數(shù)量能顯著影響隨機森林性能,本文中計算的決策樹數(shù)量為1~100。1~2層以內(nèi)隱含層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)即能實現(xiàn)非線性映射,故只研究2層以內(nèi)的BP神經(jīng)網(wǎng)絡(luò)性能。對于單層的神經(jīng)網(wǎng)絡(luò),計算的神經(jīng)元數(shù)量為1~100,共計100個組合。對于雙層的神經(jīng)網(wǎng)絡(luò),計算中第一、二層神經(jīng)元數(shù)量都為1~100,總計10000個組合。激活函數(shù)采用ReLU(整流線型單元函數(shù))。對于每一種模型結(jié)構(gòu),采用5折交叉驗證的方式,計算5組指標的均值作為最后評價指標。性能指標選用均方根誤差(Root?Mean?Squared?Error,RMSE),該值越小表示性能越好。
式(6)中:N為樣本數(shù)據(jù)的個數(shù),yi和?di?分別代表機器學(xué)習(xí)預(yù)測的沉降量和實際量測的沉降量。將隨機森林和BP神經(jīng)網(wǎng)絡(luò)的性能指標和超參數(shù)關(guān)系繪制在圖6、圖7、圖8中。從圖6可以看到,對比線性回歸RMSE=4.58,隨機森林僅在n=1時性能低于線性回歸,此時隨機森林退化為決策樹(回歸樹)模型。在n較小時(n<7),隨著n的增加,性能提升較快,在n=6時有一個局部最小值,總體而言隨著決策樹數(shù)量的增加,模型性能不斷提升,在n=40之后性能提升就不明顯。決策樹數(shù)量為52時,達到最優(yōu)性能,此時RMSE=3.31?mm。
從圖7、8中看到,單層BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)量為40時,達到最優(yōu)性能,RMSE=3.53?mm;雙層BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)量為(8,38)時,達到最優(yōu)性能,RMSE=3.18?mm。對于BP神經(jīng)網(wǎng)絡(luò)來說,神經(jīng)元數(shù)量的輕微變化導(dǎo)致算法性能波動較大,并且部分時候甚至出現(xiàn)了性能不如線性回歸的情況。
3.3結(jié)果分析
圖9、圖10所示為最優(yōu)隨機森林模型和BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練和測試樣本的對比結(jié)果。從圖中可以看出,大部分數(shù)據(jù)點位于預(yù)測和測量等值線附近,這表明訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的預(yù)測值與測量值較為接近。其中,由于5~15?mm的沉降區(qū)間內(nèi)數(shù)據(jù)相對較少,因此預(yù)測值與實測值存在較大的偏差??傮w而言,使用隨機森林模型和BP神經(jīng)網(wǎng)絡(luò)都能夠相對準確地預(yù)測本文地鐵區(qū)間工程中盾構(gòu)施工中引起的最大地表沉降量。
4?結(jié)論
本文基于隨機森林和BP神經(jīng)網(wǎng)絡(luò)兩種機器學(xué)習(xí)算法,對百~花區(qū)間隧道地表最大沉降進行預(yù)測。從隧道幾何參數(shù)、施工參數(shù)、地質(zhì)參數(shù)三方面選取11個影響因素,并構(gòu)建了訓(xùn)練與預(yù)測樣本數(shù)據(jù),選取RMSE作為評價指標,建立了最佳的隨機森林和BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,主要得出以下兩點結(jié)論。
(1)與線性回歸相比,隨機森林和BP神經(jīng)網(wǎng)絡(luò)是預(yù)測盾構(gòu)隧道施工地表最大沉降的更為有效的方式。通過調(diào)節(jié)隨機森林決策樹數(shù)量,BP神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元數(shù)量,可以使兩種機器學(xué)習(xí)模型都達到較高的準確率。
(2)對于本文采用的隧道地表最大沉降數(shù)據(jù),隨機森林模型的穩(wěn)定性優(yōu)于BP神經(jīng)網(wǎng)絡(luò)??傮w而言隨著決策樹數(shù)量的增加,隨機森林模型性能不斷提升,當決策樹數(shù)量為52時,達到最優(yōu)性能。而對于單層和雙層BP神經(jīng)網(wǎng)絡(luò)來說,神經(jīng)元數(shù)量的輕微變化導(dǎo)致算法性能波動較大,
參?考?文?獻