王耀東
中鐵十六局集團(tuán)北京軌道交通有限公司 北京 101100
隨著城市軌道交通的快速發(fā)展,土壓平衡盾構(gòu)施工方法因具有安全、高效的特點(diǎn),而被廣泛地應(yīng)用于城市地鐵隧道的修建[1-2]中。合理地設(shè)置盾構(gòu)施工參數(shù)能夠改善盾構(gòu)機(jī)對(duì)地層的適應(yīng)性,提高盾構(gòu)施工效率[1,3-4]。影響盾構(gòu)參數(shù)的因素較多,對(duì)盾構(gòu)參數(shù)的有效預(yù)測可以更好地指導(dǎo)盾構(gòu)施工。因此,采用合適的方法進(jìn)行盾構(gòu)參數(shù)的精確預(yù)測具有重要的現(xiàn)實(shí)意義。
目前,已經(jīng)發(fā)展了很多理論與經(jīng)驗(yàn)公式來確定盾構(gòu)參數(shù)[5-6],盾構(gòu)某一參數(shù)主要依靠地質(zhì)條件和相關(guān)參數(shù)進(jìn)行確定,但是由于地質(zhì)條件的復(fù)雜性和參數(shù)關(guān)系的不確定性,理論和經(jīng)驗(yàn)公式不能夠?qū)崟r(shí)預(yù)測盾構(gòu)參數(shù)值[7-8]。人工智能算法能夠克服這些困難并運(yùn)用盾構(gòu)參數(shù)的大數(shù)據(jù)進(jìn)行盾構(gòu)參數(shù)實(shí)時(shí)預(yù)測[5,9-11]。Khalid等[12]運(yùn)用遺傳算法改進(jìn)的自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行了盾構(gòu)推進(jìn)速度的預(yù)測,預(yù)測誤差在±15%以內(nèi),能夠?yàn)槎軜?gòu)施工提供參考;李超等[13]將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到復(fù)合地層中盾構(gòu)的刀盤扭矩、刀盤轉(zhuǎn)速、推力和推進(jìn)速度的預(yù)測中,預(yù)測結(jié)果與實(shí)測數(shù)據(jù)具有相近的變化規(guī)律,為復(fù)合地層盾構(gòu)參數(shù)的確定提供了一種新的方法;高旻昱等[14]將遺傳算法與GRU循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合,預(yù)測了土壓平衡盾構(gòu)掘進(jìn)過程中的土壓變化,并對(duì)預(yù)測結(jié)果進(jìn)行了修正,使其滿足施工要求。然而,大數(shù)據(jù)技術(shù)在迅速發(fā)展,對(duì)盾構(gòu)參數(shù)預(yù)測的人工智能算法不斷更新,為了滿足盾構(gòu)自動(dòng)化施工需求,就要將更多的人工智能算法應(yīng)用到盾構(gòu)參數(shù)預(yù)測中,從而得到更加準(zhǔn)確的預(yù)測值。
在本研究中,決策樹模型、正向激勵(lì)決策樹模型和隨機(jī)森林模型被應(yīng)用于盾構(gòu)推進(jìn)速度的預(yù)測。通過對(duì)盾構(gòu)機(jī)實(shí)時(shí)采集的數(shù)據(jù)進(jìn)行預(yù)處理和分析,確定影響盾構(gòu)推進(jìn)速度的關(guān)鍵參數(shù),并將更新的數(shù)據(jù)集輸入到建立的推進(jìn)速度預(yù)測模型中,最后對(duì)預(yù)測結(jié)果進(jìn)行對(duì)比和模型評(píng)估,確定最優(yōu)預(yù)測模型。
在盾構(gòu)掘進(jìn)過程中,推進(jìn)速度影響著盾構(gòu)掘進(jìn)的時(shí)間,從而對(duì)工期產(chǎn)生影響。本文針對(duì)盾構(gòu)掘進(jìn)速度,構(gòu)建了盾構(gòu)掘進(jìn)速度的決策樹預(yù)測模型,并對(duì)比了優(yōu)化的正向激勵(lì)決策樹模型和隨機(jī)森林預(yù)測模型,得到最優(yōu)的盾構(gòu)推進(jìn)參數(shù)預(yù)測模型。
洛陽城市軌道交通2號(hào)線LYGD2-TJ-01標(biāo)段位于河南省洛陽市,包括5站5區(qū)間,分別為經(jīng)三路站、王城北路站、機(jī)場路站、洛陽火車站、紗廠東路站、解放路站(不含)。機(jī)場路站—洛陽火車站區(qū)間(機(jī)洛區(qū)間)左線長度為1 173.213 m,右線長度為1 172.000 m,左線曲線半徑分別為350、400 m,右線曲線半徑分別為360、370 m,線間距11.2~17.4 m。線路右線縱坡設(shè)計(jì)為4個(gè)坡度,最大坡度為2.85%,最小坡度為0.2%,隧道頂最小埋深6.5 m、最大埋深14.2 m,采用2臺(tái)直徑為6.44 m的土壓平衡盾構(gòu)機(jī)進(jìn)行施工。
盾構(gòu)隧道穿越主要的地層自上而下主要為:雜填土、素填土、填筑土、粉質(zhì)黏土、黃土、卵石、黏質(zhì)粉土、砂巖、泥巖等。機(jī)洛區(qū)間地下水位線在19.17~21.05 m,低于隧道最大埋深14.2 m,因此,隧道掘進(jìn)過程中不考慮地下水對(duì)盾構(gòu)掘進(jìn)的影響。
盾構(gòu)機(jī)掘進(jìn)參數(shù)來自盾構(gòu)環(huán)報(bào)和盾構(gòu)機(jī)自帶采集系統(tǒng)。盾構(gòu)機(jī)上安裝了數(shù)據(jù)采集傳感器,在盾構(gòu)掘進(jìn)過程中,盾構(gòu)機(jī)的數(shù)據(jù)采集系統(tǒng)對(duì)盾構(gòu)機(jī)的數(shù)據(jù)進(jìn)行采集。本工程采用的盾構(gòu)機(jī)數(shù)據(jù)采集系統(tǒng)有196個(gè)通道,記錄包括時(shí)間、刀盤系統(tǒng)參數(shù)、推進(jìn)系統(tǒng)參數(shù)、螺旋輸送機(jī)參數(shù)、泡沫添加劑流量等數(shù)據(jù)。決策樹預(yù)測模型的輸入?yún)?shù)從盾構(gòu)機(jī)自帶采集系統(tǒng)中獲取,選取了影響盾構(gòu)機(jī)推進(jìn)速度(AR)最大的7個(gè)掘進(jìn)參數(shù)進(jìn)行分析,包括:刀盤轉(zhuǎn)速(CR)、刀盤扭矩(CT)、總推力(F)、土倉壓力(SP)、螺旋機(jī)轉(zhuǎn)速(SCR)、注漿壓力(GP)和掘進(jìn)深度(D)[12,15-16]。推進(jìn)速度預(yù)測模型過程主要包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)集劃分與交叉驗(yàn)證以及模型預(yù)測。
盾構(gòu)參數(shù)原始數(shù)據(jù)中常會(huì)存在空白值和異常值,在進(jìn)行輸入?yún)?shù)變換前,應(yīng)將空白值和異常值進(jìn)行刪除處理。利用式(1)、式(2)確定應(yīng)去除的空白值,并根據(jù)Pauta準(zhǔn)則,對(duì)在3倍標(biāo)準(zhǔn)差以外的異常值進(jìn)行刪除處理[17]。
式中,P代表是否刪除該行原始數(shù)據(jù),P=0表示刪除,P≠0表示保留;f(x)表示將原始數(shù)據(jù)轉(zhuǎn)變?yōu)?/1的函數(shù)。
在數(shù)據(jù)進(jìn)行空白值與異常值處理之后,采用算數(shù)平均值濾波算法(N=3)對(duì)原始數(shù)據(jù)進(jìn)行降噪處理[14],然后利用式(3)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將數(shù)據(jù)轉(zhuǎn)變?yōu)?~1之間的數(shù)值,標(biāo)準(zhǔn)化處理之后不僅保留了數(shù)據(jù)的特征,同時(shí)將所有數(shù)據(jù)之間的量綱保持一致,提高了模型運(yùn)算速度和精度。
式中:x*為標(biāo)準(zhǔn)化后的數(shù)據(jù),x為原始數(shù)據(jù),xmin和xmax為數(shù)據(jù)的最小值和最大值。
決策樹預(yù)測模型用于盾構(gòu)掘進(jìn)過程中盾構(gòu)推進(jìn)速度的預(yù)測,將選取的盾構(gòu)參數(shù)輸入到?jīng)Q策樹預(yù)測模型中,輸出推進(jìn)速度。本研究基于決策樹回歸算法構(gòu)建了決策樹預(yù)測模型、正向激勵(lì)決策樹預(yù)測模型和隨機(jī)森林預(yù)測模型,并對(duì)其精度進(jìn)行了對(duì)比,得到最佳預(yù)測結(jié)果,預(yù)測模型主要有以下步驟:盾構(gòu)參數(shù)收集與選取,盾構(gòu)參數(shù)預(yù)處理,劃分?jǐn)?shù)據(jù)集并進(jìn)行交叉驗(yàn)證,變量特征重要性判斷,更新輸入變量并重新劃分?jǐn)?shù)據(jù)集,輸入數(shù)據(jù)集進(jìn)行模型訓(xùn)練和預(yù)測。
本研究中,共有750環(huán)的盾構(gòu)參數(shù)被隨機(jī)地劃分為兩部分,研究表明[18],可將80%的數(shù)據(jù)劃分為訓(xùn)練集,20%的數(shù)據(jù)劃分為預(yù)測集。采用k折交叉驗(yàn)證(k=5)的方法對(duì)數(shù)據(jù)集和驗(yàn)證集進(jìn)行交叉驗(yàn)證并計(jì)算交叉驗(yàn)證的準(zhǔn)確率。如表1所示,決策樹模型、正向激勵(lì)模型與隨機(jī)森林模型的準(zhǔn)確率均滿足交叉驗(yàn)證要求。
表1 數(shù)據(jù)集劃分后交叉驗(yàn)證準(zhǔn)確率
盾構(gòu)參數(shù)之間存在一定的關(guān)聯(lián)性,這種關(guān)聯(lián)性強(qiáng)弱不同,選取的盾構(gòu)參數(shù)對(duì)推進(jìn)速度影響程度不同,采用基尼系數(shù)計(jì)算選取的盾構(gòu)參數(shù)對(duì)推進(jìn)速度影響的特征重要性指數(shù)GI,如式(4)所示,并根據(jù)主要影響推進(jìn)速度的指數(shù)占比,重新選取輸入?yún)?shù)并劃分?jǐn)?shù)據(jù)集。
式中,GI表示參數(shù)特征重要性指數(shù);K表示有K個(gè)類別,pmk表示節(jié)點(diǎn)m中類別k所占的比例。直觀地說,就是從節(jié)點(diǎn)m中隨機(jī)抽取2個(gè)樣本,其類別標(biāo)記不一致的概率。
如圖1所示,影響推進(jìn)速度的主要因素為刀盤轉(zhuǎn)速、土倉壓力和螺旋機(jī)轉(zhuǎn)速。從表2中可以更加明確地得到影響推進(jìn)速度的特征重要性指數(shù)的值,刀盤轉(zhuǎn)速、土倉壓力和螺旋機(jī)轉(zhuǎn)速的特征重要性指數(shù)占據(jù)所有參數(shù)的特征重要性指數(shù)97%以上。因此,忽略其他參數(shù)對(duì)推進(jìn)速度的影響,重新選取輸入?yún)?shù)為刀盤轉(zhuǎn)速、土倉壓力和螺旋機(jī)轉(zhuǎn)速,輸出參數(shù)為推進(jìn)速度。更新參數(shù)和數(shù)據(jù)集后,重新隨機(jī)劃分80%的輸入集和20%的輸出集,然后輸入到三種預(yù)測模型中進(jìn)行訓(xùn)練并預(yù)測。
圖1 影響推進(jìn)速度預(yù)測模型的特征重要性指數(shù)
表2 盾構(gòu)參數(shù)對(duì)推進(jìn)速度影響的特征重要性指數(shù)
通過更新后的參數(shù)與重新劃分的數(shù)據(jù)集,輸入到?jīng)Q策樹預(yù)測模型、正向激勵(lì)預(yù)測模型和隨機(jī)森林預(yù)測模型中,得到推進(jìn)速度的預(yù)測值,并與實(shí)測的推進(jìn)速度進(jìn)行對(duì)比,得到最優(yōu)的推進(jìn)速度預(yù)測值。
圖2為推進(jìn)速度決策樹預(yù)測模型預(yù)測結(jié)果與對(duì)應(yīng)的相對(duì)誤差。決策樹模型預(yù)測的相對(duì)誤差最大值為13.21%,相對(duì)誤差平均值為1.97%,但局部相對(duì)誤差普遍偏大,特別是在測試集的第5、25、40、90和140~150環(huán)誤差超過了5%,此時(shí)的預(yù)測結(jié)果不能用于指導(dǎo)盾構(gòu)機(jī)推進(jìn)速度的設(shè)置,以防產(chǎn)生地面隆起或塌陷。
圖2 推進(jìn)速度決策樹模型預(yù)測結(jié)果與相對(duì)誤差
圖3為推進(jìn)速度正向激勵(lì)決策樹預(yù)測模型預(yù)測結(jié)果與相對(duì)誤差。對(duì)于推進(jìn)速度的預(yù)測相對(duì)誤差最大值為15.6%,比決策樹預(yù)測模型最大誤差值大,因此在最大相對(duì)誤差水平上不能用于指導(dǎo)盾構(gòu)機(jī)參數(shù)的設(shè)置;在平均相對(duì)誤差水平上與決策樹預(yù)測模型相接近,雖然正向激勵(lì)決策樹預(yù)測模型最大相對(duì)誤差偏大,但相對(duì)于決策樹預(yù)測模型在局部誤差水平上有所降低,能適應(yīng)更多數(shù)據(jù)的誤測而不產(chǎn)生整體誤差偏大的現(xiàn)象。
圖3 推進(jìn)速度正向激勵(lì)模型預(yù)測結(jié)果與相對(duì)誤差
圖4為推進(jìn)速度的隨機(jī)森林預(yù)測模型預(yù)測結(jié)果與相對(duì)誤差。從整體上來看,隨機(jī)森林預(yù)測模型的預(yù)測結(jié)果曲線更接近于推進(jìn)速度真實(shí)值,隨機(jī)森林模型能夠較好地實(shí)時(shí)預(yù)測盾構(gòu)推進(jìn)速度。隨機(jī)森林模型預(yù)測結(jié)果的最大誤差發(fā)生在測試集第85環(huán),為5.05%,遠(yuǎn)小于決策樹模型和正向激勵(lì)模型,能夠適應(yīng)較多數(shù)據(jù)預(yù)測要求,從而能夠?qū)崟r(shí)預(yù)測指導(dǎo)盾構(gòu)機(jī)參數(shù)設(shè)置。
圖4 推進(jìn)速度隨機(jī)森林模型預(yù)測結(jié)果與相對(duì)誤差
隨機(jī)森林模型平均相對(duì)誤差為1.26%,同樣小于決策樹模型與正向激勵(lì)模型。從預(yù)測結(jié)果相對(duì)誤差水平上來看,決策樹模型和正向激勵(lì)模型預(yù)測效果接近,隨機(jī)森林模型優(yōu)于前兩者,可以作為盾構(gòu)機(jī)參數(shù)自動(dòng)化控制的一個(gè)研究方向,為盾構(gòu)機(jī)參數(shù)控制提供參考。
為了更好地評(píng)價(jià)決策樹模型、正向激勵(lì)模型和隨機(jī)森林模型的預(yù)測效果,表3給出了三種模型的準(zhǔn)確度(R2)和模型評(píng)價(jià)指標(biāo)均方誤差(mean-square error,MSE)與平均絕對(duì)誤差(mean-absolute error,MAE)。
式中:yi表示第i環(huán)的實(shí)際推進(jìn)速度,ypi表示i環(huán)預(yù)測推進(jìn)速度,m表示測試集的數(shù)量。
由表3可以看到,決策樹模型、正向激勵(lì)模型與隨機(jī)森林模型準(zhǔn)確度均在0.95以上,預(yù)測效果較好。此外,三種模型的均方誤差(MSE)分別為0.008、0.006和0.002,平均絕對(duì)值誤差(MAE)分別為0.020 0、0.018 6和0.010 0,模型誤差水平較低。
表3 盾構(gòu)推進(jìn)速度預(yù)測模型精度比較
通過比較發(fā)現(xiàn),隨機(jī)森林預(yù)測模型的準(zhǔn)確度R2最高且均方誤差(MSE)與平均絕對(duì)誤差(MAE)在三者中最低,模型預(yù)測精度最高,預(yù)測結(jié)果具有更高的可信度,可為盾構(gòu)推進(jìn)速度設(shè)置提供參考。
本文依托洛陽地鐵2號(hào)線機(jī)洛區(qū)間工程,通過采集土壓平衡盾構(gòu)施工參數(shù),對(duì)盾構(gòu)參數(shù)進(jìn)行處理、分析、建立預(yù)測模型,得到以下結(jié)論:
1)盾構(gòu)施工參數(shù)中有很多的空白值與異常值,可以通過數(shù)據(jù)的標(biāo)準(zhǔn)差和算術(shù)平均值濾波算法對(duì)盾構(gòu)參數(shù)進(jìn)行處理,得到連續(xù)平滑的數(shù)據(jù)集;同時(shí),對(duì)數(shù)據(jù)集進(jìn)行極差標(biāo)準(zhǔn)化處理,更能保持參數(shù)量綱的一致性,使其更加適應(yīng)建模數(shù)據(jù)的輸入要求。
2)盾構(gòu)參數(shù)之間存在著相互影響規(guī)律,通過計(jì)算基尼指數(shù)的方法可以得到參數(shù)之間的特征重要性指數(shù);本文通過分析計(jì)算得到影響盾構(gòu)推進(jìn)速度的主要影響因素是盾構(gòu)機(jī)的刀盤轉(zhuǎn)速(CR)、土倉壓力(SP)和螺旋機(jī)轉(zhuǎn)速(SCR),三者的特征重要性指數(shù)之和達(dá)到97%以上。
3)決策樹模型、正向激勵(lì)模型和隨機(jī)森林模型均能有效地預(yù)測盾構(gòu)的推進(jìn)速度;相比而言,隨機(jī)森林模型是三者中預(yù)測效果最優(yōu)的模型,能夠根據(jù)盾構(gòu)機(jī)實(shí)時(shí)參數(shù),準(zhǔn)確地預(yù)測盾構(gòu)推進(jìn)速度,能夠在實(shí)際盾構(gòu)施工過程中,為盾構(gòu)機(jī)推進(jìn)速度的設(shè)置提供參考。