胡俊濤,張細香
(湖北省地質(zhì)局第五地質(zhì)大隊,湖北 黃石 435004)
滑坡是我國重大地質(zhì)災(zāi)害之一,每年由此造成的經(jīng)濟損失巨大。對于水平運動不明顯受阻的滑坡而言,滑坡的運動距離既受體積和高差的影響,也與地形坡度有關(guān)。雖然滑坡運動過程中可能存在較多的坡度變化,但坡腳型滑坡運動區(qū)和堆積區(qū)分界點的坡度差通常處于坡腳位置,且對滑坡運動的作用非常顯著[1]?;嫫骄露?α)、滑動區(qū)與堆積區(qū)的坡度差即坡腳角度(β)和堆積區(qū)平均坡度(γ)都會對滑坡運動距離產(chǎn)生較大影響。在我國西南山區(qū),由于地形和地質(zhì)構(gòu)造的原因,由地震引起的坡腳型滑坡比較常見?;逻\動距離是評估滑坡災(zāi)害的一項重要指標,對其進行合理預測能為當?shù)氐姆罏?zāi)減災(zāi)工作提供參考。
目前國內(nèi)外學者針對滑坡運動提出了許多模型與理論,如多因素耦合機制、空氣潤滑機制以及能量傳遞機制等[2-4]。李秀珍等[5-7]通過定性與定量研究得出滑坡體體積、場地條件、地質(zhì)構(gòu)造是影響滑坡運動的重要因素。針對滑坡運動距離,唐然等[8]從動力學角度設(shè)計了模擬實驗,推導了滑坡運動距離理論計算公式;樊曉一等[9-14]基于統(tǒng)計學原理,通過數(shù)值模擬和回歸分析,得出了不同類型滑坡運動距離的預測方法,確立了各影響因素與滑坡運動距離之間的關(guān)系。但是由于滑坡的內(nèi)在機理復雜,以上研究形成的方法和模型對于滑坡運動距離的預測精度還有待提高。近年來,神經(jīng)網(wǎng)絡(luò)因具有強大的非線性處理能力和自主學習特性,被廣泛應(yīng)用于各領(lǐng)域的預測問題研究,并取得了較好的預測效果[15-16]。然而,神經(jīng)網(wǎng)絡(luò)在滑坡問題的研究中應(yīng)用較少。
本文通過主成分分析提取影響滑坡運動因素的主成分,剖析滑坡運動機理,再基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建網(wǎng)絡(luò)模型,以西南地區(qū)75個由地震引起的坡腳型滑坡為樣本對該模型進行訓練和測試,并以此模型對我國西南地區(qū)由地震引起的坡腳型滑坡運動距離進行預測。
本文選取的滑坡主要分布在汶川縣東北部和茂縣東南部地區(qū),是汶川地震災(zāi)區(qū)的Ⅹ、Ⅵ度烈度區(qū)。該地區(qū)海拔較高且起伏較大,西部最高海拔超過了3 000 m,東部低至780 m,呈西高東低的地勢。大部分區(qū)域都是山地,地質(zhì)構(gòu)造復雜,巖漿巖分布廣,處于龍門山斷裂帶上,易發(fā)生地震,故由地震引起的滑坡比較常見。
滑坡運動因具有較大危害而受到了廣泛關(guān)注,由于內(nèi)在機理復雜,傳統(tǒng)統(tǒng)計學方法在預測運動距離時存在一定困難。人工神經(jīng)網(wǎng)絡(luò)是學者受生物神經(jīng)網(wǎng)絡(luò)感知世界的原理啟發(fā)而提出的一種數(shù)學模型,具有強大的非線性問題處理能力,彌補了傳統(tǒng)統(tǒng)計學方法的不足。BP神經(jīng)網(wǎng)絡(luò)是一種基于誤差逆?zhèn)鞑ニ惴ǖ亩鄬忧梆伾窠?jīng)網(wǎng)絡(luò),其具有學習和自適應(yīng)等特點,整個訓練過程包括數(shù)據(jù)的正向傳輸和誤差的反饋修正兩個過程[17]。本文通過研究滑坡運動距離的影響因素,構(gòu)建GA-BP神經(jīng)網(wǎng)絡(luò)預測模型,以此對地震引起的坡腳型滑坡運動距離進行預測。此外,將BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)模型預測結(jié)果與回歸預測結(jié)果進行對照,以驗證神經(jīng)網(wǎng)絡(luò)相較于傳統(tǒng)統(tǒng)計學方法在滑坡運動距離預測中的適用性。
2.1.1 BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
BP神經(jīng)網(wǎng)絡(luò)在訓練時,數(shù)據(jù)通過輸入層按權(quán)重傳遞到隱含層,經(jīng)過非線性處理,最終作用到輸出層,輸出層通過誤差反饋調(diào)節(jié)數(shù)據(jù)傳遞過程中的連接權(quán)重和閾值。典型的BP神經(jīng)網(wǎng)絡(luò)包含一個輸入層、一個隱藏層和一個輸出層,其拓撲結(jié)構(gòu)如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)
2.1.2 網(wǎng)絡(luò)參數(shù)設(shè)定
隱藏層神經(jīng)元層數(shù)與單層神經(jīng)元數(shù)的確定對整個網(wǎng)絡(luò)的性能有著顯著影響,確定方法不唯一,采用式(1)初步確定隱藏層神經(jīng)元數(shù),可在實際訓練過程中適當調(diào)整。神經(jīng)網(wǎng)絡(luò)中傳遞函數(shù)、學習算法和效率、初始閾值和權(quán)重的選取也可能會對整個網(wǎng)絡(luò)的性能產(chǎn)生很大影響,在訓練過程中根據(jù)結(jié)果確定合適的學習算法和效率,初始閾值和權(quán)重由遺傳算法優(yōu)化得到。
(1)
式中:N為隱藏層神經(jīng)元數(shù),m為輸入層神經(jīng)元數(shù),n為輸出層神經(jīng)元數(shù),t為0~10的整數(shù)。
2.1.3 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)具有強大的數(shù)據(jù)擬合預測能力,初始權(quán)重和閾值的確定對神經(jīng)網(wǎng)絡(luò)的性能具有較大影響。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的目的便是優(yōu)化其初始權(quán)重和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)能夠更加科學快速地完成模型訓練。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的要素包括種群初始化、適應(yīng)度函數(shù)選擇、選擇操作、交叉操作和變異操作。具體的算法流程如圖2所示。
遺傳算法在搜索最優(yōu)初始權(quán)重和閾值的過程中,確定合適的種群規(guī)模以及交叉變異概率,可使神經(jīng)網(wǎng)絡(luò)訓練更快逼近極限最優(yōu)解,避免陷入局部最優(yōu)解和算法不收斂的情況發(fā)生。
圖2 遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法流程
為了在網(wǎng)絡(luò)模型的構(gòu)建中更加充分地反映各因素之間的內(nèi)在聯(lián)系,提高預測模型的精度,利用Matlab2016對影響滑坡運動的因素做主成分分析,將得到的主成分作為神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元。
2.2.1 分析各因素相關(guān)性
通過min-max法[見式(2)]對原始數(shù)據(jù)進行標準化處理,消除各個因素量綱帶來的影響,利用Corrcoef函數(shù)求得各因素的相關(guān)系數(shù)矩陣,再對各因素做KMO和Bartlett檢驗,以此判斷選取的因素是否適合做主成分分析。
(2)
2.2.2 主成分表達式
利用Matlab2016的PCA函數(shù)做相關(guān)性分析,得到特征值、主成分貢獻率以及得分矩陣,從而得到主成分表達式:
Yi=X·Wi,
(3)
式中,Yi為第i個主成分,X為影響滑坡運動各因素組成的向量,Wi為第i個主成分的得分向量。
影響坡腳型滑坡運動的主要因素有地質(zhì)構(gòu)造、巖性、地震等級、滑坡體含水率、滑坡體體積、坡度、地形起伏度、高程、歸一化植被指數(shù)等。本研究選取的滑坡樣本均為汶川地震引起的坡腳型滑坡,在該范圍內(nèi)的地質(zhì)構(gòu)造、巖性和滑坡體含水率比較接近,地震是滑坡的啟動因子,因而震級不會影響滑坡體的后續(xù)運動情況,在構(gòu)建模型時不考慮這4個因素。歸一化植被指數(shù)與滑坡的發(fā)育相關(guān)性較低[18],對滑坡運動距離影響較小,為了提高模型訓練效率,在構(gòu)建模型時將該因素舍去。根據(jù)相關(guān)研究[19-21],最終確定6個因素作為研究指標:坡腳以上滑面長度L,滑面平均坡度α,坡腳角度β,堆積區(qū)平均坡度γ,滑坡體體積V,滑坡體前后緣高差H。
對確定的研究指標做主成分分析,得到相關(guān)系數(shù)矩陣(見表1)。由表1可知,大部分因素之間的相關(guān)性較高。對各因素做KMO和Bartlett檢驗得到KMO檢驗系數(shù)為0.606,大于0.5;Bartlett檢驗的Sig值為0.001,小于0.05。綜上可知,選取的因素之間具有較強的相關(guān)性,適合做主成分分析。計算得到的公因子方差見表2。由表2可知,各因素的公因子方差均接近1.0,說明提取的主成分能較好地反映原始數(shù)據(jù)的信息。
由Matlab計算得到的特征值及主成分貢獻率見表3。由表3可知,前3個主成分的累計方差貢獻率達到了92.87%,主成分1、2、3的特征值分別為3.17、1.35、1.03,均大于1,說明這3個主成分能夠充分反映各因素對滑坡運動距離的影響。主成分得分矩陣見表4,由此得到3個主成分的表達式:
(4)
(5)
(6)
由式(4)-式(6)可以看出,滑坡體體積(V)、坡腳以上滑面長度(L)、滑坡體高差(H)都在第一主成分Y1上有較大的載荷,體現(xiàn)了滑坡體在加速階段能量的積累能力,可稱之為動能因子;滑面平均坡度(α)和坡腳角度(β)在第二主成分Y2上有較大載荷,體現(xiàn)了滑坡體在加速階段的加速能力,可稱之為加速因子;坡腳角度(β)和堆積區(qū)平均坡度(γ)在第三主成分Y3上有較大載荷,體現(xiàn)了滑坡體過渡到減速階段的能量損失情況,可以稱之為阻力因子。
表1 相關(guān)系數(shù)矩陣
表2 公因子方差
表3 特征值及主成分貢獻率
表4 主成分得分矩陣
通過試驗最終確定遺傳的種群規(guī)模為20,進化次數(shù)為50,交叉概率為0.4,變異概率為0.2,網(wǎng)絡(luò)學習效率為0.1,目標誤差為0.01,以此構(gòu)建由地震引起的坡腳型滑坡運動距離預測模型。試驗過程中,從樣本總體中隨機抽取60個樣本作為網(wǎng)絡(luò)模型的訓練集,其余的15個樣本數(shù)據(jù)作為測試集。采用絕對誤差(AE)、相對誤差(APE)和平均相對誤差(MAPE)3個指標來評價預測結(jié)果的準確性,其計算公式分別為
EAE=abs(LP-Lmax),
(7)
(8)
(9)
式中:EAE為預測的絕對誤差,m;EAPE為預測的相對誤差,量綱為1;EMAPE為預測的平均相對誤差,量綱為1;LP為模型的預測值,m;Lmax為模型的期望值,m;n為測試集的容量,量綱為1。
為了驗證在此類問題中,神經(jīng)網(wǎng)絡(luò)相較于傳統(tǒng)數(shù)理統(tǒng)計方法的先進性以及遺傳算法對BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化能力,在主成分分析的基礎(chǔ)上,采用最小二乘法進行多元回歸分析,并分別用多元回歸、BP神經(jīng)網(wǎng)絡(luò)(BPNN)及GA-BP神經(jīng)網(wǎng)絡(luò)對滑坡運動距離進行預測。最大垂直運動距離H和最大水平運動距離L的回歸方程見式(10)、式(11),各方法預測結(jié)果分別見表5、表6。
由表5、表6可知,GA-BP神經(jīng)網(wǎng)絡(luò)對滑坡運動距離的預測效果最好,垂直和水平方向運動距離最小絕對誤差分別為1.16 m和1.01 m,最小相對誤差分別為0.74%和0.54%,相對誤差低于10%的樣本分別占了測試樣本的93.33%和86.67%,絕對誤差的標準差分別為4.87和5.91,GA-BP神經(jīng)網(wǎng)絡(luò)預測的準確度和穩(wěn)定性均優(yōu)于多元回歸和BP神經(jīng)網(wǎng)絡(luò)(BPNN)預測。
H=58.83+0.38Y1-0.39Y2+1.44Y3。
(10)
L=-184.15-0.85Y1+2.42Y2+4.26Y3,
(11)
表5 垂直運動距離預測誤差
表6 水平運動距離預測誤差
本文首先通過主成分分析提取了影響坡腳型滑坡運動距離的主成分,再基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建了坡腳型滑坡運動距離的預測模型,對坡腳型滑坡運動距離進行了預測,取得了較好的預測效果,并將神經(jīng)網(wǎng)絡(luò)模型預測結(jié)果與多元回歸預測結(jié)果進行了對比,得到以下主要結(jié)論:
a.構(gòu)建的GA-BP神經(jīng)網(wǎng)絡(luò)模型對滑坡運動距離預測結(jié)果精確且穩(wěn)定,其強大的非線性問題處理能力適合用于解決內(nèi)在機理復雜的滑坡運動問題。
b.GA-BP神經(jīng)網(wǎng)絡(luò)模型在預測的精確性和穩(wěn)定性方面均優(yōu)于原始BP神經(jīng)網(wǎng)絡(luò)模型,說明遺傳算法從網(wǎng)絡(luò)的訓練過程到結(jié)果輸出都對BP神經(jīng)網(wǎng)絡(luò)進行了較大優(yōu)化。
c.對于滑坡運動距離的預測精度,GA-BP神經(jīng)網(wǎng)絡(luò)最優(yōu),其次是BP神經(jīng)網(wǎng)絡(luò),基于多元回歸預測的偏差較大且不穩(wěn)定,效果最差,說明神經(jīng)網(wǎng)絡(luò)相較于傳統(tǒng)數(shù)理統(tǒng)計方法更適用于該類問題的研究。
利用GA-BP神經(jīng)網(wǎng)絡(luò)構(gòu)建滑坡運動距離預測模型,是將人工智能與實際工程相結(jié)合的一次嘗試,為該類研究引入了新方法和新思路,對我國西南地區(qū)由地震引起的坡腳型滑坡的影響范圍和災(zāi)害強度的預測具有現(xiàn)實意義。本文僅選取了我國西南地區(qū)由地震引起的坡腳型滑坡運動作為研究對象,而滑坡運動的影響因素與內(nèi)在機理非常復雜,在研究過程中發(fā)現(xiàn),滑坡運動距離預測模型的建立還受滑坡的規(guī)模區(qū)間影響,后續(xù)將對此作進一步研究。