盛建龍,喬 宇,俞棟華,王 平,張彥文
(1.武漢科技大學資源與環(huán)境工程學院,湖北 武漢 430081;2.湖北省工業(yè)建筑集團有限公司,湖北 武漢 430076)
巖溶(Karst)地質(zhì)成因復(fù)雜、構(gòu)造特殊,在工程活動中導(dǎo)致了諸多損失。因此,研究巖溶發(fā)育,根據(jù)發(fā)育規(guī)律對巖溶發(fā)育程度進行評估及預(yù)測,可在巖溶環(huán)境致災(zāi)前做出及時處理,減少巖溶災(zāi)害帶來的損失,具有重要的工程意義[1-3]。一直以來,很多學者不斷進行巖溶相關(guān)工程問題評價的探索,如研究巖溶塌陷預(yù)測問題時使用了模糊綜合評價法[4- 6],研究巖溶水位與降水量、開采量之間的關(guān)系問題時使用了灰色關(guān)聯(lián)度法[7],研究巖溶隧道突水評估問題時使用層次分析法、區(qū)間屬性數(shù)學法[8]等。對于巖溶發(fā)育預(yù)測問題,目前有使用層次分析法[9]、模糊評價法[10]等的半經(jīng)驗?zāi)P停惺褂媒y(tǒng)計數(shù)學方法[11-12],也有使用層次分析法和貝葉斯網(wǎng)絡(luò)法相結(jié)合的模型[13]。但是,因?qū)嶋H工程問題具有復(fù)雜性、不確定性和非線性等特點,在使用傳統(tǒng)方法時,過程較繁雜且?guī)в休^大的主觀性。
神經(jīng)網(wǎng)絡(luò)模型能夠根據(jù)訓練樣本自動調(diào)整結(jié)構(gòu)參數(shù),改變映射關(guān)系,具有較強的自適應(yīng)性,可實現(xiàn)各種非線性映射,較好地解決傳統(tǒng)方法中較大的主觀性,提高了評估精確性,簡化了解決過程。當前,神經(jīng)網(wǎng)絡(luò)模型在巖溶相關(guān)工程問題中有較多的應(yīng)用。如BP神經(jīng)網(wǎng)絡(luò)被使用在巖溶塌陷預(yù)測模型[14-18],巖溶隧道突水風險預(yù)測模型[19],溶洞規(guī)模預(yù)測模型[20]等。但對于巖溶發(fā)育預(yù)測的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用較少。為此,本文結(jié)合武漢市某工程區(qū)域,建立了模糊神經(jīng)網(wǎng)絡(luò)模型預(yù)測巖溶發(fā)育情況,并與BP神經(jīng)網(wǎng)絡(luò)模型做了效果對比。
模糊神經(jīng)網(wǎng)絡(luò)(FNN)是模糊理論與神經(jīng)網(wǎng)絡(luò)相結(jié)合的一種理論。神經(jīng)網(wǎng)絡(luò)彌補了模糊系統(tǒng)無法自學習、主觀性強的缺點,模糊系統(tǒng)彌補了神經(jīng)網(wǎng)絡(luò)對知識提取和表達困難的缺點[21]。模糊神經(jīng)網(wǎng)絡(luò)繼承了兩者的優(yōu)點,彌補了各自的不足。
模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)見圖1。輸入層為第1層,此層節(jié)點的個數(shù)為輸入變量的個數(shù),將輸入值傳遞至下一層。模糊化層為第2層,該層實現(xiàn)輸入變量的模糊化,即隸屬度劃分,節(jié)點個數(shù)為各個輸入變量的模糊集合數(shù)之和。模糊規(guī)則計算層為第3層,該層可細分為求“與”層與求“或”層[21],其節(jié)點分別對應(yīng)規(guī)則Ri的If部分和then部分,通過規(guī)則Ri的模糊推理,得到變量的各個模糊集合的隸屬度值。輸出層為第4層,即反模糊化層,該層將上一層輸出的隸屬度值進行清晰化,轉(zhuǎn)化為輸出變量的精確值。
圖1 模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
(1)
(2)
根據(jù)模糊計算結(jié)果計算模糊模型的輸出值,即
(3)
工程位于湖北省武漢市蔡甸區(qū),總占地面積約32 614 m2,場區(qū)西側(cè)毗鄰高速公路,東側(cè)距離長江邊界約1.2 km,原始地貌單元為長江Ⅱ級階地湖泊和湖泊灘涂地帶,為廣袤的填湖區(qū)。武漢市軟土分布區(qū),無全新活動斷層經(jīng)過,基巖為二疊系泥巖、碳質(zhì)泥巖及灰?guī)r,下伏灰?guī)r巖溶較為發(fā)育,基巖面起伏較大,巖溶裂隙發(fā)育。圖2為項目場區(qū)衛(wèi)星位置。
圖2 項目場區(qū)衛(wèi)星位置(圖中標注位置)
擬建場區(qū)地下水在勘察深度范圍內(nèi)主要為賦存于上部填土層中的上層滯水和基巖中的基巖裂隙水和可溶巖中的巖溶裂隙水,上層滯水主要由地表水源、大氣降水補給,無統(tǒng)一的自由水面,水位及水量隨地表水源、大氣降水的影響而波動,反映了覆蓋層的滲透能力及地表水的影響能力,間接影響巖溶發(fā)育?;鶐r裂隙水主要賦存于各類泥巖中,主要補給來源為地層側(cè)向滲透,水量不大,可不考慮。巖溶裂隙水主要賦存于灰?guī)r的裂隙中,主要補給來源為地層滲透,埋藏深,具承壓性。地下水對基巖的潛蝕、沖刷是巖溶發(fā)育的主要誘因,結(jié)合地下水位、地下水上下波動及基巖標高來考慮,取地下水位高程、基巖標高為評價指標。此外,灰?guī)r作為典型碳酸鹽巖,是巖溶發(fā)育必不可少的條件,取基巖是否為碳酸鹽巖為評價指標。
覆蓋層過厚一般會存在多層隔水層或過厚隔水層不利于地下水徑流交換侵蝕作用,同時過厚覆蓋層形成較大垂向壓力,易致巖溶發(fā)育所產(chǎn)生土洞塌陷;而覆蓋層過薄則易受外界環(huán)境因素的影響,取覆蓋層厚度為評價指標。
根據(jù)勘察剖面圖可知,巖層組合可分為單層灰?guī)r、單層泥巖加灰?guī)r、雙層泥巖加灰?guī)r3種類型。場區(qū)基巖為二疊系泥巖、碳質(zhì)泥巖及灰?guī)r?;鶐r分界線北側(cè)基巖為泥巖、碳質(zhì)泥巖,南側(cè)基巖為灰?guī)r。2種基巖呈不整合接觸,接觸地帶巖石破碎。同時,考慮巖性影響(碳酸鹽含量、顆粒大小、與水接觸作用面積等),取基巖層數(shù)為評價指標。
表1 訓練樣本及結(jié)果節(jié)選
綜上,選取地下水位高程(X1)、覆蓋層厚度(X2)、基巖標高(X3)、基巖層數(shù)(X4)、基巖是否為碳酸鹽巖(X5)等5個因子作為輸入?yún)?shù)。其中,基巖層數(shù)(X4),單層取1,雙層取2,多層取3。基巖是否為碳酸鹽巖(X5),是取1,否取0。輸出層對應(yīng)評價指標,巖溶發(fā)育高風險區(qū)(勘察到溶洞和土洞)取0.8,中風險區(qū)(滿足發(fā)育條件,但未勘察到明顯現(xiàn)象)取0.5,安全區(qū)取0.2。輸入層個數(shù)為5個,隱含層根據(jù)2N+1原則取11,輸出層為1,因此,網(wǎng)絡(luò)結(jié)構(gòu)為5-11-1。
根據(jù)地質(zhì)資料選取數(shù)據(jù)完整、有代表性的樣本81個,其中訓練樣本69個,測試樣本12個。在運算中,模型的模糊隸屬度函數(shù)中心和寬度均隨機賦值,導(dǎo)致每次運行后的結(jié)果可能不一樣,所以在訓練和預(yù)測時,采取隨機10組的結(jié)果求平均值的方法減少樣本誤差。圖3與圖4分別是第1組訓練樣本和節(jié)選的4組預(yù)測樣本的實際輸出、預(yù)測輸出和誤差對比。表1為節(jié)選的20個訓練樣本數(shù)據(jù)。表2為12個測試樣本的數(shù)據(jù)。
圖3 第1組訓練樣本實際輸出、預(yù)測輸出和誤差對比
圖4 4組測試樣本中實際輸出、預(yù)測輸出和誤差對比
表2 預(yù)測結(jié)果
圖5 4組預(yù)測輸出與期望輸出對比
從圖4和表2可知,預(yù)測期望值與實際值存在一定的誤差,中風險區(qū)誤差較大。經(jīng)計算,預(yù)測值的平均誤差為4.7%,在可接受的范圍內(nèi),說明該模型可以有效地進行巖溶發(fā)育的初步預(yù)測。
預(yù)測樣本、測試樣本與模糊神經(jīng)網(wǎng)絡(luò)模型相同,網(wǎng)絡(luò)結(jié)構(gòu)為5-11-1,學習率為0.01,訓練次數(shù)為20 000 次,目標精度值為0.000 1,同樣采用隨機10組的結(jié)果求平均值的方法減少樣本誤差。圖5為節(jié)選的4組預(yù)測輸出與期望輸出對比。
BP神經(jīng)網(wǎng)絡(luò)模型與模糊神經(jīng)網(wǎng)絡(luò)模型預(yù)測輸出數(shù)據(jù)見表3。從表3可知,在高風險預(yù)測中,模糊神經(jīng)網(wǎng)絡(luò)模型的相對誤差為-9.6%,BP神經(jīng)網(wǎng)絡(luò)模型的相對誤差為-13.5%,在安全區(qū)預(yù)測中,兩者相對誤差分別為1.3%與3.6%。在中風險區(qū)預(yù)測中,2個模型呈現(xiàn)出較大且相近的誤差。與BP模型相比,模糊模型的預(yù)測曲線更加接近期望曲線,模糊神經(jīng)網(wǎng)絡(luò)模型在高風險區(qū)和安全區(qū)的預(yù)測結(jié)果比BP神經(jīng)網(wǎng)絡(luò)模型效果更好,精度更高,誤差滿足工程要求,且2種模型在中風險區(qū)預(yù)測效果相當。因此,與BP神經(jīng)網(wǎng)絡(luò)相比,模糊神經(jīng)網(wǎng)絡(luò)模型能夠更好地應(yīng)用于解決巖溶發(fā)育初步預(yù)測的實際問題中。
支持向量機(SVM)是一個小樣本二分類模型,在分析誤差原因時,采用“一對多”的方法構(gòu)建多個SVM模型進行分析。訓練結(jié)果顯示,除高風險與中風險構(gòu)建的模型準確率較低外,其余的模型準確率都為100%,此結(jié)果驗證了2種神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果的可靠性。從2種神經(jīng)網(wǎng)絡(luò)模型的輸出對比圖來看,中風險區(qū)的預(yù)測輸出逼近于高風險區(qū)的判斷指標,這也與高風險和中風險構(gòu)建的SVM模型訓練結(jié)果吻合。因此,中風險區(qū)較大誤差的外在原因是由于模型將中風險區(qū)判斷為高風險區(qū)。
結(jié)合神經(jīng)網(wǎng)絡(luò)模型對樣本數(shù)據(jù)的要求,認為其內(nèi)在原因是由于中風險區(qū)樣本過少,并采用AUC指數(shù)證明此結(jié)論。AUC是受試者工作特征曲線(ROC曲線)下與坐標軸圍成的面積,可作為一種衡量預(yù)測模型優(yōu)劣的指標,AUC越接近1,模型效果越好。因中風險樣本有限,所以用減少高風險樣本數(shù)量的方式,代替增加中風險樣本的效果。將高風險樣本數(shù)量減少到與中風險相同,建立SVM模型,進行AUC評價。為減少數(shù)據(jù)帶來的誤差,隨機取10組的評價結(jié)果進行平均,表4為AUC評價結(jié)果。從表4可知,與初始樣本相比,當兩類樣本數(shù)量相同時,模型預(yù)測效果顯著提升,證實了中風險區(qū)較大誤差的內(nèi)在原因是由于其樣本過少。綜上認為,中風險區(qū)較大誤差產(chǎn)生的主要原因可能有2點:①工程條件中,中風險區(qū)樣本數(shù)量過少;②工程勘探中,試驗孔未能捕捉到巖溶初期發(fā)育情況,導(dǎo)致了期望輸出指數(shù)的確定有偏差。
本文基于模糊神經(jīng)網(wǎng)絡(luò),對巖溶發(fā)育預(yù)測進行了研究,得出以下結(jié)論:
(1)采用模糊神經(jīng)網(wǎng)絡(luò)模型,確定5種輸入?yún)?shù),得到的預(yù)測結(jié)果滿足工程需要,為預(yù)測巖溶發(fā)育提供了思路。
表4 AUC評價結(jié)果
(2)從模糊神經(jīng)網(wǎng)絡(luò)模型與BP神經(jīng)網(wǎng)絡(luò)模型在同一工程中應(yīng)用對比來看,模糊神經(jīng)網(wǎng)絡(luò)模型在精度上優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型,效果更好,可為巖溶初步預(yù)測工作提供依據(jù),在實際工程中具有一定的使用價值。
(3)根據(jù)神經(jīng)網(wǎng)絡(luò)的特點,在使用模型時,應(yīng)盡量提供更多更具代表性的樣本,使模型得到充分的學習,以發(fā)揮更好的效果。