侯恩科,姚 星,文 強(qiáng)
(1.西安科技大學(xué) 地質(zhì)與環(huán)境學(xué)院,陜西 西安 710054;2.中煤科工集團(tuán) 西安研究院有限公司,陜西 西安 710054)
隨著煤礦開采越發(fā)深入,礦井水文地質(zhì)條件復(fù)雜多樣,陜北侏羅紀(jì)煤田煤層上覆基巖厚度整體較薄,極易發(fā)生表層地下水的潰涌現(xiàn)象[1],形成較為嚴(yán)重的頂板水害問題,困擾著煤礦的安全生產(chǎn)[2-3]。解決礦井水害問題的關(guān)鍵在于對(duì)礦井涌水水源進(jìn)行精確識(shí)別,從而解決和進(jìn)一步降低開采過程中地下水的影響,為礦井防治水工作提供行之有效的依據(jù)[4]。
目前,用于礦井涌水水源識(shí)別主要包括地下水化學(xué)分析法、同位素示蹤技術(shù)以及水位動(dòng)態(tài)觀測(cè)等手段[5-7]。井田內(nèi)不同含水層離子含量的差異使得各含水層間水化學(xué)特征存在一定區(qū)別,地下水的水化學(xué)特征可以反映含水層的內(nèi)在特質(zhì),以往研究中眾多學(xué)者利用地下水的水化學(xué)特征結(jié)合多種數(shù)學(xué)方法建立了礦井涌水水源的識(shí)別模型[8]。楊建通過分析葫蘆素煤礦不同含水層水化學(xué)特征,識(shí)別了礦井水的來源[9]。解海軍等應(yīng)用Fisher判別分析法對(duì)井下突水水源的類型進(jìn)行了判別,判別結(jié)果較好,但傳統(tǒng)Fisher判別分析過于依賴樣本間的關(guān)聯(lián)性[10];代革聯(lián)等將水質(zhì)分析法與聚類分析法相結(jié)合確定了礦井的突水水源,但聚類分析法無法忽略異常值的影響[11];侯恩科等利用水化學(xué)分析法結(jié)合Logistics回歸分析對(duì)礦井涌水水源進(jìn)行了識(shí)別,但該方法無法解決數(shù)據(jù)不平衡的問題[12]。利用機(jī)器學(xué)習(xí)理論對(duì)礦井不同含水層水化學(xué)組分進(jìn)行分析從而識(shí)別涌水水源這一方法應(yīng)用已越發(fā)廣泛,徐星等提出了一種改進(jìn)粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的水源識(shí)別模型,可實(shí)現(xiàn)水源的快速判別,但該算法過于依賴訓(xùn)練樣本的精度[13]。馮東梅等建立了礦井突水水源的SVM識(shí)別模型,實(shí)現(xiàn)了高維小樣本的評(píng)價(jià),但SVM算法對(duì)于核函數(shù)的選擇尚無合適的方法[14]。邵良杉等通過粗糙集理論(RS)進(jìn)行指標(biāo)約簡(jiǎn),建立了基于RS的水源識(shí)別的最小二乘支持向量機(jī)模型,但該理論仍不夠完善[15]。毛志勇等將改進(jìn)粒子群算法與極限學(xué)習(xí)機(jī)算法(KPCA-MPSO-ELM)相結(jié)合應(yīng)用到礦井突水水源識(shí)別,驗(yàn)證了模型的適用性,但其識(shí)別較為繁瑣[16]。
上述研究成果對(duì)于礦井涌水水源的識(shí)別起到了重要的指導(dǎo)作用,對(duì)于礦井水化學(xué)特征的分析已成為有效識(shí)別涌水水源的關(guān)鍵。但由于不同礦井水文地質(zhì)特征的差異性,較多判別模型未考慮水化學(xué)組分間的信息冗余,同時(shí)對(duì)于判別指標(biāo)的選取、判別模型的運(yùn)行速度還有待進(jìn)一步優(yōu)化?;诖?,為了消除水化學(xué)離子間的非線性關(guān)系,筆者以檸條塔煤礦為例,通過分析不同含水層的水化學(xué)特征,利用逐步回歸分析法實(shí)現(xiàn)樣本類間特征的提取,建立基于水化學(xué)特征法和逐步回歸-最小二乘支持向量機(jī)(SR-LSSVM)的涌水水源識(shí)別模型,并對(duì)4組待測(cè)樣本進(jìn)行水源判別。
檸條塔煤礦位于陜西省榆林市西北部,陜北侏羅紀(jì)煤田神南礦區(qū)西北部(圖1),井田面積119.773 5 km2,主采煤層為2-2煤和5-2煤。地表絕大部分被第四系松散沉積物所覆蓋,地形以沙漠灘地為主,地勢(shì)北高南低。井田地質(zhì)構(gòu)造簡(jiǎn)單。
圖1 研究區(qū)位置及高程
區(qū)內(nèi)地層由老至新依次為三疊系上統(tǒng)永坪組(T3y)、侏羅紀(jì)中統(tǒng)延安組(J2y)、直羅組(J2z)、安定組(J2a)、第四系中更新統(tǒng)離石組(Q2l)、上更新統(tǒng)薩拉烏蘇組(Q3s)、以及全新統(tǒng)(Q4)(圖2)。
圖2 地層發(fā)育特征
井田內(nèi)地下水的形成受地形地貌、地層巖性及古地理環(huán)境等因素影響,主要充水含水層包括第四系薩拉烏蘇組孔隙潛水含水層、侏羅系直羅組風(fēng)化基巖裂隙含水層、侏羅系延安組裂隙承壓含水層以及燒變巖孔隙裂隙潛水含水層,其水文地質(zhì)特征見表1。含水層間均存在隔水層,水質(zhì)類型相對(duì)穩(wěn)定。
表1 含水層水文地質(zhì)特征
由于地下水含水介質(zhì)和循環(huán)條件的不同,導(dǎo)致各含水層的水化學(xué)特征存在差異[17]。根據(jù)地下水的水化學(xué)成分差異分析其成因,進(jìn)而確定各含水層的水質(zhì)類型[18]。
表2 含水層水化學(xué)特征
利用收集到的水樣數(shù)據(jù)繪制Piper三線圖,依據(jù)水樣中陰陽離子在菱形區(qū)域投影點(diǎn)的位置表示各含水層的地下水的水化學(xué)特征[20]。
2.2.1 薩拉烏蘇組孔隙潛水
2.2.2 侏羅系直羅組風(fēng)化基巖裂隙承壓水
2.2.3 燒變巖裂隙孔隙水
2.2.4 采空區(qū)水
圖3 含水層水化學(xué)特征
圖4 含水層水化學(xué)垂向分布特征
表3 指標(biāo)間相關(guān)系數(shù)
逐步回歸分析(SR)是回歸分析中一種篩選變量的過程,其基本原理是對(duì)自變量進(jìn)行“有進(jìn)有出”的動(dòng)態(tài)引入,若原始變量顯著,而后續(xù)變量不顯著,則剔除后者,目的在于按照變量的重要程度只保留顯著性變量。重復(fù)操作直到結(jié)果中既無不顯著變量取出又無顯著變量進(jìn)入為止。
表4 模型擬合精度
最小二乘支持向量機(jī)(LS-SVM)算法是在SVM算法的基礎(chǔ)上發(fā)展起來的,對(duì)非線性高維小樣本數(shù)據(jù)的泛化能力較強(qiáng)。LS-SVM算法通過非線性映射函數(shù)將原始數(shù)據(jù)映射到高維空間,將研究問題轉(zhuǎn)化為不等式約束的二次規(guī)劃問題,大大減少了計(jì)算的復(fù)雜性。礦井水源識(shí)別問題是一種多分類的非線性問題,因此可以利用最小二乘支持向量機(jī)(LS-SVM)模型提高識(shí)別結(jié)果的準(zhǔn)確性。
LS-SVM算法的性能與懲罰參數(shù)C和核函數(shù)參數(shù)σ密切相關(guān),C值過小會(huì)造成訓(xùn)練誤差較大,預(yù)測(cè)模型的推廣能力增強(qiáng);而核函數(shù)σ則控制著最優(yōu)解的復(fù)雜程度,若該值較小則模型易陷入局部陷阱,反之則擬合度不夠。為了減少維度影響,引入拉格朗日算子θ對(duì)函數(shù)進(jìn)行約束優(yōu)化,并對(duì)其進(jìn)行偏微分求導(dǎo)。
通過分析研究區(qū)地下水水樣數(shù)據(jù),選擇70%的水樣數(shù)據(jù)作為訓(xùn)練樣本,30%作為驗(yàn)證樣本。為消除指標(biāo)間量綱的影響,利用極值化法對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理。
利用建立的SR-LSSVM模型對(duì)訓(xùn)練樣本進(jìn)行回判,并將訓(xùn)練完成后的模型應(yīng)用到8個(gè)驗(yàn)證樣本的識(shí)別中。
為了驗(yàn)證模型的準(zhǔn)確率,在同等數(shù)據(jù)下運(yùn)用LS-SVM算法、SVM算法分別對(duì)驗(yàn)證樣本進(jìn)行識(shí)別,3個(gè)模型的識(shí)別結(jié)果如圖5所示。
圖5 模型預(yù)測(cè)結(jié)果對(duì)比
從圖5可知,基于SR-LSSVM算法的識(shí)別結(jié)果與實(shí)際類型一致,而利用LS-SVM算法進(jìn)行回判估計(jì)檢驗(yàn),實(shí)際水源類型為Ⅱ的水樣被誤判為Ⅲ類水源,實(shí)際類型為Ⅲ類的水樣被誤判為Ⅰ類水源,正確判別率為75%;利用SVM算法的準(zhǔn)確率僅為62.5%。綜合分析認(rèn)為基于SR-LSSVM的礦井水樣識(shí)別模型具有較好的識(shí)別精度。
利用建立的判別模型對(duì)4個(gè)待測(cè)水樣進(jìn)行識(shí)別,識(shí)別結(jié)果見表6。從表6可知,利用SR-LSSVM模型對(duì)預(yù)測(cè)樣本進(jìn)行分析,得到的結(jié)果與實(shí)際情況完全一致,回判結(jié)果的準(zhǔn)確率達(dá)到100%。說明逐步回歸分析(SR)通過提取水化學(xué)特征中的主要變量,弱化了指標(biāo)間的相互關(guān)聯(lián);SVM算法可以很好的解決非線性小樣本問題,LS-SVM算法通過引入核函數(shù),使用最小二乘法對(duì)問題求解,在保證模型精度的同時(shí)也降低了計(jì)算的難度。逐步回歸(SR)-最小二乘支持向量機(jī)(LS-SVM)模型的預(yù)測(cè)準(zhǔn)確率高,該方法可以為礦井防治水工作提供一定的參考和依據(jù)。
表6 待測(cè)水樣類型識(shí)別結(jié)果
1)通過分析礦井各含水層的水文地質(zhì)條件,揭示不同含水層的水化學(xué)特征及其成因,結(jié)合各含水層的垂向發(fā)育規(guī)律和相關(guān)系數(shù)矩陣對(duì)樣本數(shù)據(jù)進(jìn)行對(duì)比分析,認(rèn)為水化學(xué)分析法不能準(zhǔn)確區(qū)分涌水水源,原始數(shù)據(jù)間存在著數(shù)據(jù)冗余。
3)利用建立的SR-LSSVM判別模型對(duì)20個(gè)訓(xùn)練樣本進(jìn)行訓(xùn)練,通過回代估計(jì)驗(yàn)證對(duì)8個(gè)驗(yàn)證樣本進(jìn)行了識(shí)別,并對(duì)比SVM,LS-SVM和SR-LSSVM模型的識(shí)別結(jié)果,發(fā)現(xiàn)SR-LSSVM識(shí)別模型的準(zhǔn)確率為100%高于其他模型,說明該方法可以精確高效的對(duì)礦井水源進(jìn)行識(shí)別;利用該模型對(duì)4個(gè)待測(cè)樣本進(jìn)行識(shí)別預(yù)測(cè),判別結(jié)果與實(shí)際情況吻合。