段李宏,戴磊,張金陵
(河南能源化工集團(tuán) 永城煤電控股集團(tuán)有限公司,河南 永城 476600)
近年來,我國(guó)煤礦安全生產(chǎn)發(fā)展形勢(shì)取得了明顯好轉(zhuǎn)[1],但煤礦水害事故依然每年發(fā)生,其中斷層或隱伏陷落柱導(dǎo)通煤層底板奧陶系強(qiáng)含水層是造成突水淹井的重要原因。煤層底板水源具有水壓高、水量大的特點(diǎn),是重要的突水危險(xiǎn)源。煤層底板突水水源判別是煤炭企業(yè)和相關(guān)科研機(jī)構(gòu)重要的研究方向[2-4]。
傳統(tǒng)礦井突水水源判別方法主要包括水溫水位法、水化學(xué)分析法、數(shù)學(xué)理論分析法等。水溫水位法主要作為初步判斷突水來源的重要依據(jù),其操作簡(jiǎn)單,主要在單層突水和較少突水點(diǎn)情況下應(yīng)用,但局限性大,實(shí)際應(yīng)用時(shí)需結(jié)合水化學(xué)分析等方法使之更有效地判別突水水源[5-7]。常規(guī)水化學(xué)分析法主要是對(duì)水源中宏量組分與水質(zhì)綜合指標(biāo)進(jìn)行監(jiān)測(cè),往往還要結(jié)合微量元素法和同位素法聯(lián)合使用,適用于判別含水層水質(zhì)特征變化明顯、突水來源簡(jiǎn)單的礦井[8-9]。數(shù)學(xué)理論分析法是以數(shù)學(xué)理論、構(gòu)造函數(shù)或區(qū)間進(jìn)行水源判別,該方法簡(jiǎn)單,易于操作,但適用性不強(qiáng)。針對(duì)傳統(tǒng)礦井突水水源判別方法導(dǎo)致礦井煤層底板突水水源判別準(zhǔn)確率低的問題,有必要借助機(jī)器學(xué)習(xí)相關(guān)方法來精確預(yù)測(cè)煤層底板突水水源[10-11]。Fisher 線性判別法[12]是一種將高維樣本投影到最優(yōu)判別向量空間,從數(shù)據(jù)中提取分類信息,降低特征空間維數(shù)的算法,分類效果好,成為當(dāng)前研究熱點(diǎn)。
因此,本文引入Fisher 線性判別法,以河南省正龍煤業(yè)有限公司城郊煤礦為例,構(gòu)建了Fisher 礦井底板突水水源判別分析模型。從主要含水層水化學(xué)成分角度開展典型水樣的篩選,使用SPSS 軟件完成大量樣本數(shù)據(jù)的計(jì)算和統(tǒng)計(jì)分析,利用回代估計(jì)法對(duì)礦井底板突水水源樣本進(jìn)行預(yù)測(cè),可準(zhǔn)確判別礦井突水水源類型。
城郊煤礦位于河南省永城市,屬于永夏礦區(qū),主采山西組中部的二2 煤層。據(jù)含水層巖性組合特征,井田范圍內(nèi)自上而下分為新生界孔隙含水組、二疊系裂隙含水組、石炭系太原組巖溶裂隙含水組、奧陶系巖溶裂隙含水組4 個(gè)含水組。
工作面直接充水水源為煤層頂?shù)装迳皫r裂隙水,以細(xì)粒砂巖為主,局部有中粒砂巖,單位涌水量為0.001~0.005 L/(s·m),滲透系數(shù)為0.001 32~0.027 40 m/d,礦化度為3.4~4.5 g/L,水溫為19~24 ℃。該充水巖層富水性弱,以靜儲(chǔ)量為主,對(duì)回采影響較小。
工作面間接充水水源為太原組上段灰?guī)r巖溶裂隙承壓水。其中,L11灰?guī)r含水層沉積穩(wěn)定,上距二2煤層底板間距為40~65 m,平均間距為50.36 m,中間有隔水性能強(qiáng)的泥巖、砂質(zhì)泥巖及抗壓強(qiáng)度大的厚層砂巖,單位涌水量為0.001~2.870 L/(s·m),屬富水性不均一的中等含水層,滲透系數(shù)為0.005~7.470 m/d,水溫為30~35 ℃。正常狀態(tài)下,灰?guī)r水不會(huì)潰入巷道或發(fā)生底板突水。隨著開采水平的延伸,煤層埋藏深度增加,底板承受的灰?guī)r含水層水壓增高,尤其是處于斷層發(fā)育區(qū)域的太原組上段灰?guī)r富水性強(qiáng),一旦底板裂隙發(fā)育,容易發(fā)生突水事故。
根據(jù)城郊煤礦已整理的55 個(gè)主要含水層水樣數(shù)據(jù),繪制砂巖水、太灰水和混合水的 Piper 三線圖進(jìn)行水化學(xué)分析,如圖1 所示。在三角形區(qū)域內(nèi)3 個(gè)主要含水層陰離子差異不明顯,表現(xiàn)為在右下角三角形中數(shù)據(jù)點(diǎn)聚集,且HCO3-,Cl-含量很少,SO42-含量最大;而陽離子有一定差異,表現(xiàn)為由砂巖水、太灰水到混合水Na++K+含量降低,Ca2+,Mg2+含量逐漸增加。因此,砂巖水、太灰水和混合水在陽離子方面具有一定的區(qū)分度,可作為水樣識(shí)別的重要依據(jù)。在菱形區(qū)域內(nèi),從陽離子含量方面看,砂巖水和太灰水Ca2+,Mg2+含量小于Na++K+,而混合水Na++K+含量小于Ca2+,Mg2+;從陰離子含量方面看,砂巖水、太灰水和混合水的強(qiáng)酸根均大于弱酸根。
圖1 主要含水層Piper 三線圖Fig.1 Piper trilinear diagram of main aquifers
通過主成分分析(Principal Components Analysis,PCA)原理及砂巖水、太灰水和混合水的 Piper 三線圖水化學(xué)分析可知,各水化學(xué)離子間的相關(guān)性會(huì)對(duì)礦井底板突水水源判別分析模型的精度產(chǎn)生影響。
Fisher 判別函數(shù)是在原始樣本空間里找到某(幾)個(gè)方向,把樣本投影到該方向后,利用距離判別法建立判別準(zhǔn)則將原始樣本分開[13]。各類樣本在該方向上投影之間的距離盡可能遠(yuǎn),而每一類內(nèi)的樣本投影盡可能緊湊,從而使分類效果達(dá)到最佳,即在最大化類間距離的同時(shí)最小化類內(nèi)距離。此時(shí),樣本在該空間中有最近的可分離性。
設(shè)有總體Gi(i=1,2,…,k,k為總體個(gè)數(shù))為水樣樣本,從這k個(gè)水樣樣本中抽取具有p個(gè)指標(biāo)的樣本,采用方差分析構(gòu)建Fisher 線性判別函數(shù):
式中:u1,u2,…,up為p個(gè)指標(biāo)的判別函數(shù)系數(shù);X1,X2,…,Xp為p個(gè)水化學(xué)指標(biāo);X為選取的水化學(xué)指標(biāo)集合;u為判別函數(shù)特征向量。
為了確定判別函數(shù)特征向量u= [u1u2…up]T,使樣本在此投影空間投影后具有最大類間散度和最小類內(nèi)散度,具體算法如下:
假設(shè)Gi均值和協(xié)方差矩陣分別為 μ(i)和C(i)(>0)。在X∈Gi的條件下,分別計(jì)算u′X的期望差E(u′X)與方差D(u′X)。
應(yīng)用方差分析思想,通過確定u使目標(biāo)函數(shù)達(dá)到極大,從而得到Fisher 線性判別函數(shù)。
當(dāng)只有1 個(gè)Fisher 判別函數(shù)時(shí),對(duì)于一個(gè)新的樣本x,將他的p個(gè)指標(biāo)代入式(1)中求出值,然后根據(jù)判別規(guī)則,即可判別新的樣本屬于哪個(gè)總體。判別規(guī)則:如果待判樣本的典型判別函數(shù)值與第g類中心的典型判別函數(shù)值u′μ(i)的 絕對(duì)離差|u′xu′μ(i)|最 小,則可以將該樣本判入第g類。
為考察判別準(zhǔn)則是否優(yōu)良,采用以訓(xùn)練樣本為基礎(chǔ)的回代估計(jì)法計(jì)算誤判率[14]。以所有的訓(xùn)練樣本作為新樣本,依次代入式(1)中,且利用判別準(zhǔn)則進(jìn)行判別,該過程稱為回判。用N表示將屬于總體Gi的樣本誤判的個(gè)數(shù),則誤判率η為
式中n1,n2,…,nm為m個(gè)樣本的容量。
城郊煤礦二2 煤層具有突水威脅的含水層分別為煤系砂巖含水層和底板太原組巖溶裂隙含水層。考慮到水化學(xué)離子的重要性及數(shù)據(jù)的有效性,選取Ca2+,Mg2+,Na++K+,HCO3-,Cl-,SO42-這6 種離子含量和礦化度M作為礦井突水水源判別分析的變量。
以城郊煤礦二2 煤層采集的55 個(gè)突涌水點(diǎn)水化學(xué)資料為研究對(duì)象,選擇其中45 個(gè)樣本(砂巖水1-12 號(hào),太灰水13-39 號(hào),混合水39-45 號(hào))進(jìn)行訓(xùn)練(表1)。
表1 訓(xùn)練樣本Table 1 Training sample
續(xù)表1
利用SPSS 軟件判別礦井突涌水類別,典型判別函數(shù)系數(shù)項(xiàng)和常數(shù)項(xiàng)見表2。
表2 典型判別函數(shù)系數(shù)項(xiàng)和常數(shù)項(xiàng)Table 2 Coefficient term and constant term of typical discriminant function
第1、第2 判別函數(shù)為
式中:Y1,Y2分別為第1 類、第2 類水質(zhì)類型;X1-X6分別為Ca2+,Mg2+,Na++K+,HCO3-,Cl-,SO42-這6 種離子水化學(xué)指標(biāo);X7為礦化度M指標(biāo)。
在Fisher 判別分析中,判別函數(shù)的準(zhǔn)確率可用其方差貢獻(xiàn)率來判別(表3)??煽闯龅? 判別函數(shù)方差貢獻(xiàn)率為92.8%,說明該函數(shù)可解釋樣本92.8%的信息,利用該函數(shù)能完成絕大部分樣本的判別,當(dāng)結(jié)合第2 判別函數(shù)來判別樣本時(shí),可解釋所有樣本的信息。
表3 判別函數(shù)方差Table 3 Variance of discriminant function
各典型判別函數(shù)在各類別的中心值見表4。在此基礎(chǔ)上,通過比較待判水樣函數(shù)值與這3 類水樣類別的中心值的距離來判別某一新樣本歸屬哪一類別。
表4 典型判別函數(shù)在各類別的中心值Table 4 Center value of typical discriminant function in each category
運(yùn)用第1 判別函數(shù)與第2 判別函數(shù)對(duì)45 個(gè)樣本進(jìn)行分組,結(jié)果如圖2 所示??煽闯錾皫r水的全部樣本點(diǎn)、太灰水和混合水的絕大部分樣本點(diǎn)都聚集在各類中心值附近,分類效果較好。
圖2 第1 和第2 判別函數(shù)分組結(jié)果Fig.2 Grouping results of the first and second discriminant functions
利用回代估計(jì)法對(duì)建模數(shù)據(jù)逐一進(jìn)行檢驗(yàn),結(jié)果見表5??煽闯?5 個(gè)訓(xùn)練樣本中只有3 個(gè)樣本的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果不符,其中將17 號(hào)太灰水誤判為砂巖水,22 號(hào)太灰水誤判為混合水,45 號(hào)混合水誤判為太灰水,礦井底板突水水源判別分析模型的判別正確率達(dá)93.3%。可見,礦井底板突水水源判別分析模型可較好地用于礦井突涌水水源判別,且方法簡(jiǎn)單,準(zhǔn)確率高。
表5 回代估計(jì)結(jié)果Table 5 Back substitution estimation results
利用判別分析模型對(duì)城郊煤礦二2 煤層10 個(gè)已知水樣進(jìn)行分類。將各指標(biāo)數(shù)值(表6)代入第1 判別函數(shù)(式(7)),分別得到10 個(gè)水樣的第1 判別函數(shù)值,并計(jì)算其到各類別中心值的距離,結(jié)果見表7。
表6 煤層底板突水水源判別分析模型指標(biāo)數(shù)值Table 6 Indicator value of mine floor water inrush source discrminant model
表7 各水樣的Fisher 判別結(jié)果Table 7 Fisher discrimination results of each water sample
以第1 個(gè)水樣為例,第1 判別函數(shù)值為3.914,其距砂巖水、太灰水、混合水中心值的距離分別為0.595,5.144,7.395。其中距砂巖水中心值的距離最小,因此,將第1 個(gè)水樣判別為砂巖水。同理,對(duì)其他水樣進(jìn)行判別??煽闯?0 個(gè)水樣的判別結(jié)果與實(shí)際情況吻合,正確率為100%。
運(yùn)用Fisher 判別函數(shù),在綜合考慮Ca2+,Mg2+,Na++K+,HCO3-,Cl-,SO42-及礦化度等7 個(gè)指標(biāo)的基礎(chǔ)上,建立了城郊煤礦二2煤層底板突水水源判別分
析模型。該模型檢驗(yàn)時(shí)的判別正確率達(dá)93.3%,可信度高;選取10 個(gè)已知水樣進(jìn)行模型應(yīng)用時(shí),預(yù)測(cè)精度達(dá)100%,表明該模型對(duì)實(shí)際水樣進(jìn)行判別合理可行,且方法簡(jiǎn)便,分類效率高,適用性強(qiáng),具有良好的工程應(yīng)用前景。