李千慧
(1.中煤科工集團(tuán)沈陽(yáng)研究院有限公司;2.煤礦安全技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室)
煤礦安全實(shí)驗(yàn)室依托中煤科工集團(tuán)沈陽(yáng)研究院有限公司國(guó)家重點(diǎn)實(shí)驗(yàn)室建設(shè),以煤礦安全領(lǐng)域重大科學(xué)問(wèn)題與關(guān)鍵技術(shù)創(chuàng)新研究為核心,圍繞煤礦瓦斯災(zāi)害防治、煤礦火災(zāi)防治、露天煤礦地質(zhì)災(zāi)害防治、煤礦災(zāi)害應(yīng)急救援4 個(gè)研究方向,構(gòu)建了較為系統(tǒng)的研究測(cè)試平臺(tái)。煤礦瓦斯災(zāi)害防治方向涵蓋煤層瓦斯涌出預(yù)測(cè)、瓦斯抽采技術(shù)、煤與瓦斯突出防治,實(shí)驗(yàn)室主要包括煤層瓦斯涌出預(yù)測(cè)、瓦斯抽采技術(shù)和煤與瓦斯突出防治3個(gè)研究單元,涉及孔隙率測(cè)定、煤的物理化學(xué)性質(zhì)分析、吸附解吸測(cè)定、工業(yè)分析、煤與瓦斯突出參數(shù)測(cè)試、微觀結(jié)構(gòu)分析、殘存瓦斯含量測(cè)定、煤塵爆炸性測(cè)定、突出模擬、煤樣制備及煤的堅(jiān)固性系數(shù)測(cè)定等實(shí)驗(yàn)項(xiàng)目。
實(shí)驗(yàn)室在此基礎(chǔ)上積累了一定量的原始數(shù)據(jù),在已有的基于B/S 結(jié)構(gòu)(Browser/Server,瀏覽器/服務(wù)器)的實(shí)驗(yàn)室信息管理系統(tǒng)上,可以進(jìn)行數(shù)據(jù)的錄入、查詢(xún)及簡(jiǎn)單的統(tǒng)計(jì)等表層處理操作。面對(duì)日趨增長(zhǎng)的實(shí)驗(yàn)數(shù)據(jù),如何獲得數(shù)據(jù)之間的內(nèi)在聯(lián)系、規(guī)則和發(fā)展趨勢(shì),最大化地利用實(shí)驗(yàn)數(shù)據(jù)并從中獲取更深層次的價(jià)值,是亟待解決的問(wèn)題。數(shù)據(jù)挖掘算法(Data Mining)[1-2]作為數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(Knowledge-Discovery in Databases,簡(jiǎn)稱(chēng)KDD)中的重要步驟,有效地解決了“數(shù)據(jù)豐富,知識(shí)貧乏”的問(wèn)題。數(shù)據(jù)挖掘算法能夠高度自動(dòng)化地分析實(shí)驗(yàn)得出的數(shù)據(jù),做出歸納性的整理,從中挖掘出潛在的模式,從而幫助科研工作者或礦方服務(wù)人員調(diào)整市場(chǎng)策略,規(guī)避風(fēng)險(xiǎn),并進(jìn)行瓦斯突出預(yù)測(cè)、情報(bào)檢索、情報(bào)分析及模式識(shí)別等研究。
我國(guó)煤炭工業(yè)發(fā)展至今,采掘深度與強(qiáng)度不斷地加大,過(guò)去一些不突出的礦井也出現(xiàn)突出動(dòng)力現(xiàn)象,這種情況出現(xiàn)的次數(shù)和規(guī)模也日趨變大,防治與預(yù)測(cè)突出研究仍是重中之重的工作。煤與瓦斯突出的影響因素復(fù)雜且眾多,主要從瓦斯因素、煤體因素、地質(zhì)結(jié)構(gòu)因素、地應(yīng)力因素及其他因素進(jìn)行選取指標(biāo)[3-4]。煤與瓦斯突出預(yù)測(cè)體系見(jiàn)圖1。
根據(jù)《防治煤與瓦斯突出規(guī)定》[5],影響煤與瓦斯突出的主要因素有煤層瓦斯壓力、瓦斯放散初速度、煤的堅(jiān)固性系數(shù)和煤的破壞類(lèi)型等。
采掘工作面日常預(yù)測(cè)指標(biāo)包括鉆屑瓦斯解析指標(biāo)K1、鉆屑量S等。通過(guò)歷史瓦斯涌出特征指標(biāo)(可解吸瓦斯含量指標(biāo)、瓦斯解吸速度指標(biāo)、瓦斯涌出分析特征)、歷史K1、S值的數(shù)據(jù)及當(dāng)前瓦斯涌出特征,推算當(dāng)前K1、S值。當(dāng)K1≥0.5或S≥6 kg/m時(shí),即判定危險(xiǎn)性。對(duì)工作面日常預(yù)測(cè)指標(biāo)和歷史預(yù)測(cè)循環(huán)的測(cè)定數(shù)值進(jìn)行綜合分析,連續(xù)統(tǒng)計(jì)幾個(gè)歷史預(yù)測(cè)循環(huán)的測(cè)定數(shù)值,根據(jù)其變化趨勢(shì)和幅度對(duì)工作面瓦斯突出危險(xiǎn)進(jìn)行判斷,其均值超過(guò)臨界指標(biāo)的60%時(shí),即進(jìn)行超前預(yù)測(cè)。
由于煤與瓦斯突出機(jī)制復(fù)雜且具有一定的未知性,所以需要從多種角度分析,除了選擇以上幾種參數(shù)外,還應(yīng)選取煤的瓦斯殘存量、煤層堅(jiān)固性系數(shù)、煤的瓦斯放散初速度等指標(biāo)作為預(yù)測(cè)參數(shù),表1為煤層突出危險(xiǎn)性鑒定指標(biāo)。
數(shù)據(jù)挖掘算法[6-10]對(duì)大量相關(guān)數(shù)據(jù)進(jìn)行重復(fù)地迭代處理,通過(guò)歸納分析,明確樣本對(duì)象與數(shù)據(jù)之間的關(guān)系,在此過(guò)程中建立數(shù)據(jù)挖掘模型是關(guān)鍵點(diǎn)之一。圖2為數(shù)據(jù)挖掘過(guò)程。
挖掘過(guò)程主要是對(duì)原始數(shù)據(jù)的特征分析,部分?jǐn)?shù)據(jù)已經(jīng)在實(shí)驗(yàn)室信息管理系統(tǒng)中集成。從系統(tǒng)中選取數(shù)據(jù)對(duì)象作為研究樣本,進(jìn)行預(yù)處理,控制數(shù)據(jù)范圍,可達(dá)到去除冗余數(shù)據(jù),提高數(shù)據(jù)挖掘的效率的目的。預(yù)處理一般包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、特征提取、離散化處理。經(jīng)過(guò)處理的數(shù)據(jù)則進(jìn)入到分析方法的過(guò)程,分析方法包括關(guān)聯(lián)分析、聚類(lèi)分析、決策樹(shù)等方法,也可進(jìn)行綜合利用。分析處理過(guò)的數(shù)據(jù)對(duì)象可能存在結(jié)果不明確或未達(dá)到滿(mǎn)足評(píng)價(jià)的水平,可進(jìn)行重復(fù)迭代以上的分析過(guò)程,直到得到最優(yōu)值為止。
K-maens 聚類(lèi)算法[11-16]是一種經(jīng)典數(shù)據(jù)挖掘算法,首先要認(rèn)定簇。簇是由空間歐式距離靠近的對(duì)象組成的,因此把得到緊湊且獨(dú)立的簇作為最終目標(biāo),也就是選定K值。通過(guò)初始參數(shù)K值及每一類(lèi)的初始聚類(lèi)中心對(duì)相似的數(shù)據(jù)點(diǎn)進(jìn)行劃分,劃分后的聚類(lèi)中心與本聚類(lèi)中其他點(diǎn)之間距離均值迭代優(yōu)化,獲得最優(yōu)的聚類(lèi)結(jié)果。K-means聚類(lèi)算法具有計(jì)算簡(jiǎn)單、收斂速度快、處理數(shù)據(jù)量大等優(yōu)點(diǎn),但該算法分類(lèi)結(jié)果非常依賴(lài)初始參數(shù)K的選取,由于煤與瓦斯突出機(jī)理的影響因素之前存在模糊性和不確定性,K值的選取不能夠確定,故需要借助模糊C 均值法對(duì)其進(jìn)行優(yōu)化和改進(jìn)。
實(shí)驗(yàn)數(shù)據(jù)類(lèi)別和單位較為復(fù)雜,為了減少不必要的迭代次數(shù),數(shù)據(jù)需要先進(jìn)行歸一化處理,處理公式如下:
使用每個(gè)樣本點(diǎn)(數(shù)據(jù)或?qū)ο螅┑皆擃?lèi)中心的最小誤差平方和函數(shù),找出使平方誤差函數(shù)最小的k個(gè)聚類(lèi),使生成的結(jié)果簇盡可能緊湊和獨(dú)立。平方誤差準(zhǔn)則定義如下:
式中,E為數(shù)據(jù)中全部對(duì)象的平方誤差的總和;p為空間中的點(diǎn),表示給定的數(shù)據(jù)對(duì)象;mi為簇Ci的平均值(p和mi都是多維的)。
采用歐氏距離計(jì)算點(diǎn)之間的距離,例如選取2個(gè)樣本x和y,x=(x1,x2,x3…xn),y=(y1,y2,y3…yn),其之間的距離計(jì)算公式如下:
K-means聚類(lèi)算法步驟如下:
(1)初始化聚類(lèi)中心,選擇出k個(gè)對(duì)象(k個(gè)初始簇)。
(2)計(jì)算所有點(diǎn)到初始對(duì)象的最短距離距,形成簇。
(3)計(jì)算步驟(2)形成的簇中對(duì)象的均值,更新簇的中心點(diǎn)。
(4)迭代以上過(guò)程至更新后的中心或均值沒(méi)有明顯變化。
影響礦井煤與瓦斯突出的地質(zhì)因素復(fù)雜多樣,除了單一的非線(xiàn)性預(yù)測(cè)方式,還可選取部分實(shí)驗(yàn)項(xiàng)目的原始數(shù)據(jù)作為樣本進(jìn)行聚類(lèi)分析,數(shù)據(jù)如表2所示。
#建立蘭德系數(shù),查看最佳聚類(lèi)效果
#最佳聚類(lèi)為6
通過(guò)聚類(lèi)得到各簇的標(biāo)準(zhǔn)偏差較小,其預(yù)測(cè)結(jié)果如表3 所示,可知,影響礦井煤與瓦斯突出的主要因素為甲烷總量、煤的堅(jiān)固性系數(shù)和瓦斯放散初速度,與礦井實(shí)際情況相符,K-means 聚類(lèi)算法行之有效。
數(shù)據(jù)挖掘算法在實(shí)驗(yàn)室信息管理系統(tǒng)中的應(yīng)用對(duì)瓦斯突出實(shí)時(shí)預(yù)測(cè)具有現(xiàn)實(shí)意義。
(1)能夠高度集中反映煤層采掘揭露和地質(zhì)勘探等手段測(cè)試的瓦斯地質(zhì)信息,采掘進(jìn)度和防突信息。
(2)可準(zhǔn)確預(yù)測(cè)未開(kāi)拓開(kāi)采區(qū)域的瓦斯壓力、瓦斯含量、瓦斯涌出量,反映礦井瓦斯賦存情況和涌出規(guī)律與瓦斯突出危險(xiǎn)性。
(3)可以作為區(qū)域突出危險(xiǎn)性預(yù)測(cè)和防突措施制定的依據(jù),能夠準(zhǔn)確判斷煤與瓦斯突出事故是否發(fā)生、發(fā)生強(qiáng)度、發(fā)生地點(diǎn),指導(dǎo)井下職工選擇合理的避災(zāi)路線(xiàn)迅速撤離災(zāi)區(qū),避免造成的重大經(jīng)濟(jì)損失,最大限度地挽救井下職工的生命。