司 鵠,趙劍楠,胡千庭
(1.重慶大學(xué) 煤礦災(zāi)害動力學(xué)與控制國家重點實驗室,重慶 400030;2.重慶大學(xué) 資源及環(huán)境科學(xué)學(xué)院,重慶 400030)
煤炭是中國第一大能源,2017年中國能源消費總量44.9億t標(biāo)準(zhǔn)煤,比2016年增長2.9%,煤炭消費量同比增長0.4%[1].隨著煤礦開采深度的增加和開采強度的提高,煤炭開采不可避免地面臨著諸多科學(xué)問題和技術(shù)難題,其中煤與瓦斯突出是在開采礦井瓦斯管理問題上的一個致命危險源。2003年至今,中國發(fā)生煤礦瓦斯事故5 949起,其中煤與瓦斯突出事故357起,死亡2 461人。2016年國內(nèi)共發(fā)生煤礦事故249起,死亡538人。近年來,全國突出事故起數(shù)和死亡人數(shù)有所下降,但煤礦安全生產(chǎn)形勢依然嚴(yán)峻,對煤與瓦斯突出事故的防治仍然十分重要。
大數(shù)據(jù)的興起為煤與瓦斯突出防治提供了一種新方法。大數(shù)據(jù)被認(rèn)為是一種新的科學(xué)方法和技術(shù)手段,是繼實驗科學(xué)、理論科學(xué)和計算科學(xué)之后的“第四范式”[2]。當(dāng)今是一個數(shù)據(jù)爆發(fā)增長的時代。移動互聯(lián)網(wǎng)、移動終端和數(shù)據(jù)傳感器的出現(xiàn),使數(shù)據(jù)以超出人們想象的速度快速增長。大數(shù)據(jù)在金融、電力、能源等行業(yè)的應(yīng)用已經(jīng)興起[3-11],并逐步向安全科學(xué)領(lǐng)域擴展;李瑞秋采用自組織數(shù)據(jù)挖掘方法構(gòu)建瓦斯涌出量與影響因素之間的預(yù)測模型,經(jīng)驗證該模型具有較好的預(yù)測精度[12];錢夢運用改進后的支持向量機算法(PSO-SVR)對煤層瓦斯含量進行預(yù)測[13];孫繼平探討了大數(shù)據(jù)在煤與瓦斯突出、沖擊地壓、水害、火災(zāi)等事故預(yù)警、煤礦重大關(guān)鍵設(shè)備故障診斷、煤炭需求和價格預(yù)測等方面的應(yīng)用[14];盛武等探討人的信息處理生理差異,分析不同類別員工的瓦斯事故應(yīng)急行動選擇傾向[15-16];吳海波以實時流數(shù)據(jù)處理框架Spark Streaming構(gòu)建基于流回歸的瓦斯?jié)舛葘崟r預(yù)測系統(tǒng),滿足瓦斯監(jiān)測流數(shù)據(jù)的實時分析并對瓦斯?jié)舛冗M行準(zhǔn)確預(yù)測以實現(xiàn)瓦斯災(zāi)害實時預(yù)警[17];郁云等運用人工神經(jīng)網(wǎng)絡(luò)建模方法建立瓦斯涌出量預(yù)測模型,提出了用數(shù)據(jù)預(yù)處理的方法弱化數(shù)據(jù)波動性[18];劉玉?;贖adoop Map Reduce大數(shù)據(jù)系統(tǒng)對礦井瓦斯涌出量進行了預(yù)測仿真分析,為礦井瓦斯治理和安全生產(chǎn)提供可靠依據(jù)[19];羅波等運用大數(shù)據(jù)、信息融合和灰色關(guān)聯(lián)法設(shè)計了一種甄別礦井運輸皮帶故障的實用方法[20]。由于信息化的滯后,煤炭行業(yè)的數(shù)據(jù)還無法像互聯(lián)網(wǎng)行業(yè)那樣進行大規(guī)模的收集和價值挖掘,但這并不能否定煤礦行業(yè)潛在的大數(shù)據(jù)屬性。煤炭行業(yè)與其他行業(yè)一樣,對行業(yè)的大數(shù)據(jù)有數(shù)據(jù)挖掘需求。
以大量事故案例為基礎(chǔ),應(yīng)用大數(shù)據(jù)原理,采用關(guān)聯(lián)規(guī)則、數(shù)據(jù)挖掘等技術(shù)探索事故發(fā)生原因與規(guī)律,為宏觀事故預(yù)測和安全決策提供科學(xué)依據(jù)。對煤與瓦斯突出事故的深度挖掘研究,對礦井科學(xué)開采、科學(xué)制定事故控制對策措施以及促進煤炭工業(yè)安全可持續(xù)發(fā)展有著重要的意義和價值。
迄今為止,人們還沒有完全掌握煤與瓦斯突出事故的發(fā)生規(guī)律,不能準(zhǔn)確預(yù)警煤與瓦斯突出。因此,將大數(shù)據(jù)用于煤與瓦斯突出事故預(yù)警具有十分重要的理論意義和實用價值。大數(shù)據(jù)技術(shù)是通過對海量數(shù)據(jù)進行分析,獲得具有巨大價值的結(jié)論和深刻的見解[21],其核心就是預(yù)測,通過機器學(xué)習(xí)把數(shù)學(xué)運算運用到海量數(shù)據(jù)上來預(yù)測事件發(fā)生的可能性。2003年起,國內(nèi)發(fā)生煤與瓦斯突出事故357起,這些事故為煤與瓦斯突出預(yù)測提供了大量數(shù)據(jù)。
基于此,采集近15 a來發(fā)生的一般及以上類型的煤與瓦斯突出事故,通過網(wǎng)絡(luò)數(shù)據(jù)采集方法在國家煤炭安監(jiān)局網(wǎng)站、各地區(qū)安監(jiān)局網(wǎng)站及各類新聞報告等媒介采集包括圖像、文檔、視頻等非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),將大數(shù)據(jù)理論應(yīng)用于煤與瓦斯突出致因分析的機理如圖1所示。
圖1 大數(shù)據(jù)理論下煤與瓦斯突出致因分析的機理Fig.1 Mechanism of cause analysis of coal and gas outburst based on big data theory
通過網(wǎng)絡(luò)數(shù)據(jù)采集方法采集的煤礦相關(guān)數(shù)據(jù)復(fù)雜,差異性大,不同地區(qū)的煤樣特征等均不相同,采集到數(shù)據(jù)多是不完整、不一致的非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),無法直接進行數(shù)據(jù)挖掘。因此,為了提高數(shù)據(jù)挖掘的質(zhì)量對數(shù)據(jù)進行預(yù)處理。采集到的煤與瓦斯突出事故存在3類不符合要求的數(shù)據(jù),分別是:不完整的數(shù)據(jù)、錯誤的數(shù)據(jù)和重復(fù)的數(shù)據(jù),針對這3類數(shù)據(jù),采用以下方式處理。
1)不完整數(shù)據(jù):這一類數(shù)據(jù)是指該有的信息缺失,如開拓方式、通風(fēng)方式和地質(zhì)構(gòu)造等需要的信息缺失,對于這一類信息,會查詢不重合數(shù)據(jù)庫進行補充,或與其他相似信息比對填充,如果依舊存在缺失,則過濾掉完整度低于50%的因素。因此,過濾了支護方式、通風(fēng)系統(tǒng)、通風(fēng)機工作方式和水文地質(zhì)4個數(shù)據(jù)元;
2)錯誤的數(shù)據(jù):由于數(shù)據(jù)來源不同,會出現(xiàn)數(shù)據(jù)矛盾、格式不正確、日期越界等情況。對于此類數(shù)據(jù)按照來源進行分類,以在安監(jiān)局網(wǎng)站上直接采集的數(shù)據(jù)為準(zhǔn),去除與其矛盾的數(shù)據(jù);
3)重復(fù)的數(shù)據(jù):因為提取到的影響因素多達(dá)27種,這嚴(yán)重影響了煤與瓦斯突出預(yù)測的可操作性和預(yù)測效率。結(jié)合數(shù)據(jù)性質(zhì),采用Cramer’s V相關(guān)系數(shù)計算法分析這27項數(shù)據(jù)元之間的相關(guān)性。分析發(fā)現(xiàn)采煤方法與采煤工藝、作業(yè)方式的相關(guān)性系數(shù)均大于0.5,為保證各因素之間的獨立性,去除采煤方法,同理去除總進風(fēng)量、總回風(fēng)量、落煤方式、煤層傾角、絕對瓦斯涌出、相對瓦斯涌出共計7個數(shù)據(jù)元。
數(shù)據(jù)清洗的目的是為了解決數(shù)據(jù)質(zhì)量問題并且讓數(shù)據(jù)適合做挖掘,通過對以上3類數(shù)據(jù)的清洗,得到的數(shù)據(jù)已滿足挖掘需求。
案例記錄一般是對突出案例發(fā)生的基本情況進行描述,然后描述突出救援中的實地指揮情況,最后描述突出案例的事故后果。因此,在對數(shù)據(jù)清洗后,將煤與瓦斯突出事故案例信息分為突出事故固有屬性、突出事故影響因素和事故后果3類,見表1.
表1 數(shù)據(jù)清洗后煤與瓦斯突出事故案例信息Table 1 Case info of coal and gas outburst accident after data cleaning
基于數(shù)據(jù)預(yù)處理,文中對瓦斯壓力、瓦斯含量作業(yè)方式、開拓方式、采煤工藝、掘進工藝、地質(zhì)構(gòu)造、煤層厚度等8個直接致因進行量化分析。
《防治煤與瓦斯突出規(guī)定》中規(guī)定當(dāng)瓦斯含量(W)大于8 m3/t或者瓦斯壓力(P)大于0.74 MPa時采取防治煤與瓦斯突出措施。因此,以此為臨界值對采集的瓦斯含量和瓦斯壓力進行分析,分析發(fā)現(xiàn):發(fā)生煤與瓦斯突出事故的平均瓦斯含量為7.4 m3/t,其中53%的突出事故發(fā)生時瓦斯含量小于8 m3/t,如圖2所示。因此,超過一半的礦井發(fā)生突出事故時瓦斯含量沒有達(dá)到國家規(guī)定的臨界值8 m3/t.
圖2 瓦斯含量統(tǒng)計分析Fig.2 Statistical analysis of gas content
大多數(shù)突出在發(fā)生前有作業(yè)方式誘導(dǎo),33.85%的煤與瓦斯突出事故是由爆破作業(yè)引起的,23.85%的事故由割煤造成,10.77%由手鎬造成。需要注意的是,打鉆雖是一種防突措施,但是也有9.23%的事故由于打鉆引起,分析結(jié)果如圖3(a)所示。
對不同作業(yè)類型的瓦斯含量進行分類分析結(jié)果如圖3(b)所示:只有在刷幫和打鉆作業(yè)誘發(fā)突出時瓦斯含量高于8 m3/t,危險性較大的爆破作業(yè)、割煤、手鎬導(dǎo)致突出的平均瓦斯含量分別為6.79,7.83,5.76 m3/t,沒有作業(yè)方式誘導(dǎo)的突出事故平均瓦斯含量為5.86 m3/t.對瓦斯含量較低時發(fā)生突出的作業(yè)方式進行分析發(fā)現(xiàn):爆破中有41%的事故是在瓦斯壓力小于0.74 MPa時發(fā)生,19%的割煤和43%的手鎬作業(yè)是在瓦斯壓力小于0.74 MPa時發(fā)生突出;雖然沒有作業(yè)方式誘導(dǎo)的突出中瓦斯含量較低,但是瓦斯壓力均達(dá)到了0.74 MPa,結(jié)果如圖3(c)所示。
圖3 作業(yè)方式影響分析Fig.3 Influence analysis of assignment style
井田開拓方式種類很多,文中按井筒(硐)形式將開拓方式分為立井開拓、斜井開拓、平硐開拓和綜合開拓4種進行分析,分析發(fā)現(xiàn)44%的礦井采用斜井開拓,25%的礦井采用混合開拓,22%采用立井開拓,9%采用平硐開拓,結(jié)果如圖4(a)所示。
對于不同開拓方式造成突出的瓦斯含量分析發(fā)現(xiàn):采用斜井開拓方式造成事故的礦井不僅多,其造成事故的臨界瓦斯含量也偏小,為6.57 m3/t,采用混合開拓發(fā)生突出的礦井平均瓦斯含量是7.49 m3/t,結(jié)果如圖4(b)所示。對采用斜井開拓和混合開拓的礦井發(fā)生事故時的瓦斯壓力進行分析發(fā)現(xiàn):在采用斜井開拓的礦井中,有33%的礦井發(fā)生事故時瓦斯壓力小于0.74 MPa,13%采用混合開拓的礦井發(fā)生事故時的瓦斯壓力小于0.74 MPa,如圖4(c)所示。因此,在采用瓦斯壓力達(dá)到0.74 MPa時進行煤與瓦斯突出區(qū)域預(yù)測具有將強的科學(xué)性且準(zhǔn)確率較高。
由于煤層的自然條件和采用的機械不同,完成回采工作各工序的方法也就不同,并且在進行的順序、時間和空間上必須有規(guī)律地加以安排和配合。這種在采煤工作面內(nèi)按照一定順序完成各項工序的方法及其配合,稱為采煤工藝。目前常用的采煤工藝有:爆破采煤工藝(炮采)、普通機械化采煤工藝(普采)、綜合機械化采煤工藝(綜采),在發(fā)生事故的礦井中,有131個礦井采用了炮采工藝,占所有事故的51%,分別由70和57個礦井采用普采和綜采工藝,結(jié)果如圖5(a)所示。
圖4 開拓方式影響分析Fig.4 Influence analysis of exploring ways
圖5 采煤工藝影響分析Fig.5 Influence analysis of coal mining process
對不同采煤工藝下瓦斯含量的分析發(fā)現(xiàn):不論采取何種采煤工藝,瓦斯含量的平均值相差不大且均小于8 m3/t,結(jié)果如圖5(b)所示;對不同采煤工藝下的瓦斯壓力分析,分別有30%,24%,19%的普采、炮采、綜采工藝在發(fā)生突出時的瓦斯壓力小于0.74 MPa,如圖5(c)所示。將采煤工藝和開拓方式耦合,如圖5(d)所示,對比分析后發(fā)現(xiàn):在立井開拓時采用普采工藝或者在平硐開拓時采用炮采工藝發(fā)生突出的平均瓦斯含量均高于11 m3/t,在其余采煤工藝和開拓工藝的耦合下發(fā)生突出的平均瓦斯含量均小于8 m3/t.因此,立井開拓和普采工藝結(jié)合、平硐開拓和炮采工藝結(jié)合是相對安全的開采組合方式。
掘進工藝是指巖土掘進工程中所采用的各種不同工序和達(dá)到所要求的技藝水平,分為炮掘和綜掘2種。在發(fā)生煤與瓦斯突出的礦井中,有68%的礦井采用炮掘工藝,32%的礦井采用綜掘工藝。由圖6(b)可知:不論是采用綜掘工藝還是炮掘工藝的礦井,在發(fā)生煤與瓦斯突出時發(fā)生突出的臨界瓦斯含量均值均小于8 m3/t,分別是7.39和7.44 m3/t.在采用炮掘工藝的礦井中,有29%的礦井發(fā)生突出時瓦斯壓力小于0.74 MPa,13%采用綜掘工藝的礦井在瓦斯壓力小于0.74 MPa時發(fā)生突出,如圖6(c)所示。
煤與瓦斯突出受地質(zhì)構(gòu)造的影響,文中簡單的將地質(zhì)構(gòu)造分為斷層、褶曲和穩(wěn)定3種。對煤與瓦斯突出事故案例的分析發(fā)現(xiàn),有39.84%的事故發(fā)生在斷層構(gòu)造區(qū)域,34.38%的事故發(fā)生在褶曲構(gòu)造區(qū)域,25.78%的事故發(fā)生在地質(zhì)構(gòu)造穩(wěn)定的區(qū)域,如圖7(a)所示。而在不同地質(zhì)構(gòu)造區(qū)域發(fā)生突出的臨界瓦斯含量也不同,由圖7(b)可以看出來,斷層、穩(wěn)定和褶皺構(gòu)造發(fā)生突出的平均瓦斯含量分別為8,7.35和6.91 m3/t,褶皺區(qū)域在瓦斯含量較低的情況下會發(fā)生突出。分析不同地質(zhì)構(gòu)造發(fā)生突出時的瓦斯壓力發(fā)現(xiàn):在褶皺區(qū)域發(fā)生的事故中有32%的事故在瓦斯壓力小于0.74 MPa時發(fā)生,在斷層和穩(wěn)定區(qū)域分別有23%和15%的事故在發(fā)生突出時瓦斯壓力小于0.74 MPa,如圖7(c)所示。
圖6 掘進工藝影響分析Fig.6 Influence analysis of driving technology
圖7 地質(zhì)構(gòu)造影響分析Fig.7 Influence analysis of geological structure
煤層厚度類型<1.3 m薄煤層1.3 m≤d<3.5 m中厚煤層≥3.5 m厚煤層
按煤層的厚度可以將煤層分為3類:薄煤層、中厚煤層和厚煤層,分類見表2.以這3類煤層厚度為基準(zhǔn)統(tǒng)計,得到結(jié)果如圖8(a)所示,可以發(fā)現(xiàn):61%的事故發(fā)生在厚煤層,32%的事故發(fā)生在中厚煤層,7%的事故發(fā)生在薄煤層。將3類煤層與瓦斯含量進行耦合分析發(fā)現(xiàn):中厚煤層發(fā)生煤與瓦斯突出的平均瓦斯含量為8.12 m3/t,厚煤層和薄煤層發(fā)生突出的平均瓦斯含量分別是7.07,7.29 m3/t,結(jié)果如圖8(b)所示??梢钥闯?,厚煤層發(fā)生事故較多,且發(fā)生事故的平均瓦斯含量小于8 m3/t,薄煤層事故數(shù)較少但是在瓦斯含量較低的情況下發(fā)生突出事故。因此,分別分析厚煤層和薄煤層發(fā)生事故的瓦斯壓力,如圖8(c)所示,發(fā)現(xiàn):在厚煤層中,有27%的事故在瓦斯壓力小于0.74 MPa時發(fā)生了煤與瓦斯突出事故,而所有薄煤層發(fā)生的突出事故均在瓦斯壓力大于0.74 MPa時發(fā)生。
通過計算影響因素與事故等級之間的相關(guān)性,可以得到影響因素與突出危險性的關(guān)聯(lián)程度。在類-屬性相關(guān)離散化方法的基礎(chǔ)上,提出一種基于Cramer’s V 的連續(xù)屬性離散化算法,該方法利用統(tǒng)計學(xué)中的Cramer’s V來量化類-屬性相關(guān)度,以保證離散后的類-屬性相關(guān)度最大。因此,采用Cramer’s V相關(guān)系數(shù)進行關(guān)聯(lián)分析,并在對煤與瓦斯突出事故案例進行統(tǒng)計分析時,將事故等級分為較大、重大和特別重大3類。
圖8 煤層厚度影響分析Fig.8 Influence analysis of seam thickness
Cramer’s V值是列聯(lián)表卡方檢驗拒絕虛無假設(shè)后計算的一個指標(biāo),這個指標(biāo)主要目的在衡量2個類別變項間的相關(guān)程度,也就是一般所謂的關(guān)系強度的指標(biāo)[23],相比于其他關(guān)聯(lián)度計算方法,Cramer’s V針對分類屬性,基于歷史數(shù)據(jù),使得計算結(jié)果更加準(zhǔn)確、可信。計算公式為
數(shù)據(jù)挖掘技術(shù)中,為分析2個特征之間是否獨立,研究者常采用列聯(lián)表進行獨立性檢驗。列聯(lián)表[24]是由2個以上的變量進行交叉分類的頻數(shù)分布表。假設(shè)n個隨機試驗的結(jié)果根據(jù)2個特征A和B進行分類,A={A1,A2,…,As},B={B1,B2,…,Br},屬于Ai與Bj類的個體有nij個,見表5.
表5 r×s列聯(lián)表Table 5 Alliance of r×s
文中以分析突出危險性和開拓方式的相關(guān)程度為例,建立列聯(lián)表見表6.
根據(jù)公式(1)得到突出危險性與開拓方式之間的關(guān)聯(lián)系數(shù)為0.606,同理可以得到其他影響因素與突出危險性之間的關(guān)聯(lián)系數(shù),見表7.
表6 突出危險性和作業(yè)方式的列聯(lián)表Table 6 Alliance between coal and gas outburst danger and operation mode
表7 突出危險性和影響因素關(guān)聯(lián)分析Table 7 Correlation analysis between coal and gas outburst danger and influential factors
結(jié)果顯示:瓦斯含量和瓦斯壓力對煤與瓦斯突出的影響最大;地質(zhì)構(gòu)造對煤與瓦斯突出的發(fā)生起到了非常重要的作用,特別是在地質(zhì)構(gòu)造復(fù)雜的區(qū)域要更加重視對突出事故的防治;煤層厚度和開拓方式對突出事故的發(fā)生有較大影響,針對不同礦井,要合理選取開拓方式;采煤工藝、作業(yè)方式和掘進工藝的選取影響著突出事故的發(fā)生,應(yīng)該根據(jù)礦井的地質(zhì)構(gòu)造等實際情況,選取符合其開采條件的采掘工業(yè)和作業(yè)方式。
綜上研究表明:對煤與瓦斯突出事故影響最大的因素是瓦斯含量和瓦斯壓力,其次是:地質(zhì)構(gòu)造、煤層厚度、開拓方式、采煤工藝、作業(yè)方式和掘進工藝。
1)對近15 a來一般及以上的煤與瓦斯突出事故進行統(tǒng)計,計算煤與瓦斯突出危險性和影響因素的Cramer’s V相關(guān)系數(shù),結(jié)果顯示:對煤與瓦斯突出事故影響較大的因素除了瓦斯壓力和瓦斯含量以外,地質(zhì)構(gòu)造、煤層厚度、作業(yè)方式、開拓方式、采煤工藝和掘進工藝;
2)瓦斯含量是影響煤與瓦斯突出的首要因素,研究發(fā)現(xiàn),有54%的礦井瓦斯含量小于8 m3/t的時候,也發(fā)生了突出。因此,對于復(fù)雜地質(zhì)構(gòu)造礦井,僅用瓦斯含量小于8 m3/t的判別準(zhǔn)則,難以有效預(yù)判煤與瓦斯突出;
3)將大數(shù)據(jù)應(yīng)用于煤礦安全,是一種全新的嘗試。大數(shù)據(jù)的應(yīng)用必然引起傳統(tǒng)行業(yè)安全管理的一場變革,也將提高煤礦安全管理的技術(shù)能力。文中將大數(shù)據(jù)理論應(yīng)用于煤與瓦斯突出突出事故致因分析,為進一步將大數(shù)據(jù)技術(shù)應(yīng)用于煤礦安全奠定了基石。通過大數(shù)據(jù)在煤炭行業(yè)中的深入應(yīng)用,能夠更好地服務(wù)于煤礦安全生產(chǎn)。